Durch das Auseinanderbrechen der Ampel-Koalition dürfte sich die Verabschiedung des geplanten Forschungsdatengesetzes verzögern. Das Ziel, den Datenzugang für die Forschung zu verbessern und die bestehenden Daten zu Forschungszwecken besser miteinander zu verknüpfen, bleibt von großer Bedeutung und sollte auch von einer neuen Bundesregierung entschlossen verfolgt werden. Dabei gilt es, auf die bereits erfolgreich arbeitende Dateninfrastruktur aufzubauen und diese integrativ zu nutzen. Die Erfahrungen des IAB als Bestandteil der wirtschafts- und sozialwissenschaftlichen Forschungsdateninfrastruktur bieten Lehren für die Ausgestaltung des Forschungsdatengesetzes.

Ungeachtet des Endes des Ampel-Koalition im November 2024 sollte die Umsetzung des geplanten Forschungsdatengesetzes weiter vorangetrieben werden. Dabei gilt es, den Zugang zu vorhandenen Datenbeständen zu verbessern, die bislang nicht oder nur eingeschränkt von der Forschung genutzt werden dürfen. Dazu gehört auch die Möglichkeit, insbesondere diejenigen Daten miteinander zu verknüpfen, die in administrativen Prozessen, sogenannten Registern, erhoben werden.

Die Verknüpfung von Daten verspricht hohen Erkenntnisgewinn, wie auch die Forschung des IAB im Bereich von Arbeitsmarktdaten gezeigt hat. Allerdings verhindern die aktuellen rechtlichen Rahmenbedingungen in vielen Fällen, dass Daten tatsächlich zu Forschungszwecken miteinander verknüpft werden können. In Deutschland liegt dies an zahlreichen Einzelgesetzen auf Bundes- und Landesebene, die nicht ineinandergreifen und im Regelfall keine Verknüpfung von Daten über die Grenzen des betreffenden Rechtskreises hinaus zulassen.

Seit Anfang Oktober 2024 liegt nun ein erster Referentenentwurf zum Forschungsdatengesetz vor, der versucht, die genannten Lücken im Bereich des Datenzugangs zu schließen. Zwar gab es schon Gespräche zwischen den Ministerien, aber Anhörungen von Verbänden, Interessenvertretungen und betroffenen Instituten stehen noch aus. Das Forschungsdatengesetz wird jedenfalls nicht mehr in dieser Legislaturperiode verabschiedet. Umso wichtiger ist es, sich weiterhin gemeinsam darüber auszutauschen, wie das richtige Ziel des uns vorliegenden Referentenentwurfs, nämlich den Zugang zu Forschungsdaten umfassend zu verbessern, am ehesten erreicht werden kann. Hier können die Erfahrungen des IAB lehrreich sein.

Ein Entwurf für ein Forschungsdatengesetz wird auf den Weg gebracht

Dem Referentenentwurf voraus ging eine Konsultation unter den beteiligten Stakeholdern, darunter auch das IAB, um die Anforderungen an ein Forschungsdatengesetz zu formulieren (lesen Sie dazu unter anderem die Stellungnahme des Vereins für Socialpolitik). Erste Vorstellungen zu einer möglichen Ausgestaltung des Gesetzes waren schon im Frühjahr 2024 in einem Eckpunktepapier des Bundesministeriums für Bildung und Forschung (BMBF) veröffentlicht worden.

Bereits dort wird die Idee eines Deutschen Zentrums für Mikrodaten (DMZ) aufgegriffen. Dieses soll nicht nur einen sicheren und zentralen Zugang zu Statistik- und Registerdaten bieten, sondern auch öffentlich gehaltene Daten miteinander verknüpfen. Die bereits etablierten Forschungsdatenzentren, zu denen auch das Forschungsdatenzentrum der Bundesagentur für Arbeit (BA) im IAB (kurz FDZ-BA/IAB) zählt, finden im Referentenentwurf bereits Erwähnung.

In der Umsetzung des  Referentenentwurfs kommt dem DMZ eine besondere Rolle zu. Es soll zentrale Anlaufstelle für den Zugang zu Forschungsdaten werden, die bislang noch nicht verfügbar sind. Zugleich soll es Forschenden aber auch den Zugang zu und die Verknüpfung von Daten ermöglichen, die bereits von den Forschungsdatenzentren vorgehalten werden.

Hier schießt der Referentenentwurf, wie wir im Folgenden argumentieren, übers Ziel hinaus. Denn in den vergangenen Jahrzehnten wurde bereits eine erfolgreiche dezentrale Forschungsinfrastruktur im Bereich der Sozial- und Wirtschaftswissenschaften aufgebaut. Dabei wurden Erfahrungen in der Aufbereitung und Verknüpfung von Forschungsdaten gesammelt. Diese dezentrale Infrastruktur sollte daher integrativer Bestandteil der übergeordneten Forschungsdateninfrastruktur im geplanten Forschungsdatengesetz sein.

Das Ziel muss sein, auf bestehenden Erfahrungen und bewährten Prozessen aufzubauen, klare Aufgabenzuschnitte ohne Doppelstrukturen zu schaffen und die Zusammenarbeit für innovative Datenneuerungen und neue Datenverknüpfungen zu stärken, die mit dem Forschungsdatengesetz überhaupt erst möglich werden. Daher sollte das DMZ nach dem Subsidiaritätsprinzip die bestehenden Strukturen sinnvoll ergänzen, aber diese nicht oder nur im Ausnahmefall ersetzen. Aufgaben sollten also dezentral verortet bleiben, wenn sie dort am besten funktionieren. Eine Zentralisierung ist nur dann angezeigt, wenn diese tatsächlich zu Verbesserungen führt.

Lehren aus den Erfahrungen des IAB für die Weiterentwicklung der Dateninfrastruktur

Das IAB kann in weiten Teilen durchaus als ein Vorbild für die intendierte Weiterentwicklung der sozial- und wirtschaftswissenschaftlichen Forschungsdateninfrastruktur dienen. Denn die Arbeitsmarkt- und Berufsforschung sowie die arbeitsmarktbezogene Sozialpolitikforschung (alle drei im Folgenden kurz mit Arbeitsmarktforschung bezeichnet) können schon jetzt auf hochwertige (verknüpfte) administrative Daten zugreifen. Sie sind Grundlage für die forschungs- und evidenzbasierte Politikberatung des IAB.

Das IAB verknüpft seit über 20 Jahren administrative Sozialdaten aus verschiedenen Quellen in der BA untereinander sowie mit Befragungsdaten und baut damit innovative Datensätze auf. Diese sind für die Arbeitsmarktforschung im Allgemeinen und für Forschungsfragen mit unmittelbarer politischer Relevanz im Besonderen sehr wertvoll.

Die Sozialdaten werden zunächst in der BA-Statistik zu Statistikdaten und dann am IAB zu Forschungsdaten aufbereitet. Diese administrativen Forschungsdaten verknüpfen bereits die Informationen aus unterschiedlichen Fachverfahren der BA mit den erwerbshistorischen Daten aus den Meldungen zur Sozialversicherung (Integrierte Erwerbsbiografien – IEB). Die Daten sind standardisiert, also immer nach bestimmten Regeln erstellt. Sie sind gleichzeitig Grundlage der Stichproben, aus denen unser FDZ Datensätze für die Forschungsgemeinschaft zieht.

Die Möglichkeit der zweckgebundenen Verknüpfung von Sozialdaten mit anderen Daten ist im Sozialgesetzbuch (SGB) geregelt. Zugleich müssen Regelungen der europäischen Datengrundschutzverordnung beachtet werden.

Neben Datenverknüpfungen für einzelne Forschungsprojekte werden verknüpfte Forschungsdatensätze mit Befragungen aus anderen wissenschaftlichen Einrichtungen am FDZ-BA/IAB der nationalen und internationalen Wissenschaft zur Verfügung gestellt. Dazu gehören die verknüpften Daten des Nationalen Bildungspanels des Leibniz-Instituts für Bildungsverläufe (LIfBi) oder des Sozio-oekonomischen Panels des Deutschen Instituts für Wirtschaftsforschung (DIW Berlin).

Die vorhandene Expertise beschränkt sich hierbei nicht auf die technische Umsetzung der Verknüpfungen und das Datenwissen, sondern schließt umfangreiche Erfahrungen zur Umsetzung datenschutzrechtlicher Anforderungen ein. Dazu gehören etwa die Abfrage der informierten Einwilligung zur Datenverknüpfung sowie Datenhaltung, -pseudonymisierung und -anonymisierung. Das heißt, die Befragungspersonen müssen darüber aufgeklärt werden, welche ihrer Daten verknüpft werden und könnten einer Verknüpfung und Nutzung der Daten widersprechen. Neben der Nutzung der Forschungsdatensätze des FDZ-BA/IAB sind weitere Zugangsmöglichkeiten zu Daten des IAB nach §75 SGB X gesetzlich geregelt.

Den Potenzialen bei der Verknüpfung von Daten zu Forschungszwecken sind rechtliche Grenzen gesetzt, von denen die Arbeitsmarktforschung insgesamt betroffen ist. So fehlt die gesetzliche Möglichkeit der Verknüpfung von Lebensverlaufsdaten mit Bildungs- und Gesundheitsinformation oder für die Verknüpfung von Daten über Generationen hinweg. Ebenso können derzeit nicht die Daten des IAB mit den vom Statistischen Bundesamt erhobenen Arbeitsmarktdaten verknüpft werden – ein großes Hindernis unter anderem für die Forschung zu den Wirkungen des Mindestlohns (eine ausführliche Beschreibung dieser Problematik findet sich in einem 2017 publizierten Papier des Rats für Sozial- und Wirtschaftsdaten von Ralf Himmelreicher und anderen).

Deshalb sieht das IAB im Forschungsdatengesetz eine große Chance, um die rechtlichen Voraussetzungen für Datenverknüpfungen mit anderen Rechtsbereichen, zum Beispiel mit Steuer- und Bildungsdaten, zu schaffen. Auf diese Weise ließe sich die empirische Basis für politische Entscheidungen stärken, ohne den Schutz sensibler Daten von Bürgerinnen und Bürgern preiszugeben.

Konkrete Anregungen für ein neues Forschungsdatengesetz

Das IAB möchte die Diskussion zum derzeitigen Referentenentwurf mit eigenen Vorschlägen begleiten und einen Dialog zwischen allen Beteiligten anstoßen, um gemeinsam ein erfolgreiches Forschungsdatengesetz auf den Weg zu bringen. Dabei geht es insbesondere um die folgenden Aspekte:

1. Aufgabenteilung nach dem Subsidiaritätsprinzip klären

Angesichts der bestehenden, gut eingespielten Infrastruktur an Forschungsdatenzentren sollte das DMZ vor allem als zentrale Anlaufstelle und Datentreuhänder fungieren: Es sollte Daten- und Verknüpfungsanfragen entgegennehmen und Verknüpfungen herstellen, für die es bislang keine rechtliche Grundlage gibt. Alle Anfragen zu Daten- sowie Datenverknüpfungen, die im Aufgabenbereich bestehender Forschungsdatenzentren oder Forschungsinfrastruktureinrichtungen liegen, sollte das DMZ an diese weiterleiten.

Eine dezentrale Ausrichtung hat den Vorteil, dass sich damit die bereits bestehende Infrastruktur nutzen lässt. Denn die jeweiligen dezentralen Einheiten verfügen schon heute über die notwendige Expertise zu ihren eigenen Daten und können auf bewährte Prozesse zurückgreifen. Das Rad muss also, bildlich gesprochen, nicht neu erfunden werden. Im Rahmen einer dezentralen Struktur kann der Aufbau des DMZ schneller und passgenauer erfolgen und ein möglichst großer Mehrwert gegenüber der bisherigen Struktur geschaffen werden. Etablierte Prozesse in den Forschungsdatenzentren können entsprechend angepasst und ergänzt werden.

Zudem sollten die Forschungsdatenzentren innovative Verknüpfungsansätze unter Nutzung ihrer Expertise gemeinsam mit dem DMZ umsetzen können – mit dem Ziel, die verknüpften Daten der Forschungsgemeinschaft möglichst kostenlos oder so kostengünstig wie möglich anbieten zu können.

2. Forschungsdaten definieren und datenhaltende Einrichtungen aktiv einbeziehen

Es gibt Daten, die für Verknüpfungen nicht geeignet sind. Dies gilt beispielsweise für die meisten qualitativen Interviews, die in der Regel mit wenigen ausgewählten Personen durchgeführt werden und Erzählcharakter haben. Die daraus generierten Forschungsergebnisse stützen sich auf die Interpretation und Zusammenfassung transkribierten Textmaterials und bedürfen aus Sicht der qualitativen Forschung keiner Verknüpfung.

Vor diesem Hintergrund wird eine Definition von Forschungsdaten benötigt, die offen für Innovationen ist und zugleich solche Daten ausschließt, bei denen eine Verknüpfung mit anderen Daten keinen wissenschaftlichen Mehrwert verspricht. Zudem sollte ein gewünschter einfacher Datenzugang über das DMZ nicht dazu führen, dass in diesen Fällen auf die Bewertung der dort angemeldeten Forschungsvorhaben durch die datenhaltenden Einrichtungen verzichtet werden muss. Ansonsten drohen Fehlschlüsse und Mehrarbeit auf allen Seiten.

3. Engen Austausch zwischen Forschung und Datenbereitstellung sicherstellen

Um Prozessdaten für die Forschung nutzen zu können, sind zahlreiche Aufbereitungsschritte notwendig, die eine fundierte Kenntnis der Verwaltungsprozesse erfordern, aus denen die Daten hervorgehen. Die langjährige Erfahrung des IAB in der Aufbereitung der Prozessdaten der Bundesagentur für Arbeit für die Forschung hat gezeigt, dass ein direkter Austausch zwischen Forschung und Datenbereitstellung von unschätzbarem Vorteil ist. Aus diesem Austausch sind zahlreiche Impulse für eine bessere Datenaufbereitung im IAB entstanden.

Die Qualität der Datenberatung erwächst also auch aus den langjährigen Erfahrungen, die datenhaltende Einrichtungen mit der Aufbereitung von Daten haben. Dies gilt insbesondere für Forschungsdatenzentren, die selbst Forschung betreiben und die Qualität ihrer Daten dank Unterstützung aus der Forschung stetig verbessern.

4. Zustimmung der Befragten zur Verknüpfung vereinfachen

Bislang müssen alle Befragten explizit der Verknüpfung ihrer Befragungsdaten mit anderen Individualdaten zustimmen. Effizienter wäre hier eine Widerspruchsregelung: Demnach müsste eine befragte Person einer bestimmten Verknüpfung von Daten explizit widersprechen, wenn sie diese nicht wünscht (auch Opt-out-Regelung oder Widerspruchsregelung genannt). Das würde den mit Verknüpfungen verbundenen bürokratischen Prozess erheblich vereinfachen.

Natürlich müsste in den Befragungen auf die Widerspruchsmöglichkeit hingewiesen werden. Das DMZ könnte hier als zentrale Anlaufstelle fungieren, über die sich die Bürgerinnen und Bürger einen Überblick über alle Forschungsdatensätze verschaffen können, bei denen eine Widerspruchsmöglichkeit besteht.

5. Den Datenzugang auf gemeinnützige Zwecke beschränken und die Weiterverwendung der Daten klären

Die im Referentenentwurf vorgesehene Öffnung des Datenzugangs für alle Forschungsaktivitäten ohne Zweckbindung und auch für nicht wissenschaftliche Einrichtungen ist sehr weitreichend. Sie bedarf aus unserer Sicht ergänzender Regelungen, um eine rein kommerzielle Nutzung zu verhindern. Wenn es einen Zugang zu öffentlichen Daten gibt, sollte die Datennutzung nur dann zulässig sein, wenn diese im öffentlichen Interesse liegt.

Bislang ist die Weiterverwendung von verknüpften Daten am DMZ nicht geklärt. Dies betrifft Verknüpfungen, die von wissenschaftlichen Einrichtungen Auftrag gegeben werden, ebenso wie solche, die von Forschungsabteilungen privatwirtschaftlicher Unternehmen in Auftrag gegeben werden.

Unabhängig davon ist empfehlenswert, dass eine Weiterverwendung oder Sekundärnutzung der verknüpften Daten für Forschungszwecke ermöglicht wird – auch durch andere Forschende unter Einhaltung des Datenschutzes. Im Klartext hieße dies, dass verknüpften Daten von privatwirtschaftlichen Unternehmen ebenfalls für weitere Forschung zu Verfügung stehen. All dies war bisher nicht möglich und ist bislang auch im Referentenentwurf nicht vorgesehen.

6. Finanzierung für den Mehraufwand auf Seiten der datengebenden Einrichtungen klären

Bislang sind im Referentenentwurf nur die Aufwände für ein DMZ kalkuliert und beschrieben. Es entstehen aber außerdem erhebliche Aufwände auf Seiten der datengebenden Einrichtungen. Deren Gegenfinanzierung bedarf ebenfalls einer gesetzlichen Grundlage.

7. Weitere rechtliche Voraussetzungen schaffen

Während im Eckpunktepapier des BMBF noch ein relativ weitreichendes Forschungsdatengesetz vorgesehen war, sind die entsprechenden Passagen im Referentenentwurf wesentlich weniger weitgehend. So werden in letzterem wichtige Verknüpfungspotenziale ausgeschlossen, etwa die Verknüpfung von IAB-Daten mit Gesundheitsdaten, die im Gesundheitsdatennutzungsgesetz geregelt sind. Dies ist problematisch. Denn die Gesundheit eines Menschen beeinflusst dessen Integration auf dem Arbeitsmarkt und ist deshalb für die Arbeitsmarktforschung von großer Bedeutung. Ein Forschungsdatengesetz sollte deshalb die rechtlichen Voraussetzungen dafür schaffen, dass entsprechende Beschränkungen und Ungleichbehandlungen zwischen staatlichen Datenhaltern so weit wie möglich entfallen.

Fazit

Daten sind ein entscheidender Baustein für die empirische Forschung. Die darauf fußenden Ergebnisse sind essenziell für eine faktenbasierte Beratung von Politik und Gesellschaft. Deshalb ist das geplante Forschungsdatengesetz von großer Bedeutung und sollte trotz des Auseinanderbrechens der Ampel-Koalition vorangetrieben und umgesetzt werden.

Allerdings sind die im bisherigen Referentenentwurf vorgesehenen Regelungen aus Perspektive der Forschung verbesserungswürdig. Die langjährigen Erfahrungen des IAB können hier lehrreich sein. Im Sinne des Subsidiaritätsprinzips schlagen wir vor, die bestehende dezentrale Forschungsdateninfrastruktur im Kern beizubehalten, aber um ein DMZ als zentraler Anlaufstelle zu ergänzen. Dieses sollte die existierenden Forschungsdatenzentren integrativ mit einbeziehen und sich deren Expertise und Erfahrung zunutze machen.

Doch auch darüber hinaus besteht beim Forschungsdatengesetz noch deutlicher Klärungsbedarf. Dies betrifft unter anderem die Finanzierungsstrategie, die Sicherung der Qualität von verknüpften Daten, die möglichst breite Einbeziehung von vorhandenen Daten oder die Rolle von kommerzieller Forschung.

In aller Kürze

  • Das geplante Forschungsdatengesetz muss die rechtlichen Voraussetzungen für weitreichende Verknüpfungen der bestehenden administrativen Daten schaffen.
  • Im Sinne des Subsidiaritätsprinzips schlagen wir vor, die bestehende dezentrale Forschungsdateninfrastruktur im Kern beizubehalten, aber um das geplante „Deutsche Zentrum für Mikrodaten“ (DZM) als zentraler Anlaufstelle zu ergänzen. Dieses sollte die existierenden Forschungsdatenzentren integrativ mit einbeziehen und sich deren Expertise und Erfahrung zunutze machen.
  • Die Zeit bis zur parlamentarischen Beratung des Gesetzes sollte genutzt werden, um den vorliegenden Referentenentwurf breit zu diskutieren und Verbesserungspotenziale auszuloten. Das dort formulierte Ziel, den Zugang zu Forschungsdaten umfassend zu verbessern, ist absolut berechtigt. Die Mittel und Wege, um dieses zu erreichen, sollten allerdings noch einmal auf den Prüfstand gestellt werden.

Literatur

Bundesministerium für Bildung und Forschung (BMBF)(2024): Eckpunkte BMBF Forschungsdatengesetz, 28.2.2024.

Himmelreicher, Ralf; vom Berge, Philipp; Fitzenberger, Bernd; Günther, Roland; Müller, Dana (2017): Überlegungen zur Verknüpfung von Daten der Integrierten Erwerbsbiographien (IEB) und der Verdienststrukturerhebung (VSE). RatSWD Working Paper 262/2017.

Verein für Socialpolitik (2023): Für einen besseren Datenzugang im Bereich Arbeitsmarkt und Sozialversicherung, Stellungnahme aus dem Verein für Socialpolitik, Unterarbeitsgruppe Arbeitsmarkt und Sozialversicherung, RatSWD Working Paper Series, 286/2023.

 

Hinweis: Eine gekürzte Fassung dieses Beitrags ist am 10.2.2025 als Gastbeitrag in der Frankfurter Allgemeinen Zeitung erschienen.

Bild: KanawatTH/stock.adobe.com

DOI: 10.48720/IAB.FOO.20250213.01

Müller, Dana; Fitzenberger, Bernd (2025): Forschung und Politikberatung benötigen ein Forschungsdatengesetz: Lehren aus dem IAB, In: IAB-Forum 13. Februar 2025, https://www.iab-forum.de/forschung-und-politikberatung-benoetigen-ein-forschungsdatengesetz-lehren-aus-dem-iab/, Abrufdatum: 21. February 2025

 

Diese Publikation ist unter folgender Creative-Commons-Lizenz veröffentlicht: Namensnennung – Weitergabe unter gleichen Bedingungen 4.0 International (CC BY-SA 4.0): https://creativecommons.org/licenses/by-sa/4.0/deed.de