9. April 2024 | Interviews
„Das Forschungsdatenzentrum geht mit gutem Beispiel für andere Datenbereiche voran“
Frau Müller, erstmal herzlichen Glückwunsch zum Jubiläum. Gleich zu Anfang wollen wir wissen: Was ist für Sie das Besondere am FDZ?
Dana Müller: Das Besondere am Forschungsdatenzentrum steckt schon im Namen – das sind natürlich unsere Daten. Diese sind wirklich einmalig für die Arbeitsmarkt- und Berufsforschung. Im Gesetz ist vorgesehen, dass sie für die Forschung zur Verfügung stehen. Dies zu leisten, ist unsere Aufgabe.
Wir verarbeiten die administrativen Daten der Bundesagentur für Arbeit weiter, indem wir daraus sogenannte standardisierte Datenprodukte erstellen. Damit können Forscherinnen und Forscher weltweit Forschungsfragen beantworten. Mein Kollege aus dem Datenmanagement sagt immer, dass wir am FDZ die Daten „veredeln“. Zudem stellen wir die Befragungsdaten aus dem IAB zur Verfügung und verknüpfen diese zum Großteil mit den administrativen Daten, um das Analysepotenzial zu erhöhen.
Was waren die größten Herausforderungen oder Meilensteine der letzten 20 Jahre?
Müller: 20 Jahre klingen enorm – letztendlich kamen sie mir ziemlich kurz vor. Die größte Herausforderung war für mich der Aufbau der Dateninfrastruktur. 2005 haben wir mit einem einzigen Gastarbeitsplatz im Büro eines Kollegen begonnen, über den Externe erstmals die Möglichkeit hatten, vor Ort mit unseren Daten zu forschen. Über die Jahre haben wir viele weitere Zugangsmöglichkeiten geschaffen. In Deutschland, in Europa, in den USA und in Kanada stehen jetzt Gasträume zur Verfügung, in denen Forschende Zugriff auf unsere Daten erhalten.
Müller: Der Datenschutz spielt eine sehr große Rolle.
Eine weitere Herausforderung ist der besondere Schutz unserer Sozialdaten. Der Datenschutz spielt eine sehr große Rolle. Deshalb sind unsere Vorhaben nicht von heute auf morgen umsetzbar, sondern dauern einfach ihre Zeit.
Ein anderer Meilenstein, den wir erreicht haben, ist das Verknüpfen von Befragungsdaten mit administrativen Daten. Vor 20 Jahren haben wir mit den Linked-Employer-Employee-Datensätzen angefangen, bei denen wir die Antworten der teilnehmenden Arbeitgeber aus dem Betriebspanel mit administrativen Personendaten der dort Beschäftigten verknüpfen. Damit konnten die Forschenden erstmals Angebots- und Nachfrageseite auf dem Arbeitsmarkt parallel untersuchen.
Jungbauer-Gans: Meine Mitarbeiterinnen und Mitarbeiter in Nürnberg kamen oft ins IAB und arbeiteten dort an einem Gastarbeitsplatz an den Daten.
Frau Jungbauer-Gans, was waren Ihre ersten Berührungspunkte mit dem FDZ?
Monika Jungbauer-Gans: Die liegen tatsächlich relativ lange zurück. Als ich eine Professur an der Universität Kiel hatte, knüpfte ich Kontakte mit der dortigen Regionalforschungsgruppe des IAB. Gemeinsam untersuchten wir Diversität in Unternehmen im Rahmen von zwei Projekten der Deutschen Forschungsgemeinschaft. Dazu nutzten wir genau den verknüpften Datensatz des IAB, den Dana Müller erwähnte. Während dieser Projekte bin ich an die Universität Erlangen-Nürnberg gewechselt, was natürlich sehr gut gepasst hat. Meine Mitarbeiterinnen und Mitarbeiter in Nürnberg kamen oft ins IAB und arbeiteten dort an einem Gastarbeitsplatz an den Daten. Das wäre von Kiel aus zu der Zeit noch nicht so einfach gewesen.
Das heißt, Sie waren eigentlich am Anfang vor allem Nutzerin des FDZ?
Jungbauer-Gans: Ja, genau. Später hatte ich als Mitglied des Wissenschaftlichen Beirats des IAB natürlich noch mehr Einblicke, auch in die Datenarbeit des Instituts.
Jungbauer-Gans: In Deutschland wird bei Daten nicht bereichsübergreifend gedacht, sondern für einzelne Politikbereiche.
Zudem sind Sie die Vorsitzende des Rats für Sozial- und Wirtschaftsdaten in Deutschland: Ziel des Rats ist die Verbesserung des Zugangs zu hochwertigen Daten für die Wissenschaft. Wo sehen Sie derzeit besonderen Nachholbedarf bei den Datenzugängen, bei der Verknüpfung von Datensätzen und auch bei der Dateninfrastruktur?
Jungbauer-Gans: Ein großes Problem sehe ich darin, dass Daten in Deutschland nicht per se verknüpfbar sind, so wie es in skandinavischen Ländern oder in den Niederlanden möglich ist. Es geht dabei immer um Auswertungen anonymisierter Daten unter Einhaltung des Datenschutzes. Doch in Deutschland wird bei Daten nicht bereichsübergreifend gedacht, sondern für einzelne Politikbereiche. So sind im Sozialgesetzbuch nur der Datenschutz und die Verknüpfungsmöglichkeiten für die Arbeitsmarktdaten geregelt. Dabei wäre es sehr lohnend, etwa Bildungsdaten oder Gesundheitsdaten endlich mit Arbeitsmarktdaten verknüpfen zu können.
In den Niederlanden und Skandinavien ist das möglich?
Jungbauer-Gans: In Skandinavien kann ich sehr viele Daten verknüpfen, etwa bei den Registerdaten. Je nach Fragestellung zum Beispiel Arbeitsmarkt- und Gesundheitsdaten, oder Daten zu Schulen und zur Lehrerqualifikation. Bei uns liegen Welten zwischen diesen Datenräumen.
Ist Deutschland also eher rückständig?
Jungbauer-Gans: Ja. In Österreich gibt es beispielsweise das Austrian Micro Data Centre, wo solche Verknüpfungen per se möglich sind. Bei uns sind dafür Gesetzesänderungen nötig. Mit dem Vorschlag, ein Forschungsdatengesetz zu verabschieden, fordern wir nun diese Änderungen.
Ich bin gespannt, wie weit die Politik dieser Forderung folgen wird. Und, ob sie das Problem versteht, dass wir endlich die technische Infrastruktur und dazu passende rechtlichen Regelungen brauchen: etwa eine vertrauenswürdige Organisation, der erlaubt wird, die Daten zusammenzuführen, wie das Statistische Bundesamt. Abgesehen davon gibt es in Deutschland immer noch Probleme beim Aufbau von wichtigen Daten, wie beispielsweise dem Bildungsregister. Dazu liegt zwar ein Beschluss der Kultusminister von 2003 vor, doch seither ist kaum etwas passiert. Nur einzelne Bundesländer wie Hamburg oder Bremen sammeln ihre Bildungsdaten und erlauben den Forschenden Zugriff darauf.
Das FDZ der BA ist als eines von 41 akkreditierten Datenzentren Teil des Prozesses hin zu einem leichteren Datenzugang für die Wissenschaft. Wie sehen Sie die bisherige Arbeit unseres FDZs?
Jungbauer-Gans: Das FDZ der BA ist eines der Vorreiter unter den Forschungszentren. Es war nach den FDZs der Statistischen Ämter mit das erste, das gegründet wurde. Damit hat es wesentliche Grundlagenarbeiten geleistet, etwa in Bezug auf die Datenschutzanforderungen, die Anonymisierung der Daten und den Datenzugang. Das war eine echte Pionierleistung.
Müller: Forschungsergebnisse, die auf unseren Daten basieren, können zu politischen Entscheidungen beitragen.
Frau Müller, da das FDZ durch öffentliche Gelder der Bundesagentur finanziert wird: Was haben die Beitragszahlenden von der Arbeit des FDZ?
Müller: Die Nutzung unserer Daten ist der erste Schritt, damit eine evidenzbasierte Politikberatung stattfinden kann. Forschungsergebnisse, die auf unseren Daten basieren, können zu politischen Entscheidungen beitragen. Sie helfen, den Arbeitsmarkt in seiner Komplexität und gleichzeitigen Veränderung zu verstehen.
Wir sehen, dass die Ergebnisse aus Analysen unserer Daten in verschiedenen Berichten der Bundesregierung verwendet werden, unter anderem dem Nationalen Bildungsbericht, der Arbeitsweltberichterstattung, dem Berufsbildungsbericht, aber auch dem Familienbericht und dem Mittelstandsbericht. Auch der Sachverständigenrat zur Begutachtung der gesamtwirtschaftlichen Entwicklung greift auf unsere Daten zurück, und natürlich werden die Ergebnisse über die Medien einer breiten Öffentlichkeit zugängig gemacht. Die Ergebnisse gehen in Gesetzesvorhaben ein. Wenn dadurch Reformen vorangetrieben werden, profitieren davon am Ende auch die beitragszahlenden Bürgerinnen und Bürger.
Jungbauer-Gans: Daten stärken die Innovationskraft des Landes.
Frau Jungbauer-Gans: Wer etwas bewegen will, muss sich für den Wandel stark machen. Wie begeistert man die Politik vom Thema Forschungsdateninfrastruktur? Klingt nicht unbedingt nach einem Selbstläufer!
Jungbauer-Gans: Wir sind gerade dran, mit dem geplanten Forschungsdatengesetz. Der Politik muss klar sein, dass Daten die Innovationskraft des Landes stärken. Wir müssen der Forschung gute Bedingungen bieten. Wir sind dabei permanent im Wettbewerb mit der internationalen Forschung.
Für mich hat das Thema Dateninfrastruktur aber auch mit Nachhaltigkeit zu tun. Wenn jeder Forschende selbst Daten erheben muss, um zu Erkenntnissen zu gelangen, dann hätte das keine Nachhaltigkeit. Es sind immer zu geringe Fallzahlen, das Feld wird überfischt und niemand wäre mehr bereit, Fragen zu beantworten.
Doch ich habe den Eindruck, dass die Politik mittlerweile viel begriffen hat. Inzwischen wird eine Nationale Forschungsdateninfrastruktur in allen Disziplinen errichtet, für die die vom Rat für Sozial- und Wirtschaftsdaten akkreditierten Forschungsdatenzentren in den Sozial- und Wirtschaftswissenschaften ein Stück weit Pate gestanden haben.
Big Data war das Schlagwort in den letzten Jahren, wenn es um das große Sammeln von Daten ging. Werden solche großen Datenmengen auch für die Forschung immer wichtiger? Und welche Rolle spielt das FDZ dabei?
Jungbauer-Gans: Big Data sehe ich als interessante Möglichkeit, Daten in Bereichen zu gewinnen, die wir noch nicht so gut erschlossen haben. Das Problem ist allerdings, dass Big Data zunächst riesige, unstrukturierte und meist auch eindimensionale Datenmengen sind. Daten von Payback-Karten bilden zum Beispiel ab, wieviel ein Konsument kauft, verraten aber sonst nichts über ihn. Weder erfassen sie seine regionale Mobilität noch seinen persönlichen Hintergrund. Hier müsste eine Forscherin erst einmal eine interessante Fragestellung finden, mit der sie diesen riesigen, unstrukturierten Berg an Einzelzahlen analysieren will.
Müller: Big Data ist nicht gleich good Data.
Müller: Genau, in erster Linie hängt es vom Forschungsvorhaben ab, welche Daten sinnvoll zu nutzen sind. Big Data ist nicht gleich good Data, und die Aufwände für die Datenaufbereitung und Qualitätssicherung sind enorm. Das IAB hat etwa Mobilitätsdaten über die Smartphones von Befragten mit deren Zustimmung gesammelt. Das waren Millionen an Informationen. Diese Daten wurden aufwändig zu Mobilitätsindikatoren aufbereitet, doch die haben Grenzen – zum Beispiel Datenlücken, wenn das Smartphone ausgeschaltet war.
Hier könnte man Machine Learning ins Spiel bringen. Wie schätzen Sie die Möglichkeiten etwa von Künstlicher Intelligenz für die Datenverarbeitung allgemein und für das FDZ im Besonderen ein?
Müller: Machine Learning wenden die Nutzenden bei unseren standardisierten Daten bereits an, etwa über das Suchen von Mustern. Forschende experimentieren auch teils schon mit ChatGPT, um sich beim Schreiben von Programmcodes unterstützen zu lassen. Vielleicht kann KI künftig auch im Servicebereich helfen. Etwa, um Nutzerinnen und Nutzer zu beraten. Wir kommen an diesen Themen also nicht vorbei. Es bedarf aber einer genauen Beobachtung, wohin die Entwicklung geht und sollte auf die Bedarfe der Nutzenden ausgerichtet sein. Auch der Datenschutz muss sorgfältig bedacht werden.
Jungbauer-Gans: Mir ist wichtig, dass wir Künstliche Intelligenz nicht glorifizieren, sondern als Tool betrachten – und dabei immer hinter ihre Kulissen schauen.
Jungbauer-Gans: Mir ist wichtig, dass wir Künstliche Intelligenz nicht glorifizieren, sondern als Tool betrachten – und dabei immer hinter ihre Kulissen schauen. Wir müssen die Algorithmen verstehen und einschätzen, bevor wir KI in unsere Datenarbeit einbinden. Wie selektiert sie Daten, was bedeutet das für die Inhalte? Einfach, damit wir keine falschen Schlüsse ziehen.
Müller: Wir benötigen dringend eine gesetzliche Basis in Deutschland, die die Forschung stärkt.
Frau Müller, wenn Sie auf die nächsten 20 Jahre blicken: Wohin möchten Sie das FDZ weiterentwickeln, und wo sehen Sie die größte Herausforderung?
Müller: Zunächst einmal setze ich große Hoffnung in das Forschungsdatengesetz. Wir benötigen dringend eine gesetzliche Basis in Deutschland, die die Forschung stärkt und unsere Möglichkeiten verbessert, Daten für Forschungsfragen zu verknüpfen. Ich würde mir etwa eine Verknüpfung zwischen unseren Daten und den Daten der Familienkasse wünschen. Bis jetzt können wir in unseren administrativen Daten Erwerbsbiografien auswerten, die sich vorwiegend auf Einzelpersonen beziehen. Nun leben wir Menschen aber nicht immer allein, sondern oft in Partnerschaften und Familien. Informationen zu letzteren könnte die Familienkasse liefern, und das würde unsere Forschung deutlich weiterbringen.
Eine zweite Herausforderung, die wir gerne anpacken wollen, wäre die Verbesserung des Datenzugangs. Zum Beispiel übermitteln wir jetzt schon Daten an wissenschaftliche Einrichtungen und würden es begrüßen, wenn die Nutzenden diese Daten auch im Homeoffice auswerten könnten. Das wollen wir mit unseren Datenschützer*innen vorantreiben.
Frau Jungbauer-Gans, was möchten Sie dem FDZ für die nächsten 20 Jahre mit auf den Weg geben?
Jungbauer-Gans: Allgemein ist es wichtig, offen für Innovationen zu bleiben, hartnäckig weiter zu versuchen, die Rahmenbedingungen zu verbessern. Aber ich glaube, das muss man dem FDZ nicht extra sagen. Das tun die Kolleginnen und Kollegen dort bereits – und gehen mit gutem Beispiel für andere Datenbereiche voran.
Das FDZ der BA im IAB
Das Forschungsdatenzentrum (FDZ) der Bundesagentur für Arbeit (BA), angesiedelt im IAB, spielt eine entscheidende Rolle für externe Wissenschaftlerinnen und Wissenschaftler, die sich der nicht kommerziellen Forschung im Bereich der Sozialversicherung sowie der Arbeitsmarkt- und Berufsforschung widmen. Es dient als Bindeglied zwischen den Datenproduzenten BA und IAB und den Nutzenden im In- und Ausland für den Zugang zu relevanten Daten.
Gegründet vor 20 Jahren mit dem Ziel, den Informationsaustausch zwischen Wissenschaft und Statistik zu verbessern, fungiert das FDZ heute als Serviceeinrichtung. Seine Mission besteht darin, den Zugang zu Mikrodaten der BA und des IAB für die nicht kommerzielle empirische Forschung transparent und standardisiert zu gestalten.
Das FDZ bietet nicht nur Zugriff auf Daten, sondern unterstützt Forschende auch bei der Auswahl, dem Zugang und der Handhabung von Daten. Beratungsdienste erstrecken sich über Analysemöglichkeiten, Reichweite und Gültigkeit der Daten. Im zweiten Halbjahr 2023 machten insgesamt 1.409 Forschende von den Datenprodukten des FDZ Gebrauch. Das FDZ ist jedoch nicht nur ein Bereitsteller von Daten, sondern betreibt auch selbst empirische Forschung. Dabei stehen Themen wie die Verknüpfung von Prozess- und Umfragedaten, die Internationalisierung des Datenzugangs sowie inhaltliche Analysen zur Arbeitsmarktforschung im Fokus. Die Forschung im FDZ trägt zur Verbesserung der Datenbereitstellung und zur Qualitätssicherung der Daten bei.
Bild: beeboys/stock.adobe.com;
doi: 10.48720/IAB.FOO.20240409.01
Keitel, Christiane; Winters, Jutta; Deckbar, Laura (2024): „Das Forschungsdatenzentrum geht mit gutem Beispiel für andere Datenbereiche voran“, In: IAB-Forum 9. April 2024, https://www.iab-forum.de/das-forschungsdatenzentrum-geht-mit-gutem-beispiel-fuer-andere-datenbereiche-voran/, Abrufdatum: 21. January 2025
Diese Publikation ist unter folgender Creative-Commons-Lizenz veröffentlicht: Namensnennung – Weitergabe unter gleichen Bedingungen 4.0 International (CC BY-SA 4.0): https://creativecommons.org/licenses/by-sa/4.0/deed.de
Autoren:
- Christiane Keitel
- Jutta Winters
- Laura Deckbar