FAIRmat-Konzept als "Perspektive" in „Nature“

27. April 2022

Seit 2020 entwickelt das Fritz-Haber-Institut der Max-Planck-Gesellschaft zusammen mit anderen Universitäten und Forschungsinstituten eine KI-gestützte Forschungsdatenbank für den Bereich der Materialwissenschaften und der Festkörperphysik. In einem aktuellen „Perspektiven“-Beitrag in der Wissenschaftszeitschrift „Nature“ stellen die beteiligten Wissenschaftler:innen das Konzept ihrer Daten-Infrastruktur FAIRdi vor.
 

„Nature“ ist eine der weltweit meistgelesenen und renommiertesten multidisziplinären wissenschaftlichen Zeitschriften. Eine besondere Komponente von Nature sind die "Perspectives". Dabei handelt es sich um eher zukunftsorientierte Beiträge, die zur Diskussion und zu neuen wissenschaftlichen Ansätzen anregen sollen. Im Anschluss an die internationale Konferenz über eine FAIR-Dateninfrastruktur im Sommer 2020 wurde die Leitung von FAIRmat von der nature-Redaktion eingeladen, eine "Perspektive" zu schreiben, in der sie ihre zukunftsweisenden Konzepte für die revolutionären Auswirkungen der datenzentrierten Forschung in der Materialwissenschaft und der chemischen Physik fester Stoffe beschreibt.

Wohlstand und Lebensstil unserer Gesellschaft hängen in hohem Maße von den Errungenschaften der Physik der kondensierten Materie, der Chemie und der Materialwissenschaften ab, denn neue Produkte für die Bereiche Energie, Umwelt, Gesundheit, Mobilität, IT usw. beruhen weitgehend auf verbesserten oder sogar neuartigen Materialien. Beispiele hierfür sind Festkörperbeleuchtung, Touchscreens, Batterien, Implantate, Arzneimittelverabreichung und vieles mehr. Die enormen Mengen an Forschungsdaten, die täglich in diesem Bereich produziert werden, stellen eine „Goldmine des 21. Jahrhunderts“ dar. Diese „Goldmine“ ist jedoch von geringem Wert, wenn diese Daten nicht umfassend charakterisiert und verfügbar gemacht werden. Hierzu bedarf es einer effizienten und gut nutzbaren Forschungsdatenbank. Diese hat das Fritz-Haber-Institut der Max-Planck-Gesellschaft zusammen mit anderen Forschungspartnern seit 2020 mit der Datenbank „FAIRdi“ entwickelt. Das Akronym FAIRdi steht dabei für Findable, Accessible, Interoperable and Reusable Data-Infrastrukture (auffindbar, zugänglich, interoperabel und wiederverwendbar). Hierdurch sollen die bereits erhobenen Daten problemlos gemeinsam genutzt und mit Methoden der Datenanalyse und künstlichen Intelligenz (KI) erforscht werden. In dem „Perspektiven“-Beitrag wird dargestellt, wie dies für den Bereich der Materialwissenschaften (FAIRmat) verwirklicht werden kann. Zu den Autor:innen gehören Wissenschaftler:innen der beteiligten deutschen Hochschulen wie die Humboldt-Universität zu Berlin, die TU München und TU Dresden, die Universitäten Kaiserslautern und Ulm, das Karlsruher Institut für Technologie sowie aus drei Max-Planck-Instituten, einer Leibniz- und einer Helmholtz-Einrichtung (s. ausführlicher Publikationsnachweis).

Wichtige Voraussetzung für diese Datenbank im Bereich der Materialwissenschaften, ist, die  experimentellen (oder rechnerischen) Bedingungen und die Ergebnisse in allen Einzelheiten auch tatsächlich so zu dokumentieren, dass die Studien reproduzierbar sind und die Datenerhebung (einschließlich der umfassende Charakterisierung des Versuchsaufbaus) so weit wie möglich wie möglich automatisiert werden. Dies klingt wie eine veraltete Forderung, aber sie wurde bisher nicht konsequent umgesetzt worden, und ist für eine datenzentrierte Wissenschaft unerlässlich.

Zudem erfordert dies eine enge Zusammenarbeit zwischen Expert:innen aus den Bereichen Datenwissenschaft, IT-Infrastruktur, Software-Engineering und den Materialwissenschaften als gleichberechtigte Partner. In FAIRmat wird dies durch einen zentralen Knotenpunkt von Spezialist:innen am Fachbereich Physik der Humboldt-Universität zu Berlin realisiert. Darüber hinaus ist eine Hardware für Datenspeicherung und -verarbeitung, fortgeschrittene Analysen und Hochgeschwindigkeitsnetzwerke Grundvoraussetzung für den Aufbau der beschriebenen Dateninfrastruktur aufzubauen. Ferner wird eine „Middleware“, z.B. für den effizienten Austausch von Daten, die in oder von verschiedenen digitalen Umgebungen erzeugt werden, benötigt. Schließlich werden auch neue Software-Tools entwickelt, zum Beispiel für die Anpassung von Daten, die Entfernung von Rauschen aus Daten und das Lernen von Regeln, die hinter Mustern in Daten stehen. Mit solchen Tools, kann man auch auch "Materialgene" identifizieren, d. h. physikalische Parameter, die mit den Prozessen in Verbindung stehen, die eine bestimmte Materialeigenschaft oder Funktion auslösen, erleichtern oder behindern. FAIRmat wird die die internationale Koordination solcher Werkzeugentwicklungen in der breiteren materialwissenschaftlichen Gemeinschaft fördern.

Mit FAIRmat wird damit eine Digitalisierungslücke im Bereich der Materialwissenschaften geschlossen, wie dies beispielsweise im Bereich der Biowissenschaften durch Einführung digitaler Bibliotheken schon geschehen ist.

Zur Redakteursansicht