Robuste Dateninfrastruktur für die Katalyseforschung
Forschende der Abteilung Anorganische Chemie am Fritz-Haber-Institut haben gemeinsam mit Partnern von FAIRmat, einem Projekt der nationalen Forschungsdateninfrastruktur (NFDI), ein Repositorium für das standardisierte Management experimenteller Katalysedaten entwickelt. Die Plattform ermöglicht einen zuverlässigen Datenaustausch und bietet eine gut fundierte Grundlage für KI-gestützte Analysen.
Wichtige Aspekte:
- Die neue Catalysis App: Das Team stellt ein Repositorium für standardisierte Daten der experimentellen Katalyseforschung innerhalb der NOMAD‑Plattform bereit.
- Die Motivation hinter der App: Katalysatoren sind für die chemische Industrie von großer Bedeutung und für die Dekarbonisierung unserer Wirtschaft unerlässlich. Der Einsatz moderner Methoden der Datenverarbeitung könnte die Entwicklung verbesserter und neuer Katalysatoren beschleunigen. Allerdings sind bislang veröffentlichte experimentelle Daten hierfür häufig ungeeignet oder müssen aufgrund von Inkonsistenzen infolge fehlender einheitlicher Standards aufwendig aufbereitet werden.
- Ausblick: Die Catalysis App ermöglicht das Teilen standardisierter Daten und schafft so eine solide Grundlage für die weitere KI-gestützte Analyse und Nutzung. Die Autoren ermutigen die Community, die neue Plattform zu erkunden und Feedback zu geben, denn die Leistung und der Wert der App steigen erheblich mit dem Umfang, der Vielfalt und der Qualität der Daten, die sie hostet.
Der Umgang mit großen Datenmengen aus der Forschung
Digitale Forschungsdaten bilden eine wesentliche Grundlage der wissenschaftlichen Arbeit. Ob im Labor oder am Computer – in der Wissenschaft entstehen große Datenmengen. Moderne Forschungseinrichtungen benötigen daher effektive Konzepte für das Management ihrer Daten, um Qualität, Nachvollziehbarkeit und langfristige Wiederverwendbarkeit der Daten gemäß den FAIR-Prinzipien sicherzustellen. FAIR steht für die Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit digitaler Ressourcen (FAIR: Findability, Accessibility, Interoperability and Reusability).
Aus wissenschaftspolitischer Sicht besteht das vorrangige Ziel des Forschungsdatenmanagements darin, Transparenz und Nachvollziehbarkeit in der Forschung zu fördern und durch die Wiederverwendung von Forschungsdaten Doppelarbeit zu vermeiden. Somit ist das Forschungsdatenmanagement ein zentraler Bestandteil guter wissenschaftlicher Praxis.
Die neue Catalysis App in der NOMAD Plattform
Die Untersuchung und Entwicklung neuer Katalysatoren ist ein wichtiges Forschungsgebiet in der Chemie und den Materialwissenschaften. Die Suche nach neuen Katalysatoren ist jedoch oft kostspielig und arbeitsintensiv. Moderne Methoden der Datenwissenschaft könnten die Entdeckung und Optimierung neuer und verbesserter Katalysatoren beschleunigen. Die Archivierung und Bereitstellung experimenteller Forschungsdaten sind daher von besonderem Interesse. Bislang nämlich sind datengetriebene Entdeckungen in der Katalyseforschung noch stark eingeschränkt, da nicht ausreichend maschinenlesbare experimentelle Daten zur Verfügung stehen. Zwar gibt es bereits Repositorien für Katalysedaten, jedoch sind diese unzureichend strukturiert und noch nicht ausreichend mit Metadaten ausgestattet, um sie für KI leicht nutzbar zu machen
Die webbasierte Open-Source-Plattform NOMAD (https://nomad-lab.eu/) eignet sich bestens für die Einrichtung eines Repositoriums für standardisierte experimentelle Katalysedaten. Innerhalb dieser Plattform haben die Autoren ein KI‑taugliches Katalyse‑Plugin entwickelt, das die Datenarchivierung in der Katalyse gemäß den FAIR-Prinzipien ermöglicht. Die Catalysis‑App ist jetzt einsatzbereit — siehe https://nomad-lab.eu/prod/v1/gui/search/heterogeneouscatalyst.
Nutzung der Catalysis App
Die Benutzeroberfläche des Katalyse-Plugins in NOMAD ist so gestaltet, dass Informationen aus verschiedenen Perspektiven abgerufen werden können. So lässt sich etwa ermitteln, welche chemischen Elemente oder Zusammensetzungen gute Katalysatoren für eine gewünschte chemische Reaktion bilden. Alternativ können User abfragen, welche Produkte aus bestimmten Ausgangsverbindungen mit welchem Katalysator entstehen. Darüber hinaus lassen sich viele weitere Parameter filtern, etwa Synthesemethode oder Art des Katalysators (z. B. Trägerkatalysator, Formkörper oder Dünnschicht) oder bestimmte Reaktionsbedingungen. Auf diese Weise können User gezielt nur nach Hochdruckreaktionen oder ausschließlich nach Anwendungen bei niedrigen Temperaturen suchen.
Ein zentraler Vorteil der App ist ihre Funktion zur Datenvisualisierung. Einige Diagrammtypen sind in der App vordefiniert, aber User können auch eigene grafische Darstellungen erstellen.
Daten können sowohl manuell als auch automatisch über die Anwendungs-Programmier-Schnittstelle (API) hochgeladen werden. Die Autoren entwickelten zudem eigens Schemata, also Datenstrukturen, für typische Datensätze in der Katalyse. Außerdem entwarfen sie Excel-Tabellenvorlagen, die sich direkt einlesen lassen und es den Usern ermöglichen, ihre Daten in einem Format einzugeben, mit dem die meisten Forschenden vertraut sind.
Beispieldaten zu häufig untersuchten katalytischen Reaktionen sind in der App verfügbar. Die Autorinnen und Autoren danken den zahlreichen Katalyseforschenden für ihre Unterstützung bei der Erstellung dieser Daten.
Ausblick und Aufruf zum Feedback
Das neue Repositorium unterstützt den Austausch von Katalysedaten und ermöglicht KI-gestützte Analysen. Da der Wert einer Plattform wie der Catalysis App erheblich mit dem Umfang, der Vielfalt und der Qualität der von ihr beherbergten Daten steigt, ermutigen die Autoren die Community, das neue Tool zu erkunden und seine Leistungsfähigkeit zu testen. Sie begrüßen konstruktives Feedback, um die App weiterzuentwickeln und sicherzustellen, dass sie den Bedürfnissen der Forschenden gerecht wird.
Mehr über NOMAD
“NOMAD” steht für “Novel Materials Discovery” und ist ein Projekt des Forschungsdatenmanagement. Es umfasst eine kostenlose, Open-Source Weboberfläche zur Verwaltung von Daten aus den Materialwissenschaften. Das Projekt wurde von Claudia Draxl (HU Berlin) und Matthias Scheffler, ehemals Direktor der Theorieabteilung des FHI, initiiert und begann 2014 mit dem NOMAD Repository. Seitdem ist das Projekt stetig gewachsen und wird heute im Rahmen von FAIRmat gehostet und weiterentwickelt. FAIRmat ist das Konsortium für Forschungsdatenmanagement in den Bereichen kondensierte Materie und chemische Physik fester Stoffe innerhalb der Nationale Forschungsdaten-Infrastruktur (NFDI). https://nomad-lab.eu/nomad-lab/nomad-lab.html













