Der 4. Ontologies4Chem-Workshop, organisiert von NFDI4Chem in Zusammenarbeit mit NFDI4Cat, dem Beilstein-Institut und der Physical Sciences Data Infrastructure (PSDI) organisiert wurde, fand vom 11. bis 13. November 2025 in Limburg an der Lahn, Hessen, erstmals als Präsenzveranstaltung statt. Die Veranstaltung kombinierte Vorträge mit umfangreichen praktischen „Hacking”-Sessions am Nachmittag.
Das Hauptziel des Workshops war die Weiterentwicklung eines gemeinsamen, von der Community verwalteten „Ontologie-Kanons“, verstanden als eine Reihe empfohlener chemischer Ontologien für die Metadaten-Annotation und das FAIR-Datenmanagement in der gesamten Chemie-Community. Über dieses Kernziel hinaus legte der Workshop auch großen Wert auf die Vernetzung und bot eine wichtige Plattform, um relevante Interessengruppen zusammenzubringen und den Austausch und die Zusammenarbeit innerhalb der Community zu fördern.
Wichtige Themen und Diskussionen
Auf dem Weg zu einem Kanon der Chemie-Ontologie
In den Präsentationen und Diskussionen tauchte immer wieder ein Thema auf, das die Notwendigkeit eines gemeinsamen, von der Community vereinbarten Ontologie-Kanons hervorhob, um die Fragmentierung zu verringern und die Interoperabilität chemischer Daten zu verbessern. Auf der Grundlage der Beiträge von NFDI4Chem und der während der Diskussionen gewonnenen Erkenntnisse wurde der NFDI4Chem Terminology Service (TS) als geeignete Umgebung für die Dokumentation und Verwaltung eines solchen Kanons vorgeschlagen. Der TS bietet Funktionen wie eine integrierte Problemverfolgung, die direkt mit Ontologie-Repositorien verknüpft ist, sowie benutzerspezifische Notizen zur Erfassung von Metadaten zur Ontologieverwendung, darunter welche Projekte bestimmte Ontologien verwenden, wie Begriffe angewendet werden und wo noch Lücken bestehen.
Die Teilnehmer*innen wurden gebeten, ihre eigenen realen Daten oder Kontexte beizusteuern, beispielsweise kommentierte chemische Daten oder Beschreibungen ihrer Ontologieverwendung, Hindernisse und fehlende Ontologien, um den Kanon einem Stresstest zu unterziehen und zu verbessern.

Ontologische Darstellung chemischer Reaktionen
Während des Workshop-Teils zum Thema „chemische Reaktionen“ konzentrierten sich die Diskussionen darauf, wie Reaktionen in Ontologien über die bloße Darstellung von Reaktanten und Produkten hinaus reichhaltiger dargestellt werden können.
Zwar wurden bestehende Ressourcen (z. B. Reaktionsontologien und Datenbanken) als nützliche Grundlagen anerkannt, doch herrschte Einigkeit darüber, dass der semantische Umfang erweitert werden muss, um Reaktionsrollen (z. B. Katalysator oder Reagenz), Bindungsänderungen, Mechanismen, Zwischenprodukte und Reaktionsbedingungen zu erfassen. Dies würde differenziertere, maschinell verarbeitbare Reaktionsbeschreibungen ermöglichen.
Es wurde die Idee einer Reaktionsontologie der nächsten Generation diskutiert, die potenziell umfassendere Reaktionsmetadaten, eine bessere FAIR-Annotation von Reaktionsdatensätzen und eine verbesserte Interoperabilität ermöglichen könnte.
Ontologische Darstellung chemischer Einheiten
Im Bereich der chemischen Entitäten befasste sich die Community erneut mit dem Status und der Zukunft weit verbreiteter Ontologien wie ChEBI (Chemical Entities of Biological Interest). Während ChEBI als zentrale Referenzontologie anerkannt wurde, konzentrierte sich die Diskussion darauf, ihren Anwendungsbereich über biologische Moleküle hinaus zu erweitern, um Mischungen, Materialien, Salze, racemische Gemische, Makromoleküle usw. besser abzubilden.
Die Präsentation von CHEMROF zeigte ein semantisches Schema zur Darstellung einzelner chemischer Einheiten (z. B. Elemente, Moleküle, Ionen), ihrer Gruppierungen (z. B. Stoffklassen, Mischungskomponenten) und reaktionsbezogener Konstrukte. Das Framework zielt nicht nur auf reine Verbindungen ab, sondern auch auf Gemische und reaktionsbezogene Informationen, sodass es Anwendungsfälle aus den Bereichen der Kleinmolekülchemie und der Werkstoffe unterstützen und als übergeordnetes Schema für Ontologien wie ChEBI dienen kann.
Ein weiterer Beitrag war ein Ensemble-Ansatz namens Chebifier 2, der regelbasierte, Deep-Learning- und LLM-basierte Klassifizierung kombiniert, um chemische Einheiten automatisch in ChEBI-Klassen (derzeit über 1.700) zu klassifizieren.
Darüber hinaus wurde die Einführung des verbesserten Einreichungsportals für ChEBI beschrieben. Das Portal ermöglicht eine gemeinschaftliche Kuratierung, was ein wichtiger Schritt ist, um die Ontologie auf dem neuesten Stand zu halten und auf die Bedürfnisse der Gemeinschaft einzugehen.
Zusammenarbeit, Tools und Infrastrukturintegration
Der Workshop betonte, dass die Entwicklung und Pflege eines robusten Ontologie-Kanons sowohl eine gesellschaftliche als auch eine technische Aufgabe ist, die eine koordinierte Verwaltung, Governance und die Zustimmung der Gemeinschaft erfordert.
Die Integration von Ontologien in Forschungsdateninfrastrukturen und Datenmanagement-Tools war ein wiederkehrendes Thema, beispielsweise die Verknüpfung der Ontologieverwendung mit Metadaten-Frameworks, um sicherzustellen, dass Forschungsdaten (experimentelle und rechnergestützte) von Anfang an konsistent annotiert und FAIR gemacht werden können.
Die Teilnehmer*innen wurden dazu ermutigt, reale Daten zu verwenden, um Ontologien zu testen, Probleme zu melden, fehlende Ontologien vorzuschlagen und zum TS beizutragen, um so den Kanon praktischer und gemeinschaftsorientierter zu gestalten.
Bedeutung und Ausblick
Die Zusammenstellung eines von der Community gepflegten Ontologie-Kanons für die Chemie sowie moderne Ontologie-Engineering-Tools und -Infrastrukturen sind ein wichtiger Schritt hin zu einer verbesserten semantischen Interoperabilität bei chemischen Forschungsdaten. Ein robuster, kuratierter Kanon in Verbindung mit einem sich weiterentwickelnden ChEBI (und verwandten Ontologien) würde Folgendes ermöglichen:
- zuverlässigere Integration chemischer Daten aus verschiedenen Quellen (Experimente, Berechnungen, Literatur),
- reichhaltigere und präzisere Modellierung von Reaktionen, Entitäten, Materialien und Gemischen,
- einfachere FAIR-Annotation, gemeinsame Nutzung und Wiederverwendung chemischer Datensätze sowie
- Größere Bereitschaft für KI-gestützte Forschung und maschinelles Lernen im Bereich semantischer chemischer Daten.
Dank der zunehmenden Zusammenarbeit zwischen NFDI4Chem, NFDI4Cat, PSDI und anderen Partnern ist die Community gut aufgestellt, um bedeutende Fortschritte zu erzielen, und der 4. Workshop macht deutlich, dass die Ontologieentwicklung in der Chemie in eine neue, reifere Phase eintritt.
Der Workshop-Bericht wird in Kürze veröffentlicht, und die Planung für den 5. Ontologies4Chem-Workshop im Jahr 2026 hat bereits begonnen.
