Künstliche Intelligenz in der Chemie

Kaum ein Begriff hat 2023 so hohe Wellen geschlagen wie AI (Artificial Intelligence) oder deutsch KI (Künstliche Intelligenz). Tiefe neuronale Netze in Form großer Sprachmodelle haben erstaunliche Leistungen bei Frage-Antwort-Spielen, bei der Generierung von Text und sogar bei der Lösung von Prüfungsaufgaben gezeigt. In der Wissenschaft haben Anwendungen in der medizinischen Bildinterpretation oder 3D-Strukturvorhersage von Proteinen Schlagzeilen gemacht.

In der Chemie sind KI-Technologien unterschiedlicher Komplexität bereits seit einiger Zeit integriert. Dabei beruhen nicht alle diese Techniken immer auf künstlicher Intelligenz. Eine brauchbare Abgrenzung ist es, ab dem Einsatz von tiefen neuronalen Netzen von KI zu sprechen. Diese Entwicklung bietet eine Vielzahl von Anwendungen, wie

  • Vorhersage chemischer Eigenschaften: KI-Algorithmen können große Mengen chemischer Daten analysieren und Vorhersagen über Eigenschaften wie Reaktivität, Löslichkeit und Toxizität treffen. Dies erleichtert die Identifizierung vielversprechender Kandidaten für Arzneimittel, Katalysatoren und Materialien.
  • Rationales Wirkstoffdesign: Durch die Kombination von KI mit computergestütztem Design können Forscher gezielt Moleküle entwerfen, die spezifische biologische Targets ansprechen. Dies beschleunigt den Prozess der Arzneimittelentwicklung und minimiert gleichzeitig die Kosten und den Ressourcenverbrauch.
    (https://link.springer.com/chapter/10.1007/978-3-658-33597-7_6)
  • Automatisierte Syntheseplanung: KI kann komplexe Syntheserouten analysieren und optimieren, um effiziente Wege zur Herstellung von Zielverbindungen zu identifizieren. Durch die Integration von maschinellem Lernen kann der Syntheseprozess weiter verbessert werden, indem frühere Erfahrungen und Reaktionstrends berücksichtigt werden. (https://www.nature.com/articles/nature25978)
  • Materialdesign und -optimierung: In der Materialwissenschaft ermöglicht KI die Vorhersage neuer Materialien mit maßgeschneiderten Eigenschaften für Anwendungen in Bereichen wie Energie, Elektronik und Katalyse. Dies beschleunigt die Entwicklung innovativer Materialien und trägt zur Lösung globaler Herausforderungen bei.

All diese Anwendungsbeispiele haben eine Gemeinsamkeit: große Datensätze. Immer müssen die neuronalen Netze trainiert werden, und zwar mit sehr großen Mengen offen zugänglicher, strukturierter Daten.

Da, wo KI erfolgreich sind, beispielsweise mit Alphafold im Bereich der Protein-Struktur-Vorhersage, lagen große Datenmengen offen vor, z.B. in der Protein Data Bank. In der Chemie stellen große offene Datenbanken hingegen eher eine Ausnahme dar. Dieser inzwischen Jahrzehnte andauernde Mangel an offenen, kuratierten Forschungsdaten, verursacht durch eine verbreitete Kultur der Fehlerangst, mangelnden Teilungsbereitschaft oder Unwissenheit, ist eines der größten Hemmnisse beim Einsatz von KI in der Chemie.

Siehe:

Längst sind Gegenbewegungen entstanden. Plan S ist ein internationaler Zusammenschluss von Geldgebern, die die Open-Access-Veröffentlichung zur Bedingung ihrer Förderung machen, auch die DFG erwartet dies. Mit der Nationalen Forschungsdateninfrastruktur, finanziert von der DFG und umgesetzt durch den NFDI e.V. sowie deren fachspezifischen Konsortien wie der NFDI4Chem, wird daran gearbeitet, neben den kulturellen auch die technischen Möglichkeiten zu schaffen, chemische Daten über den gesamten Data Lifecycle digital verarbeiten zu können.

Und weil offene Daten nicht zwingend auch FAIRe (findable, accessible, interoperable, reusable) Daten sind, bieten wir viele Workshops und andere Schulungsangebote, damit Daten strukturiert und maschinenlesbar sind. 

KI wird nicht alle Antworten liefern. Aber sie wird den Weg zur Erkenntnis in vielen relevanten Bereichen der Chemie erheblich verkürzen. Wer in Zukunft von den Möglichkeiten dieses Wissenszuwachses profitieren will, kann schon jetzt seinen Beitrag leisten und seine Forschungsdaten offen und FAIR veröffentlichen. Denken Sie immer an den Titel eines Vortrags von unserem Mitglied Paul Czodrowski (gehalten auf den Chemistry Data Days 2023 in Mainz): „No Data, no AI-Party“ 😉