IBM Research und Science of Synthesis von Thieme Chemistry
Kooperation bringt Forschung und Entwicklung in der organischen Chemie voran
Stuttgart – IBM führte im Jahr 2018 die Cloud-Plattform RXN for Chemistry ein, um Forschern im Bereich der synthetischen organischen Chemie dabei zu helfen, mithilfe eines Modells der künstlichen Intelligenz (KI), genannt „Molecular Transformer“, das Ergebnis chemischer Reaktionen vorherzusagen. Bis heute wurden über die Plattform knapp 4 Millionen Vorhersagen für 26 000 Nutzer erstellt und verschiedene Gruppen aus der ganzen Welt haben dieselbe zugrunde liegende Technologie für mehr als 100 Veröffentlichungen eingesetzt.
Eine Voraussetzung für optimale Vorhersageergebnisse sind hochwertige Datensätze. Bis vor kurzem wurde RXN for Chemistry mit 2,5 Millionen Datensätzen trainiert, die aus Patenten stammen oder chemischen Reaktionen wie aus dem Lehrbuch entsprechen. Die Basismodelle erreichten bei Tests zur repräsentativen Chemie der Trainingsdaten eine Genauigkeit von über 90 Prozent. Dem Team von IBM war jedoch klar, dass das Angebot auf zusätzliche Reaktionsklassen erweitert werden musste, um daraus ein Standardwerkzeug für die Forschung zu machen.
Anfang dieses Jahres haben IBM Research und Thieme Chemistry Synthesedaten aus Thiemes kuratiertem, digitalem Nachschlagewerk zur organischen Chemie – Science of Synthesis – in RXN for Chemistry integriert. Erste Ergebnisse zeigen, dass die auf Basis von Fachinhalten aus Science of Synthesis trainierten Modelle doppelt so oft korrekte Reaktionen vorhersagen wie die Basismodelle.
Erste Ergebnisse der Vorhersage einer Hinreaktion zu zwei Reaktionen aus Science of Synthesis.
"Die Herausforderung für organische Chemiker*innen besteht darin, dass es Hunderttausende von möglichen Reaktionen organischer Verbindungen gibt. Genau hier setzen wir an und haben Modelle zur Verarbeitung natürlicher Sprache für alle RXN-Vorhersageaufgaben verwendet. Die RXN-Modelle basieren dabei nicht auf kodifizierten, chemischen Regeln. Jede chemische Vorhersage basiert auf dem Wissen, das beim Training auf Datenbasis gelernt wurde. Mit KI, Cloud und Automatisierung können wir heute die Forschung und Entwicklung in der organischen Chemie um den Faktor zehn beschleunigen", erklärt Dr. Teodoro Laino, Distinguished Scientist bei IBM Research Europe.
RXN for Chemistry wendet Modelle der neuronalen maschinellen Übersetzung an, um das Ergebnis einer chemischen Reaktion vorherzusagen, ganz ähnlich wie ein KI-Modell Texte von einer Sprache in eine andere übersetzt. Das Ziel dieser KI-Plattform ist es, zuverlässige Vorhersagen für Reaktionsergebnisse zu treffen und somit die Syntheseplanung in der organischen Chemie zu verbessern.
Mit gut strukturierten und hochwertigen Daten technische Innovationen vorantreiben
"Werkzeuge zur Übersetzung von einer Sprache in eine andere sind nur so gut wie die Daten, auf deren Grundlage die Algorithmen trainiert werden", so Dr. Alain Vaucher, Research Scientist bei IBM. "Wir gehen davon aus, dass dies auch für die Vorhersage von chemischen Synthese-Resultaten gilt: Die Ergebnisse hängen sehr stark von den zugrunde liegenden Daten ab."
„Wir freuen uns, unmittelbar an diesem innovativen Projekt beteiligt zu sein, das für die Gemeinschaft der Chemie sehr wichtig ist“, erzählt Dr. M. Fiona Shortt de Hernandez, Senior Director Product Management, Strategic Partnerships and Science of Synthesis bei Thieme Chemistry. „Sechs hochrenommierte Expert*innen für organische Synthese und ihre Forschungsgruppen haben zugesagt, die neu trainierten Modelle zu testen. Diese Zusammenarbeit wird dazu beitragen, die Entwicklung moderner, maßgeschneiderter Werkzeuge für die organische Chemie voranzutreiben“, bekräftigt Shortt.
„Die Aufnahme der hochwertigen, sorgsam gepflegten Daten aus Science of Synthesis bietet uns die einmalige Gelegenheit, die Leistung von RXN for Chemistry auf ein noch nie dagewesenes Niveau zu heben. Ich freue mich sehr, diese vorläufigen Ergebnisse bekanntzugeben, und bin gespannt, wie sie in den nächsten Monaten zu einem verbesserten KI-Erlebnis für Forscher in der synthetischen organischen Chemie führen werden. Die Zusammenarbeit mit Thieme ist ein wichtiger Meilenstein für Anbieter von KI-Lösungen und Herausgeber von fachspezifischen Daten. Für beide ergeben sich interessante Geschäftsmöglichkeiten,“ so Laino.
Wären Sie daran interessiert, die auf Basis von Daten aus Science of Synthesis trainierte Plattform RXN for Chemistry als Cloud-Service zu nutzen, wenn diese später verfügbar sein sollte? Bitte kontaktieren Sie uns gerne unter ibmrxn@thieme-chemistry.com.
RXN for Chemistry von IBM steht hier kostenlos zur Verfügung: https://rxn.res.ibm.com