Kooperation zwischen IBM Research Europe und Thieme Chemistry vereint maschinelles Lernen und hochwertig kuratierte, chemische Synthesedaten

Stuttgart, November 2021 - Die in diesem Sommer bekannt gegebene Kooperation zwischen IBM Research Europe und Thieme Chemistry hat das Ziel, Synthesevorhersagen in der organischen Chemie zu verbessern: Die Cloud-Plattform RXN for Chemistry von IBM basiert auf künstlicher Intelligenz (KI) und wurde kürzlich mit den strukturierten, kuratierten Datensätzen aus Science of Synthesis und Synfacts von Thieme trainiert. IBM Research Europe und Thieme Chemistry geben nun die ersten Ergebnisse ihrer Zusammenarbeit bekannt. Das Projekt wird von sieben renommierten Expert*innen für synthetische Chemie und ihren Forschungsgruppen aus China, Deutschland, der Schweiz, Neuseeland und den USA begleitet und evaluiert. 

Organische Verbindungen können auf hunderttausende verschiedene Arten miteinander reagieren. Erfahrungswissen ist für organische Chemiker*innen dabei der Schlüssel, um langwierige und fehleranfällige Versuchsreihen im Labor zu vermeiden. Um die Syntheseplanung zu verbessern, haben IBM Research und Thieme Chemistry die von Expert*innen kuratierten Datensätze aus Thiemes kuratiertem und digitalem Nachschlagewerk für organische Chemie, Science of Synthesis, und die geprüften Inhalte aus der Zeitschrift Synfacts mit dem Modell der künstlichen Intelligenz namens Molecular Transformer in RXN for Chemistry von IBM kombiniert.

Die Wissenschaftler*innen entwickelten den Molecular Transformer, ein neuronales maschinelles Übersetzungsmodell, um das Ergebnis chemischer Reaktionen zuverlässig vorherzusagen. IBM erweiterte das Modell später mit einer Funktion für die retrosynthetische Analyse. Das Modell hat sich als sehr erfolgreich beim Erlernen der Informationen erwiesen, die in Datensätzen chemischer Reaktionen enthalten sind. Die Qualität der Datensätze spielt hier eine entscheidende Rolle.

Hohe Vorhersagegenauigkeit

Science of Synthesis und Synfacts decken einen großen Bereich möglicher chemischer Reaktionen ab. Modelle, die auf der Grundlage kommerziell verfügbarer Patentdatensätze trainiert wurden, schneiden bei vielen dieser Reaktionen in der Regel schlecht ab. Science of Synthesis und Synfacts weisen eine höhere Qualität der chemischen Datensätze auf. Die hohe Qualität der Thieme Ressourcen erleichtert den Lernprozess der KI-Modelle und führt zu konsistenteren Vorhersagen: Die Ergebnisse zeigen, dass die von Thieme trainierten Modelle auf der RXN for Chemistry-Plattform die Genauigkeit bei Vorhersagen von Vorwärtsreaktionen um das Dreifache und bei Retrosynthesen um das Neunfache erhöhen.

Die Zusammenarbeit zwischen Thieme und IBM Research Europe zeigt, welchen Einfluss hochwertige chemische Reaktionsdaten auf zukünftige KI-Tools für die chemische Synthese haben können. Die Integration hochwertiger, kuratierter Daten von Science of Synthesis und Synfacts bietet eine einzigartige Möglichkeit, die Leistung von RXN for Chemistry von IBM entscheidend zu verbessern.

Aufschlussreiches Feedback von Expert*innen für synthetische Chemie

Sieben renommierte Expert*innen für organische Synthese und ihre Forschungsgruppen aus der ganzen Welt haben sich bereit erklärt, die neu trainierten Modelle zu evaluieren. Die Wissenschaftler*innen werden IBM Research Europe und Thieme im Rahmen dieser Zusammenarbeit dabei auch weiterhin aufschlussreiches Feedback geben – ein einzigartiges Forum für den Austausch zwischen Expert*innen für maschinelles Lernen und der Gemeinschaft der synthetischen organischen Chemie:

“This innovative IBM/Thieme Chemistry platform provides an efficient tool for synthetic chemistry researchers to provide validation for their own retrosynthetic plans whilst also being presented with alternative solutions. It enables a rigorous assessment for the retrosynthetic design phase of a given synthesis which no doubt will pay dividends when the selected synthetic plan is implemented.”

Prof. Dame Margaret Brimble (University of Auckland, New Zealand)

“A sustainable future for synthesis will include minimizing the number of unproductive strategies that are pursued by running only those reactions that lead to a productive end. This is only possible through the marrying of computer designed and human designed efforts, which makes this collaboration with IBM and Thieme Chemistry exciting."

Prof. Richmond Sarpong (University of California, Berkeley, USA)

An den Tests der neu trainierten Modelle waren auch Prof. Alois Fürstner (MPI Mülheim, Deutschland), Prof. Karl Gademann und Prof. Cristina Nevado (Universität Zürich, Schweiz), Prof. Ang Li (Shanghai Institute of Organic Chemistry, China), Prof. Dirk Trauner (New York University, USA) und ihre Forschungsgruppen beteiligt.

-------------------------

Am 1. Dezember 2021 hosten IBM Research Europe und Thieme Chemistry ein kostenloses Web-Seminar, in dem die Ergebnisse ihrer Zusammenarbeit vorgestellt werden. Die Teams werden die Leistung von Sprachmodellen, die auf den hochwertigsten kommerziell verfügbaren Datensätzen (Science of Synthesis und Synfacts) trainiert wurden, mit der Leistung von öffentlich zugänglichen Patentreaktionsdatensätzen vergleichen, wobei ein besonderer Schwerpunkt auf der Vorhersage von retrosynthetischen und chemischen Prozessen liegt.

Wenn Sie an einer Teilnahme interessiert sind, melden Sie sich bitte hier an: Web-Seminar "Powering Molecular Transformers with High Quality Data"

Am 24. November 2021 veranstaltet IBM Research Europe in Zürich ein Presse-Event zum Thema "Quantum and AI shape the Future". Wenn Sie daran teilnehmen möchten, registrieren Sie sich bitte hier: Press Day 2021 | IBM Research Europe - Zurich

Wären Sie daran interessiert, IBM RXN for Chemistry, das auf Science of Synthesis/Synfacts-Daten trainiert ist, als Cloud-Service zu nutzen, falls dieser später verfügbar sein sollte? Bitte kontaktieren Sie ibmrxn@thieme-chemistry.com.

 

Über IBM Research Europe
Seit mehr als sieben Jahrzehnten definiert IBM Research mit mehr als 3.000 Forschern an 16 Standorten auf fünf Kontinenten die Zukunft der Informationstechnologie. Wissenschaftler von IBM Research haben sechs Nobelpreisträger, 10 U.S. National Medals of Technology, fünf U.S. National Medals of Science, sechs Turing Awards, 19 Aufnahmen in die National Academy of Sciences und 20 Aufnahmen in die U.S. National Inventors Hall of Fame hervorgebracht.

IBM Research entwickelt seit über vier Jahren datengesteuerte Chemielösungen auf der Grundlage von Sprachmodellen. Im Jahr 2018 führte IBM RXN for Chemistry: Die Cloud-Plattform nutzt eine künstliche Intelligenz namens Molecular Transformer, das neuronale maschinelle Übersetzungsmodelle anwendet, um das Ergebnis einer chemischen Reaktion vorherzusagen und so die Syntheseplanung in der organischen Chemie zu verbessern.

Weitere Informationen finden Sie unter www.research.ibm.com.

IBM RXN for Chemistry ist kostenlos verfügbar unter: https://rxn.res.ibm.com

Get Trial Access to the chemistry journals
Download SYNFORM or read it online
Cookie-Einstellungen