Inhalt
summary Zusammenfassung

Meta veröffentlicht mit OMol25 das bislang größte frei verfügbare Datenset für KI-gestützte Chemie und bringt mit UMA ein universelles KI-Modell auf den Markt, das chemische Eigenschaften von Molekülen und Materialien vorhersagen kann. 

Anzeige

Das OMol25-Datenset enthält über 100 Millionen hochgenaue Berechnungen zu Molekülen – deutlich mehr als alle bisherigen offenen Datensätze. Die Daten sind laut dem Meta das Ergebnis von mehr als 6 Milliarden Stunden Rechenzeit auf Hochleistungsrechnern. Sie umfassen verschiedenste Moleküle: von kleinen organischen Stoffen über Biomoleküle (z. B. Protein-Teile oder DNA-Fragmente) bis hin zu Metallkomplexen und Elektrolyten. Auch geladene und gespinnte Zustände, verschiedene Konformationen (also räumliche Anordnungen) und Reaktionen wurden abgedeckt.

Das Ziel: Mit möglichst großer Vielfalt sollen KI-Modelle lernen, wie sich Moleküle in unterschiedlichsten Situationen verhalten. Die Daten sind frei zugänglich und können so etwa für die Entwicklung neuer Medikamente, Batteriematerialien oder Katalysatoren verwendet werden. Neben den eigentlichen Energie- und Kraftwerten enthält OMol25 auch Zusatzinformationen wie Ladungsverteilung, Orbitale und weitere chemische Eigenschaften.

Der OMol25-Datensatz ist auf Hugging Face verfügbar.

Anzeige
Anzeige

UMA: Ein universelles KI-Modell für Moleküle und Materialien

Zeitgleich mit OMol25 stellt Meta mit UMA (Universal Model for Atoms) ein neues, universelles KI-Modell vor, das auf diesen und weiteren Datensätzen trainiert wurde. UMA kann Vorhersagen für chemische Eigenschaften auf atomarer Ebene treffen – und das laut dem Unternehmen deutlich schneller als klassische Methoden.

Statt wie bisher für jede Aufgabe ein eigenes, spezialisiertes Modell zu trainieren, deckt UMA viele unterschiedliche Bereiche ab: von Molekül-Simulationen (z. B. für die Wirkstoffsuche) bis zu Material- und Katalyseforschung. UMA basiert auf modernen Graph-Neuronalen Netzen und nutzt eine spezielle Architektur (Mixture of Linear Experts), die hohe Genauigkeit mit schnellem Rechnen verbindet. Im Test erreicht UMA in vielen Benchmarks sogar Werte, die bislang nur mit maßgeschneiderten Spezialmodellen möglich waren.

Mit UMA sollen sich Simulationen und Berechnungen, die früher Tage dauerten, jetzt in Sekunden durchführen lassen. So könnten laut Meta zum Beispiel tausende neue Moleküle auf ihre Eignung als Medikament oder Batteriematerial getestet werden, bevor sie überhaupt im Labor synthetisiert werden müssen.

Die UMA-Modelle sind auf Hugging Face verfügbar.

Neue Methoden für die schnelle KI-Simulation

Ein weiteres Problem bisheriger KI-Modelle war, dass sie für das Erzeugen neuer Molekülstrukturen oft auf große Mengen an Trainingsdaten angewiesen waren. Meta stellt nun mit „Adjoint Sampling“ eine neue Methode vor, mit der KI-Modelle auch dann lernen und neue Strukturen vorschlagen können, wenn es keine echten Beispieldaten gibt.

Empfehlung

Diese Technik nutzt mathematische Tricks aus der sogenannten stochastischen Kontrolle und arbeitet mit Diffusionsprozessen, die sich laut dem verantwortlichen Team bei Meta besonders gut für die Simulation von Molekülen eignen. Adjoint Sampling ermöglicht es, mit wenigen Berechnungen viele Varianten durchzuprobieren.

In den ersten Tests erstellte die Methode Molekülkonformationen, die mit klassischen Programmen nicht nur mithalten, sondern oft sogar mehr Varianten finden – besonders, wenn das Molekül viele bewegliche Teile hat.

Modell, Code und weitere Informationen gibt es auf Hugging Face und GitHub.

Laut Meta gibt es trotz dieser Fortschritte noch ungelöste Aufgaben: So sind beispielsweise einige chemische Bereiche wie Polymere, bestimmte Metalle oder komplexe Protonierungen noch nicht vollständig abgedeckt. Auch die KI-Modelle müssten noch genauer darin werden, Ladungen, Spins und langreichweitige Wechselwirkungen zu beschreiben.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Meta hat mit OMol25 das größte offene Datenset für KI-gestützte Chemie veröffentlicht: Über 100 Millionen präzise berechnete Moleküle, die eine enorme Bandbreite an chemischen Strukturen und Zuständen abdecken, stehen frei zur Verfügung.
  • Zeitgleich stellt Meta das universelle KI-Modell UMA vor, das chemische Eigenschaften von Molekülen und Materialien auf atomarer Ebene schneller als klassische Methoden vorhersagen kann und viele bisher spezialisierte Aufgaben in einem Modell vereint.
  • Mit „Adjoint Sampling“ präsentiert Meta zudem eine neue Methode, die es KI-Modellen ermöglicht, auch ohne große Datenmengen neue Molekülstrukturen vorherzusagen und dabei besonders bei flexiblen Molekülen eine hohe Variantenvielfalt zu erreichen; einige chemische Bereiche bleiben aber weiterhin eine Herausforderung.
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!