Eine Studie der Rutgers University demonstriert, dass das Sprachmodell GPT-4 in der Lage ist, einfache Strukturen von Aminosäuren und Proteinen mit überraschender Genauigkeit zu modellieren.
Forscher der Rutgers University haben die Fähigkeiten des KI-Sprachmodells GPT-4 bei grundlegenden Aufgaben der Strukturbiologie untersucht. Die in Scientific Reports veröffentlichte Studie zeigt, dass das Modell unerwartet präzise Vorhersagen zu molekularen Strukturen treffen kann.
Die Wissenschaftler forderten GPT-4 auf, die dreidimensionalen Strukturen der 20 Standard-Aminosäuren zu modellieren. Das KI-Modell konnte die atomare Zusammensetzung sowie Bindungslängen und -winkel mit hoher Genauigkeit vorhersagen. Allerdings traten Fehler bei der Modellierung von Ringstrukturen und der stereochemischen Konfiguration auf.
In einem weiteren Experiment sollte GPT-4 die Struktur einer Alpha-Helix modellieren, einem häufigen Strukturelement in Proteinen. Hierfür war die Einbindung des Wolfram-Plugins für mathematische Berechnungen erforderlich. Das resultierende Modell war mit experimentell bestimmten Alpha-Helix-Strukturen vergleichbar.
Zudem analysierte GPT-4 die Bindung zwischen dem antiviralen Medikament Nirmatrelvir und dem Hauptprotease-Enzym von SARS-CoV-2. Das Modell identifizierte korrekt die beteiligten Aminosäuren und gab die Abstände zwischen interagierenden Atomen präzise an.
Ergebnisse eröffnen neue Möglichkeiten für den Einsatz von Sprachmodellen in der Biologie
Diese Fähigkeiten sind bemerkenswert, da GPT-4 nicht speziell für strukturbiologische Aufgaben entwickelt wurde. Die Forscher weisen darauf hin, dass die Modellierungsmethode von GPT-4 unklar ist. Es könnte vorhandene atomare Koordinaten aus seinem Trainingsdatensatz verwenden oder die Strukturen neu berechnen - ein abschließendes Urteil darüber würde weitere umfassende Untersuchungen erfordern.
Während dedizierte KI-Tools wie AlphaFold 3 komplexere Strukturen vorhersagen können, zeigt GPT-4 laut den Forschern Potenzial für grundlegende Aufgaben der Strukturbiologie. Die Modellierungsfähigkeiten seien derzeit noch rudimentär und von begrenztem praktischen Nutzen.
Die Studie schaffe dennoch einen Präzedenzfall für die Anwendung dieser Technologie in der Strukturbiologie. Die Forscher empfehlen weitere Untersuchungen zu den Fähigkeiten und Grenzen generativer KI, nicht nur in der Strukturbiologie, sondern auch für andere potenzielle Anwendungen in den Biowissenschaften.