Zwei Jahre nach AlphaFold zeigen Forschende in CASP15 Möglichkeiten und Grenzen des KI-Systems auf.
1994 gründeten die Professoren John Moult und Krzysztof Fidelis die „Critical Assessment of Protein Structure Prediction“ (CASP), ein alle zwei Jahre stattfindender Wettebewerb für die Vorhersage von Proteinfaltungen.
Teilnehmende Forschungsgruppen versuchen dabei mit unterschiedlichen Methoden, Proteinstrukturen vorherzusagen, die zwar bereits von anderen Wissenschaftler:innen empirisch aufgedeckt, aber noch nicht veröffentlicht wurden.
Im Dezember 2020 veröffentlichte das Team die Ergebnisse von CASP14: Deepminds AlphaFold 2.0 sagte von den knapp 100 im Wettbewerb zu lösenden Proteinsequenzen die Struktur von 70 so präzise wie experimentelle Verfahren voraus. Diese Leistung war ein Durchbruch. Einige Forschende bezeichneten die Künstliche Intelligenz als Lösung für das 50 Jahre alte Problem der Proteinfaltung.
CASP15 stellt Künstliche Intelligenz vor neue Aufgaben
Der beeindruckende Erfolg 2020 stellte den Biologen John Moult vom CASP-Team und seine Kolleg:innen vor eine Herausforderung: "Die Leute sagen: 'Oh, wir brauchen CASP nicht mehr, das Problem wurde gelöst'", so Moult. "Ich denke, das ist genau der falsche Weg".
Statt weiter lediglich Bestwerte für ein bereits gelöstes Problem zu sammeln, fügte das Team neue Herausforderungen und Modifikationen zu alten hinzu. Dazu gehören etwa Vorhersagen zur Interkation zwischen Proteinen und anderen Molekülen wie Medikamenten oder zu den verschiedenen Formen, die einige Proteine annehmen können.
AlphaFold dominiert CASP15 auch ohne Deepmind
Nun sind Ergebnisse von CASP15 veröffentlicht worden und auch zwei Jahre später dominiert AlphaFold den Wettbewerb. Deepmind selbst nahm in dieser Runde nicht teil, doch AlphaFold ist seit 2021 Open-Source und die erfolgreichsten Teilnehmenden integrierten in ihren Ansätzen Deepminds KI-System.
In der Vorhersage der Form einzelner Proteine konnten teilnehmende Teams moderate Verbesserungen in der Genauigkeit erreichen. "Die Genauigkeit ist bereits so hoch, dass es schwer ist, sie noch zu verbessern", so Moult.
Abseits der etablierten Fähigkeiten von AlphaFold zeigten dieses Jahr einige Teams zudem, wie sich das KI-System mit Modifikationen für die Vorhersage von Protein-Interaktionen nutzen lässt. Gegenüber CASP14 konnten Systeme, die solche AlphaFold-Varianten einsetzen, signifikante Verbesserungen erlangen und nähern sich so langsam der Genauigkeit experimenteller Methoden an.
AlphaFold muss verbessert werden, Sprachmodelle könnten helfen
Um deren Genauigkeit in allen Kategorien zu erreichen, benötige es weitere Verbesserungen, sagen beteiligte Forschende. Eine Möglichkeit für Innovationen sind Sprachmodelle wie Metas ESMFold, die statt Wörtern Proteinstrukturen vorhersagen.
Im direkten Vergleich mit AlphaFold hängen diese Methoden zwar deutlich hinterher, doch sie könnten laut Forschenden nützlich sein, um vorherzusagen, wie Mutationen die Struktur eines Proteins verändern.
"Die 'low-hanging fruit' wurden gepflückt", sagt Mohammed AlQuraishi, ein Computerbiologe an der Columbia University in New York City. "Einige der nächsten Probleme werden schwieriger sein".