Inhalt
summary Zusammenfassung

Meta AI veröffentlicht eine Protein-Datenbank mit der Struktur hunderter Millionen Proteinen. Möglich ist das durch ein neues KI-Modell, das deutlich schneller rechnet als Deepminds AlphaFold.

Im Dezember 2020 zeigte Deepmind AlphaFold 2, ein KI-System für die Vorhersage von Proteinfaltungen. Das KI-System ist so viel schneller als alternative Methoden, dass es von manchen Wissenschaftler:innen als eine Lösung für das knapp 50 Jahre alte Problem der Proteinfaltung gesehen wird. Im Juli 2021 veröffentlichte Deepmind dann AlphaFold 2 als Open-Source und eine umfassende Protein-Datenbank.

Proteinstrukturen von ESMFold vorhergesagt
Bei der Strukturprognose gibt Metas AI einen Zahlenwert aus, der das Zutrauen in die eigene Prognose ausdrückt. | Bild: Meta

Nun zeigen Forschende von Meta ebenfalls ihre Fortschritte beim Einsatz von KI-Modellen für die Vorhersage von Proteinstrukturen.

ESM Metagenomic Altas Datenbank umfasst hunderte Millionen Strukturvorhersagen

Der von Meta veröffentlichte ESM Metagenomic Atlas umfasst Strukturvorhersagen für 617 Millionen Proteine, die in Mikroben im Boden, im Meer oder im menschlichen Körper vorkommen. Die Anzahl solcher Proteine übertrifft bei Weitem jene aus tierischem und pflanzlichem Leben. Dennoch gehören sie zu den am wenigsten verstandenen Proteinen.

Anzeige
Anzeige

"Das sind die Strukturen, über die wir am wenigsten wissen. Das sind unglaublich mysteriöse Proteine. Ich denke, sie bieten das Potenzial für großartige Einblicke in die Biologie", so Alexander Rives, der Forschungsleiter des Protein-Teams von Meta AI.

Metas ESMFold setzt auf ein großes Sprachmodell, das mit Aminosäure-Sequenzen trainiert wurde. | Bild: Meta

Die Strukturvorhersagen stammen von Metas ESMFold, einem KI-Modell, das im Kern auf ein großes Sprachmodell setzt, das mit Aminosäure-Sequenzen bekannter Proteine trainiert wurde. ESMFold kann nach dem Training Sequenzen vervollständigen und aus diesen im zweiten Schritt Strukturen vorhersagen.

Metas ESMFold ist ungenauer als AlphaFold, doch deutlich schneller

Laut Meta erreicht ESMFold nicht die Genauigkeit von Deepminds AlphaFold in der Strukturvorhersage, kann jedoch Strukturen 60-mal schneller generieren. Damit lässt sich Metas Ansatz deutlich einfacher auf große Datenbanken skalieren, wie im Fall der nun veröffentlichten Datenbank metagenomischer DNA. Die überwiegende Anzahl der Einträge in der Datenbank stammen von Organismen, die noch nie im Labor untersucht wurden.

Für die 617 Millionen Vorhersagen benötigte Metas ESMFold zwei Wochen. Das Modell stufte ein Drittel der Vorhersagen als qualitativ hochwertig ein. Forschende können in diesen Fällen davon ausgehen, dass die Proteinform korrekt ist und in einigen Fällen feinere Details auf atomarer Ebene erkennbar sind.

Empfehlung

Meta veröffentlicht neben dem ESM Metagenomic Atlas auch die ESMFold-Modelle sowie ein Pre-Print Paper.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Meta veröffentlicht ESM Metagenomic Atlas, eine Datenbank mit 617 Millionen Strukturvorhersagen für Proteine von Mikroorganismen.
  • Die Strukturen wurden vom KI-Modell ESMFold vorhergesagt, das auf ein mit Aminosäure-Sequenzen trainiertes Sprachmodell setzt.
  • ESMFold ist ungenauer als AlphaFold, dafür 60-mal schneller. Für die über 600 Millionen Vorhersagen benötigte Meta lediglich zwei Wochen.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!