Inhalt
summary Zusammenfassung

Mit AlphaGenome präsentiert Deepmind ein neues KI-Modell, das vorhersagen soll, wie kleine Veränderungen in der DNA die Aktivität von Genen beeinflussen können. Besonders im Blick hat das Modell jene Abschnitte der DNA, die keine direkten Baupläne für Proteine enthalten, sondern wie eine Art Schaltzentrale steuern, wann und wie Gene an- oder abgeschaltet werden. Diese Bereiche machen den Großteil des menschlichen Erbguts aus und waren bisher besonders schwer zu entschlüsseln.

Das Modell analysiert bis zu eine Million DNA-Buchstaben gleichzeitig und richtet sich insbesondere auf die sogenannten nicht-codierenden Bereiche des menschlichen Genoms. Diese machen rund 98 Prozent der DNA aus, enthalten viele krankheitsrelevante Varianten und sind bislang schwer zu interpretieren. Im Gegensatz zu codierenden Abschnitten enthalten sie keine direkten Baupläne für Proteine, steuern aber maßgeblich, wann und wo Gene aktiv sind.

AlphaGenome sagt für jede Position in einer DNA-Sequenz verschiedene molekulare Eigenschaften vorher, etwa wo ein Gen beginnt oder endet, wie viel RNA produziert wird oder an welchen Stellen bestimmte Proteine an die DNA binden. Auch sogenannte Splicing-Stellen werden vorhergesagt – das sind Punkte, an denen während der Genexpression Teile der RNA entfernt und andere miteinander verbunden werden. Fehler in diesem Prozess können schwere Krankheiten verursachen.

Anzeige

Die Vorhersagen erfolgen auf Einzel-Basen-Niveau und decken Hunderte von Zelltypen und Geweben ab. Möglich wird das durch eine Kombination verschiedener KI-Techniken: Convolutional Layers erkennen kurze Muster in der DNA, sogenannte Transformer ermöglichen die Verarbeitung langer Abhängigkeiten, und weitere Schichten erzeugen daraus die Vorhersagen.

Ein Modell für viele Aufgaben

AlphaGenome erreicht laut Deepmind in 22 von 24 Einzelbenchmarks die besten Ergebnisse und übertrifft bei der Vorhersage regulatorischer Effekte von Varianten in 24 von 26 Fällen bestehende Spezialmodelle. Es ist derzeit das einzige Modell, das alle getesteten molekularen Eigenschaften gleichzeitig vorhersagen kann. Die Trainingsdaten stammen aus öffentlich zugänglichen Forschungsprojekten wie ENCODE, GTEx, FANTOM5 und 4D Nucleome. Diese Datenbanken enthalten experimentelle Messwerte zur Genregulation in verschiedenen Zelltypen.

Ein zentrales Merkmal ist die effiziente Bewertung genetischer Varianten: AlphaGenome vergleicht die Vorhersagen mutierter und nicht-mutierter Sequenzen und fasst die Unterschiede je nach Eigenschaft zusammen. Zusätzlich kann das Modell Splice-Junctions direkt aus der DNA-Sequenz modellieren – ein Fortschritt für die Erforschung genetisch bedingter Krankheiten.

Anzeige
Anzeige

Einsatz in der Krankheits- und Grundlagenforschung

AlphaGenome soll laut Deepmind dazu beitragen, genetische Ursachen von Krankheiten besser zu verstehen. In einem Beispiel analysierte das Modell eine Mutation, die bei T-Zell akuter lymphoblastischer Leukämie (T-ALL) beobachtet wurde. Es sagte korrekt voraus, dass durch die Mutation eine neue Andockstelle für das Protein MYB entsteht, das ein benachbartes Krebsgen aktiviert – ein bekannter Krankheitsmechanismus.

Neben der Krankheitsforschung eignet sich das Modell für synthetische Biologie, etwa zur Konstruktion von DNA-Sequenzen mit gezielter Genregulation. Auch bei der Identifikation funktioneller Elemente im Genom kann AlphaGenome helfen – also jener Abschnitte, die für die Steuerung bestimmter Zelltypen besonders relevant sind.

„Es ist ein Meilenstein für das Feld“, sagt Caleb Lareau vom Memorial Sloan Kettering Cancer Center. Marc Mansour vom University College London betont, wie schwierig es bislang war, die Bedeutung nicht-codierender Varianten in großem Maßstab zu erfassen. AlphaGenome liefere hier ein „entscheidendes Puzzlestück“.

Noch kein klinisches Werkzeug

AlphaGenome ist derzeit nur für nicht-kommerzielle Forschung über eine Programmierschnittstelle (API) verfügbar. Laut Deepmind ist das Modell nicht für den klinischen Einsatz entwickelt oder validiert worden. Es kann komplexe Krankheitsverläufe, die durch Entwicklungs- oder Umweltfaktoren beeinflusst werden, nicht vollständig abbilden. Auch die Vorhersageleistung bei weit entfernten regulatorischen Elementen – etwa über 100.000 DNA-Basen entfernt – ist bisher begrenzt.

Trotzdem sieht Deepmind Potenzial für Erweiterungen: Durch zusätzliche Trainingsdaten könnten weitere Arten, Zelltypen oder molekulare Prozesse abgedeckt werden. Die Architektur sei flexibel und skalierbar, so das Forschungsteam.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Deepmind hat mit AlphaGenome ein KI-Modell vorgestellt, das vorhersagen kann, wie kleine Veränderungen in den nicht-codierenden Abschnitten der DNA die Aktivität von Genen beeinflussen – ein Bereich, der rund 98 Prozent des menschlichen Genoms ausmacht und bisher schwer zu entschlüsseln war.
  • Das Modell kombiniert verschiedene KI-Techniken, analysiert bis zu eine Million DNA-Buchstaben gleichzeitig und sagt für jede Position molekulare Eigenschaften wie Genstart, RNA-Menge, Protein-Bindungsstellen und Splice-Junctions voraus; in 22 von 24 Benchmarks erzielt AlphaGenome laut Deepmind die besten Ergebnisse.
  • AlphaGenome ist aktuell nur für nicht-kommerzielle Forschung per API verfügbar und wurde nicht für den klinischen Einsatz validiert; laut Deepmind könnten mit mehr Trainingsdaten künftig weitere Zelltypen und Prozesse abgedeckt werden, die flexible Architektur gilt als ausbaufähig.
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!