AlphaGenome erkennt krankheitsrelevante Mutationen in menschlichem Genom

26. Juni 2025

Google Deepmind

Mit AlphaGenome präsentiert Deepmind ein neues KI-Modell, das vorhersagen soll, wie kleine Veränderungen in der DNA die Aktivität von Genen beeinflussen können. Besonders im Blick hat das Modell jene Abschnitte der DNA, die keine direkten Baupläne für Proteine enthalten, sondern wie eine Art Schaltzentrale steuern, wann und wie Gene an- oder abgeschaltet werden. Diese Bereiche machen den Großteil des menschlichen Erbguts aus und waren bisher besonders schwer zu entschlüsseln.

Das Modell analysiert bis zu eine Million DNA-Buchstaben gleichzeitig und richtet sich insbesondere auf die sogenannten nicht-codierenden Bereiche des menschlichen Genoms. Diese machen rund 98 Prozent der DNA aus, enthalten viele krankheitsrelevante Varianten und sind bislang schwer zu interpretieren. Im Gegensatz zu codierenden Abschnitten enthalten sie keine direkten Baupläne für Proteine, steuern aber maßgeblich, wann und wo Gene aktiv sind.

AlphaGenome sagt für jede Position in einer DNA-Sequenz verschiedene molekulare Eigenschaften vorher, etwa wo ein Gen beginnt oder endet, wie viel RNA produziert wird oder an welchen Stellen bestimmte Proteine an die DNA binden. Auch sogenannte Splicing-Stellen werden vorhergesagt – das sind Punkte, an denen während der Genexpression Teile der RNA entfernt und andere miteinander verbunden werden. Fehler in diesem Prozess können schwere Krankheiten verursachen.

Die Vorhersagen erfolgen auf Einzel-Basen-Niveau und decken Hunderte von Zelltypen und Geweben ab. Möglich wird das durch eine Kombination verschiedener KI-Techniken: Convolutional Layers erkennen kurze Muster in der DNA, sogenannte Transformer ermöglichen die Verarbeitung langer Abhängigkeiten, und weitere Schichten erzeugen daraus die Vorhersagen.

Ein Modell für viele Aufgaben

AlphaGenome erreicht laut Deepmind in 22 von 24 Einzelbenchmarks die besten Ergebnisse und übertrifft bei der Vorhersage regulatorischer Effekte von Varianten in 24 von 26 Fällen bestehende Spezialmodelle. Es ist derzeit das einzige Modell, das alle getesteten molekularen Eigenschaften gleichzeitig vorhersagen kann. Die Trainingsdaten stammen aus öffentlich zugänglichen Forschungsprojekten wie ENCODE, GTEx, FANTOM5 und 4D Nucleome. Diese Datenbanken enthalten experimentelle Messwerte zur Genregulation in verschiedenen Zelltypen.

Ein zentrales Merkmal ist die effiziente Bewertung genetischer Varianten: AlphaGenome vergleicht die Vorhersagen mutierter und nicht-mutierter Sequenzen und fasst die Unterschiede je nach Eigenschaft zusammen. Zusätzlich kann das Modell Splice-Junctions direkt aus der DNA-Sequenz modellieren – ein Fortschritt für die Erforschung genetisch bedingter Krankheiten.

Einsatz in der Krankheits- und Grundlagenforschung

AlphaGenome soll laut Deepmind dazu beitragen, genetische Ursachen von Krankheiten besser zu verstehen. In einem Beispiel analysierte das Modell eine Mutation, die bei T-Zell akuter lymphoblastischer Leukämie (T-ALL) beobachtet wurde. Es sagte korrekt voraus, dass durch die Mutation eine neue Andockstelle für das Protein MYB entsteht, das ein benachbartes Krebsgen aktiviert – ein bekannter Krankheitsmechanismus.

Neben der Krankheitsforschung eignet sich das Modell für synthetische Biologie, etwa zur Konstruktion von DNA-Sequenzen mit gezielter Genregulation. Auch bei der Identifikation funktioneller Elemente im Genom kann AlphaGenome helfen – also jener Abschnitte, die für die Steuerung bestimmter Zelltypen besonders relevant sind.

„Es ist ein Meilenstein für das Feld“, sagt Caleb Lareau vom Memorial Sloan Kettering Cancer Center. Marc Mansour vom University College London betont, wie schwierig es bislang war, die Bedeutung nicht-codierender Varianten in großem Maßstab zu erfassen. AlphaGenome liefere hier ein „entscheidendes Puzzlestück“.

Noch kein klinisches Werkzeug

AlphaGenome ist derzeit nur für nicht-kommerzielle Forschung über eine Programmierschnittstelle (API) verfügbar. Laut Deepmind ist das Modell nicht für den klinischen Einsatz entwickelt oder validiert worden. Es kann komplexe Krankheitsverläufe, die durch Entwicklungs- oder Umweltfaktoren beeinflusst werden, nicht vollständig abbilden. Auch die Vorhersageleistung bei weit entfernten regulatorischen Elementen – etwa über 100.000 DNA-Basen entfernt – ist bisher begrenzt.

Trotzdem sieht Deepmind Potenzial für Erweiterungen: Durch zusätzliche Trainingsdaten könnten weitere Arten, Zelltypen oder molekulare Prozesse abgedeckt werden. Die Architektur sei flexibel und skalierbar, so das Forschungsteam.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren