Künstliche Intelligenz kann Prozesse in der Diagnostik beschleunigen. Dr. Ansgar Lange erkärt, welche Rolle KI in der Genomik und Sequenzierung spielt.
Die Kosten für die Sequenzierung eines Genoms sinken schnell. So schnell, dass sich in den letzten Jahren das Gleichgewicht in der Genomik verschoben hat: Während lange Zeit die Hardware und die tatsächlichen Kosten für die Sequenzierung den Preis für ein sequenziertes Genom bestimmten, sind es jetzt die Kosten für die menschlichen Ressourcen.
In diesem Artikel befassen wir uns mit den Entwicklungen in den Bereichen KI und Genetik sowie mit einer neuen Generation von Software, die KI und maschinelles Lernen einsetzt, um diesen Engpass in der Genomik zu lösen. Darüber hinaus haben wir vor kurzem eine Studie zur Validierung der Leistung von AION, unserer Plattform für die sogenannte Varianteninterpretation, durchgeführt.
Einige Hintergrundinformationen: die jüngsten Entwicklungen bei Gentests und die Notwendigkeit von KI
Genetische Krankheiten werden durch Mutationen oder Varianten im menschlichen Genom "verursacht". Genetiker müssen die verursachende (oder pathogene) Variante finden, um eine genetische Krankheit zu diagnostizieren. Das menschliche Genom besteht aus etwa 3 Milliarden Basenpaaren, und diese ursächlichen Varianten können in jedem Teil des menschlichen Genoms zu finden sein. Lange Zeit war die Sequenzierung von Genomen ein kostspieliger Prozess: Der erste Entwurf eines menschlichen Genoms im Rahmen des Humangenomprojekts kostete 300 Millionen Dollar.
Im Jahr 2006 wurden die Kosten für die Sequenzierung eines menschlichen Genoms auf 20-25 Millionen Dollar geschätzt, wobei es sich allerdings um eine hypothetische Berechnung handelte. Glücklicherweise sind die Kosten für die Genomsequenzierung seit dem 150-Millionen-Dollar-Entwurf des menschlichen Genoms im Jahr 2003 stetig gesunken – mit dem jüngsten Preis von 200 Dollar im Jahr 2022.
Es ist nicht schwer, sich vorzustellen, was dies für die Marktnachfrage bedeutet: Die steil fallenden Kosten haben zu einem starken Wachstum des Next Generation Sequencing (NGS)-Marktes geführt, mit einem geschätzten durchschnittlichen jährlichen Wachstum von über 18 % zwischen 2022 und 2030. Mit anderen Worten: Gentests werden in immer größerem Umfang verfügbar sein.
Diese Entwicklungen bedeuten, dass der Kostentreiber der genetischen Sequenzierung nicht mehr die Sequenzierung selbst ist. Zunehmend wird die Analyse all dieser Daten zum Engpass für die Labore. Die Sequenzierung eines Genoms oder Exoms erzeugt eine lange Liste von Varianten, die von einem Spezialisten interpretiert werden müssen, da viele dieser Varianten gutartig (nicht schädlich) sind.
Vereinfacht ausgedrückt, wird die Generierung der Daten jedes Jahr billiger, während die Interpretation dieser Daten – das Auffinden der pathogenen Variante – immer noch genauso arbeits- und kostenintensiv ist. Hier kommt eine neue Generation von KI-gesteuerter Software ins Spiel, die die Datenauswerter, die Variantenforscher, dabei unterstützt, den Prozess der Analyse sequenzierter Genome oder Exome zu beschleunigen. Da immer mehr Länder Gentests in großem Umfang einführen, z. B. im Rahmen von Neugeborenen-Screening-Programmen, werden KI-gesteuerte Tools benötigt, die sich auf den derzeitigen Interpretationsengpass konzentrieren.
Die klinische Validierung von KI-gesteuerten Tools zur Varianteninterpretation: unsere Studie
AION ist eine dieser Plattformen: eine Varianteninterpretationsplattform für seltene Krankheiten, die durch Algorithmen des maschinellen Lernens unterstützt wird. Bevor wir uns mit der Validierungsstudie befassen, wollen wir kurz erläutern, wie sie funktioniert. AION zielt darauf ab, Variantenforscher bei diesem Interpretationsprozess zu unterstützen, der derzeit den Engpass auf dem schnell wachsenden Sequenzierungsmarkt darstellt.
AION besteht aus zwei Hauptkomponenten: Erstens werden alle Mutationen oder Varianten als pathogen oder gutartig eingestuft – allerdings ist die kausale Wirkung von weniger als 1 % aller Mutationen bekannt. Eine größere Anzahl von Varianten sind sogenannte VUS: Varianten von ungewisser Bedeutung. Dieser Algorithmus unterstützt die Kategorisierung durch Extrapolation von Wissen, das auf öffentlichen Datensätzen und den neuesten Forschungsergebnissen beruht, indem er potenziell pathogene Varianten identifiziert.
In einem zweiten Schritt gleicht ein zweiter Algorithmus diese potenziell schädlichen Varianten mit den Symptomen eines Patienten ab, um die relevantesten Varianten für den menschlichen Experten zu ermitteln. Dies ist besonders interessant, wenn man bedenkt, dass es sich bei der überwiegenden Mehrheit der Varianten um VUS handelt, die eine Richtung für weitere klinische Untersuchungen durch einen menschlichen Experten vorgeben.
Ziel der Studie ist es, die klinische Leistungsfähigkeit unserer Plattform zu validieren. Zu diesem Zweck haben wir die Daten von Patienten mit seltenen Krankheiten aus dem Genomics England 100.000 Genomes Project analysiert. Das Computational Genomics Team von Nostos Genomics hat Fälle von seltenen Krankheiten aus dem 100.000 Genomes Project auf AION laufen lassen und die Leistung der Plattform analysiert. Dabei ging es nicht darum, neue Diagnosen zu finden, sondern die Leistung des Tools auf der Grundlage bereits diagnostizierter Fälle zu messen, um zu sehen, wie ein KI-gesteuertes Tool im Vergleich zu einem menschlichen Experten abschneidet.
Die Ergebnisse sind beeindruckend: AION identifizierte die ursächlichen pathogenen Varianten in mehr als 91 % der Fälle und in über 93 % der Fälle, wenn Daten der Eltern verfügbar waren. Das bedeutet, dass in mehr als 9 von 10 Fällen die ursächliche Variante in der Rangfolge der priorisierten Varianten über Alter und Ethnien hinweg gefunden wurde. Die KI-gesteuerte, automatisierte Varianteninterpretation bietet eine klinische Leistung, die mit der eines menschlichen Experten vergleichbar ist. Sie kann die Analyse klinischer Gentests unterstützen, was den Zeit- und Kostenaufwand für diesen wichtigen Prozess, der durch den oben beschriebenen Interpretationsengpass verursacht wird, verringern kann.
Künftiges Potenzial für KI in der Genetik
In den vorangegangenen Abschnitten haben wir die Notwendigkeit von KI-gesteuerten Werkzeugen zur Entscheidungsunterstützung angesichts des raschen Wachstums der Sequenzierungsindustrie und der Validierung ihrer Leistung erläutert. Die weitere Einführung dieser Tools kann zu einer breiteren Verfügbarkeit von Gentests auf der ganzen Welt führen.
Sinkende Sequenzierungskosten können den globalen Gesundheitsmärkten die Tür öffnen, um in die Diagnostik seltener Krankheiten zu investieren. Allerdings verfügen viele Länder mit niedrigem und mittlerem Einkommen noch nicht über das klinisch-genetische Fachwissen, um die Vielzahl von Varianten zu analysieren, die sich aus der Sequenzierung ihrer Bevölkerung ergeben würden.
KI-gesteuerte Werkzeuge müssen einfach zu integrieren sein, da viele Labore nicht über die technische Expertise verfügen, um komplexe Berechnungspipelines und Schnittstellen zu implementieren. Mit anderen Worten: KI-Entscheidungshilfen demokratisieren das Fachwissen in der Genetik und ermöglichen Laboren weltweit einen gleichberechtigten Zugang zu hochwertigen Genominterpretationen.
Zweitens ermöglichen KI-Algorithmen den Laboren, die Grenzen ihrer diagnostischen Praxis zu erweitern, indem sie den Variantenforschern mehr Zeit geben, sich auf komplexe Fälle zu konzentrieren. Obwohl Variantenforscher, die von KI-gestützter Interpretation unterstützt werden, Fälle von seltenen Krankheiten schneller lösen können, gibt es eine Reihe von Patienten, die keine eindeutige ursächliche Variante aufweisen.
Diese komplexen Fälle sind oft durch viele Varianten unklarer Bedeutung (VUS) gekennzeichnet. Eingehende Untersuchungen dieser VUS werden mit Hilfe von Funktionsscreens oder zusätzlicher familiärer Sequenzierung durchgeführt, die ausreichende Beweise für eine Neuklassifizierung liefern können. Durch die Priorisierung dieser VUS mit einem Pathogenitäts-Score verleihen KI-Tools der VUS-Kategorie zusätzliche Nuancen und zeigen die wertvollsten Varianten für eingehende Untersuchungen an, so dass die Genetikabteilungen ihre Ressourcen optimal nutzen können. Je besser trainiert und ausgefeilter der Algorithmus ist, desto besser werden diese Einstufungen sein, so dass die Variantenforscher in Zukunft noch mehr Diagnosen stellen können – unterstützt durch KI.
Quellenangaben:
- Berger, Bonnie, and Yun William Yu. 2022. “Navigating Bottlenecks and Trade-Offs in Genomic Data Analysis.” Nature Reviews. Genetics, December, 1–16.
- Kris A. Wetterstrand, M. S. 2019. “The Cost of Sequencing a Human Genome.” Genome.gov. NHGRI. March 13, 2019. https://www.genome.gov/about-genomics/fact-sheets/Sequencing-Human-Genome-cost.
- “Next-Generation Sequencing Services Market Report, 2030.” n.d. Accessed January 9, 2023. https://www.grandviewresearch.com/industry-analysis/next-generation-sequencing-ngs-services-market.
- “Press Release.” n.d. Accessed January 9, 2023. https://www.illumina.com/company/news-center/press-releases/press-release-details.html?newsid=8d04df3f-d9c1-4c85-8177-6ea604627ccd.
- Richards, S., N. Aziz, S. Bale, D. Bick, S. Das, J. Gastier-Foster, W. W. Grody, et al. 2015. “Standards and Guidelines for the Interpretation of Sequence Variants: A Joint Consensus Recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology.” Genetics in Medicine: Official Journal of the American College of Medical Genetics 17 (5). https://doi.org/10.1038/gim.2015.30.