Künstliche Intelligenz könnte die Medizin revolutionieren. Doch welche Qualitätsstandards sollen dabei gelten? Forschende aus den USA machen einen Vorschlag.
KI-Systeme können in vielen Bereichen der Medizin Nutzen stiften. Insbesondere in der Diagnostik und potenziell bei der Medikamentenentwicklung zeigen KI-Anwendungen erste Erfolge. Forschende aus den USA stellten jetzt im Fachjournal „PLOS Digital Health“ einen Ansatz für Qualitätsfaktoren medizinischer Algorithmen vor.
Sechs Eigenschaften für positive Künstliche Intelligenz in der Medizin
Die Forschenden beschreiben die sechs folgenden Eigenschaften:
- Erklärbar: Die Algorithmen zeigen, welchen Faktoren sie wie viel Gewicht zumessen und wie der Output zustande kommt.
- Dynamisch: Die Algorithmen können neue Daten in den Entscheidungsprozess einfließen lassen.
- Präzise: Die Algorithmen sind so komplex wie nötig. Außerdem sind sie in der Lage, Daten in einer angemessenen Häufigkeit zu sammeln – also beispielsweise daran angepasst, wie schnell eine physiologische Veränderung der Patientin oder des Patienten, die der Algorithmus in seine Berechnungen einfließen lassen muss, zu einem klinisch bedeutsamen Ereignis führen kann.
- Autonom: Die Algorithmen funktionieren in der Anwendung mit minimalem menschlichen Input.
- Fair: Die Algorithmen evaluieren und minimieren implizite Voreingenommenheiten und soziale Ungleichheiten, die etwa durch unausgewogene Trainingsdaten entstehen können.
- Reproduzierbar: Die Algorithmen sind extern validiert und mit der wissenschaftlichen Gemeinschaft geteilt. So können die Ergebnisse auch von anderen Forschenden reproduziert und somit überprüft werden.
Die Forschenden prüften bei ihrem Review acht häufig zitierte Algorithmen aus medizinischen Studien. Keiner der geprüften Algorithmen erfüllt demnach alle acht Eigenschaften.
Schmerzpunkte der KI-Forschung im Fokus
Das Science Media Center hat zwei Experten zu ihrer Einschätzung zum Einsatz von KI in der Medizin und die im Review aufgestellten Qualitätsmerkmale befragt.
„Die Autoren rücken einige der ‚Schmerzpunkte‘ der KI-Forschung ins Licht, zum Beispiel Reproduzierbarkeit und Interpretierbarkeit, beides sehr aktive Forschungsfelder in der KI-Forschung", sagt Dr. Anton Becker, Director Analytics und Body Imaging Service am Memorial Sloan Kettering in New York.
Einige Kategorien seien jedoch "schwammig definiert" und nicht "alle immer zwingend notwendig", etwa in der Notfalldiagnostik. Insgesamt bezeichnet Becker die acht Merkmale als "guten Leitfaden".
Laut Prof. Dr. Robert Ranisch, Juniorprofessor für Medizinische Ethik mit Schwerpunkt auf
Digitalisierung an der Universität Potsdam, leistet die Checkliste einen Beitrag zu einer "wichtigen Debatte" zum Einsatz von Künstlicher Intelligenz in der Medizin.
Es müsse sich jedoch erst noch zeigen, inwiefern der Vorschlag in der Praxis aufgegriffen werden könne. Ranisch hält eine weiterführende Diskussion über Zertifizierungs- oder Zulassungsverfahren für sinnvoll.
KI-Einsatz in der Medizin: Laborergebnisse vs. Realität
„Gegenwärtig gibt es einen Hype um KI in der Medizin und tatsächlich sehen viele Studien zum Beispiel zur Analyse von Bilddaten überaus vielversprechend aus", sagt Ranisch.
Einige KI-Systeme würden jedoch "ohne umfassende Prüfung in die Klinik gebracht" und seien unter Realbedingungen weniger leistungsfähig, manche gar "nutzlos oder sogar gefährlich".
"Um die Wirksamkeit und Sicherheit von KI unter Realbedingungen zu erhöhen, bedarf es umfangreicherer klinischer Forschung. Hier müssen sich digitale Innovationen an etablierten
methodischen Standards messen", sagt Ranisch und übt zugleich Kritik an der Digitalisierung in der Medizin insgesamt.
"So häufig wir von den Potenzialen der Künstlichen Intelligenz in Diagnostik oder Versorgung lesen, so selten sind diese bislang für die Patienten spürbar. Handschriftliche Patientenakten oder Befunde auf CD sind noch immer die Realität – Big Data und KI die Ausnahme. Deutschland ist eines der Schlusslichter der Digitalisierung im Gesundheitswesen", sagt Ranisch. Dies sei aber kein rein deutsches Phänomen.