Unternehmen wie Google entwickeln Sprachmodelle, die für medizinische Zwecke optimiert sind. Microsoft hält GPT-4 für ausreichend.
Laut Microsoft können große Sprachmodelle helfen, medizinische Prozesse zu beschleunigen, indem sie beispielsweise helfen, "große unstrukturierte Daten" zu strukturieren, die derzeit noch aufwendig manuell verarbeitet werden müssen.
Als Beispiel nennt Microsoft die schnellere Entwicklung von Krebsmedikamenten, bei der viele klinische Studien wegen unzureichender Rekrutierung abgebrochen werden müssten. Hier würden Milliarden von Dollar in langwierigen Prozessen verschwendet.
Große Sprachmodelle wie GPT-4 könnten solche Prozesse durch die effiziente Abstraktion von Patienteninformationen aus umfangreichen klinischen Texten erheblich beschleunigen. Der Einfluss von Sprachmodellen wäre hier ähnlich tranformativ wie bei der Programmierung oder Textverarbeitung.
GPT-4 erzielt SOTA-Ergebnisse ohne spezielles Medizinstudium
Obwohl GPT-4 nur mit generischen Internetdaten statt mit spezifischen medizinischen Daten trainiert wurde, sei es in der Lage, komplexe klinische Studien nach vorgegebenen Kriterien zu strukturieren. Es übertreffe in dieser Hinsicht bei Weitem aktuelle Systeme wie Criteria2Query, obwohl diese speziell für diese Aufgabe entwickelt worden seien.
Das große Sprachmodell von OpenAI könne bei medizinischen Frage-Antwort-Datensätzen wie MedQA (USMLE-Prüfung) eine Leistung auf Expertenniveau erreichen, ohne dass eine "kostspielige aufgabenspezifische Feinabstimmung oder kompliziertes Feintuning" erforderlich sei. Auch Microsoft stellte Sprachmodelle wie BioGPT vor, speziell für medizinische Aufgaben, macht aber jetzt klar, dass es für die Zukunft hauptsächlich auf GPT-4 setzen wird.
GPT-4 könne auch Patientendatensätze in großem Umfang strukturieren, etwa in der Krebsforschung. Das Modell könne als eine Art Superorganisator fungieren, der die Nutzung realer Daten in einem nie dagewesenen Umfang ermögliche.
Obwohl GPT-4 mit allgemeinen Web-Inhalten trainiert wurde, hat es sofort seine beeindruckende Kompetenz bei biomedizinischen Aufgaben gezeigt und hat das Potenzial, bisher unbekannte Aufgaben der natürlichen Sprachverarbeitung (NLP) im biomedizinischen Bereich mit außergewöhnlicher Genauigkeit auszuführen.
Microsoft
Auf dem Weg zur "evidenzbasierten Präzisionsmedizin"
LLMs könnten auch als universelle Annotatoren dienen, die das Training anderer Modelle unterstützen, indem sie aus unstrukturierten Daten markierte Beispiele generieren oder Ursache-Wirkungs-Beziehungen finden.
Eine weitere Anwendung für KI in der Medizin wären multimodale Modelle, die neben Text auch Bilder aus bildgebenden medizinischen Verfahren verarbeiten können, die genetische, Protein- und andere Arten biologischer Daten enthalten.
Microsoft entwickelt mit LLaVA-Med eine Art Chatbot für biomedizinische Bilddaten, der Fachpersonal zur Verfügung steht. Auch Google hat kürzlich mit Med-Palm M ein multimodales Medizinmodell vorgestellt, das medizinische Aufgaben in zahlreichen Domänen lösen kann und einen Chat-Modus bietet.
Das ultimative Ziel sind laut Microsofts Forschungsteam "Precision Health Copilots", die jeden an biomedizinischen Prozessen Beteiligten unterstützen können. Sie würden einen Echtzeit-Überblick über große Mengen von Gesundheitsdaten liefern, die Versorgung und neue Entdeckungen beschleunigen und eine engere Verbindung zwischen klinischer Forschung und Versorgung gewährleisten.
Jede klinische Beobachtung könne sofort genutzt werden, um den Gesundheitszustand des Patienten zu aktualisieren. So könnten Ärzte und Pflegepersonal ihre Entscheidungen auf der Grundlage der neuesten und umfassendsten Erkenntnisse treffen.
"Diese Vision verkörpert den Traum einer evidenzbasierten Präzisionsmedizin. Generative KI, einschließlich großer Sprachmodelle, wird eine entscheidende Rolle dabei spielen, uns in diese aufregende und transformative Zukunft zu führen."