Forscher haben ein KI-Modell entwickelt, das medizinische Bilder in zwei Sprachen analysieren kann. Das System übertrifft bestehende Modelle deutlich - besonders bei arabischen Texten.
Ein internationales Team um Forscher der Mohamed Bin Zayed University hat mit BiMediX2 ein KI-System vorgestellt, das medizinische Bilder sowohl auf Englisch als auch auf Arabisch analysieren und beschreiben kann. Laut der technischen Dokumentation der Forschenden ist es das erste zweisprachige medizinische KI-Modell dieser Art.
Das System kann unterschiedliche medizinische Bildtypen verarbeiten - von Röntgenaufnahmen über MRT-Bilder bis zu mikroskopischen Aufnahmen. Dabei generiert es präzise Beschreibungen und kann Fragen zu den Bildern in beiden Sprachen beantworten.
"BiMediX2 erreicht bei englischen Texten eine um 9 Prozent bessere Leistung als bisherige Modelle. Bei arabischen Texten liegt der Vorsprung sogar bei über 20 Prozent", heißt es in dem technischen Bericht der Forschenden.
Training mit 1,6 Millionen medizinischen Datensätzen
Grundlage für die hohe Genauigkeit ist ein umfangreicher Trainingsdatensatz: Die Forschenden haben das System mit 1,6 Millionen medizinischen Texten und Bildern trainiert. Dabei wurde besonderer Wert auf die Qualität der von GPT-4o angefertigten arabischen Übersetzungen gelegt, die laut dem Team von medizinischen Experten überprüft wurden.
Das System basiert auf der Llama-3.1-Architektur und wurde speziell für medizinische Anwendungen optimiert. In Tests übertraf es GPT-4 bei der Erkennung falscher medizinischer Behauptungen.
Das Team betont jedoch, dass BiMediX2 nur für Forschungszwecke gedacht ist und nicht für den klinischen Einsatz. Wie bei allen KI-Systemen könne es zu Fehlern und Halluzinationen kommen. Die BiMediX2-Modelle sind auf Hugging Face verfügbar. Das Team stellt außerdem mit BiMed-MBench einen bilingualen Benchmark vor.