Inhalt
summary Zusammenfassung

Forscher haben ein KI-Modell entwickelt, das medizinische Bilder in zwei Sprachen analysieren kann. Das System übertrifft bestehende Modelle deutlich - besonders bei arabischen Texten.

Anzeige

Ein internationales Team um Forscher der Mohamed Bin Zayed University hat mit BiMediX2 ein KI-System vorgestellt, das medizinische Bilder sowohl auf Englisch als auch auf Arabisch analysieren und beschreiben kann. Laut der technischen Dokumentation der Forschenden ist es das erste zweisprachige medizinische KI-Modell dieser Art.

Das System kann unterschiedliche medizinische Bildtypen verarbeiten - von Röntgenaufnahmen über MRT-Bilder bis zu mikroskopischen Aufnahmen. Dabei generiert es präzise Beschreibungen und kann Fragen zu den Bildern in beiden Sprachen beantworten.

"BiMediX2 erreicht bei englischen Texten eine um 9 Prozent bessere Leistung als bisherige Modelle. Bei arabischen Texten liegt der Vorsprung sogar bei über 20 Prozent", heißt es in dem technischen Bericht der Forschenden.

Anzeige
Anzeige

Training mit 1,6 Millionen medizinischen Datensätzen

Grundlage für die hohe Genauigkeit ist ein umfangreicher Trainingsdatensatz: Die Forschenden haben das System mit 1,6 Millionen medizinischen Texten und Bildern trainiert. Dabei wurde besonderer Wert auf die Qualität der von GPT-4o angefertigten arabischen Übersetzungen gelegt, die laut dem Team von medizinischen Experten überprüft wurden.

Das System basiert auf der Llama-3.1-Architektur und wurde speziell für medizinische Anwendungen optimiert. In Tests übertraf es GPT-4 bei der Erkennung falscher medizinischer Behauptungen.

Flussdiagramm: BiMediX2-Architektur für medizinische Bildanalyse mit Vision Encoder, Llama 3.1 und zweisprachiger Übersetzung Englisch-Arabisch.
Die BiMediX2-Architektur ermöglicht zweisprachige medizinische Bildanalysen durch die Kombination von Vision Encoder, Meta Llama 3.1 und GPT-4o. Das System verarbeitet medizinische Bilddaten und übersetzt die Befunde automatisch zwischen Englisch und Arabisch, mit Validierung durch medizinische Experten. | Bild: Mullappilly, Kurpath et al.

Das Team betont jedoch, dass BiMediX2 nur für Forschungszwecke gedacht ist und nicht für den klinischen Einsatz. Wie bei allen KI-Systemen könne es zu Fehlern und Halluzinationen kommen. Die BiMediX2-Modelle sind auf Hugging Face verfügbar. Das Team stellt außerdem mit BiMed-MBench einen bilingualen Benchmark vor.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Forscher der Mohamed Bin Zayed University haben mit BiMediX2 ein KI-System entwickelt, das medizinische Bilder sowohl auf Englisch als auch auf Arabisch analysieren kann.
  • BiMediX2 kann verschiedene medizinische Bildtypen wie Röntgenaufnahmen, MRT-Bilder und mikroskopische Aufnahmen verarbeiten. Es generiert präzise Beschreibungen und beantwortet Fragen zu den Bildern in beiden Sprachen.
  • Das System wurde mit 1,6 Millionen medizinischen Texten und Bildern trainiert, wobei besonderer Wert auf die Qualität der arabischen Übersetzungen gelegt wurde. Es basiert auf der Llama-3.1-Architektur und ist für Forschungszwecke gedacht, nicht für den klinischen Einsatz.
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!