Meta stellt mit DINOv3 ein neues KI-Modell für Bildverarbeitung vor, das ohne gelabelte Daten trainiert wurde. Laut Meta ist DINOv3 ohne Anpassungen über verschiedene Bildaufgaben und Domänen einsetzbar, insbesondere für Bereiche mit wenig annotierten Daten, etwa Satellitenbilder. Es erreicht in mehreren anspruchsvollen Bildaufgaben Ergebnisse, die bisher spezialisierten Systemen vorbehalten waren.

Anzeige

Video: Meta

DINOv3 nutzt wie die beiden Vorgängermodelle selbstüberwachtes Lernen (SSL) auf Basis von 1,7 Milliarden Bildern und 7 Milliarden Parametern. In Benchmarks schneidet v3 besser ab als v2, der Sprung ist laut Metas Benchmarks allerdings lange nicht so groß wie von v1 auf v2.

Meta stellt die vortrainierten Modelle in verschiedenen Varianten, Adapter sowie den Trainings- und Evaluierungscode unter der auch kommerziell nutzbaren Dinov3 Lizenz bei Github zur Verfügung.

Anzeige
Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!