Meta stellt mit DINOv3 ein neues KI-Modell für Bildverarbeitung vor, das ohne gelabelte Daten trainiert wurde. Laut Meta ist DINOv3 ohne Anpassungen über verschiedene Bildaufgaben und Domänen einsetzbar, insbesondere für Bereiche mit wenig annotierten Daten, etwa Satellitenbilder. Es erreicht in mehreren anspruchsvollen Bildaufgaben Ergebnisse, die bisher spezialisierten Systemen vorbehalten waren.
Video: Meta
DINOv3 nutzt wie die beiden Vorgängermodelle selbstüberwachtes Lernen (SSL) auf Basis von 1,7 Milliarden Bildern und 7 Milliarden Parametern. In Benchmarks schneidet v3 besser ab als v2, der Sprung ist laut Metas Benchmarks allerdings lange nicht so groß wie von v1 auf v2.
Meta stellt die vortrainierten Modelle in verschiedenen Varianten, Adapter sowie den Trainings- und Evaluierungscode unter der auch kommerziell nutzbaren Dinov3 Lizenz bei Github zur Verfügung.