Microsoft veröffentlicht neue Florence-2 Vision-Modelle
Microsoft veröffentlicht die Vision-Modelle Florence-2, die zum Teil größere Spezialistenmodelle schlagen. Florence-2 ist ein Prompt-basiertes Vision-Modell für verschiedene Computer-Vision- und Vision-Sprach-Aufgaben wie Bildbeschreibung, Objekterkennung, Lokalisierung oder Segmentierung. Laut Microsoft übertrifft Florence-2 in vielen Evaluationen andere, spezialisiertere und deutlich größere Bildverarbeitungsmodelle. Für das Training von Florence hat Microsoft den Datensatz FLD-5B mit 5,4 Milliarden Annotationen für 126 Millionen Bilder erstellt. Die Modelle sind unter der MIT-Lizenz bei Hugging Face verfügbar und können kommerziell genutzt werden.
Quelle: Hugging Face | Paper
KI-News ohne Hype
Von Menschen kuratiert.
- Mehr als 20 Prozent Launch-Rabatt.
- Lesen ohne Ablenkung – keine Google-Werbebanner.
- Zugang zum Kommentarsystem und Austausch mit der Community.
- Wöchentlicher KI-Newsletter.
- 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
- Bis zu 25 % Rabatt auf KI Pro Online-Events.
- Zugang zum kompletten Archiv der letzten zehn Jahre.
- Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.