Skip to content

Microsoft veröffentlicht neue Florence-2 Vision-Modelle

Microsoft veröffentlicht die Vision-Modelle Florence-2, die zum Teil größere Spezialistenmodelle schlagen. Florence-2 ist ein Prompt-basiertes Vision-Modell für verschiedene Computer-Vision- und Vision-Sprach-Aufgaben wie Bildbeschreibung, Objekterkennung, Lokalisierung oder Segmentierung. Laut Microsoft übertrifft Florence-2 in vielen Evaluationen andere, spezialisiertere und deutlich größere Bildverarbeitungsmodelle. Für das Training von Florence hat Microsoft den Datensatz FLD-5B mit 5,4 Milliarden Annotationen für 126 Millionen Bilder erstellt. Die Modelle sind unter der MIT-Lizenz bei Hugging Face verfügbar und können kommerziell genutzt werden.

Quelle: Hugging Face | Paper

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren