Anzeige
Skip to content

Microsofts kostenlose Bildanalyse-KI trackt genau und schnell

Image description

Microsoft veröffentlicht eine neue Bildanalyse-KI, die genauer und schneller als vergleichbare Systeme ist.

"Fair Multi-Objekt Tracking" (FairMOT) entstand in einer Kooperation zwischen Microsoft und der chinesischen Huazhong Universität. FairMOT sei anderen vergleichbaren Bildanalyse-KIs überlegen und könne auf moderner Hardware 30 Bilder pro Sekunde analysieren, schreiben die Forscher. Die leistungsstarke Künstliche Intelligenz erkennt so zuverlässig Objekte in Echtzeit-Videomaterial.

Beim Echtzeittracking von Videoaufnahmen müssen KIs ein Objekt zunächst korrekt identifizieren und dann in jedem Bild wiedererkennen (Re-Identifikation). Die meisten KI-Techniken nutzen für diese beiden Schritte jeweils ein eigenes KI-Netzwerk.

So erreichen sie eine hohe Genauigkeit, benötigen aber viel Rechenleistung. Videoanalyse in Echtzeit ist mit so einem Doppelnetzansatz daher nur mit einem Supercomputer möglich.

Anzeige
DEC_D_Incontent-1

Effizientes, schnelles Objekttracking

Alternative Ansätze versuchen, die Objekterkennung und Re-Identifikation in einem KI-Netzwerk zu vereinen. In der Praxis führt das zwar zu schnellerem Tracking, aber die Genauigkeit fällt ab.

Hier setzt Microsofts FairMOT an: Es schafft, beide Aufgaben in einem Netzwerk zu vereinen, ohne an Genauigkeit zu verlieren.

Microsoft ersetzt dafür die in der Objekterkennung üblichen ankerbasierten Bounding-Boxen, da diese zu ungenau für die Re-Identifikation seien. Stattdessen nutzen die Forscher einen feinmaschigeren Detektor.

In Multi-Objekt-Tracking Benchmarks (MOT15, MOT16 und MOT17) gehört Microsofts KI-Objekterkennung konstant zu den genausten Bildanalyse-KIs bei einer Analysegeschwindigkeit von 25 bis 30 Bildern pro Sekunde.

Anzeige
DEC_D_Incontent-2

FairMOT kostenlos verfügbar

FairMOT ist Open-Source und kann kostenlos auf GitHub heruntergeladen werden. Neben dem Quellcode hat Microsoft dort einige vortrainierte KI-Modelle veröffentlicht, die Aufnahmen oder Live-Video analysieren können.

Als mögliche Anwendungsfälle nennen die Forscher öffentliche Sicherheit, Analyse von Sportvideos, Altenpflege oder die Steuerung von Computern mit visuellen Interfaces.

Quelle: Arxiv; Titelbild: Microsoft

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren