Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
HeyGen, ein KI-Video-Start-up, hat in einer Serie-A-Finanzierungsrunde 60 Millionen Dollar erhalten. Das Unternehmen wird nun mit über 500 Millionen Dollar bewertet. Die Runde wurde von Benchmark angeführt. HeyGen ermöglicht es Unternehmen, Videos ohne Kamera oder Crew zu erstellen, zu lokalisieren und zu personalisieren. Das Start-up ist nach eigenen Angaben seit dem zweiten Quartal 2023 profitabel und hat seinen Jahresumsatz von einer Million auf über 35 Millionen Dollar gesteigert. Zu den Kunden zählen sowohl kleine Unternehmen als auch Fortune-500-Konzerne. Mit dem frischen Kapital will HeyGen sein Produktangebot erweitern und in Unternehmenssicherheit, KI-Ethik sowie Vertrauen und Sicherheit investieren.
Laut Clément Delangue, CEO von Hugging Face, wollen immer mehr Gründerinnen und Gründer ihr KI-Start-up verkaufen. Nach eigenen Angaben erhält Delangue derzeit wöchentlich Anfragen von rund zehn Gründern und Gründerinnen, die an einer Übernahme interessiert sind. Hugging Face selbst gab kürzlich die Übernahme von Argilla für 10 Millionen Dollar bekannt. Es ist die vierte Akquisition des New Yorker Start-ups, das im vergangenen Jahr 235 Millionen Dollar von Investoren eingesammelt hat und mit 4,5 Milliarden Dollar bewertet wird. Argilla entwickelt Software, mit der Menschen gemeinsam Datensätze verbessern können, um künstliche Intelligenz zu trainieren. Die 13 Mitarbeiter von Argilla werden Teil von Hugging Face, arbeiten aber weiterhin unabhängig unter demselben Namen.
Microsoft veröffentlicht die Vision-Modelle Florence-2, die zum Teil größere Spezialistenmodelle schlagen. Florence-2 ist ein Prompt-basiertes Vision-Modell für verschiedene Computer-Vision- und Vision-Sprach-Aufgaben wie Bildbeschreibung, Objekterkennung, Lokalisierung oder Segmentierung. Laut Microsoft übertrifft Florence-2 in vielen Evaluationen andere, spezialisiertere und deutlich größere Bildverarbeitungsmodelle. Für das Training von Florence hat Microsoft den Datensatz FLD-5B mit 5,4 Milliarden Annotationen für 126 Millionen Bilder erstellt. Die Modelle sind unter der MIT-Lizenz bei Hugging Face verfügbar und können kommerziell genutzt werden.
McDonald’s beendet sein gemeinsam mit IBM gestartetes KI-Bestellsystem für den Drive Thru. Nach einem zweijährigen Test der automatisierten Spracherkennung in über 100 Restaurants wird die Technologie bis zum 26. Juli 2024 abgeschaltet. Ziel war es, den Drive-Thru-Service zu beschleunigen und die Prozesse zu vereinfachen. McDonald’s sieht jedoch weiterhin Potenzial für eine breitere Erforschung von Sprachbestelllösungen und will bis Ende des Jahres einen neuen Partner finden. Auch IBM führt nach eigenen Angaben Gespräche mit anderen Fast-Food-Ketten. Das klingt, als seien die Partner nicht im Guten auseinandergegangen.