Inhalt
newsletter Newsletter

Facebooks nächstes großes KI-Projekt: Künstliche Intelligenz soll Videos besser verstehen lernen. Die Grundlage dafür ist KI-Training mit all jenen Videos, die Nutzer bei Facebook oder Instagram teilen.

Anzeige

Gigantische KI-Modelle, die mit riesigen Datenmengen selbstüberwacht (Erklärung) trainiert werden, sind die Grundlage für einige der wichtigsten KI-Entwicklungen der letzten Jahre. Egal ob Microsofts DeBERTa, OpenAIs GPT-3, DALL-E und CLIP, Googles BERT und M4 oder Facebooks M2M-100 und SEER – alle großen KI-Unternehmen haben gigantische, besonders leistungsfähige KI-Modelle mit Milliarden Parametern vorgestellt.

Diese Modelle werden mit Milliarden Text- oder Bilddaten trainiert. Die Daten müssen beim selbstüberwachten Lernen vor dem KI-Training allerdings nicht mehr aufwendig vorab per Hand beschriftet werden. Stattdessen findet die KI eigenständig Muster in den unsortierten Daten. Dadurch wird der manuelle Aufwand reduziert, die Modelle skalieren folglich leichter im Umfang.

Facebook wendet diesen selbstüberwachten Trainingsansatz im Projekt „Learning from Videos“ jetzt auf Videos an.

Anzeige
Anzeige

Instagram- und Facebook-Videos zweckentfremdet fürs KI-Training

Facebooks Plan: Der Datenkonzern verwendet öffentliche Videos von Instagram und Facebook als Trainingsmaterial für Künstliche Intelligenz. Facebooks KI-Forscher trainieren ihr Modell mit Audio-, Bild- und Textdaten der Videoclips von knapp 2,8 Milliarden Nutzern. Eine genaue Anzahl an Videos nennen die Forscher nicht, aber man muss kein großer Prognostiker zu sein, um festzustellen: Es werden sehr viele Videos sein.

Vom Videotraining versprechen sich die Forscher kurzfristig Verbesserungen für Empfehlungsalgorithmen, Spracherkennung, Moderationswerkzeuge und andere KI-Anwendungen, die Facebook bereits im Einsatz hat.

Langfristig könne das bessere Videoverständnis Nutzer ihre digitalen Erinnerungen durchsuchen lassen, schreiben Facebooks Forscher. Eine KI mit Videoverständnis könnte nach spezifischen Inhalten in einem Video suchen, und zwar nach präzisen Parametern sortiert wie im Bild vorkommende Personen, Farben, Sätze, Objekte und so weiter. So sollen Nutzer etwa nach Videos suchen können, in denen sie Happy Birthday für ihre Großmutter gesungen haben.

Spätestens wenn AR-Brillen die Norm würden, sollten Menschen in der Lage sein, bestimmte Momente aus ihrer riesigen Sammlung digitaler Erinnerungen genauso einfach abzurufen, wie sie diese aufgenommen haben. Facebook arbeitet bereits an einer AR-Brille – ob die allerdings von Anfang an mit Kameras ausgestattet wird, ist bisher unklar. Datenschutzrechtlich betrachtet gibt es hier viele Baustellen, die seit Google Glass ungeklärt geblieben sind.

Klar ist jedoch, dass Facebooks Video-KI konstant dazulernen soll: „Durch das Lernen aus globalen Streams öffentlich verfügbarer Videos, die fast jedes Land und hunderte Sprachen umfassen, werden unsere KI-Systeme nicht nur ihre Genauigkeit verbessern, sondern sich auch an unsere schnelllebige Welt anpassen“, schreiben die Forscher.

Empfehlung

Das „Learning from Videos“-Projekt sei außerdem Teil der Bemühungen, „Maschinen zu bauen, die wie Menschen lernen“.

Video-KI könnte mehr Nutzerdaten sammeln

Erste Ergebnisse der KI-Forschung existieren bereits: Instagrams Reel-Empfehlungssystem sei bereits durch das Projekt verbessert worden und in einem Experiment habe man die Genauigkeit einer Spracherkennung um knapp 20 Prozent verbessern können.

Ob Facebook die Video-KI auch für Werbezwecke einsetzen will, verrät der Blog-Beitrag nicht. Der Konzern könnte mit einer leistungsstarken KI-Analyse Nutzervideos detailliert auf Hobbys, Vorlieben, Besitztümer und andere persönliche Daten untersuchen und so noch genauere Nutzerprofile erstellen.

Titelbild: Facebook | Via: Facebook

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Weiterlesen über Künstliche Intelligenz:

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!