Auf der eigenen Tech-Fachmesse Connect 2023 stand bei Meta in diesem Jahr KI im Mittelpunkt. Hier die wichtigsten Ankündigungen.
Neuer Allzweck-Assistent "Meta AI"
Meta AI ist der neue ChatGPT-Konkurrent von Meta: Die Chat-Software soll als Assistent Meta-Produkte wie WhatsApp, Messenger, Instagram und Metas XR-Geräte aufwerten. Meta AI basiert auf Metas eigenem Sprachmodelle Llama 2 und ist zunächst nur in den USA verfügbar.
Meta AI verfügt außerdem über ein integriertes Text-zu-Bild-Modell "Emu", das über den Prompt "@MetaAI /imagine Text" auch Bilder erzeugen kann, die standardmäßig mit dem Wasserzeichen "#ImaginedWithAI" versehen sind. Die Bildqualität ist nach Metas eigenen Auswertungen "signifikant" besser als bei SDXL v1.0.
Durch eine Partnerschaft mit Microsoft bietet Meta, ähnlich wie ChatGPT, auch Zugang zu Echtzeitinformationen durch Chat-Browsing mit Bing. Die Informationen im Chat sind also nicht durch das Ende der Trainingszeit der KI begrenzt.
Interessant ist die Position von Microsoft, das trotz hoher Investitionen in OpenAI weiterhin mit direkten OpenAI-Konkurrenten zusammenarbeitet. Microsoft bietet auch das Open-Source-Modell Llama von Meta in der eigenen Cloud an.
KI-Chats für bekannte Personen
Neben Meta AI können die Nutzerinnen und Nutzer von WhatsApp, Messenger und Instagram auf spezielle Chatbots zugreifen, die auf Meta AI basieren, aber bestimmte Persönlichkeiten darstellen. Darunter sind Chatbots von Prominenten wie Tom Brady, Paris Hilton und Naomi Osaka, die im Stil der Prominenten über für sie typische Themen wie Sport, Humor oder Entspannung sprechen.
KI-generierte Sticker
Für WhatsApp, Messenger, Instagram und Facebook Stories kombiniert Meta zudem Llama 2 mit dem Bildmodell Emu für KI-generierte Sticker. Die Eingabe "Pizza spielt Basketball" generiert etwa direkt im Chatfenster eine Comic-Pizza mit einem Basketball in der Hand. Die KI-Sticker werden im kommenden Monat für ausgewählte englischsprachige Nutzerinnen und Nutzer ausgerollt.
KI-gestützte Bildbearbeitung
Meta bringt auch neue KI-Funktionen in die Bildbearbeitung seiner Plattformen. So soll es möglich sein, den Stil eines Bildes per Texteingabe zu verändern ("Restyle"), aus einem Foto wird etwa ein Gemälde, oder Hintergründe per Text auszutauschen und neue Objekte in der Umgebung zu platzieren ("Backdrop"). Bilder, die durch KI verändert wurden, sollen laut Meta entsprechend gekennzeichnet werden.
Neues Text-zu-Bildmodell Emu
Hinter den neuen Bild- und Stickerangeboten von Meta stehen das von Meta AI ebenfalls neu vorgestellte Bildmodell Emu und das bereits vorgestellte Segment Anything Modell zur Bilderkennung und -aufteilung.
Mit dem Emu-Modell hat Meta nach eigenen Angaben erfolgreich mit Bild-Feintuning experimentiert. Ein mit 1,1 Milliarden Bild-Text-Paaren vortrainiertes Diffusionsmodell wurde zusätzlich mit einigen tausend "sorgfältig ausgewählten, qualitativ hochwertigen Bildern" verfeinert.
Laut Meta AI hat das Feintuning die Qualität der Bildgenerierung deutlich verbessert: Im Vergleich zum Standardmodell ohne Bildfeintuning bevorzugen menschliche Tester in 82,9 Prozent der Fälle die Bilder des feingetunten Modells. Im Vergleich zum Open-Source-Bildmodell SDXL v.1.0 lag es in bis zu 71,3 Prozent der Fälle vorne. Als generischer Ansatz funktioniert das Bildtuning auch für andere Architekturen.