KI in der Praxis

Metas Llama dominiert Open-Source-LLMs und könnte multimodal werden

Matthias Bastian
Meta betrachtet Llama jetzt als ein KI-Ökosystem, das die Open-Source-Szene dominiert. Eine zukünftige Version könnte multimodal sein.

Meta

Meta betrachtet Llama jetzt als ein KI-Ökosystem, das die Open-Source-Szene dominiert. Eine zukünftige Version könnte multimodal sein.

In einem Podcast mit Lex Fridman sagt Mark Zuckerberg, dass Llama 2 seine Erwartungen an den Erfolg des Modells weit übertroffen habe.

Für Llama 3 hat Mark Zuckerberg noch nichts Konkretes angekündigt. Es sei aber "immer ein neues Modell in der Entwicklung", so Zuckerberg. "Aber ich weiß nicht genau, wann es fertig sein wird."

Er hoffe, dass auch das nächste Llama-Modell als Open Source veröffentlicht werden könne. Das Projekt befinde sich noch in einer frühen Phase.

Derzeit liege der Fokus darauf, Llama 2 in möglichst viele Anwendungen zu implementieren. Meta hat diese Woche unter anderem mit Meta AI einen ChatGPT-Konkurrenten vorgestellt, der von Llama 2 angetrieben wird.

Llama wird zur Sprachmodell-Ökosystem

Laut Meta wurden auf Llama basierende Modelle auf Hugging Face mehr als 30 Millionen Mal heruntergeladen, davon allein 10 Millionen im letzten Monat. Auf Github würden mehr als 7000 Projekte Llama erwähnen. Auf Google Cloud und AWS seien mehr als 3.500 Unternehmensprojekte auf Basis von Llama 2 gestartet worden.

"Llama hat sich zu einer Plattform entwickelt, auf der die Welt aufbauen kann, und wir könnten nicht begeisterter sein", schreibt Meta. "Je mehr Unternehmen und Start-ups auf unserer Technologie aufbauen, desto mehr können wir über Anwendungsfälle, sichere Modellbereitstellung und potenzielle Möglichkeiten lernen."

Meta profitiere von der Weiterentwicklung der Modelle durch die Community. Die interne Entwicklung werde dadurch beschleunigt, das Modell sei die gemeinsame Sprache. "Täglich entstehen neue Werkzeuge und Ansätze für die Bearbeitung, Verwaltung und Auswertung von Modellen", schreibt Meta.

Als nächsten Schritt nennt Meta neben weiterer Sicherheitsforschung und einem weiterhin starken Community-Fokus die Multimodalität der Modelle: "So wie die Welt nicht nur aus Text besteht, kann KI neue Modalitäten annehmen, um noch eindringlichere generative Erfahrungen zu ermöglichen."

Einen ersten Schritt in diese Richtung hat Meta bereits getan: Der ChatGPT-Konkurrent Meta AI bietet Bildgenerierung im Chat in Kombination mit dem neuen Bildmodell Emu und dem Segmentierungsmodell Segment Anything.

Einem Gerücht von Ende August zufolge soll Llama 3 mit GPT-4 konkurrieren können, das ebenfalls multimodale Funktionen bietet. Llama 3 soll frei verfügbar bleiben.