Metas Open Source GPT-4 Konkurrent Llama 3 soll in Kürze starten

10. April 2024

Midjourney prompted by THE DECODER

Update – 10. April 2024

Informationen des London-Events ergänzt

Update vom 10. April 2024:

Meta-Cheflobbyist Nick Clegg bestätigt auf einer Meta KI-Veranstaltung in London, dass Llama 3 bald starten soll. Ein genaues Datum nennt Clegg nicht. Es soll eine Reihe verschiedener Modelle mit unterschiedlichen Fähigkeiten geben, die Meta im Laufe des Jahres veröffentlicht.

Langfristig sollen die KI-Agenten in der Lage sein, neben Antworten auch konkrete Aktionen zu generieren, etwa die Buchung einer Reise. Meta selbst will Llama 3-Modelle in zahlreiche eigene Dienste integrieren, darunter WhatsApp und RayBan Smartglasses. Meta AI, das die Llama-Modelle nutzt, soll der nützlichste KI-Assistent werden.

"Wir werden die ganze Zeit mit diesen KI-Assistenten sprechen", sagte Metas KI-Chefwissenschaftler Yann LeCun. "Unsere gesamte digitale Versorgung wird über KI-Systeme laufen."

LeCun bekräftigt erneut, dass für einen signifikanten logischen Fortschritt bei großen Sprachmodellen ein wissenschaftlicher Durchbruch erforderlich ist, der es dem Modell ermöglicht, aus möglichen Antworten die beste auszuwählen und ein mentales Modell der Auswirkungen seiner Handlungen zu entwickeln.

Originalartikel vom 9. April 2024:

Meta Llama 3: Neues Open Source KI-Modell soll nächste Woche starten

Einem Angestellten von Meta zufolge wird das Unternehmen in der nächsten Woche zwei kleinere Versionen seines kommenden Large Language Model Llama 3 veröffentlichen.

Das berichtet The Information unter Berufung auf eine Quelle bei Meta. Die kleineren Modelle sollen die Vorfreude auf die größere Version von Llama 3 im Sommer schüren, die ein Jahr nach der Veröffentlichung von Llama 2 im Sommer 2023 erscheinen soll.

Seitdem hat sich der Wettbewerb auf dem Open-Source-Markt deutlich verschärft. Immer mehr Modellentwickler versuchen auf sich aufmerksam zu machen, indem sie ihre Modelle oder eine Auswahl davon ebenfalls als Open Source zur Verfügung stellen.

Neben den Llama-Modellen hat insbesondere das französische Modell-Start-up Mistral mit seinem Mistral 7B und dem Mixtral MoE-Modell die Open-Source-Szene geprägt. Mit den Gemma-Modellen mischt auch Google-Deepmind auf dem Open-Source-Markt mit.

Llama 3 wird multimodal

Die beiden kleineren Modelle werden auf die Textgenerierung spezialisiert sein. Das für den Sommer geplante vollwertige Llama 3 soll jedoch multimodal arbeiten und auch Bilder erzeugen oder Fragen zu Bildern beantworten können.

Meta hofft, dass Llama 3 zu OpenAIs GPT-4 aufschließen kann. Die größte Version von Llama 3 könnte mit etwa 140 Milliarden Parametern doppelt so groß werden wie Llama 2.

Allerdings sagt die Anzahl der Parameter nur bedingt etwas über die Qualität des Modells aus. Elon Musks Grok-1 ist mit 314 Milliarden Parametern derzeit das größte Open Source Mixture-of-Experts-Modell. Es bietet aber nur eine Leistung auf dem Niveau von OpenAIs GPT-3.5 oder dem mit 56 Milliarden Parametern wesentlich kleineren Mixtral-Modell von Mistral.

Auch inhaltlich wird es wahrscheinlich Veränderungen geben: In den vergangenen Monaten hat das Meta-Team daran gearbeitet, Llama 3 offener für die Beantwortung kontroverser Fragen zu machen. Den Verantwortlichen von Meta waren die Antworten von Llama 2 zu vorsichtig. Llama 3 könnte bei schwierigen Fragen besser auf den Nutzer eingehen und mehr Kontext liefern.

Meta investierte zuletzt stark in KI und gehört zu den Hauptkunden für Nvidias Grafik-Chips. Bis Ende des Jahres will Meta-CEO Mark Zuckerberg rund 600.000 Grafikkarten für das KI-Training im Einsatz haben. Mit Artemis entwickelt Meta zudem einen eigenen KI-Chip.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren