Meta scheint mit dem Start seines neuen KI-Modells sehr zufrieden zu sein

Nur eine Woche nach der Veröffentlichung von Meta Llama 3 für Entwickler zeigt sich die KI-Community begeistert. Die Modelle wurden mehr als 1,2 Millionen Mal heruntergeladen und die Entwickler teilen Hunderte von abgeleiteten Modellen.

Meta scheint mit dem Start von Llama 3 sehr zufrieden zu sein: Seit der Veröffentlichung vor einer Woche wurden die Modelle laut Meta mehr als 1,2 Millionen Mal heruntergeladen und mehr als 600 Modellvarianten auf Hugging Face geteilt.

Das Llama 3 GitHub Repository hat bereits über 17.000 Sterne. Llama 3 70B Instruct belegt im LMSYS Chatbot Arena Leaderboard zusammen mit einem anderen Modell den ersten Platz bei den englischsprachigen Bewertungen und den sechsten Platz insgesamt. Damit ist es das am höchsten bewertete offen verfügbare Modell, knapp hinter geschlossenen, proprietären Modellen.

Die Reaktion der Community ist enorm: Entwickler haben bereits das Kontextfenster von Llama 3 verdoppelt, arbeiten an der Quantisierung, der Webnavigation, der Nutzung von Werkzeugen, der Feinabstimmung mit niedriger Genauigkeit und der lokalen Nutzung. Eine Gruppe hat jedoch auch gezeigt, dass Llama 3 ein Sicherheitsproblem hat.

Prof. Dr. med. Llama 3

Partner aus den Bereichen Chips, Hardware und Cloud-Computing haben damit begonnen, Llama 3 für ihre Anwendungen zu adaptieren.

An der Yale School of Medicine arbeiteten Teams zusammen mit der EPFL School of Computer and Communication Sciences innerhalb von 24 Stunden nach der Veröffentlichung an der Feinabstimmung von Meta Llama 3 und stellten Llama-3[8B]-MeditronV1.0 vor - das erste feinabgestimmte Llama-3 8B-Modell für die Medizin. Dieses neue Modell übertrifft bei Standardtests wie MedQA und MedMCQA alle verfügbaren State-of-the-Art-Modelle in seiner Parameterklasse.

Llama-3[8B]-MeditronV1.0 Benchmark Resultate. | Bild: Meta

Meta betont, dass dies erst der Anfang für Llama 3 sei. In den kommenden Monaten will das Unternehmen Modelle mit neuen Fähigkeiten veröffentlichen, darunter Multimodalität, die Möglichkeit, in mehreren Sprachen zu kommunizieren, ein längeres Kontextfenster und verbesserte Gesamtfähigkeiten. Ein 400-Milliarden-GPT-4-Opus-Konkurrent ist noch im Training.

Mit dem Erfolg von Llama 3 kommt Meta-CEO Mark Zuckerberg seinem Ziel näher, das eigene KI-Modell zum Standard für KI-Anwendungen zu machen und damit mittel- bis langfristig auch finanziell zu profitieren, etwa durch geringere Entwicklungs- und Innovationskosten.

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Meta scheint mit dem Start seines neuen KI-Modells sehr zufrieden zu sein

Prof. Dr. med. Llama 3

Metas Open-Source-Modell Llama 3 405B übertrifft GPT-4o in vielen Benchmarks

Metas neuer KI-Chatbot verbreitet Lügen über US-Politiker

OpenAI Mitgründer: Aktuelle Sprachmodelle "um den Faktor 100 bis 1000 oder mehr" untertrainiert

Katzen-Attacke auf Reasoning-Modell zeigt, wie wichtig "Context Engineering" ist

Neue Studie relativiert Apples Kritik an KI-Reasoning

Cloudflare-Boss Matthew Prince hat schlechte Nachrichten für das WWW

Meta scheint mit dem Start seines neuen KI-Modells sehr zufrieden zu sein

Prof. Dr. med. Llama 3

Metas Open-Source-Modell Llama 3 405B übertrifft GPT-4o in vielen Benchmarks

Metas neuer KI-Chatbot verbreitet Lügen über US-Politiker

OpenAI Mitgründer: Aktuelle Sprachmodelle "um den Faktor 100 bis 1000 oder mehr" untertrainiert