Skip to content

Meta scheint mit dem Start seines neuen KI-Modells sehr zufrieden zu sein

Image description
Meta

Nur eine Woche nach der Veröffentlichung von Meta Llama 3 für Entwickler zeigt sich die KI-Community begeistert. Die Modelle wurden mehr als 1,2 Millionen Mal heruntergeladen und die Entwickler teilen Hunderte von abgeleiteten Modellen.

Meta scheint mit dem Start von Llama 3 sehr zufrieden zu sein: Seit der Veröffentlichung vor einer Woche wurden die Modelle laut Meta mehr als 1,2 Millionen Mal heruntergeladen und mehr als 600 Modellvarianten auf Hugging Face geteilt.

Das Llama 3 GitHub Repository hat bereits über 17.000 Sterne. Llama 3 70B Instruct belegt im LMSYS Chatbot Arena Leaderboard zusammen mit einem anderen Modell den ersten Platz bei den englischsprachigen Bewertungen und den sechsten Platz insgesamt. Damit ist es das am höchsten bewertete offen verfügbare Modell, knapp hinter geschlossenen, proprietären Modellen.

Die Reaktion der Community ist enorm: Entwickler haben bereits das Kontextfenster von Llama 3 verdoppelt, arbeiten an der Quantisierung, der Webnavigation, der Nutzung von Werkzeugen, der Feinabstimmung mit niedriger Genauigkeit und der lokalen Nutzung. Eine Gruppe hat jedoch auch gezeigt, dass Llama 3 ein Sicherheitsproblem hat.

Prof. Dr. med. Llama 3

Partner aus den Bereichen Chips, Hardware und Cloud-Computing haben damit begonnen, Llama 3 für ihre Anwendungen zu adaptieren.

An der Yale School of Medicine arbeiteten Teams zusammen mit der EPFL School of Computer and Communication Sciences innerhalb von 24 Stunden nach der Veröffentlichung an der Feinabstimmung von Meta Llama 3 und stellten Llama-3[8B]-MeditronV1.0 vor - das erste feinabgestimmte Llama-3 8B-Modell für die Medizin. Dieses neue Modell übertrifft bei Standardtests wie MedQA und MedMCQA alle verfügbaren State-of-the-Art-Modelle in seiner Parameterklasse.

Llama-3[8B]-MeditronV1.0 Benchmark Resultate. | Bild: Meta
Meta betont, dass dies erst der Anfang für Llama 3 sei. In den kommenden Monaten will das Unternehmen Modelle mit neuen Fähigkeiten veröffentlichen, darunter Multimodalität, die Möglichkeit, in mehreren Sprachen zu kommunizieren, ein längeres Kontextfenster und verbesserte Gesamtfähigkeiten. Ein 400-Milliarden-GPT-4-Opus-Konkurrent ist noch im Training.

Mit dem Erfolg von Llama 3 kommt Meta-CEO Mark Zuckerberg seinem Ziel näher, das eigene KI-Modell zum Standard für KI-Anwendungen zu machen und damit mittel- bis langfristig auch finanziell zu profitieren, etwa durch geringere Entwicklungs- und Innovationskosten.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

Quelle: Meta

KI-News ohne Hype
Von Menschen kuratiert.

  • Mehr als 20 Prozent Launch-Rabatt.
  • Lesen ohne Ablenkung – keine Google-Werbebanner.
  • Zugang zum Kommentarsystem und Austausch mit der Community.
  • Wöchentlicher KI-Newsletter.
  • 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
  • Bis zu 25 % Rabatt auf KI Pro Online-Events.
  • Zugang zum kompletten Archiv der letzten zehn Jahre.
  • Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.
The Decoder abonnieren