xAI hat Grok 2 als offenes Modell inklusive der Gewichte veröffentlicht. Elon Musk kündigte auf X an, dass "Grok 2.5", das 2024 leistungsstärkste Modell von xAI, nun quelloffen verfügbar sei. Die Modellgewichte von Grok 2 sind über Hugging Face abrufbar. Grok 3 soll laut Musk in etwa sechs Monaten ebenfalls als offenes veröffentlicht werden.
Die Nutzung ist unter der xAI Community License erlaubt: Für Forschung und nicht-kommerzielle Anwendungen ist der Einsatz frei, kommerzielle Nutzung ist nur unter Einhaltung der Nutzungsrichtlinien von xAI gestattet. Unter anderem ist es verboten, mit Grok 2 andere große KI-Modelle zu entwickeln oder zu trainieren. Bei Weitergabe muss der Ursprung kenntlich gemacht und "Powered by xAI" angegeben werden.
Sogenannte "Reasoning-Modelle" generieren deutlich mehr Wörter (Token), bevor sie antworten. Offene KI-Modelle benötigen dabei mitunter drei- bis viermal mehr Token als geschlossene Modelle wie Grok-4 oder OpenAI, zeigt eine Analyse von Nous Research. Besonders bei einfachen Wissensfragen produzieren offene Modelle unnötige Gedankenschritte, was trotz niedrigerer Tokenpreise zu höheren Gesamtkosten führen kann.
Anzahl der durchschnittlich verbrauchten Token zur Lösung einer Aufgabe. | Bild: Nous Research
OpenAIs gpt-oss-120b zeige jedoch, dass auch Open-Source-Modelle mit sehr kurzen Denkpfaden effizient arbeiten können, insbesondere bei Mathematikaufgaben. Mistrals Magistral-Modelle hingegen fallen durch hohen Tokenverbrauch auf. Die Token-Effizienz hängt stark vom Aufgabentyp ab.
Obwohl die Basispreise geringer sind, können Open-Source-Reasoning-Modelle teurer sein, wenn sie mehr Token verbrauchen. | Bild: Nous Research
Google bietet an diesem Wochenende in der Gemini-App drei kostenlose Videogenerierungen mit dem KI-Video-Tool Veo 3 an. Veo erstellt kurze KI-Videos mit Ton und ist das derzeit realistischste Videomodell am Markt. Das Angebot endet am Montag, 26. August, um 7:00 Uhr MESZ. Zugriff gibt es unter gemini.google.com/veo.
A humorous 8-second short video portraying a community theater-style play about AI video generation overheating Google's AI chips. | Video: Veo 3 prompted by THE DECODER
Elevenlabs hat ein neues Modell für Text-zu-Sprache veröffentlicht. Eleven v3 (alpha) ist ab sofort über die API verfügbar und bietet laut Unternehmen mehr Ausdrucksmöglichkeiten, Kontrolle und Unterstützung für über 70 Sprachen. Neu ist ein Dialogmodus mit beliebig vielen Sprechern sowie die Möglichkeit, mit Audiotags Emotionen und Stimme zu steuern.
Video: Elevenlabs
Die Nutzung der Eleven v3 (alpha) API ist mit einem kostenlosen Konto möglich, zusätzliche Funktionen können kostenpflichtig sein. Technische Details und Beispiele gibt es in der Dokumentation. Der Einstieg ist über eine kostenlose Anmeldung möglich.