Anzeige
Short

xAI hat Grok 2 als offenes Modell inklusive der Gewichte veröffentlicht. Elon Musk kündigte auf X an, dass "Grok 2.5", das 2024 leistungsstärkste Modell von xAI, nun quelloffen verfügbar sei. Die Modellgewichte von Grok 2 sind über Hugging Face abrufbar. Grok 3 soll laut Musk in etwa sechs Monaten ebenfalls als offenes veröffentlicht werden.

Die Nutzung ist unter der xAI Community License erlaubt: Für Forschung und nicht-kommerzielle Anwendungen ist der Einsatz frei, kommerzielle Nutzung ist nur unter Einhaltung der Nutzungsrichtlinien von xAI gestattet. Unter anderem ist es verboten, mit Grok 2 andere große KI-Modelle zu entwickeln oder zu trainieren. Bei Weitergabe muss der Ursprung kenntlich gemacht und "Powered by xAI" angegeben werden.

Anzeige
Anzeige
Short

Sogenannte "Reasoning-Modelle" generieren deutlich mehr Wörter (Token), bevor sie antworten. Offene KI-Modelle benötigen dabei mitunter drei- bis viermal mehr Token als geschlossene Modelle wie Grok-4 oder OpenAI, zeigt eine Analyse von Nous Research. Besonders bei einfachen Wissensfragen produzieren offene Modelle unnötige Gedankenschritte, was trotz niedrigerer Tokenpreise zu höheren Gesamtkosten führen kann.

Anzahl der durchschnittlich verbrauchten Token zur Lösung einer Aufgabe. | Bild: Nous Research

OpenAIs gpt-oss-120b zeige jedoch, dass auch Open-Source-Modelle mit sehr kurzen Denkpfaden effizient arbeiten können, insbesondere bei Mathematikaufgaben. Mistrals Magistral-Modelle hingegen fallen durch hohen Tokenverbrauch auf. Die Token-Effizienz hängt stark vom Aufgabentyp ab.

Obwohl die Basispreise geringer sind, können Open-Source-Reasoning-Modelle teurer sein, wenn sie mehr Token verbrauchen. | Bild: Nous Research
Short

Google bietet an diesem Wochenende in der Gemini-App drei kostenlose Videogenerierungen mit dem KI-Video-Tool Veo 3 an. Veo erstellt kurze KI-Videos mit Ton und ist das derzeit realistischste Videomodell am Markt. Das Angebot endet am Montag, 26. August, um 7:00 Uhr MESZ. Zugriff gibt es unter gemini.google.com/veo.

A humorous 8-second short video portraying a community theater-style play about AI video generation overheating Google's AI chips. | Video: Veo 3 prompted by THE DECODER

Normalerweise ist das Tool nur über bezahlte Gemini-Konten ab 21,99 Euro / Monat oder die API nutzbar. Möglich ist, dass Google damit die Belastbarkeit vor einem größeren Start prüft. Laut Google wurden seit der Einführung viele Millionen Videos generiert, ein Aspekt, der in der kürzlich veröffentlichten KI-Energiebilanz des Unternehmens nicht auftaucht.

Anzeige
Anzeige
Short

Nvidias H20-Produktion gestoppt – 700.000 KI-Chips für China liegen auf Eis.

Nach der kurzfristigen Freigabe durch die US-Regierung hatte Nvidia chinesischen Kunden rund 700.000 H20-KI-Chips zugesagt. Diese sind speziell auf die Exportauflagen der USA zugeschnitten – abgespeckte Versionen, legal für den chinesischen Markt. Nun zwingt jedoch eine neue Direktive aus Peking lokale Unternehmen, Nvidia-Chips wegen Sicherheitsbedenken nicht mehr zu kaufen. Die Folge: Bereits produzierte Halbleiterwürfel lagern ungenutzt bei Amkor, einem Verpackungspartner in den USA. Die Lieferkette steht still, obwohl der politische Deal mit Washington steht. Der Fall zeigt, wie KI-Hardware zunehmend zwischen geopolitischen Fronten zerrieben wird. Zuvor gab es Berichte, dass die USA die Verkäufe von KI-Hardware mit Tracking-Chips ausstatten sollen.

Anzeige
Anzeige
Short

Das KI-Start-up Dynamics Lab hat mit Mirage 2 eine neue Version seiner generativen Spielwelt-Engine veröffentlicht. Damit können Nutzer eigene Bilder – etwa Skizzen oder Fotos – hochladen und daraus interaktive Spielwelten erzeugen. Die Engine erlaubt zudem, das Spielgeschehen in Echtzeit per Texteingabe zu verändern. Spieler können ihre Welten speichern und teilen. Trotz technischer Fortschritte gegenüber dem Vorgänger bestehen jedoch deutliche Einschränkungen bei der Steuerungsgenauigkeit und der visuellen Stabilität. Google Deepminds Genie 3 ist in diesen Bereichen meilenweit voraus, ist jedoch bisher nicht verfügbar und benötigt wohl deutlich mehr Rechenleistung. Für Mirage 2 ist eine Demo online verfügbar.

Google News