Sogenannte "Reasoning-Modelle" generieren deutlich mehr Wörter (Token), bevor sie antworten. Offene KI-Modelle benötigen dabei mitunter drei- bis viermal mehr Token als geschlossene Modelle wie Grok-4 oder OpenAI, zeigt eine Analyse von Nous Research. Besonders bei einfachen Wissensfragen produzieren offene Modelle unnötige Gedankenschritte, was trotz niedrigerer Tokenpreise zu höheren Gesamtkosten führen kann.

OpenAIs gpt-oss-120b zeige jedoch, dass auch Open-Source-Modelle mit sehr kurzen Denkpfaden effizient arbeiten können, insbesondere bei Mathematikaufgaben. Mistrals Magistral-Modelle hingegen fallen durch hohen Tokenverbrauch auf. Die Token-Effizienz hängt stark vom Aufgabentyp ab.

Google bietet an diesem Wochenende in der Gemini-App drei kostenlose Videogenerierungen mit dem KI-Video-Tool Veo 3 an. Veo erstellt kurze KI-Videos mit Ton und ist das derzeit realistischste Videomodell am Markt. Das Angebot endet am Montag, 26. August, um 7:00 Uhr MESZ. Zugriff gibt es unter gemini.google.com/veo.
A humorous 8-second short video portraying a community theater-style play about AI video generation overheating Google's AI chips. | Video: Veo 3 prompted by THE DECODER
Normalerweise ist das Tool nur über bezahlte Gemini-Konten ab 21,99 Euro / Monat oder die API nutzbar. Möglich ist, dass Google damit die Belastbarkeit vor einem größeren Start prüft. Laut Google wurden seit der Einführung viele Millionen Videos generiert, ein Aspekt, der in der kürzlich veröffentlichten KI-Energiebilanz des Unternehmens nicht auftaucht.
Nvidias H20-Produktion gestoppt – 700.000 KI-Chips für China liegen auf Eis.
Nach der kurzfristigen Freigabe durch die US-Regierung hatte Nvidia chinesischen Kunden rund 700.000 H20-KI-Chips zugesagt. Diese sind speziell auf die Exportauflagen der USA zugeschnitten – abgespeckte Versionen, legal für den chinesischen Markt. Nun zwingt jedoch eine neue Direktive aus Peking lokale Unternehmen, Nvidia-Chips wegen Sicherheitsbedenken nicht mehr zu kaufen. Die Folge: Bereits produzierte Halbleiterwürfel lagern ungenutzt bei Amkor, einem Verpackungspartner in den USA. Die Lieferkette steht still, obwohl der politische Deal mit Washington steht. Der Fall zeigt, wie KI-Hardware zunehmend zwischen geopolitischen Fronten zerrieben wird. Zuvor gab es Berichte, dass die USA die Verkäufe von KI-Hardware mit Tracking-Chips ausstatten sollen.
Das KI-Start-up Dynamics Lab hat mit Mirage 2 eine neue Version seiner generativen Spielwelt-Engine veröffentlicht. Damit können Nutzer eigene Bilder – etwa Skizzen oder Fotos – hochladen und daraus interaktive Spielwelten erzeugen. Die Engine erlaubt zudem, das Spielgeschehen in Echtzeit per Texteingabe zu verändern. Spieler können ihre Welten speichern und teilen. Trotz technischer Fortschritte gegenüber dem Vorgänger bestehen jedoch deutliche Einschränkungen bei der Steuerungsgenauigkeit und der visuellen Stabilität. Google Deepminds Genie 3 ist in diesen Bereichen meilenweit voraus, ist jedoch bisher nicht verfügbar und benötigt wohl deutlich mehr Rechenleistung. Für Mirage 2 ist eine Demo online verfügbar.
🔵Starting from a child’s crayon drawing: 5/ pic.twitter.com/exCPTonW2h
— Dynamics Lab (@DynamicsLab_AI) August 21, 2025
Elevenlabs hat ein neues Modell für Text-zu-Sprache veröffentlicht. Eleven v3 (alpha) ist ab sofort über die API verfügbar und bietet laut Unternehmen mehr Ausdrucksmöglichkeiten, Kontrolle und Unterstützung für über 70 Sprachen. Neu ist ein Dialogmodus mit beliebig vielen Sprechern sowie die Möglichkeit, mit Audiotags Emotionen und Stimme zu steuern.
Video: Elevenlabs
Die Nutzung der Eleven v3 (alpha) API ist mit einem kostenlosen Konto möglich, zusätzliche Funktionen können kostenpflichtig sein. Technische Details und Beispiele gibt es in der Dokumentation. Der Einstieg ist über eine kostenlose Anmeldung möglich.