Sogenannte "Reasoning-Modelle" generieren deutlich mehr Wörter (Token), bevor sie antworten. Offene KI-Modelle benötigen dabei mitunter drei- bis viermal mehr Token als geschlossene Modelle wie Grok-4 oder OpenAI, zeigt eine Analyse von Nous Research. Besonders bei einfachen Wissensfragen produzieren offene Modelle unnötige Gedankenschritte, was trotz niedrigerer Tokenpreise zu höheren Gesamtkosten führen kann.
Anzahl der durchschnittlich verbrauchten Token zur Lösung einer Aufgabe. | Bild: Nous Research
OpenAIs gpt-oss-120b zeige jedoch, dass auch Open-Source-Modelle mit sehr kurzen Denkpfaden effizient arbeiten können, insbesondere bei Mathematikaufgaben. Mistrals Magistral-Modelle hingegen fallen durch hohen Tokenverbrauch auf. Die Token-Effizienz hängt stark vom Aufgabentyp ab.
Obwohl die Basispreise geringer sind, können Open-Source-Reasoning-Modelle teurer sein, wenn sie mehr Token verbrauchen. | Bild: Nous Research
Google bietet an diesem Wochenende in der Gemini-App drei kostenlose Videogenerierungen mit dem KI-Video-Tool Veo 3 an. Veo erstellt kurze KI-Videos mit Ton und ist das derzeit realistischste Videomodell am Markt. Das Angebot endet am Montag, 26. August, um 7:00 Uhr MESZ. Zugriff gibt es unter gemini.google.com/veo.
A humorous 8-second short video portraying a community theater-style play about AI video generation overheating Google's AI chips. | Video: Veo 3 prompted by THE DECODER
Nvidias H20-Produktion gestoppt – 700.000 KI-Chips für China liegen auf Eis.
Nach der kurzfristigen Freigabe durch die US-Regierung hatte Nvidia chinesischen Kunden rund 700.000 H20-KI-Chips zugesagt. Diese sind speziell auf die Exportauflagen der USA zugeschnitten – abgespeckte Versionen, legal für den chinesischen Markt. Nun zwingt jedoch eine neue Direktive aus Peking lokale Unternehmen, Nvidia-Chips wegen Sicherheitsbedenken nicht mehr zu kaufen. Die Folge: Bereits produzierte Halbleiterwürfel lagern ungenutzt bei Amkor, einem Verpackungspartner in den USA. Die Lieferkette steht still, obwohl der politische Deal mit Washington steht. Der Fall zeigt, wie KI-Hardware zunehmend zwischen geopolitischen Fronten zerrieben wird. Zuvor gab es Berichte, dass die USA die Verkäufe von KI-Hardware mit Tracking-Chips ausstatten sollen.
Das KI-Start-up Dynamics Lab hat mit Mirage 2 eine neue Version seiner generativen Spielwelt-Engine veröffentlicht. Damit können Nutzer eigene Bilder – etwa Skizzen oder Fotos – hochladen und daraus interaktive Spielwelten erzeugen. Die Engine erlaubt zudem, das Spielgeschehen in Echtzeit per Texteingabe zu verändern. Spieler können ihre Welten speichern und teilen. Trotz technischer Fortschritte gegenüber dem Vorgänger bestehen jedoch deutliche Einschränkungen bei der Steuerungsgenauigkeit und der visuellen Stabilität. Google Deepminds Genie 3 ist in diesen Bereichen meilenweit voraus, ist jedoch bisher nicht verfügbar und benötigt wohl deutlich mehr Rechenleistung. Für Mirage 2 ist eine Demo online verfügbar.