Anzeige
Short

Sogenannte "Reasoning-Modelle" generieren deutlich mehr Wörter (Token), bevor sie antworten. Offene KI-Modelle benötigen dabei mitunter drei- bis viermal mehr Token als geschlossene Modelle wie Grok-4 oder OpenAI, zeigt eine Analyse von Nous Research. Besonders bei einfachen Wissensfragen produzieren offene Modelle unnötige Gedankenschritte, was trotz niedrigerer Tokenpreise zu höheren Gesamtkosten führen kann.

Anzahl der durchschnittlich verbrauchten Token zur Lösung einer Aufgabe. | Bild: Nous Research

OpenAIs gpt-oss-120b zeige jedoch, dass auch Open-Source-Modelle mit sehr kurzen Denkpfaden effizient arbeiten können, insbesondere bei Mathematikaufgaben. Mistrals Magistral-Modelle hingegen fallen durch hohen Tokenverbrauch auf. Die Token-Effizienz hängt stark vom Aufgabentyp ab.

Obwohl die Basispreise geringer sind, können Open-Source-Reasoning-Modelle teurer sein, wenn sie mehr Token verbrauchen. | Bild: Nous Research
Short

Google bietet an diesem Wochenende in der Gemini-App drei kostenlose Videogenerierungen mit dem KI-Video-Tool Veo 3 an. Veo erstellt kurze KI-Videos mit Ton und ist das derzeit realistischste Videomodell am Markt. Das Angebot endet am Montag, 26. August, um 7:00 Uhr MESZ. Zugriff gibt es unter gemini.google.com/veo.

A humorous 8-second short video portraying a community theater-style play about AI video generation overheating Google's AI chips. | Video: Veo 3 prompted by THE DECODER

Normalerweise ist das Tool nur über bezahlte Gemini-Konten ab 21,99 Euro / Monat oder die API nutzbar. Möglich ist, dass Google damit die Belastbarkeit vor einem größeren Start prüft. Laut Google wurden seit der Einführung viele Millionen Videos generiert, ein Aspekt, der in der kürzlich veröffentlichten KI-Energiebilanz des Unternehmens nicht auftaucht.

Anzeige
Anzeige
Short

Nvidias H20-Produktion gestoppt – 700.000 KI-Chips für China liegen auf Eis.

Nach der kurzfristigen Freigabe durch die US-Regierung hatte Nvidia chinesischen Kunden rund 700.000 H20-KI-Chips zugesagt. Diese sind speziell auf die Exportauflagen der USA zugeschnitten – abgespeckte Versionen, legal für den chinesischen Markt. Nun zwingt jedoch eine neue Direktive aus Peking lokale Unternehmen, Nvidia-Chips wegen Sicherheitsbedenken nicht mehr zu kaufen. Die Folge: Bereits produzierte Halbleiterwürfel lagern ungenutzt bei Amkor, einem Verpackungspartner in den USA. Die Lieferkette steht still, obwohl der politische Deal mit Washington steht. Der Fall zeigt, wie KI-Hardware zunehmend zwischen geopolitischen Fronten zerrieben wird. Zuvor gab es Berichte, dass die USA die Verkäufe von KI-Hardware mit Tracking-Chips ausstatten sollen.

Anzeige
Anzeige
Short

Das KI-Start-up Dynamics Lab hat mit Mirage 2 eine neue Version seiner generativen Spielwelt-Engine veröffentlicht. Damit können Nutzer eigene Bilder – etwa Skizzen oder Fotos – hochladen und daraus interaktive Spielwelten erzeugen. Die Engine erlaubt zudem, das Spielgeschehen in Echtzeit per Texteingabe zu verändern. Spieler können ihre Welten speichern und teilen. Trotz technischer Fortschritte gegenüber dem Vorgänger bestehen jedoch deutliche Einschränkungen bei der Steuerungsgenauigkeit und der visuellen Stabilität. Google Deepminds Genie 3 ist in diesen Bereichen meilenweit voraus, ist jedoch bisher nicht verfügbar und benötigt wohl deutlich mehr Rechenleistung. Für Mirage 2 ist eine Demo online verfügbar.

Anzeige
Anzeige
Short

Elevenlabs hat ein neues Modell für Text-zu-Sprache veröffentlicht. Eleven v3 (alpha) ist ab sofort über die API verfügbar und bietet laut Unternehmen mehr Ausdrucksmöglichkeiten, Kontrolle und Unterstützung für über 70 Sprachen. Neu ist ein Dialogmodus mit beliebig vielen Sprechern sowie die Möglichkeit, mit Audiotags Emotionen und Stimme zu steuern.

Video: Elevenlabs

Die Nutzung der Eleven v3 (alpha) API ist mit einem kostenlosen Konto möglich, zusätzliche Funktionen können kostenpflichtig sein. Technische Details und Beispiele gibt es in der Dokumentation. Der Einstieg ist über eine kostenlose Anmeldung möglich.

Google News