Forschung Archive

23. August 2025

Sogenannte "Reasoning-Modelle" generieren deutlich mehr Wörter (Token), bevor sie antworten. Offene KI-Modelle benötigen dabei mitunter drei- bis viermal mehr Token als geschlossene Modelle wie Grok-4 oder OpenAI, zeigt eine Analyse von Nous Research. Besonders bei einfachen Wissensfragen produzieren offene Modelle unnötige Gedankenschritte, was trotz niedrigerer Tokenpreise zu höheren Gesamtkosten führen kann.

Anzahl der durchschnittlich verbrauchten Token zur Lösung einer Aufgabe. | Bild: Nous Research

OpenAIs gpt-oss-120b zeige jedoch, dass auch Open-Source-Modelle mit sehr kurzen Denkpfaden effizient arbeiten können, insbesondere bei Mathematikaufgaben. Mistrals Magistral-Modelle hingegen fallen durch hohen Tokenverbrauch auf. Die Token-Effizienz hängt stark vom Aufgabentyp ab.

Obwohl die Basispreise geringer sind, können Open-Source-Reasoning-Modelle teurer sein, wenn sie mehr Token verbrauchen. | Bild: Nous Research

Kommentieren

Jonathan Kemper

23. August 2025

Forschung

Spiral-Bench testet, wie KI-Modelle Nutzer in gefährliche Gedankenspiralen treiben

Maximilian Schreiner

22. August 2025

Forschung

Das KI-Start-up Dynamics Lab hat mit Mirage 2 eine neue Version seiner generativen Spielwelt-Engine veröffentlicht. Damit können Nutzer eigene Bilder – etwa Skizzen oder Fotos – hochladen und daraus interaktive Spielwelten erzeugen. Die Engine erlaubt zudem, das Spielgeschehen in Echtzeit per Texteingabe zu verändern. Spieler können ihre Welten speichern und teilen. Trotz technischer Fortschritte gegenüber dem Vorgänger bestehen jedoch deutliche Einschränkungen bei der Steuerungsgenauigkeit und der visuellen Stabilität. Google Deepminds Genie 3 ist in diesen Bereichen meilenweit voraus, ist jedoch bisher nicht verfügbar und benötigt wohl deutlich mehr Rechenleistung. Für Mirage 2 ist eine Demo online verfügbar.

🔵Starting from a child’s crayon drawing: 5/ pic.twitter.com/exCPTonW2h

— Dynamics Lab (@DynamicsLab_AI) August 21, 2025

Kommentieren

Jonathan Kemper

20. August 2025

Forschung

Faktenflut schlägt Psychologie: KI-Überzeugung funktioniert anders als gedacht

Einsen und Nullen formen Cloud-, E-Mail- und Dokument-Symbole über digitalem Gitter

Matthias Bastian

20. August 2025

Forschung

Turing-Preisträger Richard Sutton: KI-Industrie hat "ihren Weg verloren"

Jonathan Kemper

19. August 2025

Forschung

Alibaba erweitert Qwen-Image um Bildbearbeitungsfunktionen

Collage mit einem zentralen Qwen-Bären und 16 um ihn gruppierten Cartoon-Bären in verschiedenen Berufs- und Freizeitrollen.

Jonathan Kemper

19. August 2025

Forschung

Hunyuan GameCraft wandelt Bilder in interaktive Gaming-Videos um

Jonathan Kemper

18. August 2025

Forschung

Nett, aber falsch: Sprachmodelle machen mehr Fehler, wenn sie schmeicheln

Vektor mit Vernetzungsdiagramm, Like-Icon, geteiltem Erdball über flacher Scheibe und Nutzer-Silhouette.

Matthias Bastian

17. August 2025

Forschung

Meta stellt mit DINOv3 ein neues KI-Modell für Bildverarbeitung vor, das ohne gelabelte Daten trainiert wurde. Laut Meta ist DINOv3 ohne Anpassungen über verschiedene Bildaufgaben und Domänen einsetzbar, insbesondere für Bereiche mit wenig annotierten Daten, etwa Satellitenbilder. Es erreicht in mehreren anspruchsvollen Bildaufgaben Ergebnisse, die bisher spezialisierten Systemen vorbehalten waren.

Video: Meta

DINOv3 nutzt wie die beiden Vorgängermodelle selbstüberwachtes Lernen (SSL) auf Basis von 1,7 Milliarden Bildern und 7 Milliarden Parametern. In Benchmarks schneidet v3 besser ab als v2, der Sprung ist laut Metas Benchmarks allerdings lange nicht so groß wie von v1 auf v2.

Meta stellt die vortrainierten Modelle in verschiedenen Varianten, Adapter sowie den Trainings- und Evaluierungscode unter der auch kommerziell nutzbaren Dinov3 Lizenz bei Github zur Verfügung.

Kommentieren

Jonathan Kemper

17. August 2025

Forschung

Spiral-Bench testet, wie KI-Modelle Nutzer in gefährliche Gedankenspiralen treiben

Faktenflut schlägt Psychologie: KI-Überzeugung funktioniert anders als gedacht

Turing-Preisträger Richard Sutton: KI-Industrie hat "ihren Weg verloren"

Alibaba erweitert Qwen-Image um Bildbearbeitungsfunktionen

Hunyuan GameCraft wandelt Bilder in interaktive Gaming-Videos um

Nett, aber falsch: Sprachmodelle machen mehr Fehler, wenn sie schmeicheln

Tencent Hunyuan-Large-Vision: Multimodales KI-Modell erreicht Spitzenplatz in China