Forschung Archive

12. November 2025

Baidus neues ERNIE-Modell bearbeitet Bilder während des Denkprozesses

Baidu hat mit ERNIE-4.5-VL-28B-A3B-Thinking ein Reasoning-Model veröffentlicht, das Bilder während des Denkprozesses ver- und bearbeiten kann, etwa einzoomen, um Text besser lesen zu können.

Vollständigen Artikel lesen

Kommentieren

Matthias Bastian

12. November 2025

Forschung

KI-Forscher zeigen, dass Sprachmodelle urheberrechtlich geschützte Bücher auswendig können

Matthias Bastian

11. November 2025

Update

Forschung

Forscher zweifeln an "Reasoning"-Modellen: Effizienter ja, intelligenter nein

Eine neue Studie stellt infrage, ob Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) tatsächlich die Denkfähigkeiten großer Sprachmodelle verbessert – oder lediglich dabei hilft, bekannte Lösungswege effizienter zu reproduzieren.

Maximilian Schreiner

11. November 2025

Forschung

Räumliche Intelligenz ist die nächste große KI-Herausforderung, sagt Pionierin Fei-Fei Li

Matthias Bastian

10. November 2025

Forschung

Metas neues KI-System versteht und transkribiert gesprochene Sprache in mehr als 1.600 Sprachen

Laut Metas Forschungsabteilung Fundamental AI Research (FAIR) soll Omnilingual ASR gesprochene Sprache in über 1.600 Sprachen transkribieren können, darunter 500 seltene Sprachen. Es kann sich neue Sprachen sogar per Few-Shot-Prompting aneignen.

Vollständigen Artikel lesen

Kommentieren

Jonathan Kemper

9. November 2025

Forschung

KI-generierte OP-Videos: Optisch überzeugend, medizinisch katastrophal

Forschende haben Googles neueste Video-KI Veo 3 mit chirurgischen Aufnahmen getestet – und eine deutliche Kluft zwischen optischer Brillanz und medizinischem Verständnis festgestellt. Das System erzeugt verblüffend plausible Bilder, die fachlich oft keinen Sinn ergeben.

Vollständigen Artikel lesen

Kommentieren

Matthias Bastian

8. November 2025

Short News

Ein als "Roon" auf X bekannter OpenAI-Entwickler erklärt, warum der "Charakter" eines LLMs nicht reproduzierbar ist. Laut Roon (via JB) kann sich die Persönlichkeit eines Modells bei jedem Trainingslauf verändern, auch wenn die Daten identisch bleiben. Grund dafür sind zufällige Faktoren im Trainingsprozess, etwa beim Reinforcement Learning (RL), die zu leicht abweichenden Ergebnissen führen. Diese Unterschiede entstehen durch zufällige Entscheidungen im sogenannten Modellraum.

OpenAI versuche laut Roon, diese sogenannten "Personality Drifts" möglichst gering zu halten, da Nutzer oft eine emotionale Bindung zu bestimmten Modellen entwickeln; so geschehen beim "Speichellecker"-Modell GPT-4o, das einige Menschen vermissen (Roon nicht; er wünschte dem Modell mangels Alignment „den Tod” und löschte den Tweet später). Dennoch sei es selbst innerhalb eines Trainingslaufs schwierig, exakt dieselbe Persönlichkeit wiederherzustellen.

Kommentieren

Jonathan Kemper

8. November 2025

Forschung

Studie deckt massive Schwächen in KI-Benchmarks auf

Ein internationales Forschungsteam hat die Validität von Large-Language-Model-Benchmarks systematisch untersucht und dabei erhebliche Mängel aufgedeckt. Die Analyse von 445 Benchmark-Artikeln aus führenden KI-Konferenzen zeigt, dass fast alle Bewertungsverfahren fundamentale methodische Schwächen aufweisen.

Vollständigen Artikel lesen

Kommentieren

Jonathan Kemper

8. November 2025

Forschung

KI-System JanusCoder: Ein Modell für Text, Code und visuelle Ausgaben

Jonathan Kemper

7. November 2025

Update

Forschung

Moonshot AI stellt Kimi K2 Thinking als "bestes Open-Source-Thinking-Modell" vor

Das chinesische KI-Unternehmen Moonshot AI hat mit Kimi K2 Thinking ein neues Open-Source-Sprachmodell vorgestellt, das nach eigenen Angaben das „beste Open-Source-Thinking-Modell“ sein soll. Beeindruckend ist eine Demo, bei der das Modell aus nur einem Prompt einen Word-Klon erzeugt.

Vollständigen Artikel lesen

Kommentieren