Forschung Archive

26. Dezember 2025

Metas neues KI-Modell SAM Audio lässt Nutzer Töne in Videos anklicken

Hundegebell aus dem Straßenlärm filtern oder per Mausklick im Video eine Tonquelle isolieren: Mit SAM Audio bringt Meta sein bewährtes visuelles Segmentierungskonzept in die Audiowelt. Das Modell vereinfacht Audio-Bearbeitung durch Text, Klicks oder Zeitmarkierungen. Code und Gewichte sind frei verfügbar.

Vollständigen Artikel lesen

Kommentieren

Matthias Bastian

26. Dezember 2025

Forschung

Neuer Benchmark zeigt: LLMs scheitern noch an echter wissenschaftlicher Forschung

Maximilian Schreiner

25. Dezember 2025

Update

Forschung

Langjähriges KI-Hindernis ARC fällt durch die unaufhaltsame Optimierungsmaschinerie

Matthias Bastian

22. Dezember 2025

Forschung

GPT-5 löst angeblich offenes Mathe-Problem ohne menschliche Hilfe

GPT-5 löst erstmals ein offenes Mathe-Problem – und der Mathematiker dahinter zeigt genau, welche Zeile von welcher KI stammt. Muss Wissenschaft so transparent sein?

Vollständigen Artikel lesen

Kommentieren

Matthias Bastian

22. Dezember 2025

Forschung

KI-Pioniere Yann LeCun und Deepmind CEO Demis Hassabis bewerten menschliche Intelligenz völlig unterschiedlich

Jonathan Kemper

21. Dezember 2025

Forschung

Halb-offene KI-Modelle aus China verdrängen die US-Konkurrenz

Matthias Bastian

21. Dezember 2025

Short News

Die KI-Forschungsorganisation METR hat neue Testergebnisse für Claude Opus 4.5 veröffentlicht. Das Modell von Anthropic erreicht einen sogenannten 50-Prozent-Zeithorizont von etwa 4 Stunden und 49 Minuten. Das ist der höchste bisher gemessene Wert. Der Zeithorizont beschreibt, wie lange Aufgaben sein können, die ein KI-Modell mit einer bestimmten Erfolgsrate (in diesem Fall 50 Prozent) löst.

Auffällig ist der Unterschied zwischen verschiedenen Schwierigkeitsstufen. Der 80%-Zeithorizont liegt weiter bei nur 27 Minuten, ähnlich wie bei früheren Modellen. Laut METR zeigt das, dass Opus 4.5 besonders bei längeren Aufgaben besser abschneidet als Vorgänger. Die theoretische Obergrenze von mehr als 20 Stunden hält METR indes für unwahrscheinlich und führt sie eher auf fehlende Testdaten und statistische Unschärfe zurück als auf die tatsächliche Leistungsfähigkeit des Modells.

Wie jeder Benchmark hat auch die METR-Messung Einschränkungen, unter anderem, dass der Benchmark auf nur 14 Testfällen basiert. Eine ausführliche Analyse der Schwächen steht hier.

Kommentieren

Jonathan Kemper

20. Dezember 2025

Forschung

KI-Kennzeichnung in der Werbung lässt Klickraten um ein Drittel einbrechen

Neonfarbener Laufschuh mit glitchartigen Farbstreifen auf grün-blauem Banner symbolisiert Geschwindigkeit, digitale Dynamik

Jonathan Kemper

20. Dezember 2025

Forschung

Offener Google-Standard soll KI-Agenten schnell Nutzeroberflächen generieren lassen

Google stellt mit A2UI einen offenen Standard vor, der KI-Agenten das Erstellen grafischer Oberflächen erlaubt. Statt nur Textnachrichten zu senden, können KIs dynamisch Formulare oder Buttons generieren, die sich optisch nahtlos in die jeweilige App einfügen.

Vollständigen Artikel lesen

Kommentieren

Matthias Bastian

18. Dezember 2025

Forschung

Metas neues KI-Modell SAM Audio lässt Nutzer Töne in Videos anklicken

Neuer Benchmark zeigt: LLMs scheitern noch an echter wissenschaftlicher Forschung

Langjähriges KI-Hindernis ARC fällt durch die unaufhaltsame Optimierungsmaschinerie

GPT-5 löst angeblich offenes Mathe-Problem ohne menschliche Hilfe

KI-Pioniere Yann LeCun und Deepmind CEO Demis Hassabis bewerten menschliche Intelligenz völlig unterschiedlich

Halb-offene KI-Modelle aus China verdrängen die US-Konkurrenz

KI-Kennzeichnung in der Werbung lässt Klickraten um ein Drittel einbrechen

Offener Google-Standard soll KI-Agenten schnell Nutzeroberflächen generieren lassen

GPT-5.2 dominiert OpenAIs neuen Wissenschafts-Test, scheitert aber an komplexen Forschungsaufgaben