Anzeige
Short

Es sieht so aus, als würde die Menschheit ihr finales Examen selbst nicht bestehen. Laut FutureHouse enthalten rund 29 Prozent der Biologie- und Chemiefragen im KI-Benchmark Humanity’s Last Exam (HLE) Antworten, die laut Fachliteratur falsch oder irreführend sind. Die Fehlerquote wurde durch eine Kombination aus menschlicher und KI-gestützter Analyse ermittelt.

HLE wurde als besonders schwieriger Test konzipiert, um moderne Sprachmodelle an ihre Grenzen zu bringen, enthält aber laut der Analyse viele missverständliche oder ungenaue Fragen. Die Überprüfung durch Fachleute war auf wenige Minuten begrenzt, eine vollständige Richtigkeitsprüfung war nicht gefordert. FutureHouse veröffentlichte nun ein geprüftes Teilset namens "HLE Bio/Chem Gold" auf HuggingFace.

Short

Update: Die Registrierung ist jetzt verfügbar. Plätze werden per Lotterieverfahren vergeben.

OpenAI kündigt seinen nächsten DevDay für den 6. Oktober 2025 in San Francisco an. Die Veranstaltung soll mit mehr als 1.500 Entwicklern die bisher größte ihrer Art werden. Geplant sind eine live übertragene Eröffnungs-Keynote, praktische Workshops mit den neuesten Modellen und Tools sowie mehr Bühnen und Demos als im Vorjahr. Weitere Details zur Veranstaltung sind bisher nicht bekannt. Eine Anmeldung für die Bekanntgabe der Registrierung ist hier möglich.

Anzeige
Anzeige
Anzeige
Anzeige
Short

Netflix hat in seiner argentinischen Erfolgsserie "El Eternauta" erstmals generative KI in einer finalen Filmszene eingesetzt. Laut Co-CEO Ted Sarandos wurde dabei eine KI-gestützte VFX-Sequenz produziert, die zehnmal schneller fertiggestellt wurde als mit klassischen Methoden. Zudem sei die Umsetzung mit herkömmlichen Mitteln im Rahmen des Serienbudgets nicht möglich gewesen. Sarandos betonte, dass KI für Netflix ein Werkzeug sei, um Kreative bei der Arbeit zu unterstützen, nicht zu ersetzen. Die KI-Anwendungen kamen in Verbindung mit virtueller Produktion zum Einsatz.

Wir sind weiterhin überzeugt, dass KI eine große Chance bietet, Kreative dabei zu unterstützen, Filme und Serien besser zu machen – nicht nur günstiger. Es handelt sich um KI-gestützte Werkzeuge für Kreative. Das bedeutet: echte Menschen leisten echte Arbeit mit besseren Werkzeugen.

Netflix Co-CEO Ted Sarandos

Anzeige
Anzeige
Short

Ein KI-Modell von OpenAI erreichte den zweiten Platz beim AtCoder Heuristics World Finals, einem internationalen Wettbewerb für besonders schwierige Optimierungsprobleme. Das Modell lief zehn Stunden lang vollständig autonom und trat unter denselben Bedingungen wie die menschlichen Finalisten an: Nach einem starken Start verlor es zwischenzeitlich die Führung, holte wieder auf, wurde aber letztlich vom erfahrenen Teilnehmer FakePsyho überholt. OpenAI zufolge ist dies die erste bekannte Top-3-Platzierung eines KI-Modells bei einem führenden Programmier- und Mathematikwettbewerb. Welches Modell OpenAI genau verwendet hat, ist nicht bekannt. Der Wettbewerb wurde von OpenAI gesponsort.

Google News