Neue KI-Benchmarks: OpenAI will mit Pioneers-Programm Praxistests verbessern

10. April 2025

OpenAI startet ein neues Programm zur Entwicklung branchenspezifischer KI-Bewertungssysteme. Das "Pioneers Program" soll Benchmarks für Bereiche wie Recht, Finanzen und Gesundheitswesen schaffen, die reale Anwendungsfälle besser abbilden als bestehende Tests. Aktuelle KI-Benchmarks sind laut OpenAI problematisch, da sie oft schwer verständliche Aufgaben messen oder manipulierbar sind - ein Vorwurf, dem sich das Unternehmen selbst immer wieder stellen muss. In den kommenden Monaten will das Unternehmen mit "mehreren Firmen" zusammenarbeiten, um maßgeschneiderte Bewertungsmaßstäbe zu entwickeln und später öffentlich zu teilen. Die erste Gruppe besteht aus ausgewählten Start-ups mit praktischen KI-Anwendungen. Teilnehmende Unternehmen können zudem mit OpenAI an Modellverbesserungen durch Reinforcement-Fine-Tuning arbeiten.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Neue KI-Benchmarks: OpenAI will mit Pioneers-Programm Praxistests verbessern

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.