OpenAI erweitert API um o1-Modell mit Function Calling und mehr
OpenAIs o1 ist ab sofort über die API verfügbar. Das Modell unterstützt nun auch Funktionsaufrufe, strukturierte Ausgaben im JSON-Format sowie die Analyse von Bildern.
Wie OpenAI mitteilt, übertrifft das neue Modell mit der Bezeichnung "o1-2024-12-17" seinen indirekten Vorgänger "o1-preview" deutlich: Bei mathematischen Aufgaben erreicht es eine Genauigkeit von 96,4 Prozent (vorher: 85,5 Prozent) und bei Programmieraufgaben 76,6 Prozent (vorher: 52,3 Prozent).
Auch bei Function Calling und strukturierten Ausgaben soll o1 deutlich besser sein als der Vorgänger. Zudem benötigt es laut OpenAI im Durchschnitt 60 Prozent weniger Tokens für Reasoning-Aufgaben als o1-preview, was sich positiv auf die Geschwindigkeit und die Kosten auswirkt.
Das neue o1-Modell ist auch in ChatGPT verfügbar. Es soll umfangreichere und korrektere Antworten geben und Prompts weniger oft ablehnen. Menschen hätten das neue o1-Modell konsistent besser bewertet.
Eine weitere Neuerung betrifft die Realtime API: OpenAI senkt die Preise für Audio-Funktionen um 60 Prozent. Input-Tokens kosten nun 40 Dollar pro Million, Output-Tokens 80 Dollar pro Million. Für zwischengespeicherte Audio-Eingaben sinken die Kosten sogar um 87,5 Prozent auf 2,50 Dollar pro Million Tokens.
Zusätzlich führt OpenAI eine kostengünstigere Variante ein: Das neue GPT-4o mini-Modell ist laut OpenAI zu einem Zehntel der bisherigen Audio-Preise verfügbar. Konkret bedeutet das 10 Dollar pro Million Input-Tokens und 20 Dollar pro Million Output-Tokens.
Ebenfalls neu ist eine WebRTC-Integration ein, die es Entwicklern ermöglicht, Echtzeit-Sprachanwendungen mit wenigen Zeilen Code zu erstellen. Die maximale Sitzungsdauer wurde von 15 auf 30 Minuten erhöht.
Neue Finetuning-Option für Stil und Tonalität
Mit "Preference Fine-Tuning" stellt OpenAI eine neue Methode vor, um KI-Modelle an Nutzer- und Entwicklerpräferenzen anzupassen. Anders als beim bisherigen "Supervised Fine-Tuning" lernt das Modell dabei aus Paaren von bevorzugten und nicht bevorzugten Antworten.
Nach Angaben von OpenAI eignet sich diese Methode besonders für subjektive Aufgaben wie kreatives Schreiben oder Zusammenfassungen, bei denen Ton und Stil wichtig sind.
Für Entwickler stellt OpenAI außerdem neue Software Development Kits (SDKs) für die Programmiersprachen Go und Java bereit. Diese ergänzen die bereits vorhandenen SDKs für Python, Node.js und .NET.
OpenAI gewährt schrittweise Zugriff, gestartet wird mit Stufe 5. In der API-Dokumentation finden Entwickler detaillierte Anleitungen für o1, die Echtzeit-API, die WebRTC-Integration und Preference Fine-Tuning.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar“‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
Jetzt abonnierenKI-News ohne Hype
Von Menschen kuratiert.
- Mehr als 20 Prozent Launch-Rabatt.
- Lesen ohne Ablenkung – keine Google-Werbebanner.
- Zugang zum Kommentarsystem und Austausch mit der Community.
- Wöchentlicher KI-Newsletter.
- 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
- Bis zu 25 % Rabatt auf KI Pro Online-Events.
- Zugang zum kompletten Archiv der letzten zehn Jahre.
- Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.