OpenAI hat neue Richtlinien für die effektive Nutzung seiner KI-Modelle veröffentlicht. Der Schwerpunkt liegt auf einfachen, direkten Anweisungen anstelle von komplexen Prompt-Engineering-Techniken.
Die o-Serie, von OpenAI als "die Planer" bezeichnet, wurde für Aufgaben in Bereichen wie Mathematik, Ingenieurwesen, Recht und Finanzen optimiert. Im Gegensatz dazu seien die GPT-Modelle "Arbeitspferde" für schnelle, kostengünstige Standardaufgaben. Das kürzlich angekündigte GPT-5 soll beide Modellarten vereinen, auch Anthropic bereitet ein Hybrid-Modell vor.
Für die reine o-Serie empfiehlt OpenAI einen neuen Prompting-Ansatz. Das Unternehmen warnt vor sogenannten "Boomer Prompts" - ein Begriff, der in der Community noch für Verwirrung sorgt und der sich auf übermäßig detaillierte Prompts oder auf Prompt-Techniken beziehen könnte, die mit älteren Modellen eingeführt wurden.
Entwickler sollten bei o-Modellen zudem auf Anweisungen wie "Denke Schritt für Schritt" verzichten. Die o-Modelle führen die notwendigen Denkprozesse bereits intern durch, und zwar elaborierter als LLMs, die mit "Schritt für Schritt"-Prompts gefüttert werden. Stattdessen empfiehlt OpenAI kurze, präzise Anweisungen und bei längeren Prompts die Verwendung von Trennzeichen wie XML-Tags, um die Prompts klar zu strukturieren.
Als gutes Beispiel aus dem wissenschaftlichen Bereich nennt OpenAI den folgenden o-Prompt:
Welche drei Verbindungen sollten wir in Betracht ziehen, um die Forschung zu neuen Antibiotika voranzutreiben? Warum sollten wir sie in Betracht ziehen?
OpenAI empfiehlt, Prompts möglichst ohne Beispiele zu schreiben (Zero Shot Prompt) und Beispiele nur bei Bedarf hinzuzufügen (Few or Many Shot Prompt). Wichtig sei, spezifische Erfolgskriterien für die gewünschte Antwort zu definieren und das Modell zu ermutigen, so lange zu arbeiten, bis diese erreicht sind. Außerdem sollten konkrete Einschränkungen, wie Budgetgrenzen, explizit genannt werden.
o-Modelle sollen sich besser für komplexe Aufgaben eignen
Laut OpenAI sind o-Modelle besonders gut darin, begrenzte oder inkonsistente Informationen zu verarbeiten und die Absicht des Benutzers zu verstehen, auch wenn die Anweisungen unvollständig sind. Sie seien in der Lage, aus großen Mengen unstrukturierter Daten die für die Beantwortung einer Frage relevantesten Informationen herauszufiltern.
Auch bei der Verarbeitung komplexer Dokumente mit Hunderten Seiten dichter, unstrukturierter Informationen - wie Verträgen, Finanzberichten oder Versicherungsansprüchen - seien o-Modelle stark. Sie könnten Parallelen zwischen Dokumenten ziehen und Entscheidungen auf der Grundlage der in den Daten enthaltenen impliziten Aussagen treffen.
Laut OpenAI eignen sich o-Modelle auch besonders gut für agentenbasierte Planung und Strategieentwicklung. Das Unternehmen empfiehlt Entwicklern, ein o-Modell als "Planer" zu verwenden, der eine detaillierte, mehrstufige Lösung für ein Problem erstellt und dann für jeden Schritt das geeignete GPT-Modell als "Ausführer" auswählt und zuweist.