Eine neue Suchmaschine oder GPT-5 wird OpenAI am Montag wahrscheinlich nicht zeigen. Stattdessen könnte der Schwerpunkt auf Agenten, Spracheingabe und neuen "Quality of Life"-Funktionen für ChatGPT liegen.
Quellen von The Information zufolge arbeitet OpenAI an einem KI-Sprachassistenten, der die Bemühungen von Google und Apple im Bereich der Sprach-KI übertreffen soll. Er soll eine bessere Sprach- und Bilderkennung und bessere logische Schlussfolgerungen als aktuelle Produkte bieten.
Neu gegenüber der bisherigen Audiofunktion ist, dass nun alle diese Funktionen in einem Modell vereint sind, das das bisherige GPT-4 Turbo in einigen Bereichen übertreffen soll. Das neue kombinierte Modell soll zudem günstiger sein als das aktuelle GPT-4 Turbo. OpenAI plant darüber hinaus ein Rabattmodell für API-Nutzer mit bis zu 50 Prozent Nachlass, wenn Token im Voraus bezahlt werden.
Die neuen Funktionen sollen beispielsweise im Kundenservice helfen, die Intonation der Stimme des Anrufers oder Sarkasmus in Anfragen besser zu verstehen. Perspektivisch sollen sie auch in die kostenlose Version des Chatbots ChatGPT integriert werden. Informationen zum Rollout liegen The Information nicht vor.
OpenAI-Chef Sam Altman sieht in Assistenten eine ähnlich transformative Technologie wie das Smartphone. Altman hat bereits mehrfach darauf hingewiesen, dass persönliche Assistenzsysteme die nächste Entwicklungsstufe der KI sein sollen, und die Firma arbeitet seit Monaten konsequent auf dieses Ziel hin.
KI-Assistenten könnten beispielsweise als Tutoren für Schüler fungieren oder Menschen mit Sehbehinderungen Informationen über ihre Umgebung liefern. Die langfristige Vision sind persönliche Audio-Bots wie im Science-Fiction-Film "Her".
GPT-5 könnte laut Quellen von The Information bis Ende des Jahres fertiggestellt und der Öffentlichkeit zugänglich gemacht werden. Das neue Modell dürfte auch die Fähigkeiten der Agenten erweitern.
Zahlreiche Verbesserungen für ChatGPT in der Pipeline
Bereits Ende April fasste der ChatGPT-App-Entwickler Tibor Blaho alle möglichen neuen Funktionen zusammen, die er aus einer öffentlich zugänglichen Testumgebung von ChatGPT extrahierte.
Zu den möglichen Neuerungen gehören eine überarbeitete Benutzeroberfläche, ein erweiterter Sprachmodus, neue Funktionen für GPTs wie Memory und Interaktionen, ein verbesserter Texteditor auf Basis von Prose Mirror samt Prompt-Assistenz, ein aufs Schreiben optimierter GPT ähnlich DALL-E 3 für Bilder, Kontext-Konnektoren für Google Drive, Microsoft 365 und Notion, Suchfunktionen mit Websuche und Zitaten, ein verbessertes Datenanalyse-Tool sowie Möglichkeiten zum Teilen von Chats.
In der Vergangenheit lag Blaho mit seinen Vorhersagen auf Basis dieser Webfunde meist richtig. Allerdings müssen nicht alle der zahlreichen neuen Features am Montag vorgestellt oder gar zeitnah ausgerollt werden.
Die wohl ebenfalls in Entwicklung befindliche Verzahnung von Sprachmodell und Suchmaschine könnte im Sommer auf Apples Entwicklerkonferenz WWDC vorgestellt werden, sofern die Partnerschaft der beiden Unternehmen zustande kommt.