Die Gerüchte um die Veröffentlichung von GPT-4.5 verdichten sich. Kontert OpenAIs Antwort auf Google Gemini noch im Dezember?
Zuletzt hatte der Leak-Account "Jimmy Apples" Anfang Dezember auf X über eine mögliche Veröffentlichung von GPT-4.5 bis Ende Dezember spekuliert. Nun berichten erste Userinnen und User, dass ChatGPT auf die Frage, mit welchem Modell es interagiert, bereits mit der Version "gpt-4.5-turbo" antwortet - auch bei mir ist das der Fall.
Natürlich könnte es sich auch um eine Halluzination handeln, denn wenn man nach den Unterschieden zwischen "gpt-4.5-turbo" und "gpt-4.0-turbo" fragt, erhält man nur Allgemeinplätze mit dem Wissensstand von April 2023.
Außerdem wäre es ungewöhnlich, wenn OpenAI die Turbo-Variante von GPT-4.5 direkt veröffentlichen würde, was bei GPT-3.5 und GPT-4 erst einige Monate später der Fall war.
Mitte Dezember tauchte ein Screenshot angeblicher Preise für GPT-4.5 auf, nach dem das neue Modell neben Text und Bild auch Audio, Video und 3D unterstützen soll. Obendrein soll es komplexe logische Aufgaben lösen und ein formatübergreifendes Verständnis haben.
Auffällig im Screenshot ist der fehlende Pfeil am Ende des Links zu GPT-4.5 - dies könnte ein Fehler des Fakers sein oder jemand hat vergessen, einen Haken im Content-Management-System zu setzen.
Auch GPT-4-Turbo wurde vorab über eine Preistabelle auf der Website geleakt. OpenAI CEO Sam Altman bezeichnete den Leak jedoch als Fake.
Video und 3D: OpenAI könnte Multimodalität steigern
Dass es sich bei dem Leak um einen Fake handeln könnte, bedeutet jedoch nicht, dass GPT-4.5 Turbo nicht dennoch in den Startlöchern stehen könnte. Jedenfalls passen die Gerüchte zu früheren Berichten über KI-Fähigkeiten, an denen OpenAI derzeit arbeitet.
Bereits im März berichtete der CTO von Microsoft Deutschland, Andreas Braun, dass OpenAI an multimodalen Modellen mit Videogenerierung arbeitet. Diese Gerüchte wurden vom OpenAI-Leaker FeltSteam im Zusammenhang mit dem "Projekt Arrakis" wiederholt, das Videogenerierung bieten, weniger Halluzinationen als GPT-4 haben und als autonomer Agent geeignet sein soll.
Obwohl das auf Kosteneffizienz ausgerichtete Projekt Arrakis angeblich gescheitert ist, könnte die Arbeit in neue Modelle eingeflossen sein. Ein Kandidat ist das Projekt "Gobi", ein weiterer KI-Prototyp, der Video unterstützen soll und ersten Berichten zufolge GPT-4.5 oder GPT-5 werden könnte. Gerüchten zufolge könnte dies im Frühjahr 2024 der Fall sein.
Mit Point-E und Shap-E hat OpenAI bereits zwei KI-Systeme vorgestellt, die Text in 3D-Modelle umwandeln können.
Im Wettstreit mit Google wäre es jedenfalls typisch für OpenAI, dem großen Konkurrenten nach dessen Gemini-Präsentation noch eins draufzusetzen. Auch Microsoft konterte die Gemini-Ultra-Enthüllung schon mit optimierten GPT-4-Benchmarks.