Inhalt
summary Zusammenfassung

Das neue KI-Modell soll durch eine adaptive Architektur intelligenter, schneller und nützlicher sein. OpenAI verspricht deutliche Fortschritte bei Benchmarks, weniger Halluzinationen und führt mit "Safe Completions" einen neuen Ansatz für KI-Sicherheit ein.

Anzeige

OpenAI hat mit GPT-5 ein neues KI-Modell vorgestellt, das laut dem Unternehmen eine signifikante Weiterentwicklung gegenüber den Vorgängern GPT-4 und GPT-4o darstellt. Es soll von den Fortschritten der Reasoning-Modelle o1 und o3 profitieren und sämtliche bisherigen Modelllinien in einem einzigen System kombinieren. Die zentrale Neuerung ist eine adaptive Architektur, die ihren "Denkaufwand" an die jeweilige Aufgabe anpassen soll, um zuverlässigere und genauere Antworten zu liefern.

Der Zugang zum neuen System ist für Nutzer je nach Abonnement gestaffelt. Während die kostenlose Version erstmals Zugang zu einem Modell für logisches Denken erhält, bekommen zahlende Kunden höhere Nutzungslimits und exklusive Funktionen.

Video: OpenAI

Anzeige
Anzeige

Ein einheitliches System mit adaptivem Denkvermögen

Laut OpenAI ist GPT-5 kein einzelnes Modell, sondern ein einheitliches System. Es besteht aus einem schnellen und effizienten Modell, gpt-5-main, für die meisten Anfragen und einem tiefergehenden Reasoning-Modell, gpt-5-thinking, für komplexe Probleme. Ein Echtzeit-Router soll dabei entscheiden, welches Modell basierend auf der Komplexität der Anfrage, dem Gesprächskontext oder einer expliziten Aufforderung des Nutzers wie "denk mal scharf darüber nach" verwendet wird. Dieser Router werde kontinuierlich durch Nutzersignale trainiert.

Für "Pro"-Abonnenten gibt es zudem GPT-5 Pro, eine Variante mit erweitertem Denkvermögen, die für besonders umfassende und genaue Antworten noch länger über eine Aufgabe nachdenken soll. Laut den von OpenAI zitierten Evaluationen durch externe Experten wurde GPT-5 Pro bei komplexen Anfragen in 67,8 Prozent der Fälle gegenüber "GPT-5 thinking" bevorzugt.

Deutliche Fortschritte bei Benchmarks und realen Anwendungen

OpenAI beansprucht für GPT-5 State-of-the-Art-Leistungen in den Hauptanwendungsbereichen Programmieren, Gesundheit und Schreiben. Beim Programmieren soll das Modell besonders bei der Erstellung komplexer Frontends und dem Debugging großer Code-Repositories überzeugen. Es erreicht laut OpenAI neue Bestwerte in wichtigen Benchmarks, darunter 74,9 Prozent bei SWE-bench Verified und 88 Prozent bei Aider Polyglot, was einer Reduzierung der Fehlerrate um zwei Drittel gegenüber dem Modell o3 entsprechen soll.

Auch bei gesundheitsbezogenen Fragen soll das Modell präzisere Ergebnisse liefern und als "aktiver Gedankenpartner" agieren, der proaktiv Rückfragen stellt. Im HealthBench Hard, einem anspruchsvollen Benchmark für Gesundheitsfragen, erreicht es laut den Unterlagen 46,2 Prozent, verglichen mit 31,6 Prozent bei o3. OpenAI betont jedoch, dass das System keinen medizinischen Fachmann ersetzt. In weiteren Benchmarks soll das Modell ebenfalls neue Spitzenwerte erreichen, etwa in Mathematik mit 94,6 Prozent bei AIME 2025 (ohne Werkzeuge) und im multimodalen Verständnis mit 84,2 Prozent bei MMMU. GPT-5 Pro soll zudem bei extrem schwierigen wissenschaftlichen Fragen im GPQA-Benchmark 88,4 Prozent erreichen.

Weniger Halluzinationen und mehr Ehrlichkeit

Ein zentrales Versprechen von GPT-5 ist die Reduzierung von Halluzinationen. Laut OpenAI sollen die Antworten des Modells mit aktivierter Websuche um etwa 45 Prozent weniger wahrscheinlich sachliche Fehler enthalten als bei GPT-4o. Im reinen "Thinking"-Modus soll die Fehlerrate sogar um 80 Prozent geringer sein als bei OpenAI o3. Bei offenen, faktenbasierten Fragen auf den Benchmarks LongFact und FActScore soll GPT-5 rund sechsmal weniger Halluzinationen produzieren als o3.

Empfehlung

Auch ohne aktivierte Websuche zeigen sich deutliche Verbesserungen: In den Benchmarks LongFact-Concepts, LongFact-Objects und FActScore liegt die durchschnittliche Halluzinationsrate von GPT-5 (thinking) im Modus ohne Browsing je nach Test zwischen etwa 0,8 und 1,4 Prozent – im Vergleich zu 24 bis 38 Prozent bei OpenAI o3. Damit macht GPT-5, selbst ohne aktuelle Webdaten, mehr als 5-mal weniger faktische Fehler als o3.

Zudem soll das Modell ehrlicher seine eigenen Grenzen kommunizieren. In einem Test, bei dem das Modell Fragen zu nicht existierenden Bildern im CharXiv-Benchmark beantworten sollte, gab OpenAI o3 laut den Dokumenten in 86,7 Prozent der Fälle selbstbewusste, aber frei erfundene Antworten. GPT-5 soll dies nur noch in 9 Prozent der Fälle getan haben. Die allgemeine Täuschungsrate auf repräsentativen Konversationen sei von 4,8 Prozent bei o3 auf 2,1 Prozent bei GPT-5 gesunken.

"Safe Completions": OpenAI definiert KI-Sicherheit neu

Mit GPT-5 führt OpenAI einen neuen Sicherheitsansatz namens "Safe Completions" ein, der in einem begleitenden Forschungspapier detailliert wird. Dieser Ansatz löst die bisherige Methode der "harten Verweigerung" (Hard Refusal) ab. Das alte System war laut OpenAI oft zu starr und scheiterte bei Anfragen mit unklarer Absicht oder bei sogenannten Dual-Use-Themen, bei denen Informationen sowohl für legitime als auch für schädliche Zwecke verwendet werden können.

Das neue System konzentriert sich auf die Sicherheit des Outputs statt auf die Absicht des Inputs. Anstatt eine Anfrage pauschal abzulehnen, soll das Modell versuchen, eine maximal hilfreiche Antwort innerhalb der Sicherheitsrichtlinien zu geben. Dies kann eine hoch-levelige, eine teilweise oder eine alternative, sichere Antwort sein. Menschliche Evaluationen sollen laut OpenAI ergeben haben, dass dieser Ansatz als sicherer, hilfreicher und ausgewogener wahrgenommen wird. Passend dazu wurde GPT-5-thinking im Bereich Biologie und Chemie im Rahmen des "Preparedness Framework" als "High capability" eingestuft, was mit umfassenden Sicherheitsmaßnahmen und über 5.000 Stunden Red Teaming durch Partner wie das US-amerikanische CAISI und das britische UK AISI einherging.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Neue Werkzeuge und mehr Kontrolle für Entwickler

Für Entwickler bringt GPT-5 eine Reihe neuer Funktionen in der API. Mit den Parametern reasoning_effort und verbosity lassen sich der Denkaufwand und die Ausführlichkeit der Antworten steuern. Eine weitere Neuerung sind "Custom Tools", die es erlauben, Werkzeuge mit Plaintext statt mit striktem JSON-Format aufzurufen, was die Fehleranfälligkeit bei komplexen Eingaben reduzieren soll. Das Kontextfenster wurde auf 272.000 Input-Tokens und 128.000 Output-Tokens erweitert.

In der API stehen drei Modellgrößen zur Verfügung: gpt-5, gpt-5-mini und gpt-5-nano. Laut OpenAI ist das API-Modell gpt-5 die leistungsstarke "thinking"-Variante. Die Preise beginnen bei $1,25 pro Million Input-Tokens und $10 pro Million Output-Tokens für das gpt-5-Modell.

Personalisierung und gestaffelter Zugang

Auch in ChatGPT selbst gibt es Neuerungen. Das Modell soll deutlich weniger "sycophantisch", also übermäßig schmeichelhaft, agieren. In Tests wurde dieses Verhalten laut OpenAI von 14,5 Prozent auf unter 6 Prozent reduziert. Nutzer können zudem erstmals das Erscheinungsbild der Chats anpassen und eine von vier voreingestellten Persönlichkeiten wie "Zyniker" oder "Nerd" als Research Preview aktivieren.

Der Zugang wird gestaffelt: Kostenlose Nutzer erhalten Zugriff auf GPT-5 und GPT-5-mini mit Limits. "Plus"-Kunden erhalten höhere Limits, während "Pro"-Kunden unbegrenzten Zugang zu GPT-5 und exklusiven Zugang zu GPT-5 Pro bekommen. Für Team-, Enterprise- und Edu-Kunden wird GPT-5 zum neuen Standardmodell. Der Rollout soll laut OpenAI ab sofort beginnen.

Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • OpenAI hat mit GPT-5 ein einheitliches KI-System vorgestellt, das durch eine adaptive Architektur den "Denkaufwand" je nach Aufgabe anpasst und damit zuverlässigere, präzisere Antworten liefern soll. Nutzer erhalten je nach Abonnement gestaffelten Zugang, wobei zahlende Kunden exklusive Funktionen und Limits bekommen.
  • GPT-5 erzielt laut OpenAI in Benchmarks zu Programmierung, Gesundheit und Mathematik neue Bestwerte und reduziert Halluzinationen deutlich: Die Fehlerrate sinkt im Vergleich zu Vorgängermodellen teils um bis zu 80 Prozent, bei faktischen Fragen produziert das System rund sechsmal weniger Halluzinationen als o3. Das Modell kommuniziert seine eigenen Grenzen transparenter und gibt seltener erfundene Antworten.
  • Mit der Einführung von "Safe Completions" ersetzt OpenAI das bisherige Sicherheitssystem durch einen Ansatz, der sich auf die Sicherheit des Outputs konzentriert. Anfragen werden nicht mehr pauschal abgelehnt, sondern möglichst hilfreich und sicher beantwortet. Entwickler profitieren von erweiterten Steuerungsoptionen, neuen Werkzeugen und einem größeren Kontextfenster; ChatGPT-Nutzer erhalten zusätzlich mehr Personalisierungsmöglichkeiten und vordefinierte Persönlichkeiten.
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!