Inhalt
summary Zusammenfassung

Mit "Codex" stellt OpenAI einen cloudbasierten KI-Agenten für Softwareentwicklung vor. Der Agent automatisiert Aufgaben wie Bugfixing oder Featureentwicklung und soll langfristig ein neues Entwicklungsparadigma etablieren.

Anzeige

OpenAI hat Codex vorgestellt, einen cloudbasierten KI-Agenten für Softwareentwicklung. Der Name ist eine Hommage an das erste Code-Modell des Unternehmens, das 2023 abgeschaltet wurde. Der Agent basiert auf dem neuen Modell codex-1, einer Variante von o3, die speziell für Softwareentwicklungsaufgaben optimiert wurde. Codex ist ab sofort als Forschungs-Vorschau für Nutzer von ChatGPT Pro, Enterprise und Team verfügbar, die Integration für Plus- und Edu-Abonnenten soll folgen.

Codex arbeitet in isolierten Cloud-Containern, die mit dem jeweiligen Software-Repository vorinstalliert sind. Nutzer können Aufgaben per Textbefehl über die ChatGPT-Seitenleiste initiieren, etwa mit "Code" für Implementierungen oder "Ask" für Fragen zum Code. Jede Aufgabe wird unabhängig in ihrer eigenen Umgebung ausgeführt. Codex kann Dateien lesen und bearbeiten, Tests ausführen, Befehle wie Linter oder Type Checker absetzen und Ergebnisse protokollieren. Die Bearbeitungsdauer liegt laut OpenAI zwischen ein und 30 Minuten.

Verifizierbare Änderungen und AGENTS.md-Dateien

Nach Abschluss einer Aufgabe dokumentiert Codex seine Änderungen mit Terminal-Logs und Testergebnissen, sodass Nutzer die Arbeitsschritte nachvollziehen können. Die Umgebung soll so konfigurierbar sein, dass sie der realen Entwicklungsumgebung möglichst genau entspricht.

Anzeige
Anzeige

Codex kann zusätzlich durch sogenannte AGENTS.md-Dateien gesteuert werden. Diese Textdateien dienen als Anleitung für den Agenten und enthalten unter anderem Konventionen zum Testen, zur Code-Struktur oder PR-Nachrichten. Die Regeln gelten rekursiv für alle Dateien im Verzeichnisbaum. Bei widersprüchlichen Angaben haben tiefer liegende AGENTS.md-Dateien Vorrang.

Codex wurde mit Reinforcement Learning anhand realer Softwareentwicklungsaufgaben trainiert. Ziel war es, menschlichem Stil und PR-Präferenzen möglichst nahe zu kommen. In internen Benchmarks zeigte codex-1 laut OpenAI hohe Genauigkeit, auch ohne AGENTS.md oder angepasste Umgebungen.

OpenAI selbst nutzt Codex bereits intern, etwa für Refactoring, Testgenerierung oder Bugfixes. Auch frühe Partner wie Cisco, Temporal und Superhuman setzen Codex ein. Temporal verwendet Codex beispielsweise zur Fehleranalyse und Komponentenverkabelung, während Superhuman es Produktmanagern ermöglicht, kleinere Codeänderungen selbst vorzunehmen. Kodiak nutzt Codex im Bereich autonomes Fahren zur Verbesserung von Testabdeckung und Debugging-Werkzeugen.

OpenAI empfiehlt, gut abgegrenzte Aufgaben parallel an mehrere Agenten zu delegieren, um Codex’ Fähigkeiten optimal zu nutzen. Dabei soll langfristig eine Arbeitsweise entstehen, bei der Entwickler zwischen Echtzeit-Kollaboration (etwa mit Codex CLI) und asynchroner Delegation wechseln.

Einschränkungen, Sicherheit und Preise

Derzeit hat Codex noch keine Unterstützung für Bild-Eingaben und erlaubt keine Interaktion des Agenten während der Bearbeitung. Das Modell arbeitet ohne Internetzugriff, mit Zugriff nur auf das bereitgestellte Repository und vorinstallierte Abhängigkeiten. Codex wurde so trainiert, dass es Anfragen zur Malware-Entwicklung erkennt und verweigert, während legitime Low-Level-Aufgaben weiterhin unterstützt werden. Ein Anhang in der Systemkarte für o3 dokumentiert diese Schutzmaßnahmen.

Empfehlung

Codex wird vorerst ohne Zusatzkosten angeboten, später soll es flexible Preisoptionen geben. Das kleinere Modell codex-mini-latest für Codex CLI ist bereits verfügbar und kostet 1,50 USD pro Million Input-Tokens und 6 USD pro Million Output-Tokens, mit 75 Prozent Rabatt durch Prompt-Caching.

OpenAI plant, Codex künftig stärker mit gängigen Entwickler-Tools zu integrieren. Perspektivisch sollen Entwickler Aufgaben direkt aus Issue-Trackern oder CI-Systemen an Codex delegieren können. Auch das Nachjustieren von Aufgaben während der Bearbeitung oder kollaborative Strategiefindung sollen möglich werden.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • OpenAI hat mit "Codex" einen cloudbasierten KI-Agenten für die Softwareentwicklung vorgestellt. Codex automatisiert Aufgaben wie Bugfixing, Refactoring oder Testgenerierung und ist ab sofort als Vorschau für ChatGPT Pro, Enterprise und Team verfügbar.
  • Der Agent arbeitet in isolierten Cloud-Containern und kann über Textbefehle in der ChatGPT-Seitenleiste gesteuert werden. Zusätzlich lässt sich Codex durch AGENTS.md-Dateien konfigurieren, die Konventionen für Tests, Code-Struktur oder PR-Nachrichten enthalten.
  • Codex wurde mit Reinforcement Learning trainiert und zeigt in internen Benchmarks hohe Genauigkeit. Frühe Partner wie Cisco, Temporal und Superhuman setzen den Agenten bereits ein. OpenAI plant, Codex künftig stärker in gängige Entwickler-Tools zu integrieren und sieht darin einen Schritt hin zu produktiveren Arbeitsweisen in der Softwareentwicklung.
Quellen
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!