OpenAI hat vor kurzem die mit Spannung erwartete Programmierintelligenz Codex veröffentlicht, ein leistungsstarkes, in ChatGPT integriertes Tool, das offiziell in die Forschungsvorschau-Phase eingetreten ist. Als cloudbasiertes Assistenzsystem für die Softwareentwicklung soll Codex die Arbeitsweise von Entwicklern revolutionieren, die Effizienz der Programmierung verbessern und die Bearbeitung komplexer Aufgaben vereinfachen. In diesem Artikel werden wir eine umfassende Analyse der Funktionen, Funktionsprinzipien und praktischen Anwendungen dieser revolutionären Technologie vornehmen.
Offizieller Eingang zur Website:https://openai.com/index/openai-codex/

Codex Intelligent Bodies: Der Beginn einer neuen Ära der Programmierung
OpenAI hat im Mai 2025 die Programmierintelligenz Codex auf den Markt gebracht, nachdem in ChatGPT die Möglichkeit geschaffen wurde, sich mit GitHub-Repositories zu verbinden. Dabei handelt es sich um eine Cloud-basierte Software-Engineering-Intelligenz, die eine Vielzahl von Programmieraufgaben ausführen kann, darunter:
- Schreiben neuer Funktionsmodule
- Behebung von Codefehlern und Schwachstellen
- Laufende Testüberprüfung
- Einreichen von Codeänderungen
- Verwaltung und Ausführung mehrerer Codierungsaufgaben gleichzeitig
Im Gegensatz zu herkömmlichen Programmierassistenten basiert Codex auf dem Codex-1-Modell (einer speziellen Version des OpenAI o3-Modells), das speziell für die Softwareentwicklung optimiert wurde. Codex wird durch Reinforcement Learning in einer realen Programmierumgebung trainiert, so dass der von ihm erzeugte Code den menschlichen Codierungsstil widerspiegelt, den Anweisungen genau folgt und wiederholt getestet werden kann, bis er die gewünschten Ergebnisse erzielt.

Funktionsweise des Codex und seine wichtigsten Merkmale
Arbeitsablauf
Der Arbeitsablauf von Codex ist einfach und intuitiv gestaltet:
- Benutzerzugang zum Codex über die ChatGPT-Seitenleiste
- Geben Sie Ihre Anforderungen ein und klicken Sie auf die Schaltfläche "Code", um eine Aufgabe zuzuweisen, oder klicken Sie auf die Schaltfläche "Q&A", um eine Frage zum Code zu stellen.
- Codex führt Aufgaben in einer sicheren, isolierten Cloud-Umgebung aus, die mit der Codebasis des Benutzers vorgeladen ist.
- Benutzer können den Fortschritt von Aufgaben in Echtzeit verfolgen
- Nach Abschluss der Aufgabe überträgt Codex die Änderungen und liefert einen detaillierten Nachweis der Implementierung, einschließlich Terminalprotokollen und Testergebnissen.
- Benutzer können die Ergebnisse überprüfen, weitere Änderungen beantragen oder Änderungen in den Arbeitsablauf integrieren.
Wichtigste technische Merkmale
Charakterisierung | Beschreibungen |
---|---|
Multitasking | Fähigkeit, mehrere unabhängige Programmieraufgaben gleichzeitig zu erledigen |
Ausführung in der Cloud | Aufgaben werden in sicher isolierten Cloud-Containern ausgeführt, ohne lokale Ressourcen zu beanspruchen |
Codebase-Integration | Unterstützt die nahtlose Integration mit GitHub-Repositories und ermöglicht das direkte Lesen und Manipulieren von Benutzer-Code. |
Intelligentes Code-Verständnis | Fähigkeit, komplexe Codestrukturen zu verstehen, potenzielle Probleme zu erkennen und Lösungen anzubieten |
vollständige Überwachungskette | Überprüfbare Nachweise der Aufgabenausführung durch Terminalprotokolle, Testausgaben usw. |
Umgebung Konfiguration | Unterstützung für benutzerdefinierte Konfigurationen zur Anpassung der Umgebung an die tatsächlichen Entwicklungseinstellungen |
Sicherheit und Schutz | Der Internetzugang ist während der Ausführung deaktiviert und die Interaktion mit ausdrücklich genehmigtem Code und Abhängigkeiten ist eingeschränkt. |
Es ist erwähnenswert, dass Codex das Folgen der Codebase's AGENTEN.md
Dokumentationsanleitungen, ähnlich wie ein menschlicher Entwickler eine README-Datei liest, um die Spezifikationen eines Projekts zu verstehen. Codex funktioniert am besten, wenn er richtig konfiguriert, zuverlässig getestet und klar dokumentiert ist.
Praxisfall: Demonstration der Codex-Programmierkompetenz
Im Folgenden finden Sie Beispiele für den Einsatz von Codex in echten Open-Source-Projekten, die zeigen, dass Codex eine Vielzahl von Programmieraufgaben bewältigen kann:
Fall 1: Behebung eines verschachtelten CompoundModels-Berechnungsproblems in der astropy-Bibliothek
In diesem Fall musste Codex das Problem lösen, dass die separability_matrix des Modelling-Moduls im astropy/astropy-Repository die Trennbarkeit von verschachtelten CompoundModels nicht korrekt berechnete.

Der Codex generierte eine sehr prägnante und präzise Code-Änderung, mit nur den notwendigen Änderungen am Kern des Problems. Im Gegensatz dazu war das Änderungsschema für das o3-Modell langwieriger und enthielt sogar einige unnötige Kommentare.

Fall 2: Behebung von Fehlern bei der Kalibrierung von Matplotlib-Fenstern
Diese Aufgabe erfordert, dass die matplotlib-Bibliothek repariert wird. mlab._spektral_helper
Die Fensterkorrektur ist falsch.

Codex beweist auch die Fähigkeit, Dinge mit Präzision und Einfachheit zu beheben, indem nur die notwendigen Codezeilen geändert werden, um die Klarheit und Wartbarkeit zu erhalten.

Fall 3: Lösung des Problems des Dauerausdrucks in Django
In diesem Fall war es notwendig, ein Problem im Django-Framework zu beheben, bei dem Ausdrücke, die nur die Dauer enthielten, mit SQLite und MySQL nicht richtig funktionierten.

Codex bietet nicht nur eine saubere Lösung, sondern fügt auch die fehlenden Abhängigkeitsaufrufe zuerst ein und beweist damit seine Fähigkeit, den Kontext des Codes vollständig zu verstehen.

Fall 4: Behebung des Problems bei der Aktualisierung des Chat-Raum-Namens von Expensify-Mitgliedern
In diesem Fall handelt es sich um einen Fehler in expensify (einer Software für die Zusammenarbeit im Finanzbereich, bei der der Chat im Mittelpunkt steht): Nach dem Löschen des Cache wurden die Namen der Chat-Räume der Mitglieder im LHN nicht aktualisiert.

Codex hat das Problem genau erkannt und eine präzise und wirksame Lösung angeboten, während das o3-Modell einige unwirksame Codeänderungen vorgenommen hat.

Leistungsbewertung und vergleichende Analyse
Baseline-Punktzahl
Im SWE-Bench Verified Benchmark erzielte Codex (codex-1) beeindruckende Ergebnisse:
Modellierung | SWE-Banknote |
---|---|
Kodex (codex-1) | 72.1% |
Claude 3.7 | 62.3% |
o3-hoch | 71.7% |
Die Tests wurden mit einer Kontextlänge von bis zu 192.000 Token durchgeführt, wobei die Einstellung "mittlerer Argumentationsaufwand" verwendet wurde, wie sie derzeit in den Codex-Produktversionen verfügbar ist.

Vergleich der Codegenerierung mit dem o3-Modell
Beispiele aus der Praxis zeigen, dass codex-1 durchweg sauberere, klarere Code Change Patches als OpenAI o3 erzeugt, die sofort manuell überprüft und in Standard-Workflows integriert werden können. In mehreren Tests von Open-Source-Bibliotheken zeigte codex eine höhere Genauigkeit und bessere Codequalität.
Feedback zur tatsächlichen Nutzung
Das interne OpenAI-Team hat Codex als Teil seiner täglichen Entwicklungswerkzeuge übernommen, vor allem um sich wiederholende und gut eingegrenzte Aufgaben wie Code-Refactoring, Umbenennung und das Schreiben von Tests durchzuführen, die normalerweise den Konzentrationsfluss eines Entwicklers unterbrechen.
Darüber hinaus haben erste Tests mit mehreren externen Partnern, darunter Cisco, Temporal, Superhuman und Kodiak, gezeigt, dass Codex Aufgaben wie die Entwicklung von Funktionen, die Fehlersuche, das Schreiben und Ausführen von Tests erheblich beschleunigt und die Effizienz des Teams verbessert.
Verfügbarkeit, Preisgestaltung und Zukunftsaussichten
Aktuelle Verfügbarkeit
Der Codex ist für die folgenden Benutzer zugänglich:
- ChatGPT Pro-Benutzer ($200 pro Monat)
- ChatGPT Enterprise-Benutzer
- ChatGPT Team Benutzer
ChatGPT Plus- und Edu-Benutzer werden diese Funktion bald ebenfalls nutzen können.
Preisstrategie
Derzeit bietet OpenAI eine kostenlose Testphase an, in der die Nutzer die Codex-Funktionen in den nächsten Wochen ohne Einschränkungen ausprobieren können. Danach werden Geschwindigkeitsbegrenzungen und flexible Pay-as-you-go-Optionen eingeführt.
Für Entwickler ist das Modell codex-mini-latest über die API Responses for verfügbar:
- Token pro Million Eingänge: $1.50
- Token pro Million Output: $6.00
- Genießen Sie einen Rabatt auf den Alarm-Cache des 75%
Der Weg in die Zukunft
OpenAI plant, die Interaktivität und Flexibilität von Codex weiter zu verbessern:
- Unterstützung durch Beratung und Feedback bei der Umsetzung des Mandats
- Zusammenarbeit mit AI zur Umsetzung von Programmierstrategien
- Sie erhalten proaktive Benachrichtigungen über den aktuellen Stand der Arbeiten
- Tiefe Integration mit gängigen Entwicklungswerkzeugen (z. B. GitHub, Kommandozeile, Issue Tracker, CI-Systeme)
Die Einführung von Codex Intelligent Body markiert eine neue Etappe in der KI-gestützten Programmierung. Er soll Ingenieure nicht ersetzen, sondern vielmehr als zuverlässiger Assistent fungieren, der mühsame und sich wiederholende Aufgaben übernimmt, damit sich die Entwickler auf kreativere und strategischere Arbeit konzentrieren können. Obwohl es sich noch in der Forschungsvorschau befindet und einige Einschränkungen aufweist (z. B. fehlender Internetzugang, lange Antwortzeiten auf Aufgaben usw.), hat Codex großes Potenzial gezeigt, die zugrunde liegende Logik der Softwareentwicklung umzugestalten und ein wichtiger Bestandteil des Programmierparadigmas der Zukunft zu werden.