Interesting EngineeringTechnologie

OpenAI's GPT-5.5 beherrscht agentisches Coding mit einem Benchmark-Score von 82,7 %

OpenAI hat GPT-5.5 vorgestellt und es als sein bisher fähigstes und intuitivstes Modell positioniert, mit Fokus darauf, Benutzern zu helfen, komplexe, mehrstufige Aufgaben unabhängiger zu erledigen.

25. April 2026Aamir KhollamLive Redaktion
OpenAI's GPT-5.5 masters agentic coding with 82.7% benchmark score

Kurzfassung

Warum das wichtig ist

Interesting EngineeringTechnologie
  • OpenAI hat GPT-5.5 vorgestellt und es als sein bisher fähigstes und intuitivstes Modell positioniert, mit Fokus darauf, Benutzern zu helfen, komplexe, mehrstufige Aufgaben unabhängiger zu erledigen.
  • OpenAI hat GPT-5.5 vorgestellt und es als sein bisher fähigstes und intuitivstes Modell positioniert, mit dem Fokus darauf, Benutzern zu helfen, komplexe, mehrstufige Aufgaben unabhängiger zu erledigen.
  • Die Veröffentlichung markiert einen fortgesetzten Vorstoß hin zu „agentischen“ KI-Systemen, die Arbeit mit minimaler menschlicher Intervention planen, ausführen und verfeinern können.

OpenAI hat GPT-5.5 vorgestellt und es als sein bisher fähigstes und intuitivstes Modell positioniert, mit dem Fokus darauf, Benutzern zu helfen, komplexe, mehrstufige Aufgaben unabhängiger zu erledigen.

Die Veröffentlic OpenAI hat GPT-5.5 vorgestellt und es als sein bisher fähigstes und intuitivstes Modell positioniert, mit dem Fokus darauf, Benutzern zu helfen, komplexe, mehrstufige Aufgaben unabhängiger zu erledigen.

Die Veröffentlichung markiert einen fortgesetzten Vorstoß hin zu „agentischen“ KI-Systemen, die Arbeit mit minimaler menschlicher Intervention planen, ausführen und verfeinern können. Das Unternehmen sagte, dass das Modell die Art und Weise verbessert, wie Benutzer mit KI bei der Programmierung, Forschung und allgemeinen Wissensarbeit interagieren.

Anstatt jeden Schritt zu leiten, können

Anstatt jeden Schritt zu leiten, können Benutzer nun breitere Aufgaben zuweisen und sich darauf verlassen, dass das Modell die Ambiguität navigiert und Workflows abschließt. „GPT-5.5 versteht, was Sie zu tun versuchen, schneller und kann mehr der Arbeit selbst übernehmen“, erklärte das Unternehmen. Stärkeres agentisches CodierenGPT-5.5 zeigt große Fortschritte beim Codieren, insbesondere bei komplexen Workflows, die Planung und Tool-Koordination erfordern. Auf Terminal-Bench 2.0 erreichte es eine Genauigkeit von 82.7 %, einen Stand der Technik-Wert.

Auf SWE-Bench Pro erreichte es 58.6%, löst in einem einzigen Durchgang mehr reale GitHub-Probleme als frühere Versionen.

Das Modell übertraf auch seinen Vorgänger bei langfristigen Engineering-Aufgaben, gemessen an internen Benchmarks. Diese Aufgaben dauern menschlichen Entwicklern oft bis zu 20 Stunden.

Einführung von GPT-5.

Einführung von GPT-5. 5A neue Klasse von Intelligenz für reale Arbeit und zur Steuerung von Agenten, entwickelt, um komplexe Ziele zu verstehen, Werkzeuge zu nutzen, seine Arbeit zu überprüfen und mehr Aufgaben bis zum Abschluss zu führen.

Es markiert eine neue Art, Computerarbeit zu erledigen. Jetzt verfügbar in ChatGPT und Codex. pic. twitter. com/rPLTk99ZH5— OpenAI (@OpenAI) 23.

April 2026OpenAI sagte, die Verbesserungen gehen über Benchmarks hinaus. Frühe Tester berichteten, dass GPT-5.5 die Systemarchitektur und Fehlerpunkte besser versteht. Es kann identifizieren, wo Korrekturen hingehören, und die Auswirkungen auf nachgelagerte Teile eines Codebases vorhersagen.

Das Unternehmen betonte die Effizienz neben

Das Unternehmen betonte die Effizienz neben der Fähigkeit. GPT-5.5 erreicht die pro-Token-Latenz von GPT-5.4 trotz höherer Intelligenz.

Es verwendet auch weniger Tokens, um dieselben Aufgaben zu erledigen, was die rechnerischen Kosten senkt. „GPT-5.5 liefert diesen Sprung in der Intelligenz, ohne an Geschwindigkeit einzubüßen“, stellte OpenAI fest. Es fügte hinzu, dass das Modell auf einem höheren Niveau arbeitet und gleichzeitig die Reaktionsfähigkeit in der realen Welt beibehält.

Erweiterung des Einsatzes in der realen Welt Über die Programmierung hinaus erweitert GPT-5.5 seine Rolle in der alltäglichen Wissensarbeit.

Das Modell kann zwischen Aufgaben wechseln

Das Modell kann zwischen Aufgaben wechseln wie Informationsbeschaffung, Datenanalyse und die Generierung strukturierter Ausgaben wie Dokumente und Tabellenkalkulationen. 1.

Wir glauben an die iterative Bereitstellung; obwohl GPT-5.5 bereits ein intelligentes Modell ist, erwarten wir schnelle Verbesserungen.

Die iterative Bereitstellung ist ein großer Teil unserer Sicherheitsstrategie; wir glauben, dass die Welt auf diese Weise am besten für den Sieg im Mannschaftssport der KI-Resilienz gerüstet sein wird. 2.

Wir glauben… – Sam Altman (@sama)

Wir glauben… – Sam Altman (@sama) 23. April 2026 OpenAI sagte, dies spiegelt einen breiteren Wandel hin zu KI-Systemen wider, die Software und Werkzeuge aktiv bedienen können.

Das Modell kann Schnittstellen interpretieren, Aktionen ausführen und zwischen Workflows mit minimaler Reibung wechseln. Die interne Nutzung unterstreicht diese Fähigkeiten.

Über 85 % der Mitarbeiter von OpenAI nutzen Codex jetzt wöchentlich in verschiedenen Abteilungen, darunter Engineering, Finance und Marketing. In einem Beispiel nutzte das Kommunikationsteam GPT-5.5, um sechs Monate lang gesammelte Daten zu Sprechanfragen zu verarbeiten. Das System erstellte ein Scoring- und Risikorahmenwerk und half bei der Automatisierung von Genehmigungen mit geringem Risiko.

In der Finanzabteilung überprüfte das Modell

In der Finanzabteilung überprüfte das Modell 24.771 K-1 Steuerformulare mit insgesamt über 71.000 Seiten. Der Workflow schloss persönliche Daten aus und reduzierte die Bearbeitungszeit um zwei Wochen.

Ein anderes Team automatisierte die wöchentliche Geschäftsberichterstattung und sparte dadurch jede Woche zwischen fünf und zehn Stunden. OpenAI betonte auch die Sicherheit bei der Einführung.

Das Unternehmen sagte, es habe seine bisher stärksten Schutzmaßnahmen eingesetzt, darunter Red-Teaming, erweitertes Testen und Feedback von fast 200 Early-Access-Partnern. „Heute, GPT-5.

GPT-5.5 wird für Plus-, Pro-, Business-

„GPT-5.5 wird für Plus-, Pro-, Business- und Enterprise-Nutzer in ChatGPT und Codex ausgerollt“, so das Unternehmen. Der API-Zugang folgt, sobald zusätzliche Anforderungen an Sicherheit und Skalierung erfüllt sind.

Der Start signalisiert den anhaltenden Fokus von OpenAI auf den Aufbau von Infrastruktur für agentische KI. GPT-5.5 liefert diesen Sprung in der Intelligenz, ohne an Geschwindigkeit einzubüßen.

GPT-5.5 erreicht eine Latenz von GPT-5.4 pro Token im realen Einsatz, während es bei nahezu jeder von uns gemessenen Bewertung besser abschneidet. Es verwendet auch signifikant weniger Tokens, um dieselben Codex-… pic. twitter.com/5mR46SM7mW— OpenAI (@OpenAI) 23.

April 2026 Das Unternehmen zielt darauf ab, zu erweitern, wie Menschen und Unternehmen KI nutzen, um komplexe Arbeiten über verschiedene Bereiche hinweg zu erledigen.

Quellenprofil

Quelle und redaktionelle Angaben

Quelle
Interesting Engineering
Originaltitel
OpenAI's GPT-5.5 masters agentic coding with 82.7% benchmark score
Canonical
https://interestingengineering.com/ai-robotics/opanai-gpt-5-5-agentic-coding-gains
Quell-URL
https://interestingengineering.com/ai-robotics/opanai-gpt-5-5-agentic-coding-gains

Aehnliche Inhalte

Verwandte Themen und interne Verlinkung

Weitere Artikel aus aehnlichen Themenfeldern, damit Leser direkt im selben Kontext weiterlesen koennen.