Interesting EngineeringTechnologie

Anthropic: Claude Opus 4.8 ist ehrlicher und besser im Coden

Anthropic hat Claude Opus 4.8 eingefhrt, eine neue Version seines Flaggschiff-Modells, die laut Unternehmen seltener Fehler verschweigt oder unbegrndete Behauptungen aufstellt, wenn es komplexe Aufgaben ausfhrt.

29. Mai 2026Neetika WalterLive Redaktion
Anthropic says Claude Opus 4.8 is more honest and better at coding

Kurzfassung

Warum das wichtig ist

Interesting EngineeringTechnologie
  • Anthropic hat Claude Opus 4.8 eingefhrt, eine neue Version seines Flaggschiff-Modells, die laut Unternehmen seltener Fehler verschweigt oder unbegrndete Behauptungen aufstellt, wenn es komplexe Aufgaben ausfhrt.
  • Anthropic stellt Claude Opus 4.8 vor: Ehrlicher und leistungsfähiger im Coden Anthropic hat eine neue Version seines Flaggschiff-Modells, Claude Opus 4.8, eingeführt.
  • Laut dem Unternehmen ist dieses Modell seltener dazu neigt, Fehler zu verschweigen oder unbegründete Behauptungen aufzustellen, wenn es komplexe Aufgaben bearbeitet.

Die Aktualisierung baut auf der Vorgängerversion Claude Opus 4.7 auf und kommt in einer Phase, in der sich KI-Unternehmen intensiv darum bemühen, autonome Systeme für Programmierung, Forschung und Unternehmensabläufe zuverlässiger zu gestalten.

Anthropic gab an, dass das Modell deutliche Verbesserungen in den Bereichen Programmierung, logisches Schlussfolgern (Reasoning) sowie bei agentenbasierten Benchmarks zeigt. Gleichzeitig wird das Modell transparenter über seine Unsicherheiten. Eine der zentralen nderungen bei Opus 4.8 ist der verstrkte Fokus auf Ehrlichkeit bei langlaufenden Aufgaben.

KI-Modelle präsentieren häufig falsche Informationen selbstbewusst oder behaupten Fortschritte ohne ausreichenden Nachweis. Anthropic erklärte, dass das neue Modell besser darin sei, Unsicherheiten frühzeitig zu erkennen und Mängel in seinen eigenen Ausgaben zu identifizieren, anstatt Fehler stumm durchzulassen.

Technik und Auswirkungen

Interne Bewertungen zeigten, dass Opus 4.8 im Vergleich zu seinem Vorgänger etwa viermal weniger wahrscheinlich sei, Mängel im durchzulassen. Frühe Tester empfanden das Modell zudem als zuverlässiger bei der Bearbeitung agenter Aufgaben.

Hierbei handelt es sich um Szenarien, bei denen KI-Systeme eigenständig Pläne über mehrere Schritte hinweg erstellen und diese Aktionen ausführen. Das Unternehmen hob zudem Verbesserungen in Bezug auf Ausrichtung (Alignment) und Sicherheitsverhalten hervor.

Laut Anthropic hat sein Alignment-Team festgestellt, dass Opus 4.8 neue Höchstwerte bei den Messgrößen für prosoziale Eigenschaften erreicht hat. Dazu gehören die Unterstützung der Benutzerautonomie und das Handeln im besten Interesse des Nutzers.

Technik und Auswirkungen

Die Bewertung ergab zudem niedrigere Raten, einschließlich Täuschung und Zusammenarbeit bei Missbrauch, im Vergleich zu Opus 4.7. Parallel zur Modellverbesserung hat Anthropic neue Funktionen eingeführt, die darauf abzielen, die Fähigkeiten ältigung großer Codierungsprojekte und logischer Schlussfolgerungen zu erweitern.

Anthropic says Claude Opus 4.8 is more honest and better at coding
Anthropic says Claude Opus 4.8 is more honest and better at coding

Eine dieser Funktionen ist ein Forschungs-Preview namens „Dynamic Workflows for Claude Code". Das System ermöglicht es Claude, große Aufgaben in kleinere Teilaufgaben aufzuteilen, die einer einzigen Sitzung bearbeitet werden.

Anthropic gab an, dass diese Funktion migrationsartige nderungen im gesamten Codebestand durchfhren kann, die Hunderttausende Zeilen Code umfassen. Dabei werden die Ausgaben vor der Rückmeldung an die Benutzer gegen bestehende Testsuiten geprüft.

Technik und Auswirkungen

Als weitere Erweiterung hat das Unternehmen eine Einstellung zur Steuerung des Rechenaufwands auf claude.ai und in der Cowork-Umgebung hinzugefügt. Nutzer können nun selbst entscheiden, wie viel Rechenleistung das Modell für eine Aufgabe aufwendet.

Bei niedrigeren Anstrengungseinstellungen werden schnellere Antworten und ein reduzierter Tokenverbrauch priorisiert, während höhere Einstellungen es dem Modell erlauben, mehr Zeit für die Durchdringung anspruchsvoller Prompts zu verwenden.

Anthropic teilte mit, dass Opus 4.8 standardmäßig einen Hochleistungsmodus verwendet, der Qualität und Benutzererfahrung in Einklang bringt. Zudem senkte das Unternehmen die Preise für seinen Schnellmodus. Dieser läuft nun mit einer Geschwindigkeit von 2,5-fach im Vergleich zu früheren Modellen und kostet weniger als die vorherigen Versionen.

Technik und Auswirkungen

Abschließend erwähnte Anthropic, dass es zudem fortschrittlichere Modelle der „Mythos-Klasse" im Rahmen Systeme werden derzeit in einem kleinen Testverbund für Cybersicherheitsanwendungen erprobt, bevor sie breiter veröffentlicht werden.

Das Unternehmen betonte, dass stärkere Cybersicherheitsmaßnahmen noch ausgearbeitet werden müssen, bevor diese Modelle allgemein verfügbar sind. Claude Opus 4.8 ist nun über claude.ai und die Claude API verfügbar.

Quellenprofil

Quelle und redaktionelle Angaben

Quelle
Interesting Engineering
Originaltitel
Anthropic says Claude Opus 4.8 is more honest and better at coding
Canonical
https://interestingengineering.com/ai-robotics/anthropic-claude-opus-48-ai-honesty-agentic-coding
Quell-URL
https://interestingengineering.com/ai-robotics/anthropic-claude-opus-48-ai-honesty-agentic-coding

Aehnliche Inhalte

Verwandte Themen und interne Verlinkung

Weitere Artikel aus aehnlichen Themenfeldern, damit Leser direkt im selben Kontext weiterlesen koennen.