Anthropic: Claude Opus 4.8 ist ehrlicher und besser im Coden
Anthropic hat Claude Opus 4.8 eingefhrt, eine neue Version seines Flaggschiff-Modells, die laut Unternehmen seltener Fehler verschweigt oder unbegrndete Behauptungen aufstellt, wenn es komplexe Aufgaben ausfhrt.

Kurzfassung
Warum das wichtig ist
- Anthropic hat Claude Opus 4.8 eingefhrt, eine neue Version seines Flaggschiff-Modells, die laut Unternehmen seltener Fehler verschweigt oder unbegrndete Behauptungen aufstellt, wenn es komplexe Aufgaben ausfhrt.
- Anthropic stellt Claude Opus 4.8 vor: Ehrlicher und leistungsfähiger im Coden Anthropic hat eine neue Version seines Flaggschiff-Modells, Claude Opus 4.8, eingeführt.
- Laut dem Unternehmen ist dieses Modell seltener dazu neigt, Fehler zu verschweigen oder unbegründete Behauptungen aufzustellen, wenn es komplexe Aufgaben bearbeitet.
Die Aktualisierung baut auf der Vorgängerversion Claude Opus 4.7 auf und kommt in einer Phase, in der sich KI-Unternehmen intensiv darum bemühen, autonome Systeme für Programmierung, Forschung und Unternehmensabläufe zuverlässiger zu gestalten.
Anthropic gab an, dass das Modell deutliche Verbesserungen in den Bereichen Programmierung, logisches Schlussfolgern (Reasoning) sowie bei agentenbasierten Benchmarks zeigt. Gleichzeitig wird das Modell transparenter über seine Unsicherheiten. Eine der zentralen nderungen bei Opus 4.8 ist der verstrkte Fokus auf Ehrlichkeit bei langlaufenden Aufgaben.
KI-Modelle präsentieren häufig falsche Informationen selbstbewusst oder behaupten Fortschritte ohne ausreichenden Nachweis. Anthropic erklärte, dass das neue Modell besser darin sei, Unsicherheiten frühzeitig zu erkennen und Mängel in seinen eigenen Ausgaben zu identifizieren, anstatt Fehler stumm durchzulassen.
Technik und Auswirkungen
Interne Bewertungen zeigten, dass Opus 4.8 im Vergleich zu seinem Vorgänger etwa viermal weniger wahrscheinlich sei, Mängel im durchzulassen. Frühe Tester empfanden das Modell zudem als zuverlässiger bei der Bearbeitung agenter Aufgaben.
Hierbei handelt es sich um Szenarien, bei denen KI-Systeme eigenständig Pläne über mehrere Schritte hinweg erstellen und diese Aktionen ausführen. Das Unternehmen hob zudem Verbesserungen in Bezug auf Ausrichtung (Alignment) und Sicherheitsverhalten hervor.
Laut Anthropic hat sein Alignment-Team festgestellt, dass Opus 4.8 neue Höchstwerte bei den Messgrößen für prosoziale Eigenschaften erreicht hat. Dazu gehören die Unterstützung der Benutzerautonomie und das Handeln im besten Interesse des Nutzers.
Technik und Auswirkungen
Die Bewertung ergab zudem niedrigere Raten, einschließlich Täuschung und Zusammenarbeit bei Missbrauch, im Vergleich zu Opus 4.7. Parallel zur Modellverbesserung hat Anthropic neue Funktionen eingeführt, die darauf abzielen, die Fähigkeiten ältigung großer Codierungsprojekte und logischer Schlussfolgerungen zu erweitern.

Eine dieser Funktionen ist ein Forschungs-Preview namens „Dynamic Workflows for Claude Code". Das System ermöglicht es Claude, große Aufgaben in kleinere Teilaufgaben aufzuteilen, die einer einzigen Sitzung bearbeitet werden.
Anthropic gab an, dass diese Funktion migrationsartige nderungen im gesamten Codebestand durchfhren kann, die Hunderttausende Zeilen Code umfassen. Dabei werden die Ausgaben vor der Rückmeldung an die Benutzer gegen bestehende Testsuiten geprüft.
Technik und Auswirkungen
Als weitere Erweiterung hat das Unternehmen eine Einstellung zur Steuerung des Rechenaufwands auf claude.ai und in der Cowork-Umgebung hinzugefügt. Nutzer können nun selbst entscheiden, wie viel Rechenleistung das Modell für eine Aufgabe aufwendet.
Bei niedrigeren Anstrengungseinstellungen werden schnellere Antworten und ein reduzierter Tokenverbrauch priorisiert, während höhere Einstellungen es dem Modell erlauben, mehr Zeit für die Durchdringung anspruchsvoller Prompts zu verwenden.
Anthropic teilte mit, dass Opus 4.8 standardmäßig einen Hochleistungsmodus verwendet, der Qualität und Benutzererfahrung in Einklang bringt. Zudem senkte das Unternehmen die Preise für seinen Schnellmodus. Dieser läuft nun mit einer Geschwindigkeit von 2,5-fach im Vergleich zu früheren Modellen und kostet weniger als die vorherigen Versionen.
Technik und Auswirkungen
Abschließend erwähnte Anthropic, dass es zudem fortschrittlichere Modelle der „Mythos-Klasse" im Rahmen Systeme werden derzeit in einem kleinen Testverbund für Cybersicherheitsanwendungen erprobt, bevor sie breiter veröffentlicht werden.
Das Unternehmen betonte, dass stärkere Cybersicherheitsmaßnahmen noch ausgearbeitet werden müssen, bevor diese Modelle allgemein verfügbar sind. Claude Opus 4.8 ist nun über claude.ai und die Claude API verfügbar.
Thema weiterverfolgen
Interne Verlinkung
Im Kontext weiterlesen
Diese weiterfuehrenden Links verbinden das Thema mit relevanten Archivseiten, Schlagwoertern und inhaltlich nahen Artikeln.
Technologie Archiv
Weitere Meldungen aus derselben Hauptkategorie.
Mehr von Interesting Engineering
Alle veroeffentlichten Inhalte derselben Quelle im Archiv.
Corsair 3200D RS ARGB: Budget-Midturm mit drei Lüftern ohne hohe Kosten
Redaktionell verwandter Beitrag aus dem selben Themenumfeld.
Sicherheitslücke im Sicoob SDK: Bösartiges NuGet-Paket stiehlt Bankpasswörter
Redaktionell verwandter Beitrag aus dem selben Themenumfeld.
Quellenprofil
Quelle und redaktionelle Angaben
- Quelle
- Interesting Engineering
- Originaltitel
- Anthropic says Claude Opus 4.8 is more honest and better at coding
- Canonical
- https://interestingengineering.com/ai-robotics/anthropic-claude-opus-48-ai-honesty-agentic-coding
- Quell-URL
- https://interestingengineering.com/ai-robotics/anthropic-claude-opus-48-ai-honesty-agentic-coding
Aehnliche Inhalte
Verwandte Themen und interne Verlinkung
Weitere Artikel aus aehnlichen Themenfeldern, damit Leser direkt im selben Kontext weiterlesen koennen.

Corsair 3200D RS ARGB: Budget-Midturm mit drei Lüftern ohne hohe Kosten
Kopieren Sie den Link
29.05.2026
Live Redaktion
Sicherheitslücke im Sicoob SDK: Bösartiges NuGet-Paket stiehlt Bankpasswörter
Ein neu entdecktes bösartiges NuGet-Paket, das sich als offizielles Sicoob-Softwareentwicklungskit (SDK) ausgab, wurde dabei ertappt, dass es hochsensible Bankdaten abgreift, was ernste Bedenken hinsichtlich der Sicherhe
29.05.2026
Live Redaktion
Bambu Lab bestätigt Starttermin für neuen A2L-3D-Drucker am 1. Juni
Kopieren Sie den Link
29.05.2026
Live Redaktion
ASRock präsentiert Taichi-Update vor Computex 2026: Neue RX 9070 XT, 540-Hz-OLED-Monitor und AQUA-Wasserkühlungen im Kommen
ASRock feiert den Abschluss von 10 Jahren Taichi, der als Flaggschiff-Serie für Enthusiasten diente.
29.05.2026
Live Redaktion