Ich hab das neue Modell verwendet, bevor ich die Benchmark-Tabelle überhaupt gesehen hab. Und das, was mir zuerst aufgefallen ist, steht in keiner einzigen Spalte. Claude Opus 4.8 ist seit gestern, 28. Mai 2026, verfügbar, und Anthropic selbst nennt es ein modestes, aber spürbares Update.
Meine Einschätzung nach den ersten Stunden Arbeit damit: Die zwei Dinge, die für Einzelunternehmer wirklich zählen, sind nicht die höheren Coding-Scores. Es sind die neue Effort Control und ein Modell, das ehrlicher zugibt, wenn es sich nicht sicher ist. Ich zeig dir in diesem Artikel, welche zwei Features du als EPU sofort nutzen solltest, welche du getrost ignorieren kannst, und warum ausgerechnet Ehrlichkeit das praxisrelevanteste Update seit Monaten ist.
Was ist neu an Claude Opus 4.8?
Schauen wir uns zuerst die nüchterne Faktenlage an. Opus 4.8 baut auf Opus 4.7 auf, verbessert sich quer durch die Benchmarks und kostet dasselbe wie der Vorgänger. Das ist die offizielle Linie, und sie stimmt. Aber sie ist langweilig, und langweilig ist nicht der Grund, warum ich darüber schreibe.
Der eigentliche Punkt ist das, was rundherum mitkommt. Claude Opus 4.8 ist kein reines Modell-Update, es ist ein Bündel aus Modell plus mehreren neuen Stellschrauben, die du als Nutzer in die Hand bekommst. Und genau diese Stellschrauben verändern, wie sich das Arbeiten anfühlt, mehr als zwei Prozentpunkte auf irgendeinem Coding-Test das je könnten.
Hier ist mein zitierfähiger Kernsatz für diesen Artikel: Das wichtigste Update an Claude Opus 4.8 ist nicht, dass es klüger ist, sondern dass es ehrlicher zugibt, wenn es etwas nicht weiß. Für jeden, der mit KI baut statt nur chattet, ist das der Unterschied zwischen Vertrauen und ständigem Gegenkontrollieren.
Was bedeutet Effort Control bei Claude Opus 4.8?
Das erste neue Feature, und für EPU das praktischste, heißt Effort Control. Direkt neben der Modellauswahl in claude.ai und in Cowork kannst du jetzt einstellen, wie viel Aufwand Claude in eine Antwort steckt. Auf höheren Stufen denkt das Modell häufiger und tiefer, auf niedrigeren antwortet es schneller und verbraucht dein Rate-Limit langsamer. Diese Einstellung gibt es auf allen Plänen.
Zur Klarheit, weil die Begriffe sonst durcheinandergeraten: Opus 4.8 steht standardmäßig auf „high“. Darüber gibt es „extra“ (in Claude Code „xhigh“ genannt) und „max“. Je höher die Stufe, desto mehr Tokens verbraucht das Modell, und desto besser werden die Ergebnisse. Anthropic empfiehlt „extra“ für schwierige Aufgaben und lang laufende asynchrone Workflows.
Warum ist das für Einzelunternehmer relevant? Weil du damit zum ersten Mal selbst über das Kosten-Nutzen-Verhältnis entscheidest. Eine schnelle Formulierungshilfe für eine E-Mail braucht keine maximale Denkleistung. Eine Wettbewerbsanalyse oder ein komplexes n8n-Setup schon. Bisher hat das Modell diese Entscheidung implizit für dich getroffen. Jetzt liegt der Hebel bei dir, und das spart bei knappen Rate-Limits bares Kontingent.
Ich beobachte das regelmäßig in meiner Beratungsarbeit mit EPU und KMU in der DACH-Region: Die meisten verbrennen ihr KI-Budget an Aufgaben, die gar keine Tiefe brauchen, und stehen dann bei der wichtigen Aufgabe vor dem Limit. Effort Control löst genau dieses Problem, wenn du es bewusst einsetzt.
Warum ist die neue Ehrlichkeit das eigentliche Highlight?
Und jetzt kommt der Teil, der die meisten überrascht, weil er sich auf dem Datenblatt unscheinbar liest. Anthropic nennt Ehrlichkeit eine der prominentesten Verbesserungen von Opus 4.8.
Das Problem, das damit adressiert wird, kenne ich aus eigener Erfahrung schmerzhaft gut. KI-Modelle springen manchmal zu schnell zu Schlüssen und behaupten selbstbewusst, Fortschritte gemacht zu haben, obwohl die Belege dafür dünn sind. Übersetzt in meinen Alltag heißt das: Du lässt das Modell eine Funktion bauen, es meldet stolz „fertig und getestet“, und beim Ausführen fliegt dir der Code um die Ohren. Wer schon mal vibe-coded hat, weiß genau, wovon ich rede.
Hier wird es konkret. Frühe Tester berichten, dass Opus 4.8 eher Unsicherheiten über die eigene Arbeit kennzeichnet und seltener unbelegte Behauptungen aufstellt. In den Evaluierungen von Anthropic ist Opus 4.8 rund viermal seltener als der Vorgänger bereit, Fehler im selbst geschriebenen Code unkommentiert durchgehen zu lassen.
Viermal seltener. Das ist keine kosmetische Zahl, das ist der Unterschied zwischen einem Werkzeug, dem ich beim Bauen von VINCI vertraue, und einem, das ich Zeile für Zeile gegenprüfen muss. Auf digitalhandwerk.rocks dokumentiere ich seit Jahren, was in der KI-Praxis wirklich funktioniert und was nicht. Und das größte ungelöste Problem beim sogenannten Vibe Coding war bisher nie die Intelligenz des Modells, sondern sein blindes Selbstvertrauen. Ein Modell, das sagt „hier bin ich mir nicht sicher, schau bitte selbst drüber“, ist mir lieber als eines, das jeden Mist als Erfolg verkauft.
Das Bild hinkt leicht, aber es trifft den Kern: Ein ehrliches Modell ist wie ein guter Mitarbeiter, der weiß, wann er nachfragen muss, statt einfach draufloszupfuschen.
Dazu passt die Alignment-Bewertung. Das Alignment-Team von Anthropic kommt zum Schluss, dass Opus 4.8 neue Höchstwerte bei prosozialen Eigenschaften wie der Unterstützung der Nutzerautonomie und dem Handeln im Interesse des Nutzers erreicht. Die Rate an fehlgeleitetem Verhalten liegt deutlich unter Opus 4.7 und auf dem Niveau des am besten ausgerichteten Modells, Claude Mythos Preview.
Was sind Dynamic Workflows in Claude Code?
Das dritte Feature ist beeindruckend, aber ich bin ehrlich: Für den klassischen EPU spielt es vorerst eine Nebenrolle. Dynamic Workflows ist eine neue Funktion in Claude Code, aktuell in der Research Preview. Claude kann die Arbeit planen, dann Hunderte parallele Subagenten in einer einzigen Session laufen lassen und die Ergebnisse verifizieren, bevor es zurückmeldet. Damit lassen sich Migrationen über Hunderttausende Zeilen Code von Beginn bis zum Merge durchführen, mit der bestehenden Test-Suite als Messlatte.
Der Haken für uns Kleine: Das Feature ist nur in Claude Code für Enterprise, Team und Max verfügbar. Wenn du auf Max bist, lohnt sich der Blick. Wenn du als Einzelkämpfer eine WordPress-Seite betreust, brauchst du keine hundert Subagenten, die deine 9.488 Wiki-Seiten umbauen. Ich find die Richtung trotzdem spannend, weil sie zeigt, wohin agentisches Arbeiten geht: weg vom Einzelchat, hin zum eigenständigen Projekt.
Für Entwickler gibt es noch eine leise, aber feine Neuerung. Die Messages API akzeptiert jetzt System-Einträge innerhalb des Messages-Arrays, womit sich Claudes Anweisungen mitten in einer Aufgabe aktualisieren lassen, ohne den Prompt-Cache zu sprengen. Klingt technisch, ist es auch. Wer Agenten baut, weiß sofort, warum das praktisch ist.
Was kostet Claude Opus 4.8?
Bei den Preisen gibt es eine erfreulich kurze Antwort: nichts Neues, im positiven Sinn. Die regulären Preise bleiben unverändert gegenüber Opus 4.7, also 5 Dollar pro Million Input-Tokens und 25 Dollar pro Million Output-Tokens. Über die API läuft das Modell unter der Kennung claude-opus-4-8.
Interessant wird es beim Fast Mode. Im Fast Mode arbeitet Opus 4.8 mit 2,5-facher Geschwindigkeit und ist dabei dreimal günstiger als bei den Vorgängermodellen. Der Fast Mode kostet 10 Dollar pro Million Input- und 50 Dollar pro Million Output-Tokens. Für Workflows, die schnell und in hoher Stückzahl laufen müssen, ist das eine handfeste Ersparnis. Genau so etwas macht für automatisierte Stapelverarbeitung den Unterschied, etwa wenn dein Mail-Bot Dutzende Anfragen am Tag beantwortet.
Was kommt nach Opus 4.8?
Anthropic spielt offen mit den Karten, was als Nächstes kommt. Man arbeitet an Modellen, die viele der Opus-Fähigkeiten zu geringeren Kosten liefern. Für EPU ist das die spannendere Roadmap als noch mehr Spitzenintelligenz, denn günstiger schlägt im Mittelstand fast immer klüger.
Und dann ist da noch der größere Brocken. Anthropic plant eine neue Modellklasse mit noch höherer Intelligenz als Opus. Im Rahmen von Project Glasswing nutzt bereits eine kleine Zahl von Organisationen Claude Mythos Preview für Cybersecurity-Arbeit. Modelle dieser Leistungsstufe brauchen stärkere Cyber-Sicherheitsvorkehrungen, bevor sie breit verfügbar werden, und Anthropic will sie in den kommenden Wochen für alle Kunden bringen. Ich bin mir da nicht ganz sicher, aber mein Eindruck ist, dass hier die eigentlich große Geschichte des Jahres liegt, und Opus 4.8 ist nur das Vorprogramm.
Für wen „lohnt“ sich das Update?
Lass mich das konkret machen, weil „lohnt sich“ eine faule Antwort wäre.
Wenn du Claude hauptsächlich zum Schreiben, Recherchieren und für gelegentliche Hilfe nutzt, merkst du Opus 4.8 vor allem an der Effort Control. Stell sie bewusst ein, und du holst mehr aus deinem Plan heraus. Mehr musst du nicht tun, das Modell ist eh automatisch aktiv.
Wenn du mit Claude baust, also Code, Automationen, Agenten, dann ist die neue Ehrlichkeit dein Gewinn. Du wirst weniger Zeit mit dem Gegenprüfen von falschen „Fertig“-Meldungen verbringen. Das ist kein Versprechen, das ist eine Beobachtung aus den ersten Tagen.
Und wenn du auf einem Max-, Team- oder Enterprise-Plan sitzt und ernsthafte Code-Projekte stemmst, schau dir Dynamic Workflows an. Für alle anderen ist es ein Blick in die Zukunft, nicht in die Gegenwart.
Die Frage ist also nicht, ob du auf Opus 4.8 umsteigen sollst, das passiert ohnehin. Die Frage ist, ob du die neuen Hebel bewusst nutzt oder sie ungenutzt liegen lässt. Ich kenne genug Leute, die das beste Werkzeug haben und es bedienen wie das schlechteste. Mach es anders.
Fragen zu Claude Opus 4.8
Nein. Die regulären Preise sind identisch: 5 Dollar pro Million Input-Tokens und 25 Dollar pro Million Output-Tokens. Der Fast Mode ist mit dreifacher Kostenersparnis sogar günstiger als bei den Vorgängermodellen. Du bekommst also mehr Leistung zum gleichen Preis.
Nicht zwingend sinnvoll. Höhere Effort-Stufen liefern bessere Resultate, verbrauchen aber mehr Tokens. Für einfache Aufgaben ist hoher Effort Verschwendung. Anthropic empfiehlt die Stufe „extra“ gezielt für schwierige und lang laufende Aufgaben, nicht für jede Kleinigkeit.
Dass das Modell seltener selbstbewusst Falsches behauptet. Opus 4.8 kennzeichnet eher Unsicherheiten und lässt rund viermal seltener als der Vorgänger Fehler im eigenen Code unkommentiert durchgehen. Für alle, die mit KI bauen, ist das der praxisrelevanteste Punkt am ganzen Release.
Nein. Opus 4.8 ist überall verfügbar, von claude.ai über Cowork bis zur API. Dynamic Workflows hingegen läuft nur in Claude Code für Enterprise, Team und Max. Die Effort Control dagegen gibt es auf allen Plänen.