Gepubliceerd: 29 mei 2026
Anthropic heeft op 28 mei 2026 Claude Opus 4.8 uitgebracht, de nieuwste versie van zijn vlaggenschip-AI-model. Opus 4.8 scoort beter dan zijn voorganger op benchmarks voor codering, agentisch redeneren en kenniswerk, en introduceert een nieuwe functie genaamd “dynamic workflows” waarmee Claude Code tot 1.000 parallelle subagents in één sessie kan aansturen. Het model is direct beschikbaar voor dezelfde prijs als Opus 4.7: $5 per miljoen invoertokens en $25 per miljoen uitvoertokens. Gebruikers zullen Opus 4.8 als een bescheiden, maar merkbare verbetering ten opzichte van zijn voorganger ervaren.
Wat is Claude Opus 4.8 en wat kan het?
Claude Opus 4.8 is het krachtigste algemeen beschikbare model van Anthropic en volgt Claude Opus 4.7 op. Het ondersteunt een contextvenster van 1 miljoen invoertokens met maximaal 128.000 uitvoertokens, en accepteert zowel tekst- als beeldinvoer. Volgens Anthropic heeft het model een scherper beoordelingsvermogen en is het eerlijker over de voortgang van zijn eigen werk, wat het betrouwbaarder maakt voor langlopende agentische taken.
Vroege testers melden dat Opus 4.8 vaker onzekerheden in zijn werk signaleert en minder snel ongefundeerde claims doet. Volgens de evaluaties van Anthropic is het model ongeveer vier keer minder geneigd dan Opus 4.7 om fouten in geschreven code onopgemerkt te laten passeren. Cursor-CEO Michael Truell gaf aan dat Opus 4.8 op CursorBench beter presteert dan eerdere Opus-modellen op elk inspanningsniveau, met aanzienlijk efficiëntere tool-aanroepen.
Claude Opus 4.8 benchmarks en technische specificaties
Claude Opus 4.8 laat meetbare verbeteringen zien op meerdere evaluatiecategorieën.
- Op SWE-bench Verified scoort het 88,6%.
- De Terminal-Bench 2.1-score is 74,6%.
- Het bereikt een Elo-score van 1.890 op GDPval-AA.
- De score voor agentisch coderen steeg van 64,3% (Opus 4.7) naar 69,2%.
- Multidisciplinair redeneren met tools ging van 54,7% naar 57,9%.
- Agentisch computergebruik ging van 82,8% naar 83,4%.
- De kenniswerkscore steeg van 1.753 naar 1.890.
Anthropic stelt dat Opus 4.8 GPT-5.5 overtreft op minstens 12 benchmarks, waaronder de meeste evaluaties voor kenniswerk, codering, agentisch toolgebruik en lange-contexttaken. Op het gebied van alignment concludeerde het interne beoordelingsteam van Anthropic dat Opus 4.8 nieuwe records zet op metingen van prosociaal gedrag en aanzienlijk minder misaligned gedrag vertoont dan Opus 4.7, vergelijkbaar met Claude Mythos Preview.
Dynamic workflows: Claude Opus 4.8 draait honderden parallelle subagents
De belangrijkste nieuwe functie die samen met Opus 4.8 verschijnt, is dynamic workflows. Deze functie is beschikbaar als research preview in Claude Code. Hiermee kan Claude een grote taak plannen, honderden parallelle subagents starten (tot maximaal 1.000) en zijn eigen resultaten verifiëren voordat het terugrapporteert. De functie is ontworpen voor taken die te groot zijn voor één contextvenster.
Het primaire gebruiksscenario dat Anthropic noemt, is codemigratie op grote schaal: Claude Code met Opus 4.8 kan nu migraties uitvoeren over honderdduizenden regels code, van start tot merge, waarbij de bestaande testsuite als kwaliteitsmaatstaf dient. Dynamic workflows is beschikbaar op de Enterprise-, Team- en Max-abonnementen van Claude Code.
Daarnaast heeft Anthropic inspanningscontrole geïntroduceerd op claude.ai en Cowork. Gebruikers kunnen nu kiezen hoeveel moeite Claude in een antwoord steekt: lagere instellingen geven snellere reacties, terwijl hogere instellingen betere resultaten opleveren. Opus 4.8 staat standaard op hoge inspanning. De Messages API accepteert nu ook systeemberichten binnen de berichtenarray, waardoor ontwikkelaars instructies halverwege een taak kunnen bijwerken zonder de promptcache te onderbreken.
Hoe verhoudt Claude Opus 4.8 zich tot GPT-5.5 en Gemini 3.5 Flash?
Claude Opus 4.8 positioneert zich direct tegenover OpenAI’s GPT-5.5 en Google’s Gemini 3.5 Flash. Anthropic claimt dat Opus 4.8 GPT-5.5 overtreft op minstens 12 benchmarks voor codering, kenniswerk, agentisch toolgebruik en lange-contexttaken. Met scores van 88,6% op SWE-bench Verified en 74,6% op Terminal-Bench 2.1 behoort het tot de best presterende modellen die momenteel beschikbaar zijn.
Met $5/$25 per miljoen tokens (invoer/uitvoer) blijft Opus 4.8 duurder dan Gemini 3.5 Flash ($1,50/$9,00), maar de prijs is gelijk aan die van zijn voorganger. De fast mode-prijs is fors gedaald: $10/$50 per miljoen tokens, omlaag van $30/$150 bij Opus 4.7, wat het drie keer goedkoper maakt voor snelheidsgeoptimaliseerde taken. Opus 4.8 fast mode draait op 2,5 keer de standaardsnelheid.
Beschikbaarheid en prijzen van Claude Opus 4.8
Claude Opus 4.8 is vanaf vandaag overal beschikbaar. De standaardprijs is $5 per miljoen invoertokens en $25 per miljoen uitvoertokens, ongewijzigd ten opzichte van Opus 4.7. Fast mode kost $10 per miljoen invoertokens en $50 per miljoen uitvoertokens. Ontwikkelaars kunnen het model via de Claude API benaderen met de identifier claude-opus-4-8. Het model is vanaf de lanceringsdatum ook beschikbaar op AWS Bedrock. Anthropic gaf ook een vooruitblik op wat er komt: een nieuwe klasse modellen met hogere intelligentie dan Opus, voortbouwend op Project Glasswing en Claude Mythos Preview. Het bedrijf verwacht Mythos-klasse modellen binnen enkele weken beschikbaar te maken voor alle klanten, zodra aanvullende cyberbeveiligingsmaatregelen zijn afgerond.
De volledige technische details en alignment-beoordeling zijn te vinden in de Claude Opus 4.8 System Card op de website van Anthropic.