Zhipu AI lanceert GLM-5.2

18-06-2026

GLM-5.2 is het open-weight Mixture-of-Experts-model van Zhipu AI met een contextvenster van 1 miljoen tokens, een MIT-licentie en coding-benchmarkscores die GPT-5.5 evenaren tegen een fractie van de kosten.

Geschreven door:

Jorick van Weelie

Marketing Lead bij DataNorth | Next-Gen AI-enthousiast & Tech Storyteller

Meld je aan voor de Nieuwsbrief

18 juni 2026

Zhipu AI, het Chinese lab dat ook bekendstaat als Z.ai, heeft GLM-5.2 uitgebracht, een open-weight taalmodel met een contextvenster van 1 miljoen tokens en een ruime MIT-licentie. GLM-5.2 is een Mixture-of-Experts-model met ongeveer 744 miljard parameters in totaal, waarvan zo’n 40 miljard actief per token, en in onafhankelijke tests evenaart of verslaat het GPT-5.5 van OpenAI op meerdere coding-benchmarks voor lange taken tegen ongeveer een zesde van de kosten. Het model verscheen voor het eerst op 13 juni 2026 via het GLM Coding Plan, waarna de open weights en een losse API in de dagen daarna bij verschillende providers beschikbaar kwamen.

Wat is GLM-5.2 en wat kan het?

GLM-5.2 is het nieuwste vlaggenschipmodel van Zhipu AI, gericht op langere, agentische taken zoals coding in meerdere stappen. Het gebruikt een Mixture-of-Experts-architectuur met ongeveer 744 miljard parameters in totaal, waarvan zo’n 40 miljard actief zijn voor een gegeven token. Daardoor blijven de inferentiekosten lager dan bij een dicht model van vergelijkbare omvang. Het model ondersteunt een contextvenster van 1 miljoen tokens en kan tot 131.072 tokens per antwoord teruggeven, ongeveer vijf keer zo veel als het venster van 200.000 tokens van zijn voorganger GLM-5.1.

GLM-5.2 voegt twee instelbare redeneermodi toe, High en Max thinking effort genoemd. Z.ai raadt de Max-instelling aan voor complex codeerwerk in meerdere stappen, waarbij het model over lange reeksen moet plannen en bijsturen, terwijl High bedoeld is voor sneller dagelijks gebruik. De release is in het bijzonder gebouwd voor coding-agents, met vanaf dag een ondersteuning voor acht agentische ontwikkelomgevingen.

GLM-5.2 benchmarks en technische specificaties

Zhipu bracht GLM-5.2 zonder officiële benchmarksuite uit, dus de eerste cijfers komen uit onafhankelijke evaluaties. In die tests is GLM-5.2 het sterkste open-weight model op standaard coding-benchmarks, met 81,0 op Terminal-Bench 2.1 en 62,1 op SWE-bench Pro, en een tweede plaats op Code Arena Frontend. Op de Intelligence Index van Artificial Analysis scoorde het 51, het hoogste van alle open-weight modellen. Ter vergelijking: voorganger GLM-5.1 haalde 77,8 procent op SWE-bench Verified.

De belangrijkste architecturale verandering is een functie die Z.ai IndexShare noemt. Die hergebruikt dezelfde indexer over elke vier sparse-attentielagen, wat volgens het bedrijf de rekenkracht per token met ongeveer 2,9 keer verlaagt bij de volledige contextlengte van 1 miljoen tokens. Dat maakt het venster van 1 miljoen tokens in de praktijk bruikbaar in plaats van alleen op papier, omdat het de kosten van zeer lange invoer minder sterk laat oplopen dan anders het geval zou zijn.

Hoe verhoudt GLM-5.2 zich tot GPT-5.5 en Claude Opus 4.8?

Op meerdere coding-benchmarks voor lange taken verslaat GLM-5.2 GPT-5.5 van OpenAI, terwijl het per token ongeveer een zesde kost. Op FrontierSWE komt het tot binnen ongeveer een procent van Claude Opus 4.8 van Anthropic, op dit moment het leidende propriëtaire model op veel codeertaken. Daarmee zit GLM-5.2 dicht bij de beste gesloten modellen op het werk dat voor ontwikkelaars het meest telt, terwijl het volledig open weight blijft.

De release heeft ook een concurrentiële achtergrond. GLM-5.2 verscheen ongeveer 48 uur nadat exportregels van de Verenigde Staten Anthropic op 12 juni 2026 dwongen om zijn modellen Fable 5 en Mythos 5 voor buitenlandse gebruikers uit te schakelen. Een open-weight model onder een MIT-licentie dat overal zelf gehost kan worden, valt niet onder dezelfde toegangsbeperkingen. Dat is mede de reden dat GLM-5.2 aandacht heeft getrokken bij teams buiten de Verenigde Staten.

GLM-5.2 beschikbaarheid, prijzen en open weights

GLM-5.2 is uitgebracht onder een MIT-licentie zonder regionale beperkingen, wat zelf hosten, fine-tunen en commercieel gebruik toestaat. De officiële weights staan op Hugging Face onder zai-org/GLM-5.2 en op ModelScope. Het model kwam voor het eerst beschikbaar op 13 juni 2026 via het GLM Coding Plan, waarna een losse API en bredere ondersteuning door providers in de daaropvolgende dagen volgden.

API-toegang kost 1,40 dollar per miljoen invoertokens en 4,40 dollar per miljoen uitvoertokens, wat Z.ai positioneert op ongeveer een zesde van de kosten van vergelijkbare frontier-modellen en ongeveer tien keer goedkoper dan GPT-5 of Claude per token. Samen met de open weights is die prijsstelling gericht op ontwikkelaars die lange, token-intensieve coding-agents draaien en zowel de kosten als de plek waar het model draait willen beheersen.

Volledige technische details en de model-weights zijn te vinden in de documentatie van Z.ai over GLM-5.2.