Moonshot AI lanceert Kimi K2.6

22-04-2026

Moonshot AI lanceert Kimi K2.6, een open-weight model met 1T parameters dat 58,6% scoort op SWE-Bench Pro en 54,0 op HLE met tools.

Geschreven door:

Jorick van Weelie

Jorick van Weelie | Marketing Lead & AI-strateeg bij DataNorth AI Als Marketing Lead bij DataNorth bevindt Jorick zich op het snijvlak van merkautoriteit en technische innovatie. Hij is gespecialiseerd in het vertalen van complexe AI-architecturen naar concrete bedrijfsstrategieën, waarbij hij ervoor zorgt dat AI niet slechts een "tool" is, maar een katalysator voor groei. Met een sterke focus op de EU AI Act en AI-driven growth marketing geeft Jorick vorm aan het narratief van het Nederlandse AI-landschap, waarbij hij organisaties helpt om vertrouwen op te bouwen terwijl ze hun intelligentie verder opschalen.

Meld je aan voor de Nieuwsbrief

Gepubliceerd: 22 april 2026

Moonshot AI heeft op 21 april 2026 Kimi K2.6 uitgebracht, een open-weight taalmodel met 1 biljoen parameters dat zowel GPT-5.4 als Claude Opus 4.6 overtreft op meerdere coding- en agentbenchmarks. Kimi K2.6 maakt gebruik van een Mixture-of-Experts-architectuur met 32 miljard actieve parameters per token en een contextvenster van 256K tokens. Het model is beschikbaar via Hugging Face, de Moonshot API en Ollama, met een invoerprijs van $0,60 per miljoen tokens.

Wat is Kimi K2.6 en wat maakt het anders?

Kimi K2.6 is het nieuwste vlaggenschipmodel van Moonshot AI en de opvolger van Kimi K2.5. Het is gebouwd op een Mixture-of-Experts-architectuur (MoE) met in totaal 1 biljoen parameters, waarvan 32 miljard worden geactiveerd per forward pass. Het model routeert elk token door 8 van de 384 beschikbare experts, plus een gedeelde expert die altijd actief is. Dit ontwerp stelt Kimi K2.6 in staat om prestaties op frontier-niveau te leveren tegen een fractie van de rekenkosten van vergelijkbare dense modellen.

Kimi K2.6 ondersteunt native tekst-, beeld- en video-invoer via de geïntegreerde MoonViT vision encoder, een module met 400 miljoen parameters die visuele data naast taal verwerkt. Het model gebruikt Multi-head Latent Attention (MLA) als aandachtsmechanisme, SwiGLU als activeringsfunctie en werkt met een vocabulaire van 160.000 tokens. Het contextvenster van 256K tokens plaatst het onder de open-weight modellen met de langste context die momenteel beschikbaar zijn.

Kimi K2.6 benchmarks: vergelijking met GPT-5.4 en Claude Opus 4.6

Volgens Moonshot AI scoort Kimi K2.6 het hoogst op vijf van de acht belangrijkste benchmarks in vergelijking met GPT-5.4, Claude Opus 4.6 en Gemini 3.1 Pro. De opvallendste resultaten liggen op het gebied van agentische en codingtaken. Op Humanity’s Last Exam (HLE) met tools scoort Kimi K2.6 54,0, boven Claude Opus 4.6 met 53,0 en GPT-5.4 met 52,1. Op SWE-Bench Pro, dat real-world GitHub-issue-resolutie meet, scoort Kimi K2.6 58,6% tegenover GPT-5.4 met 57,7% en Claude Opus 4.6 met 53,4%. Op SWE-Bench Verified behaalt het 80,2%.

Op pure reasoning-benchmarks houdt GPT-5.4 de leiding. Het scoort 99,2% op AIME 2026 tegenover 96,4% voor Kimi K2.6, en 92,8% op GPQA-Diamond tegenover 90,5% voor Kimi K2.6. Bij multimodaal begrip (MMMU-Pro) leidt Gemini 3.1 Pro met 83,0%, gevolgd door GPT-5.4 met 81,2% en Kimi K2.6 met 79,4%. Deze resultaten positioneren Kimi K2.6 als het sterkste open-weight model dat momenteel beschikbaar is, concurrerend met de beste closed-source systemen in de meeste categorieën.

Kimi K2.6 Agent Swarm: opschalen naar 300 sub-agents

Een van de meest onderscheidende functies van Kimi K2.6 is het Agent Swarm-systeem, waarmee het model complexe taken kan verdelen over maximaal 300 onafhankelijke sub-agents die tot 4.000 gecoordineerde stappen tegelijk uitvoeren. Dit is een flinke upgrade ten opzichte van Kimi K2.5, dat beperkt was tot 100 sub-agents en 1.500 stappen. Elke sub-agent voert zijn eigen tool-call-keten uit en kan een andere vaardigheid afhandelen: de ene analyseert een flame graph, de andere herschrijft een hot path, en een derde draait benchmarks en rapporteert resultaten.

In de praktijk betekent dit dat Kimi K2.6 meer dan twaalf uur continu kan werken aan long-horizon codingtaken in talen als Rust, Go en Python. Moonshot AI biedt vier inzetvarianten: Instant (lage latentie), Thinking (uitgebreid redeneren), Agent (single-agent toolgebruik) en Agent Swarm (multi-agent orchestratie). Alle vier zijn beschikbaar via Kimi Chat en de Moonshot API.

Kimi K2.6 beschikbaarheid, prijzen en toegang

Kimi K2.6 is direct beschikbaar via meerdere kanalen. De open weights zijn gepubliceerd op Hugging Face onder moonshotai/Kimi-K2.6. Ontwikkelaars kunnen het model gebruiken via de Moonshot API op api.moonshot.ai, die OpenAI-compatibel is, en daarnaast via Kimi.com, de Kimi App, de Kimi Code CLI en Ollama voor lokale implementatie. Het model is ook beschikbaar op Cloudflare Workers AI.

De prijs op de officiële Moonshot API bedraagt $0,60 per miljoen invoertokens en $4,00 per miljoen uitvoertokens, met gecachete tokens voor $0,16 per miljoen. Ter vergelijking: Claude Opus 4.7 kost $5,00 per miljoen invoertokens, waardoor Kimi K2.6 ongeveer 88% goedkoper is qua invoer. Het model is ook beschikbaar via externe aanbieders op OpenRouter.Kimi K2.6 markeert een opmerkelijke stap voorwaarts voor open-weight AI-modellen en verkleint de kloof met closed-source systemen op het gebied van coding en agentische taken.

De officiële aankondiging en technische details zijn beschikbaar op de Kimi K2.6 blogpost en de modelgewichten zijn te downloaden via Hugging Face.