Alibaba lanceert Qwen3.6-Max-Preview

21-04-2026

Qwen3.6-Max-Preview is het krachtigste model van Alibaba tot nu toe, met de hoogste score op zes programmeerbenchmarks en lage inferentiekosten dankzij de 35B-totaal, 3B-actieve mixture-of-experts-architectuur.

Geschreven door:

Jorick van Weelie

Jorick van Weelie | Marketing Lead & AI-strateeg bij DataNorth AI Als Marketing Lead bij DataNorth bevindt Jorick zich op het snijvlak van merkautoriteit en technische innovatie. Hij is gespecialiseerd in het vertalen van complexe AI-architecturen naar concrete bedrijfsstrategieën, waarbij hij ervoor zorgt dat AI niet slechts een "tool" is, maar een katalysator voor groei. Met een sterke focus op de EU AI Act en AI-driven growth marketing geeft Jorick vorm aan het narratief van het Nederlandse AI-landschap, waarbij hij organisaties helpt om vertrouwen op te bouwen terwijl ze hun intelligentie verder opschalen.

Meld je aan voor de Nieuwsbrief

Gepubliceerd: 21 april 2026

Alibaba heeft op 20 april 2026 Qwen3.6-Max-Preview uitgebracht, het krachtigste model in de Qwen-serie tot nu toe. Het proprietary model behaalt de hoogste scores op zes belangrijke programmeer- en agentbenchmarks, waaronder SWE-bench Pro en Terminal-Bench 2.0, terwijl het een mixture-of-experts-architectuur gebruikt die slechts 3 miljard van de 35 miljard totale parameters activeert per inferentie. Qwen3.6-Max-Preview is direct beschikbaar via het Alibaba Cloud Bailian-platform en Qwen Studio.

Wat kan Qwen3.6-Max-Preview?

Qwen3.6-Max-Preview is een text-only taalmodel gebouwd voor agentische programmeertaken, complexe redenering en het opvolgen van instructies. Het model ondersteunt een contextvenster van 256.000 tokens en bevat een preserve_thinking-functie die redeneersporen bewaart over meerdere gespreksbeurten. Alibaba beveelt deze functie specifiek aan voor agentische workflows waarbij continuïteit van context essentieel is.

Het model maakt gebruik van een mixture-of-experts (MoE)-architectuur met 35 miljard parameters in totaal, maar activeert slechts 3 miljard parameters per inferentie. Dit ontwerp verlaagt de rekenkosten aanzienlijk en verhoogt de doorvoer ten opzichte van dense modellen met vergelijkbare capaciteiten. Bij de lancering accepteert Qwen3.6-Max-Preview geen afbeeldingen als invoer; het is een puur tekstmodel.

Qwen3.6-Max-Preview benchmarks en technische specificaties

Volgens Alibaba scoort Qwen3.6-Max-Preview het hoogst op zes programmeer- en agentbenchmarks:

  • SWE-bench Pro (software-engineering in de praktijk),
  • Terminal-Bench 2.0 (commandoregeluitvoering),
  • SkillsBench (algemeen probleemoplossend vermogen),
  • QwenClawBench (toolgebruik),
  • QwenWebBench (webinteractie)
  • SciCode (wetenschappelijk programmeren).

Deze benchmarks bestrijken een breed scala aan praktische ontwikkelaarstaken, van het oplossen van echte GitHub-issues tot het orkestreren van meerstaps toolaanroepen.

Vergeleken met zijn voorganger Qwen3.6-Plus toont de Max-Preview-variant verbeteringen van +9,9 punten op SkillsBench, +10,8 op SciCode en +3,8 op Terminal-Bench 2.0. Wereldkennisscores verbeterden eveneens, met +2,3 punten op SuperGPQA en +5,3 op QwenChineseBench. Het vermogen om instructies op te volgen, gemeten op ToolcallFormatIFBench, verbeterde met +2,8 punten.

Hoe verhoudt Qwen3.6-Max-Preview zich tot GPT-5.4 en Claude Opus 4.7?

Het AI-modellandschap van april 2026 is uiterst competitief.
Op software-engineeringtaken leidt Claude Opus 4.6 op SWE-bench Verified met 80,8%,
terwijl Qwen3.6-Plus (de voorganger van Max-Preview) 78,8% scoorde op dezelfde benchmark.
GPT-5.4 scoorde 57,7% op SWE-bench Pro.
Met de extra verbeteringen die Alibaba rapporteert voor Qwen3.6-Max-Preview ten opzichte van Qwen3.6-Plus, lijkt het nieuwste model van Alibaba de kloof met de toonaangevende proprietary modellen op programmeer specifieke taken te verkleinen.

Een opvallend verschil is de prijsstelling en architectuur. Qwen3.6-Max-Preview activeert slechts 3 miljard parameters per verzoek ondanks 35 miljard in totaal, waardoor het aanzienlijk efficiënter is dan dense modellen zoals GPT-5.4 (geprijsd op $2,50/$15 per miljoen tokens) of Claude Opus 4.7 ($5/$25 per miljoen tokens). Alibaba heeft nog geen definitieve prijzen aangekondigd voor Qwen3.6-Max, hoewel de voorganger Qwen3.6-Plus momenteel gratis beschikbaar is tijdens de previewperiode. Het contextvenster van 256.000 tokens is kleiner dan de meer dan 1 miljoen tokens die GPT-5.4 en Claude Opus 4.7 bieden.

Beschikbaarheid en toegang tot Qwen3.6-Max-Preview

Qwen3.6-Max-Preview is direct beschikbaar via het Alibaba Cloud Bailian-platform en Qwen Studio. Het API-endpoint gebruikt de modelstring qwen3.6-max-preview en is compatibel met zowel de OpenAI- als de Anthropic-API-specificaties, zodat ontwikkelaars het model met minimale codewijzigingen in bestaande pipelines kunnen integreren.

Alibaba bestempelt deze release nadrukkelijk als een preview. Het bedrijf stelt dat het model “nog actief in ontwikkeling” is en dat verdere optimalisaties verwacht worden voor een stabiele release. Er zijn geen open weights beschikbaar; het model is gehost en proprietary.

Wat betekent de release van Qwen3.6-Max-Preview voor de AI-markt?

De release van Qwen3.6-Max-Preview voegt weer een sterke kandidaat toe aan de golf van AI-modellanceringen in april 2026. Naast GPT-6 (14 april), Claude Opus 4.7 (16 april), Google Gemma 4 (2 april) en Meta Llama 4 (5 april) bevestigt het dat Chinese AI-labs modellen leveren die op technische benchmarks direct concurreren met westerse frontiersystemen. De efficiënte MoE-architectuur, die slechts 3 van de 35 miljard parameters activeert, biedt een andere afweging dan de dense modellen van OpenAI en Anthropic: lagere inferentiekosten in ruil voor minder ruwe parametercapaciteit.

Alle details over Qwen3.6-Max-Preview zijn te vinden op de Qwen-onderzoekspagina en via Alibaba Cloud Model Studio.