Gepubliceerd: 20 mei 2026
Google heeft Gemini 3.5 Flash aangekondigd op Google I/O 2026 op 19 mei en het model dezelfde dag beschikbaar gesteld via de Gemini-app, Google AI Studio, de Gemini API en AI Mode in Google Search. Gemini 3.5 Flash is het eerste model in de nieuwe Gemini 3.5-familie en levert intelligentie op frontierniveau met vier keer de outputsnelheid van vergelijkbare modellen, geprijsd op $1,50 per miljoen invoertokens en $9,00 per miljoen uitvoertokens, met een contextvenster van een miljoen tokens. Het model presteert beter dan Googles eigen Gemini 3.1 Pro op coding- en agentbenchmarks, de eerste keer dat een Flash-model een Pro-model overtreft op dit type werklasten.
Wat kan Gemini 3.5 Flash?
Gemini 3.5 Flash wordt gepositioneerd als Googles sterkste model voor agentische taken en codering tot nu toe. Het scoort 76,2% op Terminal-Bench 2.1 (tegen 70,3% voor Gemini 3.1 Pro), 83,6% op MCP Atlas voor tool-use-evaluatie en 1656 Elo op de GDPval-AA-benchmark voor economisch waardevolle agentische taken. Op de Finance Agent v2-benchmark haalt Gemini 3.5 Flash 57,9% tegenover 43,0% voor Gemini 3.1 Pro, een verschil van bijna 15 procentpunten.
Het model accepteert tekst, afbeeldingen, audio en video als invoer en produceert tekstuitvoer. Dynamisch denken is standaard ingeschakeld en de ingebouwde mogelijkheden voor toolgebruik omvatten functieaanroepen, gestructureerde uitvoer, zoeken-als-tool en code-uitvoering. De kennisafsluitdatum is januari 2026. In combinatie met Googles bijgewerkte Antigravity-harnas kan Gemini 3.5 Flash meerdere subagenten parallel inzetten voor complexe, meerstaps-werkstromen.
Gemini 3.5 Flash benchmarks en technische specificaties
Gemini 3.5 Flash heeft een contextvenster van 1.048.576 invoertokens (ongeveer een miljoen) en ondersteunt maximaal 65.536 uitvoertokens. De API-model-ID is gemini-3.5-flash. De prijs bedraagt $1,50 per miljoen invoertokens, $9,00 per miljoen uitvoertokens en $0,15 per miljoen gecachte invoertokens. Daarmee is het model ruwweg 40% goedkoper dan Gemini 3.1 Pro op zowel invoer als uitvoer, terwijl het op de meeste praktische werklasten beter presteert.
Op coderingsbenchmarks scoort Gemini 3.5 Flash 76,2% op Terminal-Bench 2.1 en 55,1% op SWE-Bench Pro (Public). Voor multimodaal begrip behaalt het 84,2% op CharXiv Reasoning en 83,6% op MMMU-Pro. Waar het model achterblijft is puur abstract redeneren: 40,2% op Humanity’s Last Exam (tegenover 44,4% voor Gemini 3.1 Pro) en 72,1% op ARC-AGI-2 (tegenover 77,1%). Google positioneert Gemini 3.5 Pro, verwacht volgende maand, als de betere keuze voor die kennisintensieve toepassingen.
Hoe verhoudt Gemini 3.5 Flash zich tot GPT-5.5 en Claude Opus 4.7?
Google positioneert Gemini 3.5 Flash in het kwadrant rechtsboven van de Artificial Analysis Intelligence Index, waar frontier-intelligentie samenvalt met Flash-snelheid. Het model draait vier keer sneller in uitvoertokens per seconde dan andere frontiermodellen, aldus Googles eigen metingen. Tegen $1,50/$9,00 per miljoen tokens onderbiedt het zowel GPT-5.5 ($5,00/$15,00 per miljoen tokens bij OpenAI) als Claude Opus 4.7 ($5,00/$25,00 per miljoen tokens).
De afweging is helder: Gemini 3.5 Flash verliest terrein op academisch redeneren en langetermijn-contextrecall op het 128k-tokenniveau, waar Gemini 3.1 Pro nog een voordeel heeft (84,9% tegenover 77,3% op MRCR v2 bij 128k). Voor werklasten die draaien om meerstaps-agentuitvoering, toolaanroepen en coderingstaken suggereren Googles benchmarks dat Gemini 3.5 Flash de sterkste optie in zijn prijsklasse is.
Welke bedrijven gebruiken Gemini 3.5 Flash al?
Google kondigde zes lanceringpartners aan met specifieke productietoepassingen. Shopify zet parallelle subagenten in voor groeiverwachtingen van verkopers. Macquarie Bank test het model voor klantonboarding aan de hand van financiele documenten van meer dan honderd pagina’s. Salesforce integreert Gemini 3.5 Flash in Agentforce voor multi-subagent-bedrijfsautomatisering. Ramp gebruikt multimodale OCR op complexe facturen gecombineerd met redeneren over historische patronen. Xero zet agenten in voor werkstromen van meerdere weken, zoals de voorbereiding van 1099-belastingformulieren. Databricks gebruikt agentische monitoring en realtime-retrieval over grote datasets.
Gemini 3.5 Flash is ook de motor achter Gemini Spark, Googles nieuwe persoonlijke AI-agent die continu draait en namens de gebruiker actie onderneemt. Spark wordt nu uitgerold naar vertrouwde testers, met een beta gepland voor Google AI Ultra-abonnees in de VS. Het model is daarnaast het nieuwe standaardmodel voor de Gemini-app en AI Mode in Google Search wereldwijd.
Gemini 3.5 Flash beschikbaarheid en prijzen
Gemini 3.5 Flash is algemeen beschikbaar sinds 19 mei 2026. Ontwikkelaars kunnen het model benaderen via Google AI Studio, de Gemini API, Android Studio, Google Antigravity 2.0, Vertex AI en het Gemini Enterprise Agent Platform. Consumenten hebben toegang via de Gemini-app en AI Mode in Google Search. De prijs bedraagt $1,50 per miljoen invoertokens en $9,00 per miljoen uitvoertokens op de mondiale laag, met 90% korting op gecachte invoertokens tegen $0,15 per miljoen. Niet-mondiale regio’s zijn iets duurder geprijsd tegen $1,65/$9,90.
Gemini 3.5 Flash is de belangrijkste Flash-release die Google tot nu toe heeft uitgebracht. De volledige aankondiging staat op de Google-blog en de evaluatiemethodologie is gepubliceerd op Google Deepmind.
Gemini 3.5 Pro, momenteel intern in gebruik bij Google, wordt verwacht in juni 2026.