Gepubliceerd: 23 april 2026
OpenAI heeft op 21 april 2026 GPT-Image-2 uitgebracht, een nieuw beeldgeneratiemodel dat O-serie redeneercapaciteiten direct in het generatieproces integreert. Het model is beschikbaar in ChatGPT en via de API onder de naam gpt-image-2, levert beelden tot 2K-resolutie en behaalt bijna perfecte tekstweergave in Latijnse, CJK-, Arabische, Hindi- en Bengaalse schriften. Binnen 12 uur na lancering veroverde GPT-Image-2 de eerste positie in elke categorie op het Image Arena-leaderboard, met een voorsprong van 242 Elo-punten op het eerstvolgende model.
Wat is GPT-Image-2 en waarin verschilt het van DALL-E?
GPT-Image-2 is de opvolger van OpenAI’s DALL-E-lijn van beeldgeneratoren. DALL-E 3 werd in november 2025 uit de API verwijderd en in december 2025 uit ChatGPT gehaald. Gebruikers werden toen gemigreerd naar het tussenmodel GPT-Image-1.5. GPT-Image-2 hanteert een fundamenteel andere aanpak: in plaats van direct beelden te genereren uit prompts, redeneert het model eerst over compositie, ruimtelijke indeling en inhoud voordat het pixels vastlegt. OpenAI noemt dit “Thinking Mode” en het is ingebouwd in de architectuur, niet toegepast als nabewerking.
Het praktische resultaat is dat GPT-Image-2 complexe scènes met meerdere elementen, gedetailleerde typografie en stilistische instructies met aanzienlijk hogere nauwkeurigheid verwerkt dan eerdere OpenAI-beeldmodellen. In tests behield het model visuele consistentie over maximaal acht beelden die vanuit één prompt werden gegenereerd, wat workflows mogelijk maakt voor storyboarding, mangacreatie en productontwerp met meerdere scènes.
GPT-Image-2 benchmarks en technische specificaties
GPT-Image-2 scoorde 1.512 op het Arena.ai Text-to-Image-leaderboard per 22 april 2026. Het nummer twee model, Google’s Nano Banana 2, scoorde 1.271. Het verschil van 242 punten is de grootste voorsprong die ooit op dat leaderboard is geregistreerd. Het model scoorde daarnaast 1.513 op single-image editing en 1.464 op multi-image editing, waarmee het in alle drie de categorieën op de eerste plaats staat.
Vijf kernverbeteringen definiëren GPT-Image-2 ten opzichte van zijn voorgangers.
- Ongeveer 99% nauwkeurigheid op tekenniveau in meerdere schriften en talen.
- Ingebouwde redenering vóór het genereren via O-serie-integratie.
- Contextbewuste bewerkingen in meerdere stappen zonder de drift die bij eerdere modellen optrad.
- Het vermogen om meer dan 100 afzonderlijke objecten in één scène weer te geven en visueel van elkaar te onderscheiden.
- Consistente kwaliteit over artistieke stijlen, zonder kwaliteitsverlies bij het wisselen tussen fotorealisme, pixel art, manga of illustratie.
Het model ondersteunt outputresoluties tot 2K (experimenteel) en kan maximaal acht samenhangende beelden genereren vanuit één prompt. De kennisgrens ligt op december 2025 en het model kan tijdens de redeneerfase realtime webzoekopdrachten uitvoeren om de nauwkeurigheid te verbeteren voor actuele gebeurtenissen of technische onderwerpen.
Hoe verhoudt GPT-Image-2 zich tot Midjourney V7?
GPT-Image-2 en Midjourney V7 bekleden verschillende posities in het huidige landschap van beeldgeneratie. GPT-Image-2 is sterker in tekstweergave, het nauwkeurig opvolgen van instructies en integratie met conversationele AI-workflows. Midjourney V7 behoudt zijn voorsprong op het gebied van pure visuele esthetiek, met superieure filmische belichting, schilderachtig detail en karakterconsistentie via het Omni Reference-systeem.
Voor ontwikkelaars die applicaties bouwen met nauwkeurige typografie, infographics, UI-mockups of meertalige visuele content is GPT-Image-2 de sterkere optie. Voor concept artists, illustratoren en social media-ontwerpers die zich richten op visuele impact blijft Midjourney V7 competitief. Beide platformen worden geconfronteerd met lopende auteursrechtelijke procedures van grote entertainment- en uitgeversmaatschappijen (stand medio 2026).
GPT-Image-2 beschikbaarheid en prijzen
GPT-Image-2 is nu beschikbaar in ChatGPT voor alle gebruikers in Instant Mode. Thinking Mode, waarmee de volledige redeneerpipeline wordt ingeschakeld en de hoogste kwaliteit output wordt geproduceerd, vereist een ChatGPT Plus-, Pro- of Business-abonnement. De API (model-ID: gpt-image-2) wordt begin mei 2026 opengesteld voor alle ontwikkelaars.
De API-prijzen zijn tokengebaseerd: image input tokens kosten $8 per miljoen, image output tokens kosten $30 per miljoen, en teksttokens kosten $5 (input) en $10 (output) per miljoen. OpenAI geeft aan dat de kosten voor beeldoutput 6% lager zijn dan bij het voorgaande model gpt-image-1.5, ondanks de verbeterde capaciteiten. Het editing-endpoint ondersteunt inpainting en outpainting via maskbeelden, waarmee specifieke gebieden van een afbeelding nauwkeurig kunnen worden aangepast zonder de omliggende inhoud te beïnvloeden.
De volledige aankondiging en technische documentatie van OpenAI voor GPT-Image-2 zijn beschikbaar op openai.com/index/introducing-chatgpt-images-2-0.