NVIDIA lanceert Nemotron 3 Ultra en Cosmos 3

03-06-2026

Nemotron 3 Ultra en Cosmos 3 breiden NVIDIA's AI-modelportfolio uit van inferentiehardware naar de modellen zelf, met open-weight alternatieven voor zowel taalredenering als multimodale Physical AI-toepassingen.

Geschreven door:

Jorick van Weelie

Jorick van Weelie | Marketing Lead & AI-strateeg bij DataNorth AI Als Marketing Lead bij DataNorth bevindt Jorick zich op het snijvlak van merkautoriteit en technische innovatie. Hij is gespecialiseerd in het vertalen van complexe AI-architecturen naar concrete bedrijfsstrategieën, waarbij hij ervoor zorgt dat AI niet slechts een "tool" is, maar een katalysator voor groei. Met een sterke focus op de EU AI Act en AI-driven growth marketing geeft Jorick vorm aan het narratief van het Nederlandse AI-landschap, waarbij hij organisaties helpt om vertrouwen op te bouwen terwijl ze hun intelligentie verder opschalen.

Meld je aan voor de Nieuwsbrief

Gepubliceerd: 3 juni 2026

NVIDIA heeft Nemotron 3 Ultra en Cosmos 3 aangekondigd tijdens de Computex 2026-keynote op 1 juni in Taipei. Nemotron 3 Ultra is NVIDIA’s grootste open-weight taalmodel tot nu toe, met ongeveer 550 miljard totale parameters waarvan 55 miljard actief per token, en een contextvenster van 1 miljoen tokens. Cosmos 3 is ‘s werelds eerste volledig open omnimodel dat taal, beeld, video, audio en actiegeneratie combineert in één architectuur voor robotica en Physical AI-toepassingen.

Wat is Nemotron 3 Ultra?

Nemotron 3 Ultra is een sparse Mixture of Experts-model met ongeveer 550 miljard totale parameters. Dankzij 90% sparsity zijn slechts ongeveer 55 miljard parameters actief per token, wat de inferentiekosten beheersbaar houdt ondanks het grote totale parameteraantal. Het model ondersteunt een contextlengte van maximaal 1 miljoen tokens, waarmee het in dezelfde categorie valt als Google’s Gemini 3.5 Flash en Alibaba’s Qwen 3.7 Max.

NVIDIA heeft Nemotron 3 Ultra specifiek ontworpen voor agentische AI-workloads: taken waarbij het model moet plannen, in meerdere stappen moet redeneren en autonoom tools moet gebruiken. Het model is volledig open-weight, waardoor onderzoekers en ontwikkelaars het kunnen downloaden, finetunen en op hun eigen infrastructuur kunnen draaien.

Benchmarks en prestaties van Nemotron 3 Ultra

Nemotron 3 Ultra scoort 48 op de Artificial Analysis Intelligence Index, ruim boven de eerstvolgende Amerikaanse open-weight modellen. Het model blijft echter achter bij de Chinese open-weight frontier, waar modellen als Qwen 3.7 Max ongeveer 92,4 scoren op GPQA Diamond. Qua inferentiesnelheid leverde een pre-release endpoint op DeepInfra meer dan 300 tokens per seconde.

De positionering van Nemotron 3 Ultra is opvallend: NVIDIA probeert niet te concurreren met de grootste closed-source frontiermodellen van OpenAI of Anthropic op ruwe intelligentiebenchmarks. In plaats daarvan richt het zich op het open-weight segment waar ontwikkelaars een capabel, aanpasbaar model nodig hebben dat ze zelf kunnen draaien en wijzigen, vooral voor enterprise-toepassingen met agentische AI waar datasoevereiniteit en maatwerk belangrijk zijn.

Wat is Cosmos 3 en hoe verschilt het van taalmodellen?

Cosmos 3 is een fundamenteel ander type model. In plaats van alleen tekst te verwerken en te genereren, combineert het taal, beeld, video, audio en actie in één Mixture-of-Transformers-architectuur. Het ontwerp koppelt een autoregressieve redeneerder aan een diffusiegenerator, waardoor het model natively kan begrijpen en genereren in al deze modaliteiten.

NVIDIA beschrijft Cosmos 3 als speciaal gebouwd voor Physical AI en robotica. Het model kan visuele scènes analyseren, beelden en video genereren, audio verwerken en actiesequenties voor robotsystemen uitvoeren, allemaal binnen één geïntegreerd model. Op publieke ranglijsten behaalde Cosmos 3 de eerste plaats onder open-weight modellen op zowel text-to-image als image-to-video benchmarks. Net als Nemotron 3 Ultra is Cosmos 3 volledig open.

Hoe verhouden Nemotron 3 Ultra en Cosmos 3 zich tot concurrenten?

In het open-weight taalmodelsegment concurreert Nemotron 3 Ultra voornamelijk met Meta’s Llama 4 Scout, Alibaba’s Qwen 3.7 Max en Mistral’s Devstral 2. Met 550 miljard totale parameters behoort het tot de grootste beschikbare open-weight modellen, en het contextvenster van 1 miljoen tokens matcht de besten in zijn klasse. Het belangrijkste onderscheid is NVIDIA’s focus op agentische AI: het model is geoptimaliseerd voor meerstaps tool-gebruik en planning, in plaats van algemene chat of creatief schrijven.

Cosmos 3 heeft minder directe concurrenten, omdat de categorie van volledig open omnimodellen nog in opkomst is. De dichtstbijzijnde vergelijkingen zijn Google’s Gemini-modellen, die ook meerdere modaliteiten aankunnen, maar Gemini is closed-source. Door Cosmos 3 open te maken, gokt NVIDIA erop dat de robotica- en Physical AI-ontwikkelaarsgemeenschap het zal adopteren als fundamentele bouwsteen voor autonome systemen.

Beschikbaarheid van Nemotron 3 Ultra en Cosmos 3

Zowel Nemotron 3 Ultra als Cosmos 3 zijn beschikbaar als open-weight modellen. Nemotron 3 Ultra is toegankelijk via NVIDIA’s ontwikkelaarsportaal en wordt al aangeboden op inferentieplatforms zoals DeepInfra. NVIDIA positioneert beide modellen als onderdeel van de bredere strategie om een end-to-end AI-infrastructuurleverancier te worden, voorbij de traditionele rol als chipfabrikant.

De officiële aankondiging van de Nemotron 3-familie is te vinden op de NVIDIA Newsroom, en technische details staan op de NVIDIA Research-pagina.