OpenAI onthult Jalapeño: AI-inferentiechip

25-06-2026

Jalapeño markeert de uitbreiding van OpenAI van modellen en producten naar eigen silicium, en geeft het bedrijf een speciaal gebouwde inferentiechip die samen met Broadcom is ontwikkeld en gepland staat voor uitrol eind 2026.

Geschreven door:

Jorick van Weelie

Marketing Lead bij DataNorth | Next-Gen AI-enthousiast & Tech Storyteller

Meld je aan voor de Nieuwsbrief

Gepubliceerd: 25 juni 2026

OpenAI en Broadcom hebben Jalapeño onthuld, de eerste eigen AI-chip van OpenAI en zijn eerste zelf ontworpen inferentieprocessor. Jalapeño werd op 24 juni 2026 aangekondigd en is een speciaal gebouwde ASIC die is ontworpen voor het draaien van grote taalmodellen (inference) en niet voor training. Volgens OpenAI ging de chip in negen maanden van het eerste ontwerp naar de productie-tape-out. De bedrijven mikken op een eerste uitrol eind 2026, als eerste stap in een meergeneratieplatform dat samen met Broadcom en Celestica wordt gebouwd.

Wat is de Jalapeño-chip van OpenAI?

Jalapeño is wat OpenAI zijn eerste Intelligence Processor noemt: een eigen accelerator die vanaf de grond is ontworpen rond inference van grote taalmodellen. Anders dan een algemene GPU of een trainingsaccelerator die voor inference wordt hergebruikt, is Jalapeño een ASIC met een schone lei, afgestemd op de serving-patronen die OpenAI elke dag draait in ChatGPT, Codex en zijn API. OpenAI ontwierp zelf de chiparchitectuur, de kernels, de geheugensystemen en het netwerk, terwijl Broadcom de siliciumimplementatie en het netwerk verzorgde en Celestica de board-, rack- en systeemintegratie bijdroeg.

Het ontwerpdoel is om de doorvoer van de huidige toonaangevende AI-accelerators te combineren met een latency die dichter bij die van gespecialiseerde inferentiesystemen ligt, waardoor de chip geschikt is voor interactieve LLM-producten op grote schaal. Volgens OpenAI draaien engineering samples in het lab al machine learning-workloads op de beoogde productiefrequentie en het beoogde productievermogen, waaronder het model GPT-5.3-Codex-Spark.

Specificaties, prestaties en de tape-out in negen maanden

Jalapeño is een grote, reticle-grote ASIC. OpenAI en Broadcom zeggen dat de chip in negen maanden van het eerste ontwerp naar de productie-tape-out ging, wat zij omschrijven als de snelste ASIC-ontwikkelcyclus die zij kennen binnen geavanceerde high-performance halfgeleiders. De architectuur is gebouwd om dataverkeer te beperken en om reken-, geheugen- en netwerkcapaciteit in balans te brengen, zodat de werkelijke benutting dichter bij de theoretische piekprestatie ligt. De chip gebruikt Broadcoms Tomahawk-netwerksilicium om over veel chips op te schalen.

Over de prestaties meet OpenAI nog de definitieve cijfers en het bedrijf heeft een uitgebreid technisch rapport voor de komende maanden beloofd. De belangrijkste claim is dat de eerste generatie accelerator een prestatie per watt levert die aanzienlijk beter is dan de huidige state-of-the-art hardware. Omdat Jalapeño een ASIC is en geen flexibele GPU, is de chip goedkoper te produceren en kan hij worden afgestemd op een beperkt aantal taken. Sommige media meldden dat het ontwerp de inferentiekosten met ongeveer 50 procent zou kunnen verlagen ten opzichte van conventionele GPU’s, al heeft OpenAI geen concreet kostencijfer gepubliceerd.

Hoe OpenAI zijn eigen modellen gebruikte om Jalapeño te ontwerpen

Een detail dat OpenAI benadrukt, is dat de eigen modellen van het bedrijf delen van het ontwerp en de optimalisatie van de chip hebben versneld. Het bedrijf beschrijft dit als een vliegwiel: betere infrastructuur verbetert de rekenefficiëntie, wat beter trainen en serveren mogelijk maakt, wat krachtigere modellen oplevert, die op hun beurt helpen om de volgende generatie hardware te ontwerpen. Richard Ho, die het hardwareprogramma van OpenAI leidt, zei dat de architectuur is geoptimaliseerd rond de kernels, het geheugenverkeer, het netwerk en de serving-patronen die het belangrijkst zijn voor frontier-modellen, en dat vroege tests erop wijzen dat Jalapeño de belangrijkste workloads van OpenAI dicht bij de theoretische limieten van de hardware zal draaien.

Hoe verhoudt Jalapeño zich tot Nvidia-GPU’s?

Jalapeño wordt breed gezien als de stap van OpenAI om zijn afhankelijkheid van Nvidia te verkleinen, waarvan de GPU’s nu de AI-training en inference domineren. Een ASIC als Jalapeño is minder flexibel dan een algemene Nvidia-GPU, maar is goedkoper en kan worden ontworpen voor een specifieke taak, in dit geval LLM-inference. De aanpak komt overeen met de eigen-siliciumstrategieën van andere grote AI-spelers, zoals Google, dat eigen TPU’s bouwt, en Amazon, dat Trainium- en Inferentia-chips bouwt. Voor OpenAI betekent het bezit van de chiplaag dat het de volledige stack kan optimaliseren, van silicium en kernels tot de ChatGPT- en Codex-producten die erop draaien.

Beschikbaarheid, uitrol en roadmap van Jalapeño

Jalapeño wordt gebouwd voor de eigen infrastructuur van OpenAI en niet als losstaand product verkocht. De bedrijven mikken op een eerste uitrol eind 2026. Broadcom-topman Hock Tan zei dat de samenwerking datacenters op gigawatt schaal mogelijk maakt met Microsoft en andere partners vanaf 2026, en dat dit de komende jaren over meerdere generaties wordt uitgebreid. Greg Brockman, president en medeoprichter van OpenAI, omschreef Jalapeño als onderdeel van een langetermijnstrategie voor full-stack infrastructuur die rekenkracht overvloediger en AI betaalbaarder moet maken voor mensen en bedrijven.

Alle details en citaten staan in de officiële aankondiging van OpenAI over Jalapeño.