{"id":3440560,"date":"2026-06-25T13:44:48","date_gmt":"2026-06-25T11:44:48","guid":{"rendered":"https:\/\/datanorth.ai\/?post_type=news&#038;p=3440560"},"modified":"2026-06-25T13:44:23","modified_gmt":"2026-06-25T11:44:23","slug":"openai-onthult-jalapeno","status":"publish","type":"news","link":"https:\/\/datanorth.ai\/nl\/nieuws\/openai-onthult-jalapeno","title":{"rendered":"OpenAI onthult Jalape\u00f1o: AI-inferentiechip"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\"><em>Gepubliceerd: 25 juni 2026<\/em><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">OpenAI en Broadcom hebben Jalape\u00f1o onthuld, de eerste eigen AI-chip van OpenAI en zijn eerste zelf ontworpen inferentieprocessor. Jalape\u00f1o werd op 24 juni 2026 aangekondigd en is een speciaal gebouwde ASIC die is ontworpen voor het draaien van grote taalmodellen (inference) en niet voor training. Volgens OpenAI ging de chip in negen maanden van het eerste ontwerp naar de productie-tape-out. De bedrijven mikken op een eerste uitrol eind 2026, als eerste stap in een meergeneratieplatform dat samen met Broadcom en Celestica wordt gebouwd.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Wat is de Jalape\u00f1o-chip van OpenAI?<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Jalape\u00f1o is wat OpenAI zijn eerste Intelligence Processor noemt: een eigen accelerator die vanaf de grond is ontworpen rond inference van grote taalmodellen. Anders dan een algemene GPU of een trainingsaccelerator die voor inference wordt hergebruikt, is Jalape\u00f1o een ASIC met een schone lei, afgestemd op de serving-patronen die OpenAI elke dag draait in ChatGPT, Codex en zijn API. OpenAI ontwierp zelf de chiparchitectuur, de kernels, de geheugensystemen en het netwerk, terwijl Broadcom de siliciumimplementatie en het netwerk verzorgde en Celestica de board-, rack- en systeemintegratie bijdroeg.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Het ontwerpdoel is om de doorvoer van de huidige toonaangevende AI-accelerators te combineren met een latency die dichter bij die van gespecialiseerde inferentiesystemen ligt, waardoor de chip geschikt is voor interactieve LLM-producten op grote schaal. Volgens OpenAI draaien engineering samples in het lab al machine learning-workloads op de beoogde productiefrequentie en het beoogde productievermogen, waaronder het model GPT-5.3-Codex-Spark.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Specificaties, prestaties en de tape-out in negen maanden<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Jalape\u00f1o is een grote, reticle-grote ASIC. OpenAI en Broadcom zeggen dat de chip in negen maanden van het eerste ontwerp naar de productie-tape-out ging, wat zij omschrijven als de snelste ASIC-ontwikkelcyclus die zij kennen binnen geavanceerde high-performance halfgeleiders. De architectuur is gebouwd om dataverkeer te beperken en om reken-, geheugen- en netwerkcapaciteit in balans te brengen, zodat de werkelijke benutting dichter bij de theoretische piekprestatie ligt. De chip gebruikt Broadcoms Tomahawk-netwerksilicium om over veel chips op te schalen.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Over de prestaties meet OpenAI nog de definitieve cijfers en het bedrijf heeft een uitgebreid technisch rapport voor de komende maanden beloofd. De belangrijkste claim is dat de eerste generatie accelerator een prestatie per watt levert die aanzienlijk beter is dan de huidige state-of-the-art hardware. Omdat Jalape\u00f1o een ASIC is en geen flexibele GPU, is de chip goedkoper te produceren en kan hij worden afgestemd op een beperkt aantal taken. Sommige media meldden dat het ontwerp de inferentiekosten met ongeveer 50 procent zou kunnen verlagen ten opzichte van conventionele GPU&#8217;s, al heeft OpenAI geen concreet kostencijfer gepubliceerd.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Hoe OpenAI zijn eigen modellen gebruikte om Jalape\u00f1o te ontwerpen<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Een detail dat OpenAI benadrukt, is dat de eigen modellen van het bedrijf delen van het ontwerp en de optimalisatie van de chip hebben versneld. Het bedrijf beschrijft dit als een vliegwiel: betere infrastructuur verbetert de rekeneffici\u00ebntie, wat beter trainen en serveren mogelijk maakt, wat krachtigere modellen oplevert, die op hun beurt helpen om de volgende generatie hardware te ontwerpen. Richard Ho, die het hardwareprogramma van OpenAI leidt, zei dat de architectuur is geoptimaliseerd rond de kernels, het geheugenverkeer, het netwerk en de serving-patronen die het belangrijkst zijn voor frontier-modellen, en dat vroege tests erop wijzen dat Jalape\u00f1o de belangrijkste workloads van OpenAI dicht bij de theoretische limieten van de hardware zal draaien.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Hoe verhoudt Jalape\u00f1o zich tot Nvidia-GPU&#8217;s?<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Jalape\u00f1o wordt breed gezien als de stap van OpenAI om zijn afhankelijkheid van Nvidia te verkleinen, waarvan de GPU&#8217;s nu de AI-training en inference domineren. Een ASIC als Jalape\u00f1o is minder flexibel dan een algemene Nvidia-GPU, maar is goedkoper en kan worden ontworpen voor een specifieke taak, in dit geval LLM-inference. De aanpak komt overeen met de eigen-siliciumstrategie\u00ebn van andere grote AI-spelers, zoals Google, dat eigen TPU&#8217;s bouwt, en Amazon, dat Trainium- en Inferentia-chips bouwt. Voor OpenAI betekent het bezit van de chiplaag dat het de volledige stack kan optimaliseren, van silicium en kernels tot de ChatGPT- en Codex-producten die erop draaien.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Beschikbaarheid, uitrol en roadmap van Jalape\u00f1o<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Jalape\u00f1o wordt gebouwd voor de eigen infrastructuur van OpenAI en niet als losstaand product verkocht. De bedrijven mikken op een eerste uitrol eind 2026. Broadcom-topman Hock Tan zei dat de samenwerking datacenters op gigawatt schaal mogelijk maakt met Microsoft en andere partners vanaf 2026, en dat dit de komende jaren over meerdere generaties wordt uitgebreid. Greg Brockman, president en medeoprichter van OpenAI, omschreef Jalape\u00f1o als onderdeel van een langetermijnstrategie voor full-stack infrastructuur die rekenkracht overvloediger en AI betaalbaarder moet maken voor mensen en bedrijven.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><em>Alle details en citaten staan in <a href=\"https:\/\/openai.com\/index\/openai-broadcom-jalapeno-inference-chip\/\" target=\"_blank\" rel=\"noreferrer noopener\">de offici\u00eble aankondiging van OpenAI over Jalape\u00f1o<\/a>.<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Jalape\u00f1o markeert de uitbreiding van OpenAI van modellen en producten naar eigen silicium, en geeft het bedrijf een speciaal gebouwde inferentiechip die samen met Broadcom is ontwikkeld en gepland staat voor uitrol eind 2026.<\/p>\n","protected":false},"author":12,"featured_media":3440558,"template":"","tags":[],"news-category":[],"class_list":["post-3440560","news","type-news","status-publish","has-post-thumbnail"],"meta_box":[],"_links":{"self":[{"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/news\/3440560","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/news"}],"about":[{"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/types\/news"}],"author":[{"embeddable":true,"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/users\/12"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/media\/3440558"}],"wp:attachment":[{"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/media?parent=3440560"}],"wp:term":[{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/tags?post=3440560"},{"taxonomy":"news-category","embeddable":true,"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/news-category?post=3440560"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}