{"id":3436500,"date":"2026-04-16T08:19:15","date_gmt":"2026-04-16T07:19:15","guid":{"rendered":"https:\/\/datanorth.ai\/?post_type=news&#038;p=3436500"},"modified":"2026-04-16T08:19:01","modified_gmt":"2026-04-16T07:19:01","slug":"google-lanceert-gemini-3-1-flash-tts","status":"publish","type":"news","link":"https:\/\/datanorth.ai\/nl\/nieuws\/google-lanceert-gemini-3-1-flash-tts","title":{"rendered":"Google lanceert Gemini 3.1 Flash TTS"},"content":{"rendered":"\n<p><em>16 april 2026<\/em><\/p>\n\n\n\n<p>Google DeepMind heeft op 15 april 2026 Gemini 3.1 Flash TTS uitgebracht, een text-to-speech-model dat gedetailleerde audiotags introduceert voor het aansturen van vocale stijl, tempo en intonatie. Het model ondersteunt meer dan 70 talen en native multi-speaker-dialoog, en is nu beschikbaar via de Gemini API, Google AI Studio, Vertex AI en Google Vids.<\/p>\n\n\n\n<p>Gemini 3.1 Flash TTS staat op de tweede plaats in het Artificial Analysis TTS-klassement met een Elo-score van 1.211, waarmee het ElevenLabs v3 overtreft in algehele kwaliteit. Google positioneert het als het meest expressieve en controleerbare text-to-speech-model in de Gemini-familie tot nu toe.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Wat kan Gemini 3.1 Flash TTS?<\/h2>\n\n\n\n<p>Gemini 3.1 Flash TTS zet tekst om in natuurlijk klinkende spraak met een mate van controle die verder gaat dan standaard TTS-systemen. Het model introduceert meer dan 200 audiotags die ontwikkelaars direct in de invoertekst kunnen plaatsen om vocale stijl, toon, tempo en accent te sturen. Tags zoals [enthusiasm], [whispers], [curiosity] en [determination] bieden gedetailleerde emotionele controle zonder aparte configuratie of nabewerking.<\/p>\n\n\n\n<p>Naast emotionele expressie biedt het model formaattemplates voor veelvoorkomende toepassingen: podcastgesprekken, audioboekverhaler, taaldocent, spraakassistent, wellnessgids, nieuwslezer en klantenservicemedewerker. Gebruikers kunnen kiezen uit regionale accenten per taal. Alleen al voor het Engels zijn er Amerikaanse varianten zoals Valley en Southern, en Britse opties zoals Brixton en RP. Alle instellingen kunnen als API-code worden ge\u00ebxporteerd voor integratie in productieomgevingen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Gemini 3.1 Flash TTS benchmarks en technische specificaties<\/h2>\n\n\n\n<p>Op het Artificial Analysis TTS-klassement behaalde Gemini 3.1 Flash TTS een Elo-score van 1.211, goed voor de tweede plaats. Het model overtreft ElevenLabs v3 in algehele kwaliteit en staat net achter Inworld 1.5 Max. Het valt vooral op door de verhouding tussen kwaliteit en prijs.<\/p>\n\n\n\n<p>Het model ondersteunt meer dan 70 talen native, waaronder Japans, Hindi en Duits. Het verwerkt multi-speaker-dialoog zonder aparte modelaanroepen per spreker, wat de productie van conversatiecontent zoals podcasts en interactieve spraaktoepassingen vereenvoudigt.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Gemini 3.1 Flash TTS prijzen en beschikbaarheid<\/h2>\n\n\n\n<p>Gemini 3.1 Flash TTS is beschikbaar als preview via vier kanalen: de Gemini API voor ontwikkelaars, Google AI Studio voor gratis experimenteren, Vertex AI voor zakelijke gebruikers en Google Vids voor Workspace-abonnees. De betaalde laag kost $1,00 per miljoen invoertokens en $20,00 per miljoen audio-outputtokens. Een batchmodus biedt 50% korting: $0,50 en $10,00 respectievelijk. Er is ook een gratis laag beschikbaar, al merkt Google op dat data uit gratis gebruik mogelijk wordt ingezet voor productverbetering.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Hoe verhoudt Gemini 3.1 Flash TTS zich tot andere TTS-modellen?<\/h2>\n\n\n\n<p>Het TTS-landschap in april 2026 bevat sterke aanbiedingen van ElevenLabs, Inworld en OpenAI. Gemini 3.1 Flash TTS onderscheidt zich door de combinatie van het audiotag-systeem en concurrerende prijzen. Hoewel Inworld 1.5 Max de hoogste Elo-positie bezet, biedt Googles model een bredere functieset tegen lagere kosten per token. Dat maakt het aantrekkelijk voor toepassingen met hoog volume, zoals klantenservice, contentcreatie en toegankelijkheidstools.<\/p>\n\n\n\n<p>Vergeleken met eerdere modellen in de Gemini TTS-familie voegt de 3.1 Flash TTS-versie het systeem van 200+ audiotags toe, breidt het de taalondersteuning uit en introduceert het native multi-speaker-dialoog. De toevoeging van formaattemplates voor specifieke toepassingen vermindert bovendien de benodigde setup.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">SynthID-watermerken en veiligheid<\/h2>\n\n\n\n<p>Alle audio die door Gemini 3.1 Flash TTS wordt gegenereerd, is voorzien van een watermerk met Googles SynthID-technologie. Dit onhoorbare watermerk wordt direct in de audio-uitvoer ingebed, waardoor AI-gegenereerde spraak betrouwbaar kan worden gedetecteerd. Google presenteert dit als een bescherming tegen misbruik en desinformatie, zodat downstream-systemen kunnen controleren of audio door het model is geproduceerd.<\/p>\n\n\n\n<p><em>Gemini 3.1 Flash TTS is nu beschikbaar als preview. Ga voor volledige documentatie, prijsinformatie en API-toegang naar de\u00a0<a href=\"https:\/\/blog.google\/innovation-and-ai\/models-and-research\/gemini-models\/gemini-3-1-flash-tts\/\" target=\"_blank\" rel=\"noopener noreferrer nofollow\">offici\u00eble Google-blogpost<\/a> of de <a href=\"https:\/\/ai.google.dev\/gemini-api\/docs\/speech-generation\" target=\"_blank\" rel=\"noopener noreferrer nofollow\">Gemini API-documentatie<\/a>.<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Google levert een TTS-model dat brede taalondersteuning, gedetailleerde expressieve controle en concurrerende prijzen combineert in een enkele API.<\/p>\n","protected":false},"author":12,"featured_media":3436498,"template":"","tags":[],"news-category":[],"class_list":["post-3436500","news","type-news","status-publish","has-post-thumbnail"],"meta_box":[],"_links":{"self":[{"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/news\/3436500","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/news"}],"about":[{"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/types\/news"}],"author":[{"embeddable":true,"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/users\/12"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/media\/3436498"}],"wp:attachment":[{"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/media?parent=3436500"}],"wp:term":[{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/tags?post=3436500"},{"taxonomy":"news-category","embeddable":true,"href":"https:\/\/datanorth.ai\/nl\/wp-json\/wp\/v2\/news-category?post=3436500"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}