De toekomst van stemacteren
Hoe zal het vak van stemacteur zich de komende jaren ontwikkelen? Zijn stemacteurs in de toekomst overbodig en vervangen door kunstmatige intelligentie? En hoe zorg je als stemacteur of voice-over dat je nieuwe technieken in je voordeel kunt gebruiken? In dit blog probeer ik op basis van het verleden en het heden een blik te werpen op de toekomst van stemacteren.
Niets is zo lastig als het voorspellen van de toekomst. De meeste voorspellingen blijken er achteraf faliekant naast te zitten. Niemand weet precies hoe het vak van stemacteur er over, pak 'em beet, 10 tot 25 jaar uitziet, maar op basis van recente ontwikkelingen en de huidige situatie kunnen we er wél een aardige ‘educated guess’ op loslaten.
Audio explosie
De afgelopen decennia is de audiovisuele industrie enorm gegroeid. Door een onstuimige toename van het aantal tv- en radiozenders, streamingsdiensten, online video, podcasts en luisterboeken is ook de hoeveelheid content geëxplodeerd. Al die programma’s, webvideo’s, explainers en commercials moeten ingesproken worden door professionele stemacteurs. Het ziet ernaar uit dat de groei van audiovisuele media de komende jaren nog wel even doorgaat.
Daar komt bij dat technische ontwikkelingen het produceren van professionele audio een stuk simpeler en goedkoper hebben gemaakt. Waar stemacteurs voorheen naar een geluidstudio moesten reizen en daar een paar uur bezig waren met het inspreken van een tekst, kunnen ze dat nu doen vanuit een eenvoudige homestudio. En waar opnames vroeger verzonden moesten worden op een CD of DAT-cassette, ‘vliegt’ alle audio tegenwoordig in een fractie van een seconde de hele wereld over.
Meer stemacteurs en voice-overs
Al die technische mogelijkheden hebben het vak van stemacteur een stuk toegankelijker gemaakt. Als je stemacteur wilt worden, kun je tegenwoordig met een kleine investering meteen aan de slag. Het produceren van professioneel klinkende audio is vergeleken met vroeger een eitje. En omdat de vraag groot is, is het ook veel makkelijker geworden om als stemacteur of voice-over een voet tussen de deur te krijgen.
Het verdelen van het voice-overwerk is ook veel democratischer geworden. Waar vroeger een handvol grote studio’s en stemmenbureaus werkten met een kleine groep stemacteurs, is er nu een enorm aanbod van (online) voice agencies en websites met vraag- en aanbod van professionele stemmen. Bovendien kunnen stemacteurs zichzelf promoten via hun eigen website en social media, waardoor klanten direct contact hebben met stemacteurs.
Waar de technische ontwikkelingen de afgelopen decennia vooral gezorgd hebben voor meer werk en mogelijkheden voor stemacteurs, is de vraag of nieuwe ontwikkelingen dat óók zullen doen. De volgende stap lijkt namelijk het vervangen van de stemacteur zelf. Kunstmatige intelligentie maakt het mogelijk om kant en klare voice-overs uit een computer te toveren en die techniek wordt steeds beter en slimmer.
Kunstmatige stemmen
Er bestaan al een tijdje AI-voices die ‘gevoed’ zijn door echte stemacteurs. Tot nu toe moesten die stemmen eerst uren aan teksten inspreken, waarmee zoveel mogelijk klanken en combinaties van woorden en letters gemaakt konden worden. We kennen allemaal de stemmen van Siri en Alexa, stemmen van navigatiesystemen en de automatische voice-over van TikTok.
AI-stemmen klinken vaak nog een beetje vlak, houterig en onnatuurlijk. De grote lijnen kloppen vaak wel, maar de AI-stemmen vallen nu nog door de mand doordat ze nog niet de natuurlijke ‘flow’ hebben van een echte stem. Er zitten vreemde stembuigingen in of sommige woorden worden verkeerd uitgesproken. Maar de techniek staat niet stil. Kunstmatige intelligentie zal het steeds eenvoudiger maken om een professionele AI-voice te produceren.
Voice-cloning
Huidige AI-stemmen doen nog vooral aan ‘voice-cloning’. De stem van een bestaande stemacteur wordt gekopieerd om een computerstem te ontwikkelen. Maar het is inmiddels ook mogelijk om geheel nieuwe, oorspronkelijke stemmen uit de computer te toveren. Deze digitale stemacteurs klinken als echte mensen, maar zijn niet gebaseerd op bestaande stemmen. De Nederlandse startup Daisys.ai heeft hierin al flinke stappen gemaakt, zo valt te horen in dit voorbeeld uit 2022.
Kunstmatige intelligentie kan nu soms al tot verbluffende resultaten leiden. Kijk bijvoorbeeld naar ChatGPT, dat op verzoek nieuwe, goed geschreven teksten kan produceren over elk denkbaar onderwerp. Dit is een vorm van ‘generative AI’: kunstmatige intelligentie die in staat is om zelf nieuwe content te produceren. Er wordt gewerkt aan software die bioscoopfilms kan omzetten in andere talen en waarmee je met een paar muisklikken bewegingen en teksten kunt aanpassen. Dit is een behoorlijk indrukwekkend voorbeeld. De software vervangt een scheldwoord en past het geluid en het beeld daarop aan. Hetzelfde gebeurt daarna bij de omzetting naar andere talen. Overigens lijkt het erop dat de vertalingen in dit voorbeeld nog wel zijn ingesproken door andere stemmen.
Tekenfilms nasynchroniseren met AI
Bovenstaande ontwikkelingen zouden een gamechanger kunnen zijn voor nasynchronisatie van tekenfilms. Neem de Disney-film ‘Frozen’ uit 2013. Actrice Kristen Bell is hierin te horen als de stem van Anna. Het karakter van Anna is in de film 18 jaar oud, maar is ook te zien als 15-jarige (tevens ingesproken en gezongen door Bell) en als 9- en 5-jarige (ingesproken door andere stemmen). In de toekomst zou een actrice als Bell ook de 9- en 5-jarige versie van zichzelf in kunnen spreken, en desnoods ook een 65- en 98-jarige evenknie van zichzelf.
Maar de mogelijkheden reiken nog veel verder. Kristen Bell kan in de toekomst haar rollen ook in het Nederlands, Spaans, Japans of Swahili inspreken. Kunstmatige intelligentie kan wat ze zegt realtime omzetten in elke taal, mét behoud van Bell’s stemgeluid. Waarom zou je een Disney-film nog nasynchroniseren als de oorspronkelijke cast elke denkbare taal kan spreken en zingen?
AI als brand voice
De mogelijkheden van door kunstmatige intelligentie gegenereerde stemmen zijn eindeloos. Een multinational als Coca-Cola zou een unieke kunstmatige stem kunnen laten ontwikkelen die exact past bij haar uitstraling en merkwaarden. Een dergelijke ‘brand voice’ kan vervolgens elke uiting van Coca-Cola inspreken, in elke taal en voor elk denkbare productie. En deze stem is nooit moe, verkouden of op vakantie!
Ook zullen kunstmatige stemmen gebruikt gaan worden voor toepassingen waar echte stemacteurs niet geschikt voor zijn. Denk aan virtuele spraakassistenten of callcenters. Door AI-stemmen te koppelen aan andere vormen van kunstmatige intelligentie, kun je in de toekomst een gesprek voeren met de AI-stem van een energiebedrijf. Wat te denken van personages in computerspellen waarmee je over werkelijk alles van gedachten kunt wisselen? Een stem geven aan mensen die door ziekte of een ongeluk niet meer kunnen praten? Of wat dacht je van commercials die je persoonlijk aanspreken: “Hé Albert-Jan, heb je onze aanbieding al gezien?”
Kunstmatige stem: concurrent of collega?
Het is logisch om in AI stemmen een concurrent te zien voor stemacteurs van vlees en bloed. Toch zie ik de toekomst voor stemmen niet somber in. Artificiële intelligentie zal vooral ingezet worden voor toepassingen waar stemacteurs niet geschikt voor zijn of voor grote opdrachten met een klein budget. De meeste commercials zullen ingesproken blijven worden door ‘echte’ stemmen.
Beperkingen van AI-voices
Daarnaast ben ik er nog niet helemaal van overtuigd dat AI-voices de menselijke stem voor de volle 100% geloofwaardig zullen benaderen. Ik heb heel goede voorbeelden gehoord, maar nog geen enkele waarvan ik steil achteroversloeg van verbazing. Natuurlijk, de techniek staat voor niets en we kunnen amper bevatten welke ongelofelijke ontwikkelingen nog in het verschiet liggen. Maar de lat ligt hoog. AI-voices moeten minstens even goed klinken als een echte stem.
De menselijk stem is enorm complex. Het moet technisch mogelijk zijn om alles wat wij met onze stembanden kunnen, te benaderen met AI. Een kunstmatige stem zou zelfs méér dan dat moeten kunnen. Maar de menselijke stem is niet slechts een paar trillende stembanden. Zal AI bijvoorbeeld in staat zijn om geloofwaardige emoties mee te geven aan een stem? Kan AI altijd de juiste klemtonen leggen? Hoe zit het met kleine imperfecties die een stem kleur en karakter geven? Een hapering, slisje of nasaliteit? Hoe gaat kunstmatige intelligentie om met taal- en schrijffouten in een script? En bovendien: waarom zou je een paar honderd euro willen besparen op een stemacteur bij de productie van een commercial die toch al duizenden euro’s kost?
Stemacteur + AI = winwin
Stemacteurs zouden de mogelijkheden van kunstmatige intelligentie in hun voordeel moeten gebruiken. Waarom niet investeren in een voice-cloon van je eigen stem en die tegen vergoeding aanbieden voor het inspreken van e-learnings en non-fictie luisterboeken? Gebruik de techniek om aanpassingen of verbeteringen in een bestaande voice-over aan te brengen. Twee woordjes omdraaien in een voice-overopname? Laat de AI-stem het oplossen! Of wat dacht van je van een serie promo's of commercials waarin steeds één zinnetje anders is? Spreek de basis in en laat AI alle versies produceren.
Kunstmatige intelligentie zal een deel van de taken van stemacteurs overnemen, maar de hoeveelheid stemmenwerk zal de komende jaren hard blijven doorgroeien. Dat betekent dat de markt voor AI-voices zal groeien, maar dus óók de markt van échte stemacteurs van vlees en bloed. Kunstmatige intelligentie zal de stemmenwereld niet overnemen, maar wel veranderen.