Innovazione
marzo, 2025

Senti chi parla: l'algoritmo ora alza la voce

I software che riproducono il tono umano si fanno sempre più precisi e indistinguibili dalla controparte in carne e ossa. E si preparano a stravolgere settori come doppiaggio e servizio clienti

Sapresti distinguere una voce umana da una generata da un’Ia? Se ti facessero ascoltare una conversazione telefonica o un estratto audio di qualcuno che racconta una storia, saresti sicuro di riuscire a capire se dall’altra parte c’è un essere umano o un’intelligenza artificiale? Se fino a qualche tempo fa la risposta era sì, oggi la faccenda è più complicata.

 

Da qualche giorno, una demo della startup Sesame (lanciata da uno dei fondatori di Oculus) ha lasciato senza parole gli addetti ai lavori. Per la prima volta, è stata mostrata una voce generata dall’Ia capace di conversare con un livello di naturalezza mai sentito prima: pause, inflessioni, cambi di tono, esitazioni. Tutte quelle sfumature che rendono una voce autenticamente umana. Il risultato e apre a una serie di considerazioni sul futuro della comunicazione, del lavoro e delle interazioni tra uomo e macchina.

 

Non è un segreto che la tecnologia per la sintesi vocale stia facendo passi da gigante. Negli ultimi anni, le voci generate dall’Ia hanno migliorato la loro qualità a una velocità incredibile. Società come ElevenLabs, specializzate nella generazione vocale basata sull’Ia, hanno raggiunto valutazioni miliardarie e continuano a crescere grazie all’enorme interesse per le loro tecnologie. Non a caso, le voci di ElevenLabs vengono già utilizzate in settori come la creazione di contenuti, il gaming e l’educazione, dove l’automazione permette di abbattere tempi e costi. E non è l’unica: anche grandi aziende come Google, Microsoft e OpenAi stanno investendo in questo settore. La direzione è chiara: nel giro di poco tempo, le voci sintetiche saranno indistinguibili da quelle umane.

 

Tutto questo porta inevitabilmente una serie di conseguenze. La prima riguarda le categorie professionali che basano il loro lavoro sulla voce: doppiatori, speaker, operatori del customer service, venditori telefonici e molti altri. Se un’azienda può ottenere una voce realistica a costi molto più bassi e senza limiti di disponibilità, perché dovrebbe continuare a pagare una persona? Già oggi, le intelligenze artificiali vengono impiegate per sostituire voci umane in video aziendali, audiolibri, assistenti vocali e persino nel doppiaggio di serie Tv e film. Questo scenario potrebbe estendersi rapidamente a molti altri ambiti, mettendo a rischio migliaia di posti di lavoro.

 

Un caso emblematico è quello di Sonantic, startup acquisita da OpenAi, che ha creato una voce sintetica per dare vita a Val Kilmer in “Top Gun: Maverick”, dopo che l'attore ha perso la capacità di parlare a causa di un cancro alla gola. Un’operazione che dimostra come la tecnologia possa essere usata in modo straordinario, ma allo stesso tempo solleva il timore che Hollywood e l’industria dell’intrattenimento possano ridurre sempre più il ricorso a voci reali. È recente lo spot dell’Associazione Nazionale Attori Doppiatori per sensibilizzare sul tema. Nel video, un gruppo di doppiatori italiani storici ha lanciato un messaggio chiaro: «Noi non possiamo essere sostituiti». Ma la realtà è che il mercato sta andando in un’altra direzione, e anche il mondo del doppiaggio dovrà reinventarsi e trovare un equilibrio tra tradizione e innovazione.

 

Non è la prima volta che una tecnologia mette in discussione intere professioni. Ogni rivoluzione tecnologica porta con sé la paura del cambiamento e la necessità di adattarsi. La questione non è più se le voci Ia sostituiranno quelle umane, ma come le persone potranno reinventarsi e trovare nuovi modi per collaborare con la tecnologia invece di subirla. E poi c’è un aspetto che riguarda tutti, non solo chi lavora con la voce. L’Ia sta trasformando non solo il mondo dell’audio, ma ogni settore professionale. Oggi parliamo della voce, ma ieri era il disegno digitale, l’editing video, la scrittura automatizzata. Domani potrebbe essere la programmazione, la consulenza legale, la progettazione architettonica. Nessuna professione è immune all’ondata di automazione che sta arrivando, e ignorarla non è un’opzione. La vera domanda è: come possiamo sfruttare questa tecnologia a nostro vantaggio? Come possiamo usarla per lavorare meglio, in modo più creativo ed efficiente, invece di lasciarci sopraffare dal cambiamento?

 

È una sfida che riguarda tutti. E chi saprà adattarsi e innovare avrà la possibilità di essere non solo un testimone di questo cambiamento, ma protagonista attivo di una nuova era.

L'edicola

Le radici culturali dell'Europa, antidoto al caos

Contro la crisi identitaria del Continente non c’è che uno sbocco: la riaffermazione dei valori comuni

La copertina del decimo numero: "Vieni avanti, straniero".