Innovazione
25 luglio, 2025Non legge testi con una voce artificiale, ma interloquisce con fluidità e naturalezza. Il tono resta coerente, la risposta ha senso, il dialogo non si spezza. Non è esente da falle e rischi, perché sostiene delle conversazioni
Fino a pochi mesi fa non esisteva nemmeno. Oggi, Grok 4 è una delle Ia più discusse del momento. Il motivo? Parla. E lo fa in un modo che, per molti, segna un punto di svolta nel modo in cui interagiamo con le macchine.
Non è la prima intelligenza artificiale capace di rispondere a voce, ma è tra le prime a farlo con una fluidità e naturalezza che confondono. Non legge testi con una voce artificiale: costruisce le frasi vocalmente, mentre pensa, scegliendo ritmo, pause e intonazione in tempo reale. Il risultato è una voce che sembra umana. Non perché imita, ma perché adatta il tono alla situazione. Non comprende davvero l’umore dell’interlocutore, ma può simularlo con una coerenza sorprendente.
Tutto questo è possibile grazie a una modalità vocale progettata per sostenere conversazioni vere, anche lunghe, senza che tu abbia costantemente la sensazione di parlare con un algoritmo. Puoi interromperla, riformulare, cambiare direzione: lei (o “lui”, o “esso”?) ti segue. Il tono resta coerente, la risposta ha senso, il dialogo non si spezza.
La struttura tecnica che regge il sistema è piuttosto solida, anche se xAI non ha rilasciato molti dettagli. Si sa che Grok 4 gira su Colossus, un’infrastruttura sviluppata da loro per gestire modelli su larga scala, e che la parte vocale è stata ottimizzata per rispondere in modo quasi istantaneo. Quando lo usi, la sensazione è quella di avere davvero qualcuno che ti ascolta — anche se, ovviamente, non è così.
Una delle differenze più concrete rispetto ad altri modelli è che Grok 4 non si perde facilmente il filo. Ricorda quello che hai detto, collega i concetti, li rielabora in base a quello che dici dopo. Non ha una vera memoria a lungo termine, almeno per ora, ma riesce a mantenere il contesto per un bel po’ e questo, nel dialogo, fa la differenza.
Anche l’interfaccia è pensata per semplificare: niente finestre complicate o pulsanti ovunque. L’esperienza è tutta vocale, il più possibile naturale. In alcuni test Grok 4 è riuscito persino a distinguere più interlocutori nello stesso momento, mantenendo separati i discorsi. Funziona? In parte sì, ma per ora solo in ambienti molto controllati.
Sul fronte dell’addestramento, xAI dice di aver scelto i dati con attenzione, per evitare contenuti tossici, pregiudizi o risposte culturalmente sbilanciate. L’obiettivo è avere un modello neutro e flessibile, ma — com’è prevedibile — non tutto fila liscio. Alcuni test indipendenti hanno già trovato falle: Grok 4 può essere spinto, con tecniche mirate (i cosiddetti jailbreak), a dire cose che non dovrebbe e in certi casi ha dato risposte fuori luogo. Insomma, il tema del controllo è tutt’altro che chiuso, anche se xAI ha promesso aggiornamenti e correzioni rapide.
Intanto, alcune aziende lo stanno già provando: customer service, assistenti vocali integrati, ambienti immersivi. In alcune demo è stato usato come guida vocale in mondi virtuali, in altre come tutor per chi studia lingue. Le possibilità sono tante, ma lo strumento è ancora giovane. Ci vorranno mesi — o forse una versione nuova — per capire se Grok 4 è pronto davvero per l’uso quotidiano.
Al di là della tecnica, Grok 4 è interessante per un motivo semplice: mette al centro la voce. Non l’interfaccia, non il testo. Un elemento che diamo spesso per scontato, ma che ha un impatto enorme sul nostro modo di comunicare. Questa Ia non si limita a scrivere bene: prova a parlarti e quando succede, ti ritrovi a pensare a cose che vanno oltre la tecnologia.
Quanto vale una conversazione se dall’altra parte non c’è nessuno? Cosa succede quando una macchina riesce a sembrare più attenta di certe persone? E cosa perdiamo se iniziamo a preferire la simulazione alla realtà?
Grok 4 non è perfetto. Non è nemmeno del tutto affidabile, ma segna un passo in avanti chiaro: non è un chatbot che ti risponde. È un modello che cerca di stare nella conversazione, di adattarsi, di mantenere il flusso e questo, che piaccia o meno, è l’inizio di qualcosa di nuovo.
L'E COMMUNITY
Entra nella nostra community Whatsapp
L'edicola
Insidie d'agosto - Cosa c'è nel nuovo numero de L'Espresso
Il settimanale, da venerdì otto agosto, è disponibile in edicola e in app