La truffa del “falso nipote” si è evoluta grazie alle nuove tecnologie in grado di riprodurre le voci dei propri cari
WASHINGTON D.C. - Negli Stati Uniti è allarme per le cosiddette “impersonation scam”, ovvero le truffe telefoniche per imitazione che adoperano la voce, perfettamente clonata, di familiari o amici delle vittime.
A finire sotto accusa è ancora una volta l’intelligenza artificiale che segna la nuova, pericolosissima frontiera del deepfake. L’IA, difatti, è in grado di replicare una voce umana e di produrre un campione audio di poche frasi. Abbastanza per interagire con un familiare facilmente suggestionabile. In aggiunta, il servizio offerto online da diversi siti è molto economico.
L’anno scorso negli Stati Uniti le truffe telefoniche segnalate sono state oltre cinquemila. Il copione è quasi sempre lo stesso: un familiare o un amico chiamano per chiedere aiuto economico perché alle prese con una emergenza.
La voce è identica, ma a parlare è un computer che riproduce in maniera pressoché perfetta cadenze, accenti e suoni. L’impostore, concitato e spaventato, chiede denaro da consegnare rapidamente. Le vittime sono quasi sempre persone anziane. Inutile pensare di recuperare i soldi truffati, perché al momento questi incidenti non sono coperti dalle compagnie assicurative.
I nuovi software in circolazione - come quello della start-up di sintesi vocale ElevenLabs - permettono a tante compagnie di mettere a disposizione degli utenti dei creatori di voci artificiali di facile accesso.
Partendo da un campione della voce originale, l’intelligenza artificiale analizza tutte le caratteristiche della voce e le riproduce in maniera straordinariamente fedele conservando non solo l’intonazione, ma anche l’accento e i singoli suoni.
È bene ricordare quanto risulti semplice per i malintenzionati avere accesso alla voce originale. Per clonarla, bastano soltanto trenta secondi di audio. Dove pescarli? Ovviamente nel mare magnum dei social, magari estrapolandoli da un video caricato su Instagram, su Facebook o TikTok, oppure da un podcast.
Un passo ulteriore – e spaventoso – dell'intelligenza artificiale generativa, oggi in grado di produrre testi, immagini o suoni in base ai dati che gli vengono forniti.