mercoledì , luglio 24 2019
Home / Tecnologia / Deepfake (falsi realistici): cosa sono, come funzionano e come si fanno
Deepfake (falsi realistici): cosa sono, come funzionano e come si fanno

Deepfake (falsi realistici): cosa sono, come funzionano e come si fanno

I media da tempo parlano di questa tecnologia, spesso spiegandola in termini molto semplicistici; un certo allarmismo si è diffuso attorno a questo tipo di algoritmi di AI (Artificial Intelligence), soprattutto per un eventuale uso improprio che se ne potrebbe fare. Molto utilizzati (e con risultati molto realistici) nel cinema e nelle animazioni CGI, se avete sentito parlare dei deepfake è ora di fare un po’ di chiarezza in merito e capire bene di cosa si tratti.

E così, oggi, vi spieghiamo come funzionano le contraffazioni realistiche di immagini e video.

Cosa sono i deepfake

Deepfake è un algoritmo di intelligenza artificiale per la sintesi di immagini umane, che viene utilizzato per combinare e sovrapporre immagini e video (ad esempio di una persona famosa) su immagini o video di origine (un’altra persona) al fine di generare un video molto realistico completamente fake (cioè finto). I deepfake – che si possono tradurre in italiano con “falsi realistici” – sono immagini, video o articoli creati interamente da un’intelligenza artificiale, in grado di analizzare campioni di dati (ad esempio foto e video di una persona) e creare video artificiali ex novo a partire da quegli esempi: ad esempio, far dire alla persona cose che non ha mai detto, nè fatto. La tecnologia è davvero inquietante e non è facile già ora arginarne l’uso improprio, peraltro già analizzato dall’horror di Netflix CAM. Per fortuna, comunque, realizzare questo genere di lavori richiede una potenza computazionale non alla portata di chiunque, e si fonda su basi teoriche non banali che è necessario conoscere.

Storia dei deepfake

La tecnologia deep learning (da cui deriva il termine contratto deepfake) si lega alla tecnologia classica delle reti neurali, ovvero le varie tecniche automatiche per “addestrare” un algoritmo a riconoscere situazioni nuove, il tutto sulla base di un campione di casi noti. A differenza delle tecniche di programmazione classica che partono da un input e producono un output, banalmente un calcolo o l’applicazione di un filtro ad un’immagine, le tecniche per creare deepfake sono in grado di “apprendere” da un campione di dati simili e riprodurli sempre meglio – banalmente, imitare la scrittura di una persona sull’analisi di un grosso campione di testo scritto da quella persona. Anche Google, del resto, affina e migliora i propri risultati di ricerca sulla base dell’analisi di campioni di dati, ad esempio – sfruttando estensivamente tecniche di cosiddetto machine learning (apprendimento macchina).

Le primissime conoscenze in merito risalgono più o meno ai primi anni 2000, periodo in cui vengono sperimentate le prime tecniche automatiche di riconoscimento facciale. Alla base di tutto c’è infatti quest’ultima, per cui la tecnologia deepfake, pertanto, non è una vera e propria novità, anche se la parte davvero clamorosa è stata introdotta nel 2017, come vedremo tra un attimo.

Il riconoscimento facciale è alla base delle tecniche di sostituzione perfetta di una faccia con un’altra, come è possibile vedere in questa immagine (tratte dal blog del programmatore Alan Zucconi) in cui viene mostrata l’applicazione dell’algoritmo di face recognition su una foto di Ted Cruz e la conseguente creazione di una maschera (mask) che va a sostituirsi perfettamente a quella del presidente USA Donald Trump. Mediante un semplice algoritmo matematico che rileva la copertura convessa (convex hull) sui contorni del viso, può essere applicata una sostituzione su qualsiasi altro viso, con risultati davvero notevoli ed un tempo molto piccolo.

Vari software open source, già in questa fase, erano in grado di realizzare l’operazione anche senza saperne quasi nulla delle basi teoriche; ma se queste prime strategie erano in grado di produrre risultati del genere, non potevano spingersi oltre – cosa che l’introduzione delle reti neurali ha permesso di realizzare qualche anno dopo. La face detection, in altri termini, funzionava all’epoca soltanto su immagini pre-esistenti, cioè non è in grado di effettuare il morphing (o trasformazione) della faccia di Trump in modo che possa coincidere con quella di Cruz. Quello che sono in grado di fare i deepfake è superare questa limitazione, ed applicarla non solo ad immagini ma anche a brevi video – che quindi vengono creati sulla base dell’analisi e dell’elaborazione di un campione di video della stessa persona.

Alla fine del 2017, come dicevamo, avviene una scoperta clamorosa da parte di un utente di Reddit (il social network di contenuti molto utilizzato soprattutto negli USA): l’utente deepfake è riuscito a realizzare dei video fake partendo da video della stessa persona scaricati da internet, e realizzando dei “falsi realistici” davvero impressionanti. La tecnica si basa sulle neural networks (reti neurali), una tecnologia di analisi dei dati stratificata, in grado di effettuare il morph delle espressioni facciali di una persona partendo dalla mimica di quelli di un’altra – ad esempio, potrei fargli riprodurre le mie smorfie (riprese dalla webcam, ad esempio) applicandole alle fattezze di Donald Trump, oppure – per estensione – fargli addirittura dire qualsiasi altra cosa.

Nel cinema, per inciso, questa tecnica è stata in grado di riprodurre risultati impressionanti: ad esempio questo video, tratto dal film Rogue One del 2016, include una versione digitalizzata della Principessa Leia molto difficile da distinguere dalla versione originale. La tecnica utilizzata, in questa sede, è nota come deep learning. e richiede una potenza di calcolo che solitamente si ottiene sfruttando schede video di alto livello che siano in grado di parallelizzare le operazioni (un po’ come avviene per il mining di bitcoin, ad esempio).

Perchè sono diventati famosi

I deepfake sono diventati noti su internet grazie ad alcuni utenti Reddit che, anni fa, postavano delle originali realizzazioni di video, spesso di natura diffamatoria: realizzavano video fake in cui, in sostanza, era possibile vedere un politico muovere la bocca e parlare dicendo qualsiasi cosa il suo realizzatore volesse. Una cosa da vera e propria fantascienza distopica, in pratica degli alter ego digitali che hanno creato problemi a molti VIP e politici – tanto per capirci, spesso i deepfake vengono sfruttati impropriamente per creare video porno finti con protagonisti attori ed attrici famosi che mai ne farebbero. C’era un utente di Reddit che faceva esattamente questo (i suoi contenuti sono stati quasi tutti rimossi, ad oggi, ma potrebbe essercene ancora traccia nel dark web, per quel che ne sappiamo e per come funzionano di solito queste cose): prendeva la faccia di persone famose, e andava a metterla in modo realistico sui corpi di varie attrici ed attori hard. La cosa impressionante dei deep fakes è riuscire a far assumere espressioni facciali che gli originali non avevano, sulla base di un complesso calcolo algoritmico.

I deepfake sono quindi una tecnologia in grado di manipolare la realtà, creando video finti realistici, immagini fake realistiche e addirittura notizie o articoli in modo algoritmico, credibile e del tutto automatizzato. Questo, in prima istanza, dovrebbe farci riflettere su un maggiore scetticismo che ognuno di noi dovrebbe avere quando si imbatte in news, video e immagini che sembrano vere e che potrebbero essere state create da un software (ad esempio quando vi capita di leggere appelli allarmistici sulla rete 5g).

Molte delle critiche sui deepfake sono talmente aspre, del resto, che  ci si chiede a cosa questa tecnologia potrebbe davvero essere utile. Cinema e installazioni artistiche a parte, ovviamente.

Programmi open source per fare deepfake

La cosa davvero inquietante è che si tratta di una tecnologia alla portata di chiunque, non nel senso di utilizzo bensì di facilità di reperire software del genere: il codice di queste applicazioni è quasi tutto open source, e spesso non viene citato apertamente (cosa che non faremo neanche qui, per ovvie ragioni) per paura che possa scatenarsi un meccanismo di emulazione di massa. Esistono anche interfacce piuttosto semplici da utilizzare per realizzarli, per quanto in molti casi il tipo di software sia impegnativo da utilizzare e non esattamente alla portata di chi non abbia un minimo di competenze tecniche specifiche: addestramento di modelli supervised, programmazione Python e così via.

Un recente esperimento finanziato da Elon Musk, tanto per fare un altro esempio, si basa probabilmente su una tecnologia su questa falsariga: è in grado di creare in automatico articoli credibili per il web (il codice ed i dettagli non sono stati divulgato, anche qui, per una forma di cautela). Le app per creare deepfake (sia per mobile che per desktop) sono periodicamente rimosse dal web e si preferisce non lasciarle online per evitare abusi. Esistono inoltre vari siti web che permettono di creare deepfake a partire da qualsiasi video direttamente online, senza dover installare nulla.

Non possiamo aspettarci che il segreto rimanga tale molto a lungo: la strategia security thought obscurity non è molto efficace, come i ripetuti casi di violazione di sicurezza informatica ci dimostrano ogni giorno. Tutto sta nella responsabilità dei singoli e sulla conoscenza a livello globale dell’esistenza di queste tecniche, in modo che ognuno possa valutare criticamente qualsiasi contenuto e sappia, almeno, che molti video realistici potrebbero essere semplici fake realizzati ad arte.

Esempi di immagini e video deepfake

Per capirci, un esempio di deepfake in forma di immagine è il seguente: a sinistra il modello di riferimento, a destra la riproduzione creata dall’algoritmo. Difficile o impossibile dire quale sia l’originale e quale, invece, la copia.

Altri esempi di deepfake sono ancora più inquietanti: l’intelligenza artificiale basata su reti neurali è riuscita, con una mole relativamente piccola di lavoro, a creare dei cloni digitali di qualsiasi genere, anche molto realistici (tanto da non risultare distinguibili dagli originali).

Un primo caso di deepfake diventato famoso riguarda l’ex Presidente degli Stati Uniti Obama.

Uno dei deepfake più famosi è un video fake di Putin, ad esempio.

Conclusioni (e niente allarmismo)

I deepfake fanno paura, ovviamente, ma non c’è da temere troppo: la loro popolarità sarà senza dubbio crescente, tanto che ci sono anche vere e proprie sotto-categorie di siti hard, ad oggi, che sono incentrati esclusivamente sui deepfake. E questo la dice lunga: l’utente Reddit di cui si parlava all’inizio, deepfake, aveva anche creato un’app per facilitare il compito della creazione di deepfake, che ad oggi è scomparsa pubblicamente. Ma per come funzionano internet ed il dark web, un giorno potrebbe tornare: e non sappiamo dire, ad oggi, che conseguenze potrebbe avere la cosa sulla vita di molte persone che già, di loro, badano poco o nulla alla propria privacy.

Per poter funzionare l’algoritmo deepfake necessita di centinaia, se non migliaia, di video della stessa persona: meglio pensarci bene, quindi, prima di postare centinaia di video in pubblico che ci ritraggono, e lasciarli a disposizione di chiunque. In ogni caso, come ricordato giustamente da un articolo su Focus, gli esseri umani sbattono gli occhi ogni 2 massimo 10 secondi, e ogni battito di ciglia richiede tra un decimo e quattro decimi di secondo. Difficilmente, a questo punto, si trovano sul web foto di persone con gli occhi chiusi: “un po’ perché” – scrive l’articolo – “trascorriamo la maggior parte del tempo con gli occhi aperti, e un po’ perché raramente un fotografo pubblica ritratti ad occhi chiusi in un servizio“. Per riconoscere un deep fake, a questo punto, basta fare caso ai battiti di ciglia, che nel caso di video artificiali sono del tutto assenti per via di un limite attualmente insito nell’algoritmo.

(Immagine di copertina tratta da wsj.com)

Ti piace questo articolo?

Su Trovalost.it puntiamo sulla qualità dei contenuti da quando siamo nati:
la tua sincera valutazione può aiutarci a migliorare ogni giorno.

Deepfake (falsi realistici): cosa sono, come funzionano e come si fanno

di Salvatore Capolupo

I media da tempo parlano di questa tecnologia, spesso spiegandola in termini …

#####IMG000000002#####

Leggi Anche

Google Traduttore si rinnova: ecco nuove lingue, rilevamento automatico della traduzione e nuova interfaccia

Google Traduttore si rinnova: ecco nuove lingue, rilevamento automatico della traduzione e nuova interfaccia

Google Translate permette agli utenti ogni giorno di esplorare paesi sconosciuti, comunicando in lingue diverse …