Un nuovo dispositivo indossabile sviluppato dagli scienziati della Cornell University è in grado di catturare le espressioni facciali di una persona utilizzando un sonar e di riprodurle come avatar digitale. Evitare le telecamere potrebbe mitigare i problemi di privacy.
EarIO, questo il nome del dispositivo, è iper semplice. È composto da un auricolare con un microfono e un altoparlante per lato, e può essere collegato a qualsiasi normale auricolare. Gli altoparlanti riproducono impulsi sonori al di fuori della gamma dell'udito umano, e la loro eco viene rilevata da microfoni, proprio come funziona un sonar.
I profili dell'eco cambiano a seconda delle espressioni facciali: per questo algoritmi opportunamente addestrati riconoscono le variazioni ricevute dal sonar e le traducono in immagini.

EarlO, sonar che "vede" le cose dai suoni
"Grazie alla potenza dell'intelligenza artificiale, il nostro algoritmo costruisce intricate connessioni tra il movimento muscolare e le espressioni facciali che gli esseri umani non possono percepire", dice Ke Li, uno dei coautori dello studio. "Può essere usato per estrarre informazioni molto complesse: quelle dell'intera parte anteriore del viso". La ricerca è stata pubblicata sulla rivista Proceedings of the Association for Computing Machinery on Interactive, Mobile, Wearable and Ubiquitous Technologies. E ve la linko qui.
Il team ha testato il sonar EarIO su 16 partecipanti, eseguendo l'algoritmo su un normale smartphone. E il dispositivo è stato in grado di ricostruire le espressioni facciali come potrebbe fare una normale telecamera/fotocamera. I rumori di sottofondo come il vento, il parlare o il rumore della strada non hanno interferito minimamente con la sua capacità di registrare i volti.
Tecnologia da 007
I ricercatori sottolineano che il sonar presenta diversi vantaggi rispetto all'utilizzo di una telecamera. I dati acustici consumano molta meno energia e capacità di elaborazione, consentendo di utilizzare dispositivi più piccoli e leggeri. Le telecamere possono anche raccogliere molte informazioni personali aggiuntive che gli utenti potrebbero non voler condividere, quindi il sonar potrebbe essere più sicuro.
Certo, volando con la fantasia immagino una tecnologia del genere "infilata" silenziosamente in un normale auricolare, e penso che possa trasmettere a distanza movimenti labiali e espressioni anche a scopo di sorveglianza. Questa volta però ci vedo utilizzi più pratici.
Quali? Anzitutto quelli del comparto videoludico: un modo pratico per replicare le espressioni facciali fisiche su un avatar digitale per i giochi, la realtà virtuale o il metaverso. Ora il team è al lavoro per escludere altre interferenze, come quando l'utente gira la testa, e semplificare il sistema di addestramento per l'algoritmo di AI.
Staremo a vedere. Cioè, a sentire. Insomma, avete capito.