L’intelligence artificielle va-t-elle nous déposséder de notre voix ?
La synthèse vocale fait des bonds de géant. Esquissons les contours d’un monde virtuel bavard.
Les amateurs de philosophie et de cinéma reconnaitront peut-être ici les accents caractéristiques du réalisateur allemand Werner Herzog et du philosophe slovène Slavoj Zizek. Nul besoin de traduire leur propos, ce qui est important, c’est de comprendre que cet échange est le fruit d’un deepfake, une technique qui utilise la synthèse vocale et l’intelligence artificielle pour réaliser des trucages audios ou vidéos. Ce ne sont donc pas les vrais Werner Herzog et Slavoj Zizek que vous entendez mais leurs clones vocaux virtuels, assez réalistes, conçus et codés par l’artiste et programmeur Giacomo Miceli à partir de logiciels gratuits et des discours des deux intellectuels qu’il a pu retrouver en ligne. La singularité de cette œuvre est d’être alimentée chaque jour par de nouveaux échanges générés aléatoirement par l’intelligence artificielle, si bien qu’elle peut potentiellement durer éternellement, d’où son nom : The Infinite Conversation, la conversation infinie.
« Si ce bavardage généré par l’intelligence artificielle semble plausible, imaginez les discours aux sonorités réalistes qui pourraient être utilisés pour ternir la réputation d’hommes politiques ou distraire les gens avec des informations erronées qui ressemblent à des nouvelles rapportées par des humains. »
Cette citation de Giacomo Miceli exprime l’inquiétude de l’artiste vis-à-vis des potentielles utilisations abusives de fausses pistes audio. Et ce n’est pas qu’une vue de l’esprit. Il y a dix jours, dans un spot publicitaire à charge contre Donald Trump, un comité d’action politique soutenant son rival conservateur Ron DeSantis a imité la voix de l’ancien président des Etats-Unis dans le but de lui nuire. Toujours Outre-Atlantique, le FBI s’inquiète de la multiplication des escroqueries utilisant l’intelligence artificielle pour cloner la voix d’un enfant et simuler son enlèvement en téléphonant à sa famille. Voilà le genre de perspective qui laisse sans voix…
Un futur rempli de fausses voix clonées ?
Il est actuellement difficile d’imaginer un futur rempli de fausses voix clonées, tant la voix marque une incarnation, une présence, qui la rend indissociable d’une personnalité. On a coutume de dire que si les paroles peuvent tromper, la voix, elle, ne ment jamais. Mais à l’ère des deepfakes, plus on laisse des traces de sa voix sur les réseaux sociaux ou dans les vocaux que l’on s’envoie pour communiquer, plus on risque d’en être dépossédé. Le paradoxe c’est que le jour où une intelligence artificielle pourra imiter à la perfection toutes les intonations, les inflexions d’une voix, l’idée selon laquelle nous sommes des individus uniques avec des personnalités uniques disparaîtra.