Tipik - Pop Culture

Une intelligence artificielle est capable de reproduire une voix après 3 secondes d’écoute

Vall-E est capable de reproduire une voix après trois secondes d’écoute.

© DrPixel / Getty Images

Les avancées se poursuivent dans le domaine de l’intelligence artificielle : après le robot conversationnel ChatGPT, le générateur d’images Dall-E, voici VALL-E, une intelligence artificielle développée par Microsoft, capable d’imiter n’importe quelle voix humaine. La prouesse réside surtout dans le fait qu’un échantillon audio de trois secondes seulement suffit pour reproduire la voix en question, intonation comprise !

Les exemples disponibles sont épatants : le timbre, le ton, les émotions et même l’environnement sonore (par exemple un son de conversation téléphonique), tout se retrouve dans la voix synthétisée par l’intelligence artificielle. Si trois secondes suffisent pour reproduire une voix, plus l’extrait sonore fourni à VALL-E est riche et long, plus la reproduction sera fidèle.

L’intelligence artificielle a été entrainée grâce à 60.000 heures de données vocales en anglais (notamment via le catalogue de livres audio LibriVox). Cet outil Text To Speech (transformation d’un texte écrit en contenu audio) est capable de prononcer des mots qu’il n’a jamais entendus.

Pour le moment, le logiciel n’est pas accessible au grand public. On imagine les dérives auquel ce type d’usage pourrait mener : deepfakes de personnalités, usurpation d’identité (notamment pour les systèmes de sécurité basés sur la reconnaissance vocale). Certains craignent également que le secteur artistique n’en pâtisse : pourrait-on se passer de comédiens dans les doublages ou de présentateurs dans les émissions de radio ou les podcasts ?

Alors à quoi pourrait actuellement servir VALL-E ? Microsoft parle d’édition vocale ou de création de contenu et envisage, si son utilisation se généralise "de construire un modèle de détection pour discriminer si un clip audio a été synthétisé par VALL-E" comme expliqué dans un article scientifique.

Microsoft a bien l’intention de se positionner comme un acteur majeur dans le champ de l’intelligence artificielle. Ces derniers jours des rumeurs évoquent un investissement colossal du géant de l’informatique dans l’entreprise OpenAI à l’origine de ChatGPT et Dall-E.

Inscrivez-vous aux newsletters de la RTBF

Info, sport, émissions, cinéma...Découvrez l'offre complète des newsletters de nos thématiques et restez informés de nos contenus

Sur le même sujet

Articles recommandés pour vous