L’intelligence artificielle s’invite de plus en plus dans les arts visuels. De nouveaux logiciels sont capables de générer des images à partir d’une simple phrase. Le résultat est bluffant, mais leur utilisation pose de nombreuses questions quant à l’avenir de la création.
En 1901, l’architecte américain Frank Lloyd Wright prononçait un discours à Chicago sur le rôle de la machine dans le processus créatif. Il expliquait qu’elle permettait, avant tout, "l’émancipation de l’expression humaine". Un siècle plus tard, cette machine est communément appelée l’intelligence artificielle (IA). Elle est capable de créer en quelques secondes n’importe quelle image à partir d’une description textuelle. Vous aimeriez voir le naturaliste anglais sir David Attenborough se battre à mains nues avec un ours polaire ? Ou l’acteur américano-canadien Dwayne Johnson rencontrer son alter-ego, The Rock ? C’est désormais possible grâce à des logiciels comme Midjourney, DALL-E 2, Imagen, DreamBooth ou encore Stable Diffusion.
Ces outils utilisent des modèles de compréhension du langage et d’apprentissage sur de très grandes quantités de données pour concevoir des images à partir d’une ligne de texte. Google explique avoir entraîné Imagen notamment sur LAION-400-M, une base de données de 400 millions d’images associées à des légendes écrites, trouvées sur Internet. Voilà d’où l’intelligence artificielle tire son "inspiration". Elle génère ensuite plusieurs illustrations correspondant à une demande — par exemple, une théière tout en muscles — en "débruitant" (éclaircissant) un amas de pixels de couleurs aléatoires. C’est cette technique dite "de diffusion" qui fait le succès actuel des logiciels de génération d’images.
Depuis le mois de juin, DALL-E 2, Midjourney et consorts ont vu leur popularité grimper en flèche sur les réseaux sociaux, en grande partie grâce aux visuels tantôt réalistes tantôt grotesques qu’ils produisent. Certains illustrent des concepts assez vagues comme la blockchain ou la joie, tandis que d’autres répondent à des demandes très précises (comme "des cailles qui écoutent des parents d’élèves en colère lors d’une réunion du conseil d’administration d’un établissement scolaire"). Les logiciels d’intelligence artificielle générative sont capables de répondre à n’importe quelle requête envoyée par un utilisateur, à condition qu’elle n’aille pas à l’encontre de leur politique de modération. OpenAI, l’entreprise derrière le programme DALL-E, interdit la génération d’images violentes, pornographiques ou politiques, et empêche de créer des illustrations "photoréalistes", notamment de personnalités publiques. DALL-E refusera ainsi d’imaginer un combat à mort entre Donald Trump et Vladimir Poutine.