RTBFPasser au contenu
Rechercher

Culture web

Imagen, la nouvelle IA de Google qui transforme un texte en image

Ici une image réalisée avec le texte : "Un geai bleu debout sur un grand panier de macarons arc-en-ciel."

Google dévoile un nouveau modèle d’intelligence artificielle, "Imagen", capable de créer une image à partir d’une simple description textuelle. Ce nouveau terrain de jeu pourrait permettre à des artistes ou des entreprises de laisser libre cours à leur créativité. Mais "Imagen" n’est pas destiné, pour le moment du moins, au grand public. La faute à un problème majeur encore compliqué à résoudre : les biais algorithmiques.

Il y a un peu plus d’un an, OpenAI, dévoilait Dall-E, un modèle d’intelligence artificielle capable de créer de toute pièce une image à partir d’un texte. Aujourd’hui le Google Research Lab, dévoile "Imagen", un nouveau modèle encore plus performant et plus puissant, d’après l’entreprise américaine. Google décrit cette innovation comme "un modèle de diffusion texte-image avec un degré de photoréalisme sans précédent et un niveau profond de compréhension du langage".

Derrière cette explication se trouve une réalité beaucoup plus simple : il suffit d’un texte pour créer une infinité d’images d’une qualité extrêmement élevée et réaliste. "Imagen" est capable, de combiner des concepts et des attributs pour créer une image selon son désir. On retrouve dans les différentes démonstrations disponibles sur le site un cobra en maïs ou une petite maison faite en sushi. On pourrait facilement lui trouver une utilité certaine pour une majorité d’entreprises du digital avec des campagnes de communication rapide, efficace, voire même personnalisée. Pour les artistes la possibilité de création pourrait venir agrémenter leur univers d’une multitude de manières.

Loading...

Les possibilités offertes par ces modèles sont quasiment infinies. Et pourtant, un outil grand public n’est pas à l’ordre du jour à cause d’un épineux problème : les biais algorithmiques. Dans sa définition la plus sommaire, le biais algorithmique est le fait que le résultat d’un algorithme d’apprentissage ne soit pas équitable, c’est-à-dire qu’il reprend des données produites par les humains en très grand nombre et n’est pas donc pas neutre. Pour construire et faire fonctionner ces modèles qui traitent une énorme quantité de données, les ingénieurs utilisent des algorithmes d’apprentissage profond pour les entraîner au maximum.

Des "défis éthiques se posent"

L’objectif est de pouvoir répondre avec la plus haute précision possible à une requête d’un utilisateur. Pour réussir pareil exploit, il faut traiter des données massivement et sous toutes leurs formes. Les bibliothèques de données issues d’internet sont fortement présentes dans l’initiation de l’intelligence artificielle. Cette dernière se nourrit de tout ce que l’on peut trouver sur le web, stéréotypes, préjugés ou discriminations inclus.

Dans la présentation de son nouveau produit, Google alerte encore une fois sur cette réalité qui empêche la société de déployer son modèle :

Plusieurs défis éthiques se posent à la recherche texte-image au sens large, explique Google. Les applications en aval des modèles texte-image sont variées et peuvent avoir un impact complexe sur la société. Les risques d’utilisation abusive soulèvent des inquiétudes quant à l’ouverture responsable du code et des démos.

Pour l’instant, et comme pour Dall-E, l’entreprise américaine a pris la décision de ne pas publier le code ou d’effectuer une démo publique. "L’évaluation préliminaire suggère également qu’Imagen encode plusieurs préjugés et stéréotypes sociaux, notamment un biais général en faveur de la génération d’images de personnes au teint plus clair et une tendance à aligner les images représentant différentes professions sur les stéréotypes de genre occidentaux". L’entreprise espère faire davantage de progrès sur ces prochains défis pour définitivement ouvrir son modèle et éviter les potentiels dangers et dérives.

Sur le même sujet

Google va fusionner ses applications Meet et Duo

High tech

Google Drive accueille une grande nouveauté… le copier/coller

High tech

Articles recommandés pour vous