Le laboratoire de recherche de Microsoft travaille sur une nouvelle technologie d'IA capable de dessiner une image à partir d'une simple légende écrite.
Il y a les élèves qui ont une aversion profonde pour le sport ou ceux qui détestent les maths. Moi lorsque j’étais au collège, le cours qui me faisait le plus peur, c’était celui d’art plastique. Parce que j’étais (et je suis toujours) vraiment très mauvaise lorsqu’il s’agit de prendre un crayon ou un pinceau pour dessiner quelque chose. Eh bien il se trouve que les nouvelles générations de nuls en dessin vont pouvoir souffler : les chercheurs de Microsoft ont mis au point un "bot dessinateur" capable de croquer tout ce qu’on lui demande.
Un bot qui fait preuve d'imagination artificielle
Dans un post de son blog dédié à l’intelligence artificielle, John Roach détaille : "Cette nouvelle technologie d’intelligence artificielle en développement dans le laboratoire de recherche de Microsoft est programmée pour (…) générer des images à partir de descriptions écrites ressemblant à des légendes." À partir de quelques mots clés choisis par l’humain, le bot créé "pixel par pixel" une image. "Chaque image contient donc des détails qui sont absents de la légende, prouvant que cette intelligence artificielle fait preuve d’imagination artificielle", poursuit le post. Les algorithmes de machine learning du bot sollicitent donc l’IA pour imaginer les parties manquantes.
"Si vous allez sur Bing et que vous cherchez un oiseau, vous allez avoir une photo d’oiseau. Mais ici, les images sont créées par l’ordinateur, pixel par pixel, à partir de rien", explique Xiaodong He, directeur de la recherche du Deep Learning Technology Center de Microsoft à Redmond, dans l’État de Washington. "Ces oiseaux n’existent peut-être pas dans le monde réel – ils sont juste issus de l’imagination de notre ordinateur lorsqu’on lui parle d’oiseau."
Bien-sûr l’ordinateur a appris à quoi doivent ressembler les choses à partir d’une base de données de photos existantes. Puisque beaucoup d’images de la base représentaient des oiseaux assis sur une branche, le "bot dessinateur" a pris l’habitude de représenter les volatiles sur une branche même si le texte ne le spécifie pas. Et lorsqu’on le bouscule un peu avec des légendes d’images absurdes comme "un bus rouge à deux étages flotte sur un lac", il perd complètement les pieds.
Même si Microsoft concède que sa technologie est encore imparfaite, Xiaodong He croit beaucoup en son "bot dessinateur". Il l’imagine déjà collaborer par exemple à la production de films d’animation pour générer des images directement à partir d’un scénario écrit.
Quelque chose à ajouter ? Dites-le en commentaire.