Google a présenté mardi 14 mai ses dernières innovations en intelligence artificielle (IA) générative, qui vont potentiellement transformer le quotidien de ses utilisateurs, de la recherche en ligne à de nombreuses tâches du quotidien, grâce à des assistants toujours plus omniscients.
"La transformation la plus excitante, c'est évidemment la recherche en ligne générative sur Google", a lancé le patron Sundar Pichai, sur la scène de l'amphithéâtre en plein air de l'entreprise à Mountain View (Californie).
Google testait depuis un an son moteur de recherche dopé à l'IA générative (production de contenus sur simple requête en langage courant). L'internaute entre sa question et reçoit, en haut de la page de résultats, une réponse générée par Gemini, le modèle d'IA de Google. Il peut ensuite cliquer sur des suggestions de questions, ou, plus bas, sur des liens vers des sites web. "Les utilisateurs font plus de recherches et sont plus satisfaits", se félicite Sundar Pichai.
La nouvelle formule - la transformation la plus importante du moteur de recherche depuis sa création - sera déployée aux États-Unis cette semaine, puis dans d'autres pays, pour atteindre plus d'un milliard de personnes d'ici fin 2024.
Google domine la recherche en ligne au point que son nom est synonyme de l'action. Mais l'éruption de ChatGPT et d'autres chatbots capables de répondre aux questions des utilisateurs menace son empire.
Recherche menacée
Google va devoir "traduire ses innovations dans l'IA en produits et services rentables à grande échelle, s'il veut conserver son avantage concurrentiel et satisfaire les investisseurs", a commenté Jacob Bourne, analyste d'Emarketer.
Toute la Silicon Valley rivalise de nouveaux outils permettant de contourner le numéro un mondial de la publicité numérique. Sur Facebook, Instagram et WhatsApp, les utilisateurs peuvent poser des questions à Meta AI, qui a accès à internet.
Le cabinet d'analyse stratégique Gartner prédit que d'ici 2026, le volume de requêtes adressées aux moteurs de recherche traditionnels chutera de 25 %, au fur et à mesure que les nouveaux interlocuteurs virtuels grignotent des parts de marché. La bataille se déplace vers ces assistants IA, qui semblent gagner de nouveaux pouvoirs toutes les semaines, grâce aux progrès des modèles d'IA générative.
Le modèle central de Google, Gemini 1.5 Pro, prendra en compte plus d'informations de contexte apportées par l'utilisateur (centaines de pages de texte, vidéos plus longues...) et digérer des formats différents (le modèle "comprend" aussi bien du texte, que du son et des images, et peut répondre à l'écrit, par la voix ou en générant des images).
Google DeepMind, le laboratoire de recherche du groupe, a présenté d'autres nouveaux modèles, Gemini 1.5 Flash (plus rapide et moins coûteux), Imagen 3 (génération d'images) et Veo (génération de vidéos, un secteur en plein essor). Et surtout Gemini est intégré directement dans Android, le système d'exploitation mobile de Google, pour être utilisé à tout moment. "Il peut anticiper ce que vous essayez de faire", s'est félicité Dave Burke, un responsable d'Android.
"Conversations en profondeur"
Sundar Pichai a présenté sa vision pour l'avenir. Les agents d'IA seront "des systèmes intelligents capables de raisonner, de planifier et de retenir des informations. Ils anticipent les étapes et savent travailler avec des logiciels pour accomplir des choses en votre nom, sous votre supervision". La société qui a réalisé près de 74 milliards de dollars de profits en 2023, investit tous azimuts pour donner corps à cette vision.
Mardi, elle a présenté "Gemini Live", qui permettra d'avoir des "conversations en profondeur avec Gemini", à l'oral, via l'application mobile. Les utilisateurs pourront aussi créer des "Gems", des asistants personnalisés, comme un sous-chef personnel. Et les avancées de Project Astra, un prototype d'agent d'IA, doivent enrichir ces expériences.
Google DeepMind a diffusé une démonstration vidéo d'Astra. On y voit un utilisateur pointer la caméra de son smartphone - ou des lunettes avec caméra intégrée - sur son environnement, et interroger le modèle qui identifie le lieu où il se trouve, résoud un problème informatique à partir d'un schéma et se souvient de là où il a posé un objet.
Lundi, OpenAI a réalisé une présentation similaire, où ChatGPT interagit avec un ingénieur d'une façon si naturelle que la machine semble humaine. Mais la fluidité de la conversation ne fait pas encore des chatbots des agents d'IA omniscients, proactifs et personnalisés.
Avec AFP