AlphaGo Zero, dernier né de Google DeepMind, a largement surpassé les précédentes versions du programme de jeu de go. L'intelligence artificielle apprend toute seule à une vitesse sidérante.
Vous souvenez-vous d’Alpha Go ? L’intelligence artificielle développée par DeepMind, start-up britannique rachetée par Google en 2014, est devenue le premier programme à battre un professionnel au jeu de go, en octobre 2015.
Depuis cette victoire contre le champion d’Europe Fan Hui, l’équipe de DeepMind continue de développer son programme qui a battu d’autres champions du domaine. Dans un article publié dans la revue scientifique Nature, mercredi 18 octobre, les créateurs de l’IA expliquent avoir mis au point une version plus puissante du programme.
Appelée AlphaGo Zero, sa particularité tient en une seule caractéristique exceptionnelle : elle n’a plus besoin des humains pour apprendre. La première version avait été programmée avec une base de données de pas moins de 100 000 parties de jeu de go. Pour battre ses adversaires, AlphaGo avait donc réalisé son apprentissage en observant des parties ayant eu lieu entre des humains.
Mais AlphaGo Zero n’a plus besoin de ça. L’équipe de DeepMind lui a seulement inculqué les règles les plus basiques du jeu de go, comme la position des pierres noires et blanches sur le plateau. Tout le reste, l’intelligence artificielle l’a appris en jouant, sans cesse, des millions de parties contre elle-même. Et à chaque partie, AlphaGo Zero a mis à jour son programme, seule.
Une révolution de l’intelligence artificielle ?
Après seulement trois jours d’entraînement, AlphaGo Zero a été capable de battre la version du programme ayant battu le 18 fois champion du monde Lee Se-dol. Et les victoires furent sans appel : AlphaGo Zero a gagné 100 fois d’affilée, contre 0 victoire pour AlphaGo. Après quarante jours d’entraînement, Zero a obtenu un taux de victoire de 90 % contre la version la plus avancée de son prédécesseur, qui avait notamment battu en mai 2017 le numéro 1 mondial Ke Jie. Une prouesse.
"Sans utiliser les données humaines – sans utiliser l’expertise humaine de quelque manière que ce soir –, nous avons en vérité supprimé toutes les contraintes de la connaissance humaine" du programme, a expliqué David Silver, programmeur en chef, à une conférence de presse, rapporteThe Verge.
DeepMind a déjà commencé à utiliser AlphaGo Zero pour travailler sur le repliement de protéines, responsable de nombreuses maladies
Le fonctionnement et les victoires d’AlphaGo Zero représentent une avancée majeure dans le développement de l’intelligence artificielle. Par ailleurs, le programme nécessite bien moins de ressources et de données pour fonctionner que ses prédécesseurs. Pour DeepMind, la question est désormais de savoir si le programme utilisé pour AlphaGo Zero peut être appliqué à d’autres champs.
"Dans l’absolu, nous voulons exploiter découverte algorithmique pour aider à résoudre des problèmes du monde réel", a déclaré Demis Hassabis, PDG de DeepMind à l’occasion de cette conférence de presse. "Si des techniques similaires peuvent être appliquées à d’autres structures problématiques, comme le repliement de protéines, la réduction de la consommation des énergies ou la recherche de nouveaux matériels révolutionnaires, nos découvertes ont le potentiel pour conduire plus avant la compréhension humaine et avoir un impact positif sur nos vies."
DeepMind a déjà commencé à utiliser AlphaGo Zero pour travailler sur le repliement de protéines, responsable de nombreuses maladies comme Alzheimer ou Parkinson. Nous verrons bien comment cette application du programme se développe, mais ce qui est certain, c’est l’originalité de l’approche développée par DeepMind. Une IA qui est née comme une feuille blanche et apprend à dessiner par elle-même.
Quelque chose à ajouter ? Dites-le en commentaire.