Accueil portail recherche > Actualités


Jeu de go : l’intelligence artificielle s’impose

4 manches à 1. Le programme informatique AlphaGo développé par l’entreprise britannique Google DeepMind a largement dominé le champion de go sud-coréen Lee Sedol, détenteur de 18 titres internationaux. Entre le 9 et 15 mars 2016, plusieurs centaines de milliers de personnes ont suivi en direct les rencontres qui, bien au-delà du jeu, ont consacré une avancée majeure dans le champ de l’intelligence artificielle. Grégory Bonnet, Gaël Lejeune, Florent Madelaine et Antoine Widlocher (GREYC • UMR 6072) reviennent sur cet événement au retentissement mondial.

Droit Wiki Commons

Qu’est-ce que AlphaGo ?

AlphaGo est un algorithme dédié au jeu de Go où l’analyse exhaustive des successions de coups est impossible. En effet, les algorithmes pour de tels grands jeux arrêtent l’analyse exacte à un horizon (10 coups par exemple) où on estime la valeur de la position en s’appuyant sur des règles préalablement données par l’humain : la fonction d’évaluation. L’absence d’une bonne fonction d’évaluation au Go a conduit Rémy Coulom à l’apprendre avec Crazy Stone à partir de la simulation de nombreuses parties aléatoires : c’est la méthode de Monte Carlo Tree Search (MCTS). En 2008 avec MoGo, Olivier Teytaud biaise ces simulations pour orienter l’apprentissage vers des bons coups. MoGo est le premier à battre des maîtres humains mais sur des plateaux plus petits ou avec des handicaps pour les plus grands. L'avancée d'AlphaGo est d'avoir couplé MCTS à un apprentissage par réseau de neurones profonds exploitant des données massives (ici des parties de maîtres). Pour évaluer un coup, il exploite à la fois MCTS et le résultat de l’apprentissage. Cependant, cela nécessite une puissance de calcul hors de portée des ordinateurs personnels, à la fois pour la phase d’apprentissage et pour la phase de jeu.

En quoi cet événement est-il significatif ?

C’est une prouesse technologique, combinaison astucieuse de méthodes existantes. C’est aussi la démonstration qu’avec des moyens humains et financiers, la recherche fondamentale trouve des applications concrètes. L’aspect éthique propre à l’utilisation des données humaines dépasse toutefois la simple opposition un peu manichéenne entre intelligence humaine et artificielle. AlphaGo a pu apprendre en synthétisant le savoir exprimé dans des parties réellement jouées. Que pourrait apprendre un algorithme similaire à partir des traces informatiques que des milliers d’humains laissent chaque jour ?

Qu'est-ce qui distingue, encore aujourd'hui, l'intelligence artificielle de l'intelligence humaine ?

Le terme d’intelligence dérive du latin Intellegere “comprendre”. L’intelligence artificielle d’AlphaGo ne rentre clairement pas dans cette définition, la machine ne comprend pas ce qu’elle fait, elle n’est pas en mesure de justifier ses coups autrement que par la probabilité de victoire ou de défaite qui en découle. En effet, AlphaGo propose un résultat sans pour autant pouvoir expliquer les propriétés du chemin qui y mène.
Sur ce plan, les deux intelligences ne sont toujours pas comparables.

article publié dans Prisme n°3, mai 2016, p.12.

Télécharger la page

Dernière modification : 25 janvier 2017



UNICAEN
Université de Caen Normandie
Esplanade de la Paix | CS 14032 | 14032 CAEN cedex 5