Le fuseki d’Alphago

Le fuseki d’Alphago

Deepmind avait annoncé fin Mai le développement d’un outil basé sur Alphago, destiné à aider les joueurs de go du monde entier. Le but était d’offrir un dernier cadeau à la communauté, après l’annonce de la retraite de la fameuse intelligence artificielle. Les spéculations sur les fonctionnalités de cet outil allaient bon train. Il était peu probable que l’équipe de Google publie un outil pour analyser n’importe quelle position donnée, car cela reviendrait à rendre Alphago libre d’utilisation. La communauté ne savait donc pas trop à quoi s’attendre, et la réponse est enfin arrivée hier. Cet « Alphago teaching tool » vient d’être mis en ligne sur le site de Deepmind :

Alphago teaching tool

Il s’agit donc d’un « dictionnaire » des débuts de partie, made in Alphago. On distingue les coups préférés par l’IA en pointillés, des coups joués plus traditionnellement par les humains, en cercle plein. Sur chaque coup, on peut lire la probabilité de gagner pour noir (selon Alphago bien sûr, rien d’absolu). Il ne faut donc pas se tromper : lorsque c’est à noir de jouer, il faut préférer les coups avec la probabilité la plus haute, et quand c’est à blanc de jouer, la plus basse.

Aja Huang, membre de l’équipe Deepmind, explique que l’outil compile environ 6000 variations d’ouvertures classiques du go moderne, collectées sur plus de 230 000 parties humaines. Alphago a ensuite calculé les probabilités de gagner pour chaque position, chaque coup étant évalué avec 10 minutes de réflexion (représentant 10 millions de simulations par coup !). L’outil contient ainsi plus de 20 000 branches et 370 000 positions de jeu.

Aja Huang, membre de Deepmind

Chaque variation s’étend sur une trentaine de coups, ce qui donne une bonne idée de la façon dont l’IA joue ses débuts de partie. La plupart d’entre-elles rappellent d’ailleurs ce que l’on pouvait voir dans les parties d’Alphago contre lui-même. On trouve également beaucoup de fusekis modernes joués par les joueurs professionnels, comme expliqué plus haut. On peut donc voir quels sont coups préférés de l’IA en réponse à ces différentes ouvertures.

L’outil n’est donc pas entièrement novateur, dans le sens où de nombreuses démonstrations des ouvertures d’Alphago avaient déjà été montrées. On pense par exemple aux 60 victoires de Master (la version  d’AG datant de début 2017) contre les professionnels du monde entier, ou plus récemment les parties d’Alphago Zero, une version ayant appris à jouer au jeu complètement de zéro !

L’Alphago teaching tool est plutôt à prendre comme une sorte de synthèse de ce que l’IA a apporté au fuseki jusqu’à aujourd’hui. À analyser de fond en comble pour les professionnels, et à prendre comme source d’inspiration pour nous autres, les amateurs !

On regrettera néanmoins l’absence de commentaire sur les variations. Alphago ne sachant toujours pas différencier le mot « noir » du mot « blanc »… Une aubaine pour les pédagogues : il reste encore du travail pour eux, et mon blog n’est pas (encore) bon pour la poubelle 🙂

Poster un Commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.