AlphaZero, le programme de Google, bat Stockfish à plates coutures
AlphaZero contre Stockfish / Un artwork Chess.com.

AlphaZero, le programme de Google, bat Stockfish à plates coutures

Aujourd'hui, les échecs ont changé à tout jamais. Demain, peut-être le monde...

Il y a un peu plus d'un an, AlphaGo créait la sensation en battant le numéro un mondial du jeu de Go. Cette fois, c'est le programme d'intelligence artificielle AlphaZero qui réalise l'exploit de battre du premier coup le programme d'échecs le mieux classé du monde

Stockfish, que de nombreux joueurs utilisent assidûment pour leur préparation, est le récent vainqueur du TCEC Championship 2016 et du Chess.com Computer Championship 2017. Pourtant, AlphaZero ne lui a laissé aucune chance, remportant 28 victoires, annulant 72 fois, et ne perdant aucune partie sur 100 !

Petite précision : il n'a fallu que quatre heures à AlphaZero pour "apprendre" les échecs. Désolé, amis humains, cette fois, c'est bel et bien terminé pour nous...

En effet, les développeurs d'AlphaZero (membres de DeepMind, une filiale de Google), ont lancé leur programme sur une procédure d'"apprentissage automatique", et plus exactement d'apprentissage par renforcement. Pour faire simple, les développeurs n'ont pas "appris" le jeu à leur programme (au delà des règles de base). Il ne possède ni répertoire d'ouverture, ni tableaux de finales, et apparemment, pas d'algorithme ultra-complexe disséquant les infimes différences de valeur entre un pion du centre et un pion de l'aile.

Google Headquarters in London.

Le siège de Google à Londres. Les locaux de DeepMind sont au huitième étage. | Photo : Maria Emelianova/Chess.com.

Pour comparer, imaginez un robot auquel on fournirait des milliers de pièces en métal, sans lui donner aucune connaissance sur le moteur à explosion. Celui-ci, après avoir essayé toutes les combinaisons possibles, finirait par construire une Ferrari... Et tout cela en moins de temps qu'il n'en faut pour regarder la trilogie du Seigneur des anneaux ! Le programme s'est donc contenté de jouer contre lui-même pendant quatre heures, devenant par conséquent son propre professeur.

Pour le moment, l'équipe de développement se refuse à tout commentaire, précisant à Chess.com que le rapport d'expérience est "toujours en phase de relecture". Il est malgré tout dès à présent accessible ici. Dans le groupe de chercheurs figure Demis Hassabis, un candidat-maître anglais, co-fondateur de DeepMind (racheté par Google en 2014). Hassabis, qui a notamment participé à l’événement Pro-Biz organisé en ouverture du London Chess Classic, est actuellement en Californie pour participer à la conférence "Neural Information Processing Systems". Il y présente un autre mémoire qu'il a coécrit, sans aucun lien avec AlphaZero.

Demis Hassabis with Michael Adams in London.

Demis Hassabis aux côtés Michael Adams lors de l'événement ProBiz, au siège londonien de Google il y a quelques jours. | Photo : Maria Emelianova/Chess.com.

Un grand-maître a accepté de commenter la nouvelle pour Chess.com, et le moins qu'on puisse dire, c'est qu'il ne manque pas d'expérience dans le domaine des parties contre ordinateur... Garry Kasparov, car il s'agit bien de lui, a reconnu ne pas être surpris par l’intérêt porté par DeepMind au jeu d'échecs.

"C'est un exploit remarquable, mais on pouvait s'y attendre depuis la réussite d'AlphaGo." a-t-il reconnu. "On se rapproche de l'approche de type-B, un concept rêvé par Claude Shannon et Alan Turing. Les machines se mettent à fonctionner comme des humains, et ne s'appuient plus seulement sur la force brute."

L'une des 10 parties incluses dans le rapport.

En effet, à l'instar des humains, AlphaZero calcule moins de positions que ses prédécesseurs virtuels. Le rapport mentionne notamment que le programme "ne calcule "que" 80 000 positions par seconde, contre 70 millions par seconde pour Stockfish."

Le GMI Peter Heine Nielsen, longtemps secondant de Magnus Carlsen, a, comme le président de la FIDE avant lui, l'impression d'avoir rencontré des aliens : "Je me suis toujours demandé ce qui se passerait si une espèce supérieure arrivait sur terre et apprenait les échecs. Après avoir lu le rapport, mais surtout vu les parties, j'ai l'impression de le savoir."

Chess.com a interviewé Nielsen (en anglais).

Sans surprise, nous avons également appris qu'il était préférable d'avoir les blancs, même pour un monstre de silicone. Sur les 28 victoires d'AlphaZero, 25 ont été remportées avec les pièces blanches. Cela dit, le score de +3 =47 -0 avec les noirs contre un Stockfish classé à plus de 3400 est à saluer également !

La machine a également compilé la fréquence à laquelle elle a utilisé les différentes ouvertures. Désolé, amis de la défense est-indienne, votre chouchou est loin de figurer au sommet. La popularité de la française a également décliné avec le temps, tandis que le gambit dame et l'ouverture anglaise étaient très bien représentés.

null

Fréquence des ouvertures choisies par AlphaZero lors de sa "phase d'apprentissage". Image issue du rapport de recherche AlphaZero.

Lorsque l'on ne se fatigue jamais, et que l'on est venu à bout d'un jeu vieux de 1400 ans, que faire ? En apprendre un autre, bien sûr ! Après son match contre Stockfish, AlphaZero s'est "entraîné" pendant deux heures, avant de battre Elmo, le meilleur programme de Shogi du monde.

Les ramifications d'un tel procédé d'apprentissage ne sont bien entendu pas limitées aux jeux.

"Nous avions toujours considéré que les échecs réclamaient trop de connaissances empiriques pour qu'une machine les apprennent par elle-même, sans apport humain" a commenté Kasparov. "Bien sûr, je suis impatient de savoir ce qu'AlphaZero peut nous apprendre sur le jeu d'échecs. C'est la grande promesse de l'ère des machines : elle parviennent à identifier des règles que les humains ne peuvent détecter. Mais évidemment, c'est au delà des échecs et des jeux en général que les applications semblent les plus intéressantes. Une machine qui parvient à copier et à surpasser des siècles de connaissances humaines dans des systèmes fermés et complexes, c'est un outil qui pourrait changer le monde."

Garry Kasparov and Demis Hassabis in London.

Garry Kasparov et Demis Hassabis à l'événement ProBiz. | Photo : Maria Emelianova/Chess.com.

Chess.com a interrogé huit des 10 participants du London Chess Classic. Une compilation vidéo de leurs réactions sur le match AlphaGo-Stockfish sera bientôt disponible sur le site.

Un joueur a cependant émis certaines objections sur les conditions du match : Hikaru Nakamura. Alors que sur les forums internet, on débat volontiers de la puissance des processeurs alloués aux deux camps, Hikaru considère cet aspect comme secondaire.

Cependant, l'américain a trouvé les conditions du match "malhonnêtes", précisant que Stockfish avait besoin de son répertoire d'ouverture pour réaliser des performances optimales. Il ne considère cependant pas que le résultat du match aurait été différent, mais que l'écart au score aurait été considérablement réduit.

"Je suis à peu près sûr que Dieu lui-même ne battrait pas Stockfish 75% du temps avec les blancs, sans certain handicaps..." a-t-il commenté. Précisons qu'AlphaZero a réalisé 25 victoires et 25 nulles avec les blancs.

Le GMI Larry Kaufman, consultant pour le programme d'échecs Komodo, espère que les performances du nouveau programme seront reproductibles sur des machines privées, et pas seulement sur les ordinateurs de Google. Il a également rejoint Nakamura sur le handicap affectant Stockfish, privé de son répertoire d'ouverture standard.

"Bien entendu, c'est assez incroyable", a-t-il cependant ajouté. "Lorsque j'ai appris les exploits du programme AlphaGo, je me suis bien sûr douté que DeepMind allait venir se frotter au monde des échecs, d'autant plus que l'un de leurs fondateurs, Demis Hassabis, est candidat-maître. Ce qui reste à déterminer, c'est si AlphaZero sera capable de jouer aux échecs sur un ordinateur normal, et le cas échéant, s'il sera capable d'y battre les meilleurs programmes actuels. La fin du règne des moteurs d'échecs à algorithme minimax est peut-être proche, mais il est encore trop tôt pour l'affirmer. Il faut préciser qu'AlphaZero a eu le temps de construire son propre répertoire d'ouverture, il serait donc bon de le remettre à nouveau en concurrence avec un fort programme, cette fois doté de son propre répertoire."

Quel qu’aient été les conditions du match, Peter Heine Nielsen, lui, est impatient de découvrir les applications de l'apprentissage automatique à d'autres disciplines :

"Il s'agit d'une véritable intelligence artificielle. Pour l'instant, elle gagne aux échecs, mais demain, elle pourrait gagner des prix Nobel, ou bien plus encore... En fait, on ne peut que leur être reconnaissant d'avoir bien voulu la faire jouer quatre heures aux échecs, car cela va nous permettre d'en apprendre beaucoup. Pour nous autres joueurs d'échecs, c'est un grand jour, mais pour le reste du monde, cette avancée va bien plus loin."

Mieux connaître FM MikeKlein
Les Armenia Eagles remportent la PRO Chess League au bout du suspense

Les Armenia Eagles remportent la PRO Chess League au bout du suspense

Aronian bat MVL au départage et remporte l'Open de Gibraltar

Aronian bat MVL au départage et remporte l'Open de Gibraltar