IA et Bridge
DIVERS
+ DE 2 ANS
Le 26/11/2019 à 14h56
156 vues
Question d'origine :
Bonjour,
Après les échecs et le go, quel est l'étape nouvelle du défi de l'Intelligence artificielle avec l'humain ? Le Bridge ?
Merci
Réponse du Guichet
gds_et
- Département : Équipe du Guichet du Savoir
Le 27/11/2019 à 13h51
Bonjour,
Vous faites référence aux défis relevés par les programmes Deep Blue, qui a battu le champion du monde d’échecs Garry Kasparov en 1997, puis AlphaGo, qui a battu les meilleurs joueurs mondiaux de Go entre 2016 et 2017.
Notons que DeepMind, l’entreprise ayant développé AlphaGo, a ensuite créé AlphaGo Zero, version améliorée d’AlphaGo « développée sans l'aide de données provenant de parties jouées entre humains, ni de connaissances autres que les règles du jeu. Cette version est plus forte que n'importe quelle version précédente. En jouant contre lui-même, AlphaGo Zero a dépassé la force de la version d’AlphaGo du match contre Lee Se-dol en trois jours en gagnant par 100 jeux à 0, a atteint le niveau d’AlphaGo Master en 21 jours, et a dépassé toutes les anciennes versions en 40 jours. »
AlphaZero, une version généraliste d’AlphaGo Zero, est adaptée pour jouer aux échecs et au shogi (échecs japonais).
Le dernier né de DeepMind, MuZero, a réussi à maîtriser différents jeux de stratégie (les jeux d’arcade Atari, le jeu de Go, les échecs et le shogi) sans qu’on lui en enseigne les règles au préalable… Ce qui serait comparable au processus cognitif d’un enfant découvrant un jeu sur son Ipad, et qui commencerait à jouer sans connaître les règles.
Source : DeepMind Unveils MuZero, a New Agent that Mastered Chess, Shogi, Atari and Go Without Knowing the Rules, towardsdatascience.com
Vous vous demandez si le bridge est la prochaine étape. Nous pouvons difficilement répondre à votre interrogation dans l’absolu, mais ce jeu représente effectivement un grand défi à relever pour l’IA.
Voici par exemple ce que nous lisons sur le site will-bridge.com :
« La grande nouveauté serait l’« apprentissage par renforcement profond » de l’AlphaGo Zéro qui sait travailler sur des millions de parties (obtenues en jouant contre elle-même) avec, si l’on en croit ses auteurs, des capacités d’auto-apprentissage lui permettant d’apprendre à jouer à partir de zéro, sans aucune connaissance, sans rien savoir du Go. Un parfait autodidacte, semblerait-il.
Malheureusement DeepMind a annoncé qu’elle ne participera plus à des compétitions homme-machine.
[…] En tout cas la tentation est grande d’essayer de s’en inspirer et actuellement il est de bon ton d’utiliser les techniques inductives des « réseaux de neurones », surtout si l'on cherche à lever des capitaux.
Le Bridge s’y prête-t-il ?
Il faudrait déjà pour cela disposer de millions de donnes jouées par des champions pour que le système puisse s’entraîner et apprendre efficacement par l’exemple.
Contrairement au Go et aux Echecs, ces donnes ne peuvent pas être générées par la machine elle-même sans intervention humaine car au Bridge il y a une différence entre le « gagner » et le « bien jouer » : on peut gagner en jouant mal et perdre en jouant bien !
Prenons par exemple une donne qui possède deux lignes de jeu, une qui gagne à 80% et une seconde qui ne gagne qu’à 60 % : le « bien jouer » consiste à prendre la ligne à 80 % mais il se peut que cette ligne perde alors que la ligne à 60% gagne.
Le simple fait de gagner ou de perdre ne peut donc pas être utilisé pour caractériser la "récompense" et il faut faire intervenir d'autres paramètres, le score obtenu en tournoi par exemple, mais alors ce procédé ne peut plus être automatisé.
Le Bridge est un jeu de comparaison qui ne trouve en effet sa véritable vocation qu'en tournoi où tous les joueurs jouent avec les mêmes jeux. C'est d'ailleurs ce qui en fait l'attrait essentiel, la chance étant ainsi éliminée. Au Bridge le but du jeu est finalement, pour paraphraser Colette :"Avec les cartes de tout le monde, jouer comme personne".
Pour les enchères, le problème est encore plus complexe car il faudrait faire intervenir un autre paramètre très difficile à déterminer ici avec cette méthode, l'espérance mathématique de gain. Prenons par exemple la situation où 4P est un bon pari à l'enchère mais infaisable à la carte. Le top ira au mauvais joueur qui n'aura demandé que 3P !
Remarquons à ce propos que savoir si 4P est un bon pari ou non dépend typiquement du jugement d'un Système Expert (voir plus loin) qui pourra très facilement apprécier l'incidence les enchères adverses (notamment celles d'Est) et les plus-values éventuelles de sa main (cartes intermédiaires, honneurs bien placés, etc...).
Les donnes d’entraînement doivent donc obligatoirement être supervisées par des experts(ou alors il faudrait trouver une méthode de supervision automatique, ce qui ne simplifie pas le problème).
Mais le plus important d’après Philippe Pionchon, est qu’il existe une caractéristique essentielle qui distingue le Bridge du Go et des Echecs, sans même parler de l’existence ou non d’éléments cachés.
- Le Go et les Echecs sont des jeux qui dépassent complètement les possibilités humaines : la machine peut donc en effet y apporter des « idées » nouvelles.
- En revanche le Bridge est un jeu beaucoup plus simple sur le plan combinatoire :les hommes le maîtrisent parfaitement et il a été totalement théorisé.
Au Bridge on ne joue pas contre des adversaires mais contre des configurations de cartes adverses que la théorie est parfaitement capable de déterminer : que viendraient apporter des statistiques ?
Il ne s’agit donc pas de traitement statistique d’un domaine mal connu dont personne n’a la solution, mais de mise en œuvre de l’expertise d’un domaine parfaitement maîtrisé.
DeepMind ne s'y est pas trompé qui a préféré travailler sur un autre jeu de cartes, Hanabi, plutôt que sur le Bridge pourtant infiniment plus célèbre mais qui ne se prête pas à cette technique et où il n'y a plus rien à trouver depuis plus de 30 ans.
Comme nous le verrons plus loin, c'est cette maîtrise humaine qui fait toute la difficulté d’un traitement informatique du Bridge... »
Pour aller plus loin, vous pouvez consulter ces autres ressources (en anglais) sur le bridge et l’intelligence artificielle :
- Is Bridge a Solved Game? improvebridge.com
- Boosting a Bridge Artificial Intelligence, Veronique Ventos, Yves Costel, Olivier Teytaud, Solène Thépaut Ventos
Bonne journée.
Vous faites référence aux défis relevés par les programmes Deep Blue, qui a battu le champion du monde d’échecs Garry Kasparov en 1997, puis AlphaGo, qui a battu les meilleurs joueurs mondiaux de Go entre 2016 et 2017.
Notons que DeepMind, l’entreprise ayant développé AlphaGo, a ensuite créé AlphaGo Zero, version améliorée d’AlphaGo « développée sans l'aide de données provenant de parties jouées entre humains, ni de connaissances autres que les règles du jeu. Cette version est plus forte que n'importe quelle version précédente. En jouant contre lui-même, AlphaGo Zero a dépassé la force de la version d’AlphaGo du match contre Lee Se-dol en trois jours en gagnant par 100 jeux à 0, a atteint le niveau d’AlphaGo Master en 21 jours, et a dépassé toutes les anciennes versions en 40 jours. »
AlphaZero, une version généraliste d’AlphaGo Zero, est adaptée pour jouer aux échecs et au shogi (échecs japonais).
Le dernier né de DeepMind, MuZero, a réussi à maîtriser différents jeux de stratégie (les jeux d’arcade Atari, le jeu de Go, les échecs et le shogi) sans qu’on lui en enseigne les règles au préalable… Ce qui serait comparable au processus cognitif d’un enfant découvrant un jeu sur son Ipad, et qui commencerait à jouer sans connaître les règles.
Source : DeepMind Unveils MuZero, a New Agent that Mastered Chess, Shogi, Atari and Go Without Knowing the Rules, towardsdatascience.com
Vous vous demandez si le bridge est la prochaine étape. Nous pouvons difficilement répondre à votre interrogation dans l’absolu, mais ce jeu représente effectivement un grand défi à relever pour l’IA.
Voici par exemple ce que nous lisons sur le site will-bridge.com :
« La grande nouveauté serait l’« apprentissage par renforcement profond » de l’AlphaGo Zéro qui sait travailler sur des millions de parties (obtenues en jouant contre elle-même) avec, si l’on en croit ses auteurs, des capacités d’auto-apprentissage lui permettant d’apprendre à jouer à partir de zéro, sans aucune connaissance, sans rien savoir du Go. Un parfait autodidacte, semblerait-il.
Malheureusement DeepMind a annoncé qu’elle ne participera plus à des compétitions homme-machine.
[…] En tout cas la tentation est grande d’essayer de s’en inspirer et actuellement il est de bon ton d’utiliser les techniques inductives des « réseaux de neurones », surtout si l'on cherche à lever des capitaux.
Il faudrait déjà pour cela disposer de millions de donnes jouées par des champions pour que le système puisse s’entraîner et apprendre efficacement par l’exemple.
Contrairement au Go et aux Echecs, ces donnes ne peuvent pas être générées par la machine elle-même sans intervention humaine car au Bridge il y a une différence entre le « gagner » et le « bien jouer » : on peut gagner en jouant mal et perdre en jouant bien !
Prenons par exemple une donne qui possède deux lignes de jeu, une qui gagne à 80% et une seconde qui ne gagne qu’à 60 % : le « bien jouer » consiste à prendre la ligne à 80 % mais il se peut que cette ligne perde alors que la ligne à 60% gagne.
Le simple fait de gagner ou de perdre ne peut donc pas être utilisé pour caractériser la "récompense" et il faut faire intervenir d'autres paramètres, le score obtenu en tournoi par exemple, mais alors ce procédé ne peut plus être automatisé.
Le Bridge est un jeu de comparaison qui ne trouve en effet sa véritable vocation qu'en tournoi où tous les joueurs jouent avec les mêmes jeux. C'est d'ailleurs ce qui en fait l'attrait essentiel, la chance étant ainsi éliminée. Au Bridge le but du jeu est finalement, pour paraphraser Colette :"Avec les cartes de tout le monde, jouer comme personne".
Pour les enchères, le problème est encore plus complexe car il faudrait faire intervenir un autre paramètre très difficile à déterminer ici avec cette méthode, l'espérance mathématique de gain. Prenons par exemple la situation où 4P est un bon pari à l'enchère mais infaisable à la carte. Le top ira au mauvais joueur qui n'aura demandé que 3P !
Remarquons à ce propos que savoir si 4P est un bon pari ou non dépend typiquement du jugement d'un Système Expert (voir plus loin) qui pourra très facilement apprécier l'incidence les enchères adverses (notamment celles d'Est) et les plus-values éventuelles de sa main (cartes intermédiaires, honneurs bien placés, etc...).
Les donnes d’entraînement doivent donc obligatoirement être supervisées par des experts(ou alors il faudrait trouver une méthode de supervision automatique, ce qui ne simplifie pas le problème).
Mais le plus important d’après Philippe Pionchon, est qu’il existe une caractéristique essentielle qui distingue le Bridge du Go et des Echecs, sans même parler de l’existence ou non d’éléments cachés.
- Le Go et les Echecs sont des jeux qui dépassent complètement les possibilités humaines : la machine peut donc en effet y apporter des « idées » nouvelles.
- En revanche le Bridge est un jeu beaucoup plus simple sur le plan combinatoire :les hommes le maîtrisent parfaitement et il a été totalement théorisé.
Au Bridge on ne joue pas contre des adversaires mais contre des configurations de cartes adverses que la théorie est parfaitement capable de déterminer : que viendraient apporter des statistiques ?
Il ne s’agit donc pas de traitement statistique d’un domaine mal connu dont personne n’a la solution, mais de mise en œuvre de l’expertise d’un domaine parfaitement maîtrisé.
DeepMind ne s'y est pas trompé qui a préféré travailler sur un autre jeu de cartes, Hanabi, plutôt que sur le Bridge pourtant infiniment plus célèbre mais qui ne se prête pas à cette technique et où il n'y a plus rien à trouver depuis plus de 30 ans.
Comme nous le verrons plus loin, c'est cette maîtrise humaine qui fait toute la difficulté d’un traitement informatique du Bridge... »
Pour aller plus loin, vous pouvez consulter ces autres ressources (en anglais) sur le bridge et l’intelligence artificielle :
- Is Bridge a Solved Game? improvebridge.com
- Boosting a Bridge Artificial Intelligence, Veronique Ventos, Yves Costel, Olivier Teytaud, Solène Thépaut Ventos
Bonne journée.
DANS NOS COLLECTIONS :
Ça pourrait vous intéresser :
Commentaires 0
Connectez-vous pour pouvoir commenter.
Se connecter