Faites vos jeux !
Transcription
Faites vos jeux !
Nino Garcia HEC Paris 21 ans Faites vos jeux ! M ai 1997. Le supercalculateur Deep Blue remporte son duel face au champion du monde d’échecs Garry Kasparov après une première défaite un an auparavant(1). Ironie du sort, le coup qui a déstabilisé Kasparov lors de la première partie était un bug. Le joueur russe avait analysé ce mouvement contrintuitif comme une preuve de la supériorité de la machine et s’en était trouvé déstabilisé par la suite(2). L’intelligence artificielle avait été créée par l’homme et renforcée par l’interprétation que ce dernier en avait faite. Cet exemple met en évidence un point crucial qui fera l’objet de mon analyse : le concept même d’intelligence augmentée dans le domaine du jeu repose sur la synthèse entre l’intelligence informatique et les spécificités humaines. Le jeu, expression de l’intelligence humaine Le jeu, en tant qu’il est loisir généralement improductif(a), a longtemps été considéré comme peu digne d’intérêt et secondaire par rapport aux obligations sérieuses de chacun(3). Pourtant, il s’est lentement imposé comme une activité à part entière(b) (4). Cet aspect, combiné à son improductivité, en fait un domaine à part pour l’intelligence artificielle. En effet, un robot spécialisé dans les échecs n’a pas directement vocation à être productif. L’ambition est ailleurs : témoigner de la possibilité pour la machine de surpasser l’homme dans un domaine où seul l’intellect compte. De fait, plus les algorithmes sont compliqués, plus les chances de victoires de la machine sont faibles(5). Jeu de go : (19 x 19) x (19x19 – 1) = 129 960 combinaisons possibles au premier tour. Jeu d’échecs : 20 x 20 = 400 combinaisons possibles au premier tour. Par exemple, les ordinateurs n’ont pas été en mesure de battre les maîtres du jeu de go(6). De même, l’introduction de paramètres difficiles à prendre en compte complique la tâche. Au bridge, les cartes adverses ne sont pas visibles pour l’ordinateur qui s’en trouve perturbé(7). Le succès potentiel de la machine repose donc sur sa capacité à intégrer toutes les données pertinentes et à y répondre de manière adéquate. Intelligence augmentée ou intelligence alternative ? Ainsi, les machines sont encore incapables de surpasser l’homme sur des problèmes trop complexes. De plus, un chiffre est frappant : en 1997, Deep Blue avait la capacité de calculer près de 200 millions de positions à la seconde(8) face à un cerveau humain qui a besoin de plusieurs secondes par combinaison. En temps limité, l’ordinateur est donc supérieur à l’homme(c) (9). Malgré tout, cette comparaison montre les limites de l’approche robotique traditionnelle dans un jeu de réflexion. 1 L’algorithme « minimax »(d) est extrêmement coûteux(10) ; l’homme s’en sort avant tout par une sélection des options les plus pertinentes. C’est le cas dans le jeu de go où le facteur de ramification est de 250 – contre 35 aux échecs(11). Les processus de simplification utilisés aux échecs, tels que le « alpha-beta search » ou le « nullmove »(12) sont inapplicables au jeu de go, où repérer les mouvements dignes d’attention relève souvent de l’habitude et de l’instinct du joueur. Ceci dépasse la rationalité robotique. La quantification nécessaire à l’interprétation mathématique et algorithmique est ici absente. La seconde limite des programmes informatiques est leur incapacité à incorporer l’intégralité du plateau de go dans leur analyse(6) ; ils ont tendance à se concentrer sur des zones qui peuvent être d’importance mineure. Ces deux éléments montrent donc que l’intelligence artificielle dans le domaine du jeu relève davantage d’une intelligence alternative que d’une intelligence augmentée. Conclusion : vers une intelligence augmentée L’intelligence artificielle, telle qu’évoquée dans le domaine du jeu, reste artificielle en ce qu’elle est dépourvue d’humanité : par exemple, la machine ne se réjouit pas (encore) de sa victoire. Elle n’est qu’une codification de la rationalité humaine qui trouve ses limites là où l’action de l’homme a recours à l’inquantifiable. En ce sens, le défi est de passer de ce stade à celui d’une véritable intelligence augmentée, qui serait la synthèse entre la puissance mathématique de la machine et le ressenti humain. Notes : (a) Le Larousse définit le jeu comme une « activité d'ordre physique ou mental, non imposée, ne visant à aucune fin utilitaire, et à laquelle on s'adonne pour se divertir, en tirer un plaisir » Le défi : augmenter ce nouveau type d’intelligence Dès lors, de nouvelles approches sont requises pour améliorer les programmes existants. Le français Rémi Coulom(13), en intégrant un algorithme Monte Carlo(14) à l’analyse minimax de son ordinateur Crazy Stone, remporta plusieurs tournois de go pour robots dont la très réputée UEC Cup(e). Mais au-delà de l’aspect purement technique, il s’agit d’incorporer de l’humain à l’artificiel. Ainsi, un ordinateur a pour but de remporter la partie sans tenir compte de l’écart de la victoire. Ceci peut le mener à gaspiller des pièces en cas de net avantage. L’approche de la fin du jeu doit permettre le basculement d’une logique algorithmique vers une logique humaine – conclure la partie dès que possible. En outre, l’imprédictibilité des mouvements adverses constitue un plafond aux progrès des machines. Seule la compréhension approfondie de l’interaction d’un joueur avec la situation présente sur le plateau permettra d’y remédier. C’est donc un double défi auquel sont confrontés les programmeurs. D’une part, la rationalisation algorithmique a encore de l’avenir, ainsi que le montrent les limites évoquées précédemment. Si un bug peut s’avérer salutaire comme dans le cas de Deep Blue, il conduit le plus souvent à une stratégie erronée sur laquelle l’ordinateur ne peut pas revenir puisqu’il la tient pour exacte(15). D’autre part, l’esprit humain, non content d’être concepteur, doit également devenir acteur à part entière et être intégré au raisonnement de l’ordinateur. (b) Schiller affirme notamment dans Lettres sur l’éducation esthétique de l’homme (1795) : « l'homme ne joue que là où dans la pleine acception de ce mot il est homme, et il n'est tout à fait homme que là où il joue ». (c) Ainsi, Kasparov s’était incliné en 1994 face au logiciel ChessGenius avec une limite de 25 minutes par joueur pour toute la partie. Des précédents existaient déjà : Kasparov lui-même en 1992 et 1994, Karpov en 1990. (d) L’algorithme « minimax » consiste en la réalisation d’un arbre des possibles qui évalue toutes les options en fonction de la réaction qu’elles impliquent. Le choix est ensuite fait de sorte à minimiser la meilleure réponse possible de la part de l’adversaire. (e) L’UEC Cup est une compétition de jeu de go pour ordinateurs organisée par l’University of ElectroCommunications (UEC) à Tokyo, au Japon. Les finalistes remportent notamment la possibilité d’affronter les meilleurs joueurs de go pour mesurer la puissance de leurs algorithmes. 2 Sources : (8) IBM, Deep Blue, Frequently Asked Questions, “What are the differences between last year’s rendition of Deep Blue and this year’s model?” (1) IBM, Icons of progress, Deep blue, “Overview”. [En ligne]. Disponible : http://www03.ibm.com/ibm/history/ibm100/us/en/icons/de epblue/ (2) Washington Post, Brad Plumer, Nate Silver’s ’The signal and the Noise’, 26 septembre 2012. [En ligne]. Disponible : https://www.washingtonpost.com/news/wonk/ wp/2012/09/26/nate-silvers-the-signal-and-thenoise/ (3) Saint Thomas d’Aquin, Somme théologique Ilae, Question 168 : La modestie dans mouvements extérieurs du corps, « Article Peut-il avoir une vertu dans les activités jeu ? ». Ilales 2: de (4) Colas Duflo, Le jeu : de Pascal à Schiller, PUF, 1997. (5) Pour un exemple d’algorithme aux échecs, voir par exemple : Université de Toulon, UFR-Sciences & Techniques, IMATH, Jean-Pierre Zanetti, Le problème du cavalier. [En ligne]. Disponible : http://zanotti.univ-tln.fr/algo/SOURCESC/cavalier.c (6) Wired Business, Alan Levinovitz, The mystery of go, the ancient game that computers still can’t win, 5 décembre 2014. [En ligne]. Disponible : http://www.wired.com/2014/05/the-world-ofcomputer-go/ (7) Le Monde, Gregor Brandy et Etienne Chaudagne, Les jeux où l’homme bat (encore) la machine, 25 septembre 2014. [En ligne]. Disponible : http://www.lemonde.fr/pixels/article/2014/09/2 5/les-jeux-ou-l-homme-bat-encore-lamachine_4490715_4408996.html (9) Le Monde, Pierre Barthélémy, L’espèce humaine, échec et mat, 11 septembre 2014. [En ligne]. Disponible : http://www.lemonde.fr/jeux-desprit/article/2014/09/11/l-espece-humaineechec-et-mat_4486139_1616889.html (10) Ecole des Mines de Saint-Etienne, Gauthier Pi card, Algorithme Minimax et élagage αβ, 9 novembre 2011. [En ligne]. Disponible : http://www.emse.fr/~picard/files/minimax.pdf (11) Jacek Manziuk, Studies in Computational Intelligence 276: Knowledge-Free and LearningBased Methods in Intelligent Game Playing, “Introduction”, Springer, 27 janvier 2010. (12) MIT Open Course, Patrick H. Winston, Artificial intelligence, “Lecture 6: Search: Games, Minimax and Alpha-Beta”, 6.034, Fall 2010. [En ligne]. Disponible : https://www.youtube.com/watch?v=STjW3eH0Ci k (13) Rémi Coulom, Site Officiel. [En ligne]. Disponible : http://www.remi-coulom.fr/ (14) Université Paris 7 et Paris 1, Annie Millet, Master 2ème année Spécialité Modélisation Aléatoire, « Méthodes de Monte-Carlo ». [En ligne]. Disponible : https://samos.univparis1.fr/archives/ftp/cours/millet/montecarlo.p df (15) Paolo Zanella, Yves Ligier & Emmanuel Lazard, Architecture en technologie des ordinateurs, « 13.7.9 Traitement des erreurs », Dunod, 5ème édition, 2013. Nombre total de signes de l’article : 5 578 signes (espaces compris, hors légende de l’illustration, notes et sources). Rappel : l’article (titre + introduction + corps de l’article + conclusion) ne doit pas dépasser 6000 signes espaces compris (hors légende de l’illustration, notes et sources) 3