Faites vos jeux !

Transcription

Faites vos jeux !
Nino Garcia
HEC Paris
21 ans
Faites vos jeux !
M
ai 1997. Le supercalculateur Deep Blue
remporte son duel face au champion du
monde d’échecs Garry Kasparov après une
première défaite un an auparavant(1). Ironie du sort, le
coup qui a déstabilisé Kasparov lors de la première partie
était un bug. Le joueur russe avait analysé ce mouvement
contrintuitif comme une preuve de la supériorité de la
machine et s’en était trouvé déstabilisé par la suite(2).
L’intelligence artificielle avait été créée par l’homme et
renforcée par l’interprétation que ce dernier en avait
faite. Cet exemple met en évidence un point crucial qui
fera l’objet de mon analyse : le concept même
d’intelligence augmentée dans le domaine du jeu repose
sur la synthèse entre l’intelligence informatique et les
spécificités humaines.
Le jeu, expression de l’intelligence humaine
Le jeu, en tant qu’il est loisir généralement
improductif(a), a longtemps été considéré comme peu
digne d’intérêt et secondaire par rapport aux obligations
sérieuses de chacun(3). Pourtant, il s’est lentement
imposé comme une activité à part entière(b) (4). Cet
aspect, combiné à son improductivité, en fait un domaine
à part pour l’intelligence artificielle. En effet, un robot
spécialisé dans les échecs n’a pas directement vocation à
être productif. L’ambition est ailleurs : témoigner de la
possibilité pour la machine de surpasser l’homme dans
un domaine où seul l’intellect compte. De fait, plus les
algorithmes sont compliqués, plus les chances de
victoires de la machine sont faibles(5).
Jeu de go : (19 x 19) x (19x19 – 1) = 129 960 combinaisons
possibles au premier tour.
Jeu d’échecs : 20 x 20 = 400 combinaisons possibles au
premier tour.
Par exemple, les ordinateurs n’ont pas été en mesure
de battre les maîtres du jeu de go(6). De même,
l’introduction de paramètres difficiles à prendre en
compte complique la tâche. Au bridge, les cartes
adverses ne sont pas visibles pour l’ordinateur qui s’en
trouve perturbé(7). Le succès potentiel de la machine
repose donc sur sa capacité à intégrer toutes les données
pertinentes et à y répondre de manière adéquate.
Intelligence augmentée ou intelligence alternative ?
Ainsi, les machines sont encore incapables de
surpasser l’homme sur des problèmes trop complexes.
De plus, un chiffre est frappant : en 1997, Deep Blue avait
la capacité de calculer près de 200 millions de positions à
la seconde(8) face à un cerveau humain qui a besoin de
plusieurs secondes par combinaison. En temps limité,
l’ordinateur est donc supérieur à l’homme(c) (9). Malgré
tout, cette comparaison montre les limites de l’approche
robotique traditionnelle dans un jeu de réflexion.
1
L’algorithme « minimax »(d) est extrêmement coûteux(10) ;
l’homme s’en sort avant tout par une sélection des
options les plus pertinentes. C’est le cas dans le jeu de go
où le facteur de ramification est de 250 – contre 35 aux
échecs(11). Les processus de simplification utilisés aux
échecs, tels que le « alpha-beta search » ou le « nullmove »(12) sont inapplicables au jeu de go, où repérer les
mouvements dignes d’attention relève souvent de
l’habitude et de l’instinct du joueur. Ceci dépasse la
rationalité robotique. La quantification nécessaire à
l’interprétation mathématique et algorithmique est ici
absente.
La seconde limite des programmes informatiques est
leur incapacité à incorporer l’intégralité du plateau de go
dans leur analyse(6) ; ils ont tendance à se concentrer sur
des zones qui peuvent être d’importance mineure. Ces
deux éléments montrent donc que l’intelligence
artificielle dans le domaine du jeu relève davantage d’une
intelligence alternative que d’une intelligence
augmentée.
Conclusion : vers une intelligence augmentée
L’intelligence artificielle, telle qu’évoquée dans le
domaine du jeu, reste artificielle en ce qu’elle est
dépourvue d’humanité : par exemple, la machine ne se
réjouit pas (encore) de sa victoire. Elle n’est qu’une
codification de la rationalité humaine qui trouve ses
limites là où l’action de l’homme a recours à
l’inquantifiable. En ce sens, le défi est de passer de ce
stade à celui d’une véritable intelligence augmentée, qui
serait la synthèse entre la puissance mathématique de la
machine et le ressenti humain.
Notes :
(a) Le Larousse définit le jeu comme une « activité
d'ordre physique ou mental, non imposée, ne
visant à aucune fin utilitaire, et à laquelle on
s'adonne pour se divertir, en tirer un plaisir »
Le défi : augmenter ce nouveau type d’intelligence
Dès lors, de nouvelles approches sont requises
pour améliorer les programmes existants. Le français
Rémi Coulom(13), en intégrant un algorithme Monte
Carlo(14) à l’analyse minimax de son ordinateur Crazy
Stone, remporta plusieurs tournois de go pour robots
dont la très réputée UEC Cup(e). Mais au-delà de l’aspect
purement technique, il s’agit d’incorporer de l’humain à
l’artificiel. Ainsi, un ordinateur a pour but de remporter la
partie sans tenir compte de l’écart de la victoire. Ceci
peut le mener à gaspiller des pièces en cas de net
avantage. L’approche de la fin du jeu doit permettre le
basculement d’une logique algorithmique vers une
logique humaine – conclure la partie dès que possible. En
outre, l’imprédictibilité des mouvements adverses
constitue un plafond aux progrès des machines. Seule la
compréhension approfondie de l’interaction d’un joueur
avec la situation présente sur le plateau permettra d’y
remédier.
C’est donc un double défi auquel sont confrontés les
programmeurs.
D’une
part,
la
rationalisation
algorithmique a encore de l’avenir, ainsi que le montrent
les limites évoquées précédemment. Si un bug peut
s’avérer salutaire comme dans le cas de Deep Blue, il
conduit le plus souvent à une stratégie erronée sur
laquelle l’ordinateur ne peut pas revenir puisqu’il la tient
pour exacte(15). D’autre part, l’esprit humain, non content
d’être concepteur, doit également devenir acteur à part
entière et être intégré au raisonnement de l’ordinateur.
(b) Schiller affirme notamment dans Lettres sur
l’éducation esthétique de l’homme (1795) :
« l'homme ne joue que là où dans la pleine
acception de ce mot il est homme, et il n'est tout
à fait homme que là où il joue ».
(c) Ainsi, Kasparov s’était incliné en 1994 face au
logiciel ChessGenius avec une limite de 25
minutes par joueur pour toute la partie. Des
précédents existaient déjà : Kasparov lui-même
en 1992 et 1994, Karpov en 1990.
(d) L’algorithme « minimax » consiste en la
réalisation d’un arbre des possibles qui évalue
toutes les options en fonction de la réaction
qu’elles impliquent. Le choix est ensuite fait de
sorte à minimiser la meilleure réponse possible
de la part de l’adversaire.
(e) L’UEC Cup est une compétition de jeu de go pour
ordinateurs organisée par l’University of ElectroCommunications (UEC) à Tokyo, au Japon. Les
finalistes remportent notamment la possibilité
d’affronter les meilleurs joueurs de go pour
mesurer la puissance de leurs algorithmes.
2
Sources :
(8) IBM, Deep Blue, Frequently Asked Questions,
“What are the differences between last year’s
rendition of Deep Blue and this year’s model?”
(1) IBM,
Icons
of
progress,
Deep
blue,
“Overview”. [En ligne]. Disponible :
http://www03.ibm.com/ibm/history/ibm100/us/en/icons/de
epblue/
(2) Washington Post, Brad Plumer, Nate Silver’s
’The signal and the Noise’, 26 septembre
2012.
[En
ligne].
Disponible
:
https://www.washingtonpost.com/news/wonk/
wp/2012/09/26/nate-silvers-the-signal-and-thenoise/
(3) Saint Thomas d’Aquin, Somme théologique
Ilae, Question 168 : La modestie dans
mouvements extérieurs du corps, « Article
Peut-il avoir une vertu dans les activités
jeu ? ».
Ilales
2:
de
(4) Colas Duflo, Le jeu : de Pascal à Schiller, PUF,
1997.
(5) Pour un exemple d’algorithme aux échecs, voir
par exemple : Université de Toulon, UFR-Sciences
& Techniques, IMATH, Jean-Pierre Zanetti, Le
problème du cavalier. [En ligne]. Disponible :
http://zanotti.univ-tln.fr/algo/SOURCESC/cavalier.c
(6) Wired Business, Alan Levinovitz, The mystery of
go, the ancient game that computers still can’t
win, 5 décembre 2014. [En ligne]. Disponible :
http://www.wired.com/2014/05/the-world-ofcomputer-go/
(7) Le Monde, Gregor Brandy et Etienne Chaudagne,
Les jeux où l’homme bat (encore) la machine, 25
septembre 2014. [En ligne]. Disponible :
http://www.lemonde.fr/pixels/article/2014/09/2
5/les-jeux-ou-l-homme-bat-encore-lamachine_4490715_4408996.html
(9) Le Monde, Pierre Barthélémy, L’espèce humaine,
échec et mat, 11 septembre 2014. [En ligne].
Disponible : http://www.lemonde.fr/jeux-desprit/article/2014/09/11/l-espece-humaineechec-et-mat_4486139_1616889.html
(10) Ecole des Mines de Saint-Etienne, Gauthier Pi
card, Algorithme Minimax et élagage αβ, 9
novembre 2011. [En ligne]. Disponible :
http://www.emse.fr/~picard/files/minimax.pdf
(11) Jacek Manziuk, Studies in Computational
Intelligence 276: Knowledge-Free and LearningBased Methods in Intelligent Game Playing,
“Introduction”, Springer, 27 janvier 2010.
(12) MIT Open Course, Patrick H. Winston,
Artificial intelligence, “Lecture 6: Search:
Games,
Minimax and Alpha-Beta”, 6.034,
Fall
2010.
[En
ligne].
Disponible
:
https://www.youtube.com/watch?v=STjW3eH0Ci
k
(13) Rémi Coulom, Site Officiel. [En ligne].
Disponible : http://www.remi-coulom.fr/
(14) Université Paris 7 et Paris 1, Annie Millet,
Master 2ème année Spécialité Modélisation
Aléatoire, « Méthodes de Monte-Carlo ».
[En
ligne]. Disponible :
https://samos.univparis1.fr/archives/ftp/cours/millet/montecarlo.p
df
(15) Paolo Zanella, Yves Ligier & Emmanuel Lazard,
Architecture en technologie des ordinateurs,
« 13.7.9 Traitement des erreurs », Dunod, 5ème
édition, 2013.
Nombre total de signes de l’article : 5 578 signes (espaces compris, hors légende de l’illustration, notes et sources).
Rappel : l’article (titre + introduction + corps de l’article + conclusion) ne doit pas dépasser 6000 signes espaces compris
(hors légende de l’illustration, notes et sources)
3