Une intelligence artificielle se confronte à Mario Bros

mario-bros-ia

Un scientifique de l’Université de Berkeley (Californie) a mis au point une intelligence artificielle auto apprenante capable de jouer au jeu Mario Bross. Elle affiche de meilleures capacités que d’autres IA testées sur les jeux grâce à une méthode récompensant la curiosité et non les performances.

Désormais, même l’intelligence artificielle joue aux jeux vidéo. Et comme tout gamer qui se respecte, elle commence par les classiques avec Mario Bros et Doom.

C’est le cas pour pour l’IA créée par Deepak Pathak, un chercheur de l’Université de Berkeley. Ce dernier tente de créer une nouvelle façon d’apprendre pour les intelligences artificielles basée sur la reconstitution du désir humain d’apprendre : la curiosité.

Récompenser l’objectif atteint ou l’apprentissage de nouvelles techniques ?

Jusqu’à présent, les IA auto apprenantes, comme AlphaGO (celle développée par Google DeepMind et qui vient de battre le champion du monde du jeu de Go), ont fonctionné via un principe d’optimisation récompensée. Autrement dit, l’humain fixe un objectif à atteindre  récompense la machine à chaque fois qu’elle le réalise.

Une telle IA dans un niveau de Mario Bros va ainsi se mettre à explorer son univers de fond en comble, et retenant chacun des éléments qu’elle découvre pour progressivement parvenir à le terminer de la meilleure façon possible (selon les paramètres, cela peut vouloir dire très vite, ou avec le maximum de points, ou les deux).

Le procédé de Deepak Pathak est plus complexe. Car cette fois-ci l’intelligence artificielle n’est plus récompensée en atteignant un objectif donné, mais plutôt à chaque fois qu’elle découvre quelque chose qui lui permettra de progresser dans le jeu. Cela sous entend que l’on motive l’intelligence à faire preuve de curiosité, plutôt que de lui faire atteindre un objectif précis.

D’après Deepak Pathak, c’est en quelque sorte la base de l’apprentissage de la vie. Même si l’on ne réussit pas ce que l’on entreprend, chaque essai reste riche d’enseignements.

Des mouvements plus fluides dans les jeux vidéo, mais pas forcément de victoire

Dans Mario Bros, son intelligence artificielle se montre très hésitante en début de partie, puis parvient à prendre de la vitesse. Un obstacle franchit d’une certaine manière sera franchit instantanément par la suite, à moins que l’environnement du jeu ne change le contexte. Reste que « l’agent » (comme il est évoqué par les chercheurs) n’a atteint que 30% du niveau qui lui était proposé pour le moment. L’IA a stoppé sa progression, soit pour protéger la vie de Mario face à un obstacle qu’elle ne parvient pas à franchir (toujours dans une logique de ne pas perdre la partie), soit « parce qu’elle n’a pas compris qu’elle pouvait aller encore plus loin » d’après son créateur.

L’intelligence artificielle de Deepak Pathak a aussi été testée dans les labyrinthes de Doom, où ses déplacements se sont très vite révélés beaucoup plus fluides que les IA auto apprenantes classiques. Ces dernières se contentant de cartographier la carte en longeant les murs.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *