Une IA pour apprendre à Mario et Luigi à sauver Peach par eux-mêmes
Le Professeur Martin Butz et son équipe travaillent sur la création de l'intelligence sociale dans un jeu Super Mario, ce qui permet aux personnages de se parler en anglais. Cela les aide à apprendre en observant les actions des uns et des autres, et à collaborer pour atteindre un objectif commun.
NewsL'intelligence artificielle a fait des progrès importants pour s’approcher de la manière de penser d’un humain. Cependant, un domaine où l’AI reste toujours à la traîne est la capacité à exploiter la puissance des interactions sociales afin d’en apprendre davantage sur le monde. L’observation, la communication, l'imitation et la collaboration sont des outils essentiels d'apprentissages humains, et la recherche tente de les traduire dans le domaine de l'intelligence artificielle. Il reste cependant encore un très long chemin avant de pouvoir placer les capacités de notre cerveau à l'intérieur d'une puce de silicium.
Aussi c’est un grand pas réalisé par l’équipe du Professeur Butz qui a été réalisé. Dans un jeu vidéo clone de Super Mario, ils ont donc démontré l’importance de cette intelligence sociale en permettant à Luigi, Mario, Yoshi et Toad de parler les uns aux autres en anglais, d’apprendre des actions des uns et des autres, ainsi que de collaborer entre eux.
Au début du jeu, les quatre personnages sont équipés de différentes capacités et leurs connaissances sont limitées à des contrôles pour se déplacer dans le monde et des concepts abstraits comme des ennemis, pièces de monnaie, et des blocs. Comme pour un joueur humain commençant un jeu la première fois, ils n’ont aucune connaissance préalable de la façon dont ces entités se comportent ou interagissent avec les personnages.
Les quatre personnages dans le jeu ne peuvent être contrôlés directement par les utilisateurs à travers le clavier, mais sont motivés par quatre objectifs différents : la nourriture, la santé, l'achèvement du niveau, et en apprendre davantage sur le monde. En communiquant entre eux, en s’observant et en s’imitant, ils apprennent de nouvelles règles et de nouveaux concepts. Ensuite, un algorithme probabiliste leur permet de tirer rapidement des conclusions sur les règles qui régissent le monde afin qu'ils puissent utiliser ces connaissances pour progresser dans le niveau. Différentes jauges de comportement peuvent aussi être modulées. En fonction du niveau de curiosité appliqué à Mario, celui-ci peut « décider » de partir à la découverte de son environnement de manière autonome, en visitant les moindres recoins de son monde. Une jauge modulable permet aussi de définir le moral de Mario qui se montrera déprimé si la jauge est abaissée par exemple.
Les personnages apprennent les interactions entre les objets d’une manière probabilistes, très rapidement. Ainsi, une interaction avec un objet de type « détruire une boîte » permet d’obtenir une connaissance immédiate de cette règle (un essai). L’apprentissage des règles est très rapide.
Mais le personnage peut s'adapter quand les choses changent dans le monde, parce que chaque règle encode une croyance probabiliste codée en fonction des conséquences d'interaction.
À titre d'exemple, si Toad a compris comment collecter des pièces, Mario peut lui demander comment le faire et puis essayer de lui-même. Ou, pour aller au-delà d'une partie plus délicate dans le niveau, les deux pourraient travailler afin de se tenir sur la tête de l’un ou de l’autre pour atteindre des pièces de monnaie ou des blocs qu'ils ne pourraient pas autrement atteindre.
La tâche de compléter le niveau peut ne pas sembler trop complexe en elle-même, parce que d'autres logiciels pourraient facilement être mis en œuvre pour réaliser une attaque frontale de la solution. Ce qui rend ici cet exploit impressionnant, c’est ce que les personnages sont en mesure d'atteindre par leurs propres moyens, à travers leur propre curiosité et leur intelligence social, avec très peu d’instruction humaines explicites.
Selon Fabian Schrodt, l'un des principaux développeurs de l'équipe, l'un des objectifs principaux des chercheurs est de rendre l'intelligence sociale artificielle plus facile à enseigner. Le but est également d’avancer dans le domaine de l'interaction homme-machine, y compris dans des projets d’aide à la conduite.
Les demandes pourraient se concentrer sur les systèmes de soutien social qui peuvent communiquer au sujet de certains aspects du monde et en particulier certains ensembles d'interactions comme : « Vous avez X, peut-être que vous voulez faire maintenant Y » nous dit Butz. Tout système de soutien intelligent bénéficierait de ces capacités sociales.
Regardez maintenant la vidéo ci-dessous qui illustre ce que les personnages sont capables de réaliser en s’appuyant sur ces algorithmes. Fascinant !
Sources : Université de Tübingen via Gizmag et GoNintendo
Cet article vous a intéressé ? Vous souhaitez réagir, engager une discussion ? Ecrivez simplement un commentaire.