Parcourant depuis sa Waterloo natale et comme à son habitude une bière à la main la souris dans l’autre un forum dont nous tairons le nom, Bertrand-Eude trouve soudain un sujet qui l’intéresse : IA et bots dans les jeux vidéos.
L’un des protagonistes de ce fil de discussion pose sur la table l’IA, à l’époque révolutionnaire, de Quake 3 Arena qui, non contente de savoir nager dans de superbes maillots de bain, était aussi connue pour son adaptabilité aux styles des joueurs.
He’s aliiiiiive
Le principe : appliquer au maximum de ce que l’époque permettait une sorte d’apprentissage génétique des meilleurs comportements à avoir.
Très basiquement : tu évolues, je m’adapte. Tu me butes, je cherche à comprendre pourquoi. Et le tour d’après, je ne reproduis pas le même schéma.
Le but du jeu de Quake 3 pour les plus jeunes d’entre vous (ou les sombres N00bs. Choisis ton camps camarade) : Une arène, 16 connards sous ritalin et un chrono. Le plus de tués = le plus de points.
Mais Quake 3 est sorti à une époque où l’on n’était pas toujours connecté (1999). On pouvait donc, en attendant la prochaine LAN, s’entrainer contre des bots. Des bots (que j’aime à imaginer portant le nom de Harry) dont la promesse était, nous l’avons vu, de s’adapter à ton jeu pour te forcer à te sortir de ta routine, de ta zone de confort.
Le son des bots au pas
Bertrand-Eude, s’ouvrant une deuxième bière, se souvient avec émoi qu’il avait mis au point une expérience à l’époque de la sortie du jeu pour vérifier si ce discours était du Bullshit marketing ou pas. Quelques années plus tôt, Bébert avait en effet paramétré un serveur pour que 16 bots s’affrontent en free for all ou «chacun pour sa peau» comme dirait le comité de la blague français.
Ce dont il ne se souvient pas en revanche, c’est d’avoir stoppé l’expérience. Quel putain de monde génial où l’on peut oublier une bécane.
Quelques «mots de passe oubliés» plus tard, Bertrand-Eude retrouve ce serveur tournant toujours vaillamment, faisant vivre un univers parallèle et ses 16 Harry l’habitant. Hélas, c’est avec une certaine déception qu’il constate que rien ne bouge. Pas un seul des 16 bots ne semble faire quoi que ce soit. Bertrand-Eude change la map : même constat. Et, aussi loin que ses logs lui permettent de remonter, l’idée est la même : pas de mouvement. Les bots ne sont pas immobiles, ils tournent parfois sur eux-même, semblent observer, mais aucun déplacement n’est visible. Et ce depuis des années.
Il constate également que chaque bot possède une «mémoire» sorte de log de son évolution. Y est consigné tout ce qui fonctionne et ne fonctionne pas d’un point de vue survie et domination du monde. Chacun de ses 16 bots possèdent un fichier de 512 Mo à cet effet. 512 fucking méga. Pour qui est familier avec le monde des ordinateurs, ça ne sonne pas comme un hasard mais bien comme une limite. Comme la fin d’un apprentissage. Et ça commence à faire un bon pool de data.
What the Frag is happening ?
Détaillant les paramètres de son expérience sur ce même forum, Bertrand-Eude demande en toute simplicité si quelqu’un se sent d’attaque pour formuler une hypothèse. Il s’ouvre alors encore une bière et bascule en arrière dans son fauteuil avec l’air satisfait du mec qu’en colle une bonne.
Accroche toi à ton slip, parce que l’hypothèse la plus probable est également la plus INSANE-AWESOME-YOUTUBE.
Après des années à se défourailler la gueule non-stop, tous ces bots se connaissent par cœur. Ils connaissent leurs faiblesses et leurs forces mais aussi leurs stratégies préférées et celles de leurs adversaires. Leur but ultime, c’est de gagner. Mais ils ont également compris que pour gagner, faudrait déjà commencer par ne pas perdre. Et comment on perd dans un simulateur de meurtre ? En crevant. Et si y a pas de mort, y a pas de perdant.
Par conséquent, et ça ne s’est pas passé par d’interminables sommets du G16 de la castagne en ligne, par une succession innombrables d’essais et d’échecs, c’est le statu quo qui l’a remporté.
Tu m’butes pas, j’te bute pas. Tu perds pas, moi non plus. Tu gagnes pas, moi non plus. On est tous égaux.
Ils ont d’eux-mêmes (et j’insiste sur ce point) instauré la paix dans leur monde. Celui qu’on leur a créé. Un monde avec le pire climat possible : une arène avec des flingues et aucune échappatoire. Ils n’avaient aucune autre possibilité que de se mettre dessus. Et ils ont jugé plus efficace de ne pas le faire et de “vivre peinards“ que de se faire des injections de saturnisme à longueur de journée.
Il y aurait une analogie sympa à faire avec notre monde à nous. Mais on a pas le temps. Parce que j’dois te parler de ce qui suit. Et que je trouve encore mieux que tout ça.
Rencontre du seizième type
Voyant que ça ne bougeait plus, Bertrand-Eude a enfilé sa meilleure souris d’exploration urbaine, et a pris la place d’un des bots. Imagine un peu la sensation de déambuler parmi 15 parias numériques qu’on a laissé là quatre ans plus tôt pour qu’ils s’entretuent.
Et là, ce qui se passe est tout simplement grandiose : RIEN.
Bertrand-Eude déambule de pièce en pièce croisant ces bots immobiles mais pas tout à fait. Tous, sans exception, suivent du regard notre héros lorsqu’il passe devant eux.
Et après quelques minutes à errer dans un univers sans gagnant mais surtout sans perdant, la nature humaine de Bertrand-Eude reprend le dessus. Ivre, Bertrand-Eude tire sur l’un des bots.
Aussitôt, ça tonne sur Waterloo et le feu nucléaire s’abat sur lui. Tous les bots, ces IA qui n’avaient probablement pas utilisé leurs armes depuis des années se liguent entre eux et le punissent sur le champs.
Lui, l’humain venu troubler la paix d’un monde se portant bien mieux sans lui…
Ce film raconte leur histoire
*L’expérience et son résultat semblent vrais, le contexte est quelques peu romancé. Ça calme hein ?
Ça me rappelle cet article : http://www.numerama.com/magazine/25685-super-mario-bros-joue-par-une-intelligence-artificielle.html
Une IA est développée en se basant sur le fait que plus le score est bon, meilleur est le schéma utilisé et on voit cette même IA (dans la vidéo) roxxer à Mario et d’autres jeux mais se planter lamentablement au Tétris :
Dans un premier temps le moyen le plus rapide pour scorer étant de droper les pièces sans les bouger, mais quand viens la dernière ligne, il ne faut pas la franchir et donc, pause infinie (pour ne pas perdre).
La machine est rationnelle. L’homme non. Probablement l’une de ses plus grandes faiblesses. Mais probablement l’une de ses plus grandes forces aussi.
comme dans Wargame en fait