Dos en un mundo: RELATO

Hace poco la Inteligencia Artificial, ha podido ganar a dos juegos relativamente complejos.



Uno es el "Moctezuma Revenge" de la Atari, un videojuego que combina plataformas con exploración y resolución de puzles (necesitas llaves para abrir puertas etc) y que te mata de las maneras más gratuítas. He probado a jugarlo, y es realmente complicado.
El algortimo, Go-Explore (UberLabs), una red neuronal comvolucional, ha podido conseguir una puntuación sobrehumana, dándole varias vueltas al marcador. Tenía varias ayudas como la de que su terreno estaba más pixelado de lo normal, y además, en blanco y negro, además es un sistema determinista (al hacer X siempre sale Y) y  dándole información de su avance.

Fuente

Juego



Otro hito, es que la IA Deepmind (Google), ha ganado a jugadores profesionales del Starcraft II, TLO y Mana (son humanos, por raro que sean sus nombres), perdiendo una partida y ganando las otras nueve.
Starcraft es un juego de los creadores de WoW que consiste en derribar la base del enemigo, un juego de estrategia similar al tan famoso League of Legends. La cosa, es que el agente que juega, ya sea humano o no, solo puede ver un fragmento del mundo a recorrer en su pantalla, no todo, como de costumbre en los juegos en los que haya jugado la IA. Por lo que para ello tuvo que resolver el problema del marco.


Pero... ¿Podría una IA jugar a un juego tan complejo como sería Minecraft?
He escrito un relato en el que se mostraría como sería la experiencia.



" Arthur y Max son dos jugadores primerizos de Minecraft, un videojuego que simula un mundo real a base de bloques, un mundo natural del que sacar recursos y construir cosas. El problema de este juego es que no es apenas lineal, dándo demasiada libertad al jugador y marcando solo un objetivo final "matar al dragón", a partir del cual el juego no acaba sino que sigue hasta el infinito.

- Arthur y Max tienen una serie de reglas,
- Ambos solo pueden utilizar en su juego las teclas de desplazarse, agacharse, saltar, y los botones derecho e izquierdo del ratón (atacar o poner bloques e interactuar).
- Arthur puede aprender de otros jugadores viendo videos en youtube o en guías mientras que Max solo puede aprender de su compañero.
- Arthur ve el mundo tal cual mientras que Max lo ve ligeramente más pixelado.
- Max no puede matar a Arthur.
- Si Arthur ha aprendido algo, se le comunica a Max como lo ha hecho, indicando teclas y procedimientos.

Arthur es humano, Max es una compleja red neuronal convolucional, mezclada con técnicas de aprendizaje simbólico.

DIA 1= Empiezan los dos en el mundo. Aprenden a desplazarse y saltar a modo de probar teclas. Arthur sigue a Max para que no se pierda, pero este pronto acaba saltando por un precipicio y muriendose. Ha aprendido que no solo hay gravedad sino que hay daño por caída.

Arthur vuelve al spawn (zona de regeneración) en busca de su compañero.
Siguen dándo vueltas hasta que cae la noche, aparecen una serie de mosntruos que matan a ambos.

DIA 2= Arthur, ha visto varios tutoriales, por lo que sabe los controles básicos y las mecánicas iniciales. Si construyes con algo en tu inventario solo puedes hacer un grupo reducido de cosas, para construir cosas más complejas se necesita una mesa de crafteo que hay que conseguir talando un árbol y creando tablillas en el inventario, uno de madera da cuatro bloques de tablillas con los que construirlo. Por lo que en su segundo día del mundo, se dedica a ello, Max le observa y lo imita.
Arthur crea la mesa y la pone a disposición de los dos.

Con la madera que le queda construye un pico de madera, ha visto picos en su vida y sabe lo que es, por lo que pica la piedra con él, Max le imita. Probando muchísimas combinaciones, da con la del pico. Ambos pican hasta que Max pica una mena de carbón y queda recompensado por ello.
Arthur también pica carbón y hace un horno con la piedra que ha conseguido. Cae la noche y deben defenderse, Arthur pega a los enemigos y mata a algunos, lo que le recompensa, Max hace lo mismo, solo que sabe los movimientos exactos de sus enemigos por pura observación. Aprende a luchar muy bien pese a no tener espada o armadura. Aun así vuelven a morir, pero de hambre.

DIA 3= Los dos siguen en el mundo, Arthur ha construido una rudimentaria casa con los bloques para defenderse, pero Max solo consigue colocar bloques al azar por el suelo, hasta que hace una cosntrucción exactamente igual a la de su compañero. Cae la noche pero no mueren ya que la casa les portege. Arthur construye un cofre para guardar las cosas y no perderlas, Max aprende a hacerlo, así no se tendrán que resetear de cero por cada muerte. Arthur se hace una espada y le da otra a Max.

Cuando llega la mañana Arthur va a una cueva, le divierte picar menas y matar enemigos, explorando cada rincón e iluminando con una antorcha a su paso. En cambio Max, evita las cuevas y cava sus propios túneles, una tareá que Arthur ve demasiado repetitiva y aburrida, pero a Max le funciona, ha conseguido el doble de recursos que su compañero.

Guardan todo en el cofre. Arthur explora el mundo y caza monstruos mientras que Max sigue vaciando el mundo a base de túeneles.
Arthur visita los túneles de su compañero, están iluminados con antorchas a intervalos regulares y todos tienen una forma perfecta, en cuanto hay una cueva, Max cava hacia otro lado evitando el peligro. Arthur se pierde por el laberinto de túneles y cava hacia arriba para salir, Max lo tiene perfectamente memorizado, pero no solo eso, sino que memoriza cada bloque que ha visto, mientras que Arthur tiene una vaga y abstracta idea. Lo que Arthur ve como "Por aquí está nuestra casa, al lado de un río y unos cuantos arboles, delante una alta montaña." Max lo ve como un perfecto mapa. Max sabe que hay un montículo de bloques que supera en altura al resto, dónde Arthur ve una montaña. Que cerca de la construcción que realizaron, hay una masa de bloques que se pueden atravesar, pero si pasas demasiado tiempo en ellos te mueres. A eso Max le llama río, agua y ahogarse.

DIA 4= Arthur tiene una bonita casa, decorada con varias cosas que ha recogido por ahí y bloques que imiten muebles como sillas o mesas. Max no para de poner bloques y antorchas alrededor de casa para aumentar la zona segura.
Arthur, ha conseguido crear una granja con vallas y atrayendo animales, pero Max ha matado a todos lo animales para conseguir sus recursos, por lo que Arthur ha hecho otra escondida de Max, ha críado a los animales, lo que le da recompensas mayores y poder seguir generando animales, cuando lo ha conseguido se lo ha enseñado a su compañero.

También ha hecho cultivos para no morir de hambre.

Una vez consiguiron bajar y picar un mineral rojizo llamado redstone, con un pico de hierro, Max lo intentó con el de madera pero el mineral no salía una vez rompiendo el bloque, por lo que aprendió que solo se podía obtener con un pico de hierro o mayor.

Arthur cosntruyó algúnos circuitos básico de redstone, para encender luces o hacer puertas automáticas. Max lo aprendió demasiado bien. hasta el punto de conseguir crear murallas retráctiles, relojes electricos, granjas para conseguir todo tipo de cosas y demás perogrulladas absurdamente complejas, aparte de sus galerías de túneles.

La partida de Arthur era divertida e imaginativa, con entusiasmo por la exploración, en cambio Max hacía cosas que Arthur consideraría largas y muy aburridas pero mucho más eficientes.

Continuará...














Comentarios

Entradas populares de este blog

Los robots sexuales

Prometeus

Trilogía "The Sprawl"