Un equipo de científicos, liderados por Max Jaderberg, han enseñado a una inteligencia artificial a jugar a un popular videojuego multijugador en primera persona (Quake III) con habilidades similares a las de los humanos, una tarea previamente imposible para este tipo de tecnología debido a la cantidad de eventos y tácticas involucradas, muchas de ellas sin regla ni cronologías lógicas.
La IA demostró una extraña habilidad para desarrollar y utilizar estrategias de alto nivel aprendidas de forma independiente para competir contra jugadores humanos y cooperar con su equipo (formado también por humanos) en el entorno del juego.
Para llegar a este resultado, el equipo de Jaderberg entrenó a la IA con el sistema de aprendizaje por refuerzo (RL por sus siglas en inglés). Básicamente se trata de enseñarle a un software las acciones más adecuadas para alcanzar una meta.
El método no es nuevo, ya que se había utilizado anteriormente en máquinas que aprendieron a jugar al Go y al ajedrez. La diferencia es que en estos casos se trata de dos jugadores que tienen cada uno sus turnos en la partida, mientras que en los videojuegos, hay colaboración entre varios jugadores y no hay turnos que respetar y la reacción al movimiento del adversario debe ser instantánea si se quiere ganar.
En contraste con estudios anteriores, donde la IA recibía información sobre el entorno del juego o el estado de otros jugadores, el equipo de Jaderberg le dio a cada máquina su propio tiempo para aprender a jugar y a crear su estrategia individual usando solo lo que podía «ver «(píxeles) y la puntuación del juego. Y luego enfrenó a varias IA entre sí en miles de partidas generadas aleatoriamente. Según los autores del estudio, publicado en Science, a lo largo del tiempo, la IA desarrolló de forma independiente estrategias de alto nivel, no muy diferentes a las utilizadas por los jugadores humanos expertos. Lo que es más, en los juegos con jugadores humanos, los agentes superaron a los humanos, incluso cuando los tiempos de reacción eran similares. Por si fuera poco también pudieron formar y cooperar en equipos informáticos y humanos formados en el momento.