Los modelos de inteligencia artificial que juegan existen desde hace décadas, pero normalmente están especializados en un juego y centrados en ganar. Los investigadores de Google Deepmind tienen un objetivo diferente: crear un modelo que aprenda a jugar varios juegos 3D como un humano, mientras hace todo lo posible por comprender y actuar según sus instrucciones verbales. Introdujeron el modelo SIMA, que significa Scalable, Instructable, Multiworld Agent y actualmente está bajo investigación.
Con el tiempo, SIMA aprenderá a jugar a cualquier videojuego, incluso aquellos que no tienen un camino lineal hasta el final del juego o juegos de mundo abierto. Aunque el algoritmo no pretende reemplazar la IA del juego existente , se puede considerar más bien como un socio y compañero. Combina el aprendizaje del lenguaje natural con la comprensión de mundos 3D y el reconocimiento de imágenes.
Introducing SIMA: the first generalist AI agent to follow natural-language instructions in a broad range of 3D virtual environments and video games. 🕹️
It can complete tasks similar to a human, and outperforms an agent trained in just one setting. 🧵 https://t.co/qz3IxzUpto pic.twitter.com/02Q6AkW4uq
— Google DeepMind (@GoogleDeepMind) March 13, 2024
La empresa ha trabajado con varios desarrolladores de juegos, incluidos Hello Games, Embracer, Tuxedo Labs, Coffee Stain y otros, para entrenar y probar SIMA. Los investigadores conectaron SIMA a juegos como No Man’s Sky, Teardown, Valheim y Goat Simulator 3 para enseñarle al agente de IA los conceptos básicos para jugarlos.
El equipo eligió juegos que son más abiertos que los orientados a la narrativa para ayudar a SIMA a aprender habilidades generales de juego. Si has jugado o visto tutoriales de Goat Simulator, sabes que hacer cosas aleatorias y espontáneas es de lo que se trata el juego, y el equipo dice que ese es exactamente el tipo de espontaneidad que esperan inculcar en SIMA.
Para hacer esto, el equipo primero creó un nuevo entorno en el motor Unity. Luego, Google registró parejas de jugadores, uno controlando el juego y el otro dando instrucciones sobre qué hacer a continuación, para capturar las instrucciones habladas. Después de eso, los jugadores jugaron solos para mostrar a qué conducen sus acciones en el juego. Todo esto se enviaba a SIMA para que el agente pudiera aprender a predecir lo que sucedería a continuación en la pantalla. Actualmente, SIMA tiene alrededor de 600 habilidades básicas, como girar a la izquierda o subir escaleras, pero eventualmente aprenderá funciones más complejas.
SIMA no es un NPC con inteligencia artificial como NVIDIA y Convai, sino un jugador más en el juego que afecta el resultado. El colíder del proyecto SIMA, Frédéric Besse, dice que todavía es demasiado pronto para decir qué aplicaciones podrían encontrar estos agentes de IA en los juegos fuera de la investigación. Pero Google dijo que con modelos de IA más avanzados , SIMA eventualmente podrá realizar tareas más complejas y convertirse en un socio ideal.