La IA de OpenAI ha aprendido a jugar Minecraft tras entrenarse con 70 mil horas de video en Internet. La compañía indicó que la inteligencia artificial es capaz de hacer todas las actividades del videojuego y que, incluso, se desempeña muy bien.
“Con un ajuste fino, nuestro modelo puede aprender a fabricar herramientas de diamante, una tarea que normalmente lleva a los humanos competentes más de 20 minutos (24.000 acciones). Nuestro modelo utiliza la interfaz humana nativa de pulsaciones de teclas y movimientos del mouse, lo que lo hace bastante general y representa un paso hacia los agentes generales que usan computadoras”, aseguró OpenAI en el artículo.
“Internet contiene una enorme cantidad de videos disponibles y públicos, de los que podemos aprender. Puedes ver a una persona hacer una hermosa presentación, un artista digital dibujar una hermosa puesta de sol y un jugador de Minecraft construir una casa intrincada. Sin embargo, estos videos solo brindan un registro de lo que sucedió, pero no exactamente cómo se logró, es decir, [la IA] no sabrá la secuencia exacta de movimientos del mouse y teclas presionadas”, añadió.
MIRA: Parti, el nuevo modelo de Google que genera imágenes fotorrealistas a partir de textos
Es decir, la IA no pudo aprender qué teclas utilizar para realizar las acciones, por lo que los desarrolladores tuvieron que preentrenarla. “Con el fin de utilizar la gran cantidad de datos de video sin etiquetar disponibles en Internet, presentamos un método de aprendizaje de imitación semisupervisado novedoso, pero simple: Video PreTraining (VPT). Comenzamos recopilando un pequeño conjunto de datos de los contratistas donde grabamos no solo su video, sino también las acciones que realizaron, que en nuestro caso son pulsaciones de teclas y movimientos del mouse”, indicó.
“Con estos datos entrenamos un modelo de dinámica inversa (IDM), que predice la acción que se está tomando en cada paso del video. Es importante destacar que el IDM puede usar información pasada y futura para adivinar la acción en cada paso. Esta tarea es mucho más fácil y, por lo tanto, requiere muchos menos datos que la tarea de clonación de comportamiento de predecir acciones solo con fotogramas de video pasados, lo que requiere inferir lo que la persona quiere hacer y cómo lograrlo. Luego podemos usar el IDM entrenado para etiquetar un conjunto de datos mucho más grande de videos en línea y aprender a actuar a través de la clonación de comportamiento”, añadió OpenAI.
MIRA: Probamos DALL-E Mini, la IA que “crea arte”, y este es el curioso resultado que nos dio ante frases sobre el Perú
Este modelo generó que la IA pueda realizar las mismas acciones que los humanos. “Entrenado con 70.000 horas de video en línea etiquetado por IDM, nuestro modelo de clonación de comportamiento (el “modelo básico VPT”) realiza tareas en Minecraft que son casi imposibles de lograr con el aprendizaje reforzado desde cero. Aprende a talar árboles para recolectar troncos, a convertir esos troncos en tablones y luego a convertir esos tablones en una mesa de trabajo; esta secuencia le lleva a un humano experto en Minecraft aproximadamente 50 segundos o 1,000 acciones de juego consecutivas”, aseguró.
Finalmente, en sus conclusiones, la compañía cree que esta prueba puede ser un paso para que la IA pueda aprender a utilizar computadoras por sí solas. “Si bien solo experimentamos en Minecraft, el juego es muy abierto y la interfaz humana nativa (mouse y teclado) es muy genérica, por lo que creemos que nuestros resultados son un buen augurio para otros dominios similares, por ejemplo, el uso de la computadora”, concluyó.
Contenido sugerido
Contenido GEC