Crear videos hiperrealistas queda corto, la IA ahora busca armar 'minimundos' en 3D interactivos
Genie 3, de Google, es una de las apuestas más recientes de la industria tecnológica para usar la Inteligencia Artificial y generar minimundos interactivos, como si fueran un juego.

Ilustración promocional de mundos generados por el modelo Genie 3 de Google.
- Foto
Google DeepMind
Autor:
Actualizada:
Compartir:
Cuando piensa en Inteligencia Artificial, pueda que se le venga a la mente una interfaz tipo 'chatbot' como la de ChatGPT, Gemini, Grok o Claude, en la que ingresas una instrucción escrita y recibes una respuesta a manera de texto o imagen, y en algunos casos videos.
Aunque, los usos que se les da a este tipo de herramienta, especialmente en sectores de nicho, son cada vez más avanzados.
Uno de ellos es el de usarla para crear minimundos virtuales, en los que se propone una interacción similar a la de un videojuego en primera persona.
Genie 3, la apuesta de Google
Genie 3, de Google, es el ejemplo más reciente de esta propuesta, que incluso se ha atrevido a crear una versión 'navegable' del cuadro de Edward Hooper, Noctámbulos.
El nombre de estos modelos que permiten la creación de mundos es bastante frontal: modelos de mundo (world models, en inglés).
Como recordatorio, el nombre de los modelos en el que se basan los servicios de ChatGPT, Gemini, o aplicaciones similares es Large Language Models (LLM), que en español se traducen como grandes modelos de lenguaje.
Esta nueva tecnología, que forma parte del laboratorio de Google DeepMind, es capaz de crear "mundos dinámicos" en los que se puede navegar a una tasa de refresco fluida de 24 fotogramas por segundo por "algunos minutos" a una resolución de 720 píxeles.
Para ocupar este modelo, por ahora, se debe ser parte de un grupo reducido de prueba.
Genie 3 es el caso más reciente, y quizá por eso mismo uno de los más refinados, pero no es el único.
Muse, el sofisticado Frankestein de Microsoft
Ya en febrero de 2025 Microsoft presentaba Muse, que fue descrito como el "primer Modelo de acción humana y mundial" (World and Human Action Model o WHAM, en inglés).
En palabras sencillas, lo que hace este modelo es crear los "elementos visuales" o escenas de un videojuego, no un videojuego en sí. Pero dentro de él es posible que, en tiempo real, se puedan poner elementos adicionales, según se ha mostrado en algunos videos de demostración.
Las generaciones se han basado en el equivalente de siete años humanos de juego del título 'Bleeding Edge'.
La calidad visual de Muse dista mucho de lo que ha logrado Genie 3, tomando en cuenta los meses de diferencia, que en el campo de la inteligencia artificial pueden ser una eternidad.
Para entender la diferencia en calidad, los 'gameplay' de los videojuegos generados con Muse son de una resolución de apenas 300x180.
Son los detalles debajo de los pixeles, por decirlo de alguna manera, los que evidencian lo sofisticados que son estos nuevos modelos artificiales.
Según los investigadores de Microsoft, Muse es un "modelo de IA generativa que puede generar elementos visuales de juegos, acciones de controles, y ambos".
De momento, Muse y WHAM pueden ser probados únicamente mediante la plataforma de desarrollo Azure AI Foundry.
China no se queda atrás
En un evento mucho más desapercibido como el que generó DeepSeek en su momento, con un sacudón en las bolsas por temor que sembró en ChatGPT de OpenAi, a finales de julio la empresa china Tencent presentó HunyuanWorld 1.0.
Al igual que con DeepSeek, y a diferencia de Genie 3, Hunyuan World es un modelo de código abierto, es decir, que cualquiera con los conocimientos y equipos tecnológicos necesarios lo puede tomar libremente desde los repositorios oficiales para 'jugar' o experimentar con ellos.
Según explica Tencent, este modelo permite una experiencia inmersiva en 360°, la generación de escenarios para juegos, ser capaz de interactuar con objetos, e integrar simulaciones de físicas.
Hunyuan World 1.0 también es capaz de generar mundos ya sea a partir de imágenes o de texto, según exponen en su 'reporte' de investigación.
Compartir: