Google ha introducido Genie 3, un modelo de lenguaje innovador desarrollado por DeepMind, que promete revolucionar el terreno de la inteligencia artificial al simular entornos fotorrealistas. Este avance es considerado un trampolín hacia la superinteligencia artificial, ya que Genie 3 es capaz de generar simulaciones duraderas que pueden ser empleadas para entrenar agentes de propósito general. La compañía ha afirmado que los entornos generados son consistentes y que Genie es capaz de recordar lo que ha creado anteriormente.
Según una publicación en el blog de DeepMind, Genie 3 combina características de su predecesor y de Veo 3, el modelo que permite crear videos a partir de texto. A diferencia de Genie 2, que ofrecía escenarios interactivos de solo unos pocos segundos, la nueva IA presenta simulaciones de múltiples minutos en resolución 720p. Los usuarios pueden interactuar con estos entornos mediante el teclado o controles direccionales.
Una de las características principales de Genie 3 es su enfoque en la generación autorregresiva, una técnica que le permite construir el mundo cuadro por cuadro mientras recuerda el contexto anterior. Esto le otorga coherencia física, permitiendo a los usuarios retroceder a momentos previos. A pesar de que esta técnica puede introducir ciertas imprecisiones, Google garantiza que los entornos permanecen coherentes, con una memoria visual de hasta un minuto.
En cuanto a su rendimiento, Genie 3 se destaca por la capacidad de generar escenas con propiedades físicas complejas, como una moto acuática desplazándose por un lago o una caminata a través de un bosque. Esto abre múltiples posibilidades para el desarrollo de escenarios dinámicos y variados.
Además, Genie 3 no solo está dirigido a la creación de mundos para videojuegos, sino que también se utiliza para entrenar a otros agentes de IA en diversas simulaciones. Google ha mencionado que realizó pruebas utilizando este nuevo modelo para instruir a su agente SIMA en realizar diversas acciones dentro de los mundos virtuales.
Los videos generados incluyen controles de navegación que permiten a los usuarios mover la cámara o desplazarse por los entornos. También existe la opción de programar interacciones a través de prompts basados en texto, facilitando así la elección de eventos que afectarán el desarrollo de la simulación, similar a lo visto en el episodio de Black Mirror: Bandersnatch.
Jack Parker-Holder, científico investigador de DeepMind, enfatiza la importancia de los modelos mundiales como una pieza clave en el camino hacia una inteligencia artificial general, especialmente para agentes integrados que enfrentan desafíos significativos al simular escenarios del mundo real.
Sin embargo, a pesar de los avances que presenta Genie 3, existen limitaciones. Por un lado, la simulación del comportamiento físico no está exenta de detalles, y la IA tiene dificultades para representar con precisión ubicaciones del mundo real. Además, no es factible que varios agentes interactúen dentro del mismo entorno, ni se pueden llevar a cabo entrenamientos prolongados.
Por el momento, Genie 3 no estará disponible para el público, aunque se están evaluando posibles accesos para investigadores y desarrolladores de IA. Google considera que este modelo podría impactar significativamente en el entrenamiento de robots y sistemas autónomos. La información presentada corresponde a la fecha de publicación original, el 5 de agosto de 2025.
Gracias por leer Columna Digital, puedes seguirnos en Facebook, Twitter, Instagram o visitar nuestra página oficial. No olvides comentar sobre este articulo directamente en la parte inferior de esta página, tu comentario es muy importante para nuestra área de redacción y nuestros lectores.


