La empresa de IA Runway ha presentado GWM-1, su conjunto inicial de modelos del mundo diseñados para ir más allá de la generación de vídeo hacia áreas como la robótica y los avatares. Construidos sobre el modelo de texto a vídeo Gen-4.5, estos tres modelos especializados de autoregresión permiten simulaciones en tiempo real, creación de datos sintéticos e interacciones naturales similares a las humanas. El lanzamiento resalta el empuje de Runway en un campo competitivo dominado por gigantes tecnológicos.
Runway, conocida por sus herramientas de generación de vídeo, presentó GWM-1 como un trío de modelos postentrenados con datos específicos de dominio a partir de su base Gen-4.5. Este movimiento señala la expansión de la compañía desde las industrias creativas hacia aplicaciones de IA más amplias.
El primero, GWM Worlds, proporciona una interfaz para explorar entornos digitales con entradas de usuario en tiempo real que influyen en la generación de fotogramas. Los usuarios pueden especificar elementos del mundo, apariencias, reglas de física y acciones como movimientos de cámara o cambios ambientales, manteniendo la consistencia a lo largo de secuencias extendidas. Usos potenciales incluyen la previsualización en el desarrollo de juegos, configuraciones de realidad virtual y simulaciones educativas de sitios históricos. También permite entrenar agentes de IA, incluidos los de robótica.
GWM Robotics se centra en generar datos de entrenamiento sintéticos para mejorar los conjuntos de datos de robótica, incorporando objetos nuevos, instrucciones de tareas y variaciones ambientales. Esto ayuda a simular condiciones reales difíciles como el clima variable y permite pruebas de políticas más seguras y económicas en entornos virtuales antes de las pruebas físicas. Runway ofrece un SDK de Python para su API de robótica por solicitud.
GWM Avatars integra la generación de vídeo y voz para crear avatares que se mueven y expresan emociones de manera natural al hablar y escuchar, manteniendo conversaciones largas sin pérdida de calidad. Pronto se integrará en la aplicación web y la API de Runway.
Aunque aspira a modelos más unificados entre dominios, las versiones actuales de Runway son distintas. El CEO Cristóbal Valenzuela describió GWM-1 en X como «un gran paso hacia la simulación universal». La compañía entra en un espacio saturado con jugadores como Google y Nvidia, apuntando a la robótica, la física y las ciencias de la vida junto con el cine y los juegos.
Además, Runway reveló actualizaciones de Gen-4.5 con audio nativo, edición de audio y capacidades de vídeo multishot, además de una asociación con CoreWeave para los racks GB300 NVL72 de Nvidia que respaldarán el entrenamiento e inferencia de IA futuros.