Runway anuncia la familia GWM-1 de modelos del mundo

La empresa de IA Runway ha presentado GWM-1, su conjunto inicial de modelos del mundo diseñados para ir más allá de la generación de vídeo hacia áreas como la robótica y los avatares. Construidos sobre el modelo de texto a vídeo Gen-4.5, estos tres modelos especializados de autoregresión permiten simulaciones en tiempo real, creación de datos sintéticos e interacciones naturales similares a las humanas. El lanzamiento resalta el empuje de Runway en un campo competitivo dominado por gigantes tecnológicos.

Runway, conocida por sus herramientas de generación de vídeo, presentó GWM-1 como un trío de modelos postentrenados con datos específicos de dominio a partir de su base Gen-4.5. Este movimiento señala la expansión de la compañía desde las industrias creativas hacia aplicaciones de IA más amplias.

El primero, GWM Worlds, proporciona una interfaz para explorar entornos digitales con entradas de usuario en tiempo real que influyen en la generación de fotogramas. Los usuarios pueden especificar elementos del mundo, apariencias, reglas de física y acciones como movimientos de cámara o cambios ambientales, manteniendo la consistencia a lo largo de secuencias extendidas. Usos potenciales incluyen la previsualización en el desarrollo de juegos, configuraciones de realidad virtual y simulaciones educativas de sitios históricos. También permite entrenar agentes de IA, incluidos los de robótica.

GWM Robotics se centra en generar datos de entrenamiento sintéticos para mejorar los conjuntos de datos de robótica, incorporando objetos nuevos, instrucciones de tareas y variaciones ambientales. Esto ayuda a simular condiciones reales difíciles como el clima variable y permite pruebas de políticas más seguras y económicas en entornos virtuales antes de las pruebas físicas. Runway ofrece un SDK de Python para su API de robótica por solicitud.

GWM Avatars integra la generación de vídeo y voz para crear avatares que se mueven y expresan emociones de manera natural al hablar y escuchar, manteniendo conversaciones largas sin pérdida de calidad. Pronto se integrará en la aplicación web y la API de Runway.

Aunque aspira a modelos más unificados entre dominios, las versiones actuales de Runway son distintas. El CEO Cristóbal Valenzuela describió GWM-1 en X como «un gran paso hacia la simulación universal». La compañía entra en un espacio saturado con jugadores como Google y Nvidia, apuntando a la robótica, la física y las ciencias de la vida junto con el cine y los juegos.

Además, Runway reveló actualizaciones de Gen-4.5 con audio nativo, edición de audio y capacidades de vídeo multishot, además de una asociación con CoreWeave para los racks GB300 NVL72 de Nvidia que respaldarán el entrenamiento e inferencia de IA futuros.

Artículos relacionados

Photorealistic illustration depicting OpenAI's ChatGPT Images 2 launch, with AI generating text-rich infographics on a laptop screen.
Imagen generada por IA

OpenAI launches ChatGPT Images 2 image generation model

Reportado por IA Imagen generada por IA

OpenAI announced ChatGPT Images 2, its new AI image model, on Tuesday. The upgrade focuses on creating text-heavy professional visuals like infographics and study guides. It rolls out to all ChatGPT users with generation limits based on subscription plans.

Shanghai-based Fysics AI announced the launch of Fysiverse on Wednesday, a new-generation physics-based world model.

Reportado por IA

California-based Generalist AI has launched Gen-1, a new physical AI model that enables robots to handle tasks like folding laundry, fixing other robots and stuffing cash into wallets. The model draws on human dexterity data collected worldwide to teach robots 'physical common sense.' Co-founder Pete Florence described it as a major advance for real-world robotics.

OpenAI has launched GPT-Rosalind, a large language model trained specifically on biology workflows. The model, named after scientist Rosalind Franklin, aims to address challenges in handling massive biological datasets and specialized subfields. Access is currently limited to US-based entities due to safety concerns.

Este sitio web utiliza cookies

Utilizamos cookies para análisis con el fin de mejorar nuestro sitio. Lee nuestra política de privacidad para más información.
Rechazar