Runway presenterar GWM-1-familjen av världmodeller

AI-företaget Runway har lanserat GWM-1, sin första samling världmodeller utformade för att sträcka sig bortom vide generering till områden som robotik och avatarer. Byggda på Gen-4.5 text-till-video-modellen gör dessa tre specialiserade autoregressiva modeller realtidssimuleringar, syntetisk dataskapande och naturliga mänsklighetsliknande interaktioner möjliga. Lanseringen belyser Runways framstöt in i ett konkurrensutsatt fält dominerat av teknologijättar.

Runway, känt för sina vide genereringsverktyg, introducerade GWM-1 som en trio modeller eftertränade på domänspecifika data från sin Gen-4.5-grund. Detta drag signalerar företagets expansion från kreativa industrier till bredare AI-applikationer.

Den första, GWM Worlds, tillhandahåller ett gränssnitt för att utforska digitala miljöer med realtidsanvändarinmatningar som påverkar ramgenerering. Användare kan ange världselement, utseenden, fysikregler och åtgärder som kamerarörelser eller miljöförändringar, och bibehålla konsistens över utsträckta sekvenser. Potentiella användningsområden inkluderar förvisualisering i spelutveckling, VR-uppsättningar och utbildningsmässiga simuleringar av historiska platser. Den stöder också träning av AI-agenter, inklusive de för robotik.

GWM Robotics fokuserar på att producera syntetiska träningsdata för att förbättra robotikdataset, inklusive nya objekt, uppgiftsinstruktioner och miljövariationer. Detta underlättar simulering av utmanande verkliga förhållanden som varierande väder och möjliggör säkrare, kostnadseffektiv politiktestning i virtuella miljöer före fysiska försök. Runway erbjuder ett Python SDK för sin robotik-API på per-förfrågan-basis.

GWM Avatars integrerar video- och talgenerering för att skapa avatarer som rör sig och uttrycker känslor naturligt under tal och lyssning, och upprätthåller långa samtal utan kvalitetsförlust. Den kommer snart att integreras i Runways webbapp och API.

Även om målet är mer enhetliga modeller över domäner är Runways nuvarande versioner distinkta. VD Cristóbal Valenzuela beskrev GWM-1 på X som "ett stort steg mot universell simulering". Företaget träder in i en trångt område med aktörer som Google och Nvidia, och riktar sig mot robotik, fysik och livsvetenskaper vid sidan av film och spel.

Dessutom avslöjade Runway Gen-4.5-uppdateringar med inbyggt ljud, ljudredigering och multi-shot-videofunktioner, plus ett partnerskap med CoreWeave för Nvidias GB300 NVL72-rack för att stödja framtida AI-träning och inferens.

Relaterade artiklar

Photorealistic illustration depicting OpenAI's ChatGPT Images 2 launch, with AI generating text-rich infographics on a laptop screen.
Bild genererad av AI

OpenAI launches ChatGPT Images 2 image generation model

Rapporterad av AI Bild genererad av AI

OpenAI announced ChatGPT Images 2, its new AI image model, on Tuesday. The upgrade focuses on creating text-heavy professional visuals like infographics and study guides. It rolls out to all ChatGPT users with generation limits based on subscription plans.

Shanghai-based Fysics AI announced the launch of Fysiverse on Wednesday, a new-generation physics-based world model.

Rapporterad av AI

California-based Generalist AI has launched Gen-1, a new physical AI model that enables robots to handle tasks like folding laundry, fixing other robots and stuffing cash into wallets. The model draws on human dexterity data collected worldwide to teach robots 'physical common sense.' Co-founder Pete Florence described it as a major advance for real-world robotics.

OpenAI has launched GPT-Rosalind, a large language model trained specifically on biology workflows. The model, named after scientist Rosalind Franklin, aims to address challenges in handling massive biological datasets and specialized subfields. Access is currently limited to US-based entities due to safety concerns.

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj