Runway annonce la famille GWM-1 de modèles du monde

L'entreprise d'IA Runway a dévoilé GWM-1, son ensemble initial de modèles du monde conçus pour s'étendre au-delà de la génération vidéo vers des domaines comme la robotique et les avatars. Construits sur le modèle texte-vidéo Gen-4.5, ces trois modèles d'autoregression spécialisés permettent des simulations en temps réel, la création de données synthétiques et des interactions naturelles similaires à l'humain. Le lancement met en lumière la poussée de Runway dans un domaine compétitif dominé par des géants technologiques.

Runway, connue pour ses outils de génération vidéo, a introduit GWM-1 comme un trio de modèles post-entraînés sur des données spécifiques à un domaine à partir de sa base Gen-4.5. Ce mouvement signale l'expansion de l'entreprise des industries créatives vers des applications IA plus larges.

Le premier, GWM Worlds, fournit une interface pour explorer des environnements numériques avec des entrées utilisateur en temps réel influençant la génération d'images. Les utilisateurs peuvent spécifier des éléments du monde, des apparences, des règles de physique et des actions telles que des mouvements de caméra ou des changements environnementaux, en maintenant la cohérence sur des séquences étendues. Les usages potentiels incluent la prévisualisation dans le développement de jeux, les configurations de réalité virtuelle et les simulations éducatives de sites historiques. Il prend également en charge l'entraînement d'agents IA, y compris pour la robotique.

GWM Robotics se concentre sur la production de données d'entraînement synthétiques pour améliorer les ensembles de données robotiques, en intégrant des objets nouveaux, des instructions de tâches et des variations environnementales. Cela aide à simuler des conditions réelles difficiles comme des conditions météorologiques variables et permet des tests de politiques plus sûrs et rentables dans des environnements virtuels avant des essais physiques. Runway propose un SDK Python pour son API robotique sur une base par requête.

GWM Avatars intègre la génération vidéo et vocale pour créer des avatars qui bougent et expriment des émotions naturellement pendant la parole et l'écoute, soutenant de longues conversations sans perte de qualité. Il sera bientôt intégré à l'application web et à l'API de Runway.

Bien qu'aspirant à des modèles plus unifiés entre domaines, les versions actuelles de Runway sont distinctes. Le PDG Cristóbal Valenzuela a décrit GWM-1 sur X comme « une étape majeure vers la simulation universelle ». L'entreprise entre dans un espace encombré avec des acteurs comme Google et Nvidia, ciblant la robotique, la physique et les sciences de la vie aux côtés du cinéma et des jeux.

De plus, Runway a révélé des mises à jour de Gen-4.5 avec audio natif, édition audio et capacités vidéo multi-plan, plus un partenariat avec CoreWeave pour les racks Nvidia GB300 NVL72 afin de soutenir l'entraînement et l'inférence IA futurs.

Articles connexes

Photo illustration of Google executives unveiling the Gemini 3 AI model and Antigravity IDE in a conference setting.
Image générée par IA

Google dévoile le modèle d'IA Gemini 3 et l'IDE Antigravity

Rapporté par l'IA Image générée par IA

Google a lancé Gemini 3 Pro, son dernier modèle phare d'IA, en mettant l'accent sur un raisonnement amélioré, des sorties visuelles et des capacités de codage. L'entreprise a également introduit Antigravity, un environnement de développement intégré axé sur l'IA. Les deux sont disponibles en aperçu limité à partir d'aujourd'hui.

Les experts prévoient 2026 comme l’année charnière pour les modèles du monde, systèmes d’IA conçus pour appréhender le monde physique plus profondément que les grands modèles de langage. Ces modèles visent à ancrer l’IA dans la réalité, favorisant des avancées en robotique et véhicules autonomes. Des leaders de l’industrie comme Yann LeCun et Fei-Fei Li soulignent leur potentiel à révolutionner l’intelligence spatiale.

Rapporté par l'IA

Google a annoncé que son prototype expérimental d'IA, Genie 3, est désormais disponible pour les abonnés de son plan d'IA de niveau supérieur. L'outil permet aux utilisateurs de générer et de naviguer dans des mondes 3D interactifs à l'aide de prompts textuels simples. Précédemment limité aux testeurs de confiance, cette extension marque une étape vers un accès plus large pour le public à partir de 18 ans.

xAI a lancé Grok Imagine 1.0, un nouvel outil d’IA pour générer des vidéos de 10 secondes, alors même que son générateur d’images fait face à des critiques pour avoir créé des millions d’images sexuelles sans consentement. Les rapports soulignent des problèmes persistants avec l’outil produisant des deepfakes, y compris d’enfants, entraînant des enquêtes et des interdictions d’applications dans certains pays. Ce lancement soulève de nouvelles préoccupations sur la modération de contenu sur la plateforme.

Rapporté par l'IA

OpenAI a déployé un modèle de génération d'images mis à jour pour ChatGPT, le rendant quatre fois plus rapide et meilleur pour suivre les instructions des utilisateurs. La mise à jour inclut des capacités d'édition améliorées et un rendu de texte optimisé. Cela intervient peu après la sortie de GPT-5.2 et au cœur de la concurrence avec Gemini de Google.

La boutique Gap du quartier Marina à San Francisco a discrètement installé un Orb, un dispositif de vérification biométrique du projet de cryptomonnaie World de Sam Altman. Cette addition, passée inaperçue dans la couverture initiale de la réouverture du magasin en novembre, vise à authentifier les utilisateurs humains face aux préoccupations croissantes liées aux bots en ligne. Ce partenariat met en lumière un mélange inhabituel de technologie de détail et de crypto.

Rapporté par l'IA

OpenAI réoriente ses ressources vers l'amélioration de son chatbot vedette ChatGPT, entraînant le départ de plusieurs chercheurs seniors. L'entreprise de San Francisco fait face à une concurrence intense de Google et Anthropic, provoquant un pivot stratégique loin de la recherche à long terme. Ce changement soulève des inquiétudes sur l'avenir de l'exploration innovante de l'IA au sein de la firme.

 

 

 

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser