RunwayがGWM-1ワールドモデルファミリーを発表

AI企業Runwayは、ビデオ生成を超えてロボティクスやアバターなどの分野に拡大するよう設計された初期のワールドモデルセットGWM-1を公開した。Gen-4.5テキスト-to-ビデオ・モデルを基盤とし、これら3つの専門的な自己回帰モデルはリアルタイムシミュレーション、合成データ作成、自然な人間らしいインタラクションを可能にする。この発売は、テックジャイアントが支配する競争の激しい分野へのRunwayの進出を強調している。

ビデオ生成ツールで知られるRunwayは、Gen-4.5基盤からドメイン特化データで後訓練されたGWM-1を3つのモデルとして導入した。この動きは、クリエイティブ産業からより広範なAIアプリケーションへの同社の拡大を示している。

最初にGWM Worldsは、リアルタイムのユーザー入力がフレーム生成に影響を与えるデジタル環境の探索インターフェースを提供する。ユーザーはワールド要素、外観、物理法則、カメラ移動や環境変化などのアクションを指定でき、長大なシーケンスで一貫性を維持する。潜在的な用途にはゲーム開発のプレビジュアライゼーション、VRセットアップ、歴史サイトの教育シミュレーションが含まれる。また、ロボティクスを含むAIエージェントの訓練もサポートする。

GWM Roboticsは、ロボティクスデータセットを強化するための合成訓練データを生成することに焦点を当て、新規オブジェクト、タスク指示、環境変動を組み込む。これにより、変動する天候などの厳しい現実世界条件をシミュレートし、物理試験前の仮想環境での安全でコスト効果の高いポリシーテストが可能になる。RunwayはロボティクスAPI向けにリクエストベースのPython SDKを提供する。

GWM Avatarsはビデオと音声生成を統合し、話す・聞く際に自然に動き感情を表現するアバターを作成し、品質低下なしに長い会話を維持する。近日中にRunwayのウェブアプリとAPIに統合される。

ドメイン横断的なより統一されたモデルを目指しつつ、Runwayの現行バージョンは別々だ。CEOのCristóbal ValenzuelaはXでGWM-1を「ユニバーサルシミュレーションへの大きな一歩」と表現した。同社はGoogleやNvidiaなどの混雑した分野に参入し、映画・ゲームに加えロボティクス、物理学、ライフサイエンスをターゲットとする。

さらに、RunwayはGen-4.5のアップデートを公開し、ネイティブオーディオ、オーディオ編集、マルチショットビデオ機能を備え、将来のAI訓練・推論をサポートするNvidia GB300 NVL72ラック向けにCoreWeaveとの提携を発表した。

関連記事

Photorealistic illustration depicting OpenAI's ChatGPT Images 2 launch, with AI generating text-rich infographics on a laptop screen.
AIによって生成された画像

OpenAI launches ChatGPT Images 2 image generation model

AIによるレポート AIによって生成された画像

OpenAI announced ChatGPT Images 2, its new AI image model, on Tuesday. The upgrade focuses on creating text-heavy professional visuals like infographics and study guides. It rolls out to all ChatGPT users with generation limits based on subscription plans.

Shanghai-based Fysics AI announced the launch of Fysiverse on Wednesday, a new-generation physics-based world model.

AIによるレポート

California-based Generalist AI has launched Gen-1, a new physical AI model that enables robots to handle tasks like folding laundry, fixing other robots and stuffing cash into wallets. The model draws on human dexterity data collected worldwide to teach robots 'physical common sense.' Co-founder Pete Florence described it as a major advance for real-world robotics.

OpenAI has launched GPT-Rosalind, a large language model trained specifically on biology workflows. The model, named after scientist Rosalind Franklin, aims to address challenges in handling massive biological datasets and specialized subfields. Access is currently limited to US-based entities due to safety concerns.

このウェブサイトはCookieを使用します

サイトを改善するための分析にCookieを使用します。詳細については、プライバシーポリシーをお読みください。
拒否