RunwayがGWM-1ワールドモデルファミリーを発表

AI企業Runwayは、ビデオ生成を超えてロボティクスやアバターなどの分野に拡大するよう設計された初期のワールドモデルセットGWM-1を公開した。Gen-4.5テキスト-to-ビデオ・モデルを基盤とし、これら3つの専門的な自己回帰モデルはリアルタイムシミュレーション、合成データ作成、自然な人間らしいインタラクションを可能にする。この発売は、テックジャイアントが支配する競争の激しい分野へのRunwayの進出を強調している。

ビデオ生成ツールで知られるRunwayは、Gen-4.5基盤からドメイン特化データで後訓練されたGWM-1を3つのモデルとして導入した。この動きは、クリエイティブ産業からより広範なAIアプリケーションへの同社の拡大を示している。

最初にGWM Worldsは、リアルタイムのユーザー入力がフレーム生成に影響を与えるデジタル環境の探索インターフェースを提供する。ユーザーはワールド要素、外観、物理法則、カメラ移動や環境変化などのアクションを指定でき、長大なシーケンスで一貫性を維持する。潜在的な用途にはゲーム開発のプレビジュアライゼーション、VRセットアップ、歴史サイトの教育シミュレーションが含まれる。また、ロボティクスを含むAIエージェントの訓練もサポートする。

GWM Roboticsは、ロボティクスデータセットを強化するための合成訓練データを生成することに焦点を当て、新規オブジェクト、タスク指示、環境変動を組み込む。これにより、変動する天候などの厳しい現実世界条件をシミュレートし、物理試験前の仮想環境での安全でコスト効果の高いポリシーテストが可能になる。RunwayはロボティクスAPI向けにリクエストベースのPython SDKを提供する。

GWM Avatarsはビデオと音声生成を統合し、話す・聞く際に自然に動き感情を表現するアバターを作成し、品質低下なしに長い会話を維持する。近日中にRunwayのウェブアプリとAPIに統合される。

ドメイン横断的なより統一されたモデルを目指しつつ、Runwayの現行バージョンは別々だ。CEOのCristóbal ValenzuelaはXでGWM-1を「ユニバーサルシミュレーションへの大きな一歩」と表現した。同社はGoogleやNvidiaなどの混雑した分野に参入し、映画・ゲームに加えロボティクス、物理学、ライフサイエンスをターゲットとする。

さらに、RunwayはGen-4.5のアップデートを公開し、ネイティブオーディオ、オーディオ編集、マルチショットビデオ機能を備え、将来のAI訓練・推論をサポートするNvidia GB300 NVL72ラック向けにCoreWeaveとの提携を発表した。

関連記事

Photo illustration of Google executives unveiling the Gemini 3 AI model and Antigravity IDE in a conference setting.
AIによって生成された画像

GoogleがGemini 3 AIモデルとAntigravity IDEを発表

AIによるレポート AIによって生成された画像

Googleは、最新のフラッグシップAIモデルであるGemini 3 Proをリリースし、推論の改善、視覚出力、コーディング機能に重点を置いています。同社はまた、AI優先の統合開発環境であるAntigravityも導入しました。両者は本日より限定プレビューで利用可能です。

専門家は2026年をワールドモデルの画期的な年と予測しており、これらは大規模言語モデルよりも物理世界を深く理解するよう設計されたAIシステムである。これらのモデルはAIを現実に根ざすことを目指し、ロボット工学や自動運転車の進歩を可能にする。Yann LeCunやFei-Fei Liのような業界リーダーは、空間知能を革命化する可能性を強調している。

AIによるレポート

Googleは、実験的なAIプロトタイプであるGenie 3を最上位のAIプラン加入者に提供すると発表した。このツールは、シンプルなテキストプロンプトを使ってインタラクティブな3Dワールドを生成・探索できる。以前は信頼できるテスターに限定されていたが、この拡大は18歳以上のユーザーへのより広範なアクセスに向けた一歩となる。

GoogleはAI駆動の仮想試着機能を強化し、シンプルなセルフィーから全身アバターを生成可能にしました。このアップデートにより全身写真が不要になり、XSから4XL+までのサイズをサポートします。このツールは現在米国で利用可能で、5月に発売されたオリジナル版を基にしています。

AIによるレポート

GoogleはフラッグシップAIモデルの更新版であるGemini 3.1 Proをリリースしました。問題解決と推論の改善を強調しています。このモデルは本日から開発者と消費者向けにプレビュー版として利用可能です。11月のGemini 3リリースを基盤としています。

OpenAIはChatGPT向け画像生成モデルを更新し、4倍高速化しユーザー指示の追従性を向上させました。アップグレードには編集機能の改善とテキストレンダリングの強化が含まれます。これはGPT-5.2のリリース直後、GoogleのGeminiとの競争の中で行われます。

AIによるレポート

Razerは2026年のGame Developers Conference(GDC)で、自社のQA Companion-AIの強化機能とProject AVAおよびAdaptive Immersive Experienceの新機能を発表した。これらのツールは品質保証の自動化、ワークフローの合理化、ゲーム開発におけるマルチセンサリー効果の統合に焦点を当てている。これらの発表は既存のセットアップに大きな変更を必要とせずに効率を向上させることを目的としている。

 

 

 

このウェブサイトはCookieを使用します

サイトを改善するための分析にCookieを使用します。詳細については、プライバシーポリシーをお読みください。
拒否