専門家は2026年をワールドモデルの画期的な年と予測しており、これらは大規模言語モデルよりも物理世界を深く理解するよう設計されたAIシステムである。これらのモデルはAIを現実に根ざすことを目指し、ロボット工学や自動運転車の進歩を可能にする。Yann LeCunやFei-Fei Liのような業界リーダーは、空間知能を革命化する可能性を強調している。
AIの風景は、ChatGPTやGeminiを動かすテキスト生成の大規模言語モデルから、物理環境を解釈するワールドモデルへと移行している。これらのシステムは、物理法則、物体検出、運動などの要素をAIが処理可能なデジタル形式に変換し、現実世界で理解するだけでなく行動する物理AIの基盤を形成する。 インタラクティブなチャットボットとは異なり、ワールドモデルは現実的なビデオ生成、外科用ロボット、改良された自動運転などのアプリケーションを支えるだろう。その開発は、AIの時折の幻覚から、より信頼性が高く現実に基づいた出力への移行を示している。 著名な人物がこの移行を推進している。AI研究者の主要人物であるYann LeCunは最近、MetaのAIイニシアチブの指導を離れ、ワールドモデルに特化したスタートアップに加わった。AIのゴッドマザーと呼ばれるFei-Fei Liは、11月のブログ投稿で空間知能の重要性を強調した:「空間知能は、現実世界と仮想世界を作成し交流する方法を変革する—ストーリーテリング、創造性、ロボット工学、科学的発見などを革命化する。」 NvidiaのCEOであるJensen HuangはCES 2026の基調講演でワールドモデルを取り上げ、トレーニングデータの役割を強調した:「物理法則とグラウンドトゥルースに基づくAIモデルを構築するには、トレーニングに使用するデータから始まる。」NvidiaのCosmosプラットフォームはこれを体現しており、車両センサーを用いて周囲をリアルタイムでマッピングし、事故などのシナリオをシミュレートして安全性を向上させる。このようなモデルは、人間生成コンテンツやシミュレーションを含む膨大なデータセットに依存するが、後者はデータ使用に関する法的懸念や希少なエッジケースを合成データで解決するのに役立つ。 ワールドモデルへのこの焦点は、AI業界が仮想テキスト機能の拡大よりも物理世界との統合を優先していることを示している。