元OpenAIの科学者Andrew Carr氏と元Googleクリエイティブ・ディレクターのJonathan Jarvis氏が設立した3DアニメーションのスタートアップCartwheelは、AIが生成するアニメーションの編集性と制御性の向上を目指している。同社は、単純な2D動画を正確な3Dスケルトンに変換することに注力しており、編集不可能な「ブラックボックス」型のプロンプトに頼るのではなく、アーティストが生成結果を細かく修正できるようにしている。創業者は、AIによる画一化を防ぎ、自由度の高いストーリーテリングを実現するための「制御レイヤー」の提供を重視している。
Andrew Carr氏とJonathan Jarvis氏がCartwheelを立ち上げたのは、現在の生成AIアニメーションツールが抱える限界に対処するためである。従来のツールでは、プロンプトから生成された映像に足が歪むなどの欠陥が生じても、最初からやり直さなければ修正が困難だった。彼らの手法では、2D入力から編集可能な3Dデータを生成する。例えば、裏庭で踊る動画をリアルな3Dスケルトンへと変換することが可能だ。これにより、クリエイターは生成後にポーズや照明、環境を調整できるようになり、AIを最終成果物を出すためのツールではなく、制作プロセスの一部として活用できる。「我々のシステムの出力は、人間が編集することを前提に設計されています。人が手を加え、操作するために作られているのです。プロンプトを入力して、AIが完成品のアニメーションを吐き出すのを待つようなツールにはしたくありません。それでは意味がないし、退屈で誰も見てくれないでしょう」とCarr氏は語る。創業者は、大手テクノロジー企業が利用している膨大なテキストや画像、動画と比較して、3Dモーションデータが不足している点を指摘する。「データ収集が困難であることは覚悟していましたが、実際には予想の10倍から100倍は大変でした」とJarvis氏は述べた。Cartwheelは人間の動きをマッピングすることで、精緻なパフォーマンスモデルを構築している。将来を見据え、同社はゲームやソーシャルメディアにおけるリアルタイムで反応するキャラクターの実現や、自由度の高いワールド構築の支援を構想している。Carr氏は、「今後3年以内に、たとえ最終的な出力が2Dビデオであっても、制作は2Dで行われ、誰もが3Dで作業するようになる」という重要な仮説を披露した。ピクセル層の下の構造に焦点を当てることで、Cartwheelは技術的な作業を自動化しつつ、タイミングや感性といった人間ならではの創造性を維持することを目指している。