Cartwheel, une nouvelle startup spécialisée dans l'animation 3D fondée par l'ancien scientifique d'OpenAI, Andrew Carr, et l'ancien directeur créatif de Google, Jonathan Jarvis, cherche à rendre les animations générées par IA plus modifiables et contrôlables. L'entreprise se concentre sur la conversion de simples vidéos 2D en squelettes 3D précis, permettant ainsi aux artistes d'affiner les résultats plutôt que de dépendre de prompts « boîte noire » impossibles à modifier. Les fondateurs insistent sur la mise en place d'une « couche de contrôle » pour éviter l'uniformité de l'IA et permettre une narration ouverte.
Andrew Carr et Jonathan Jarvis ont lancé Cartwheel pour remédier aux limites des outils d'animation par IA générative actuels, où les prompts produisent souvent des résultats imparfaits, comme des pieds déformés, difficiles à corriger sans tout recommencer. Leur approche génère des données 3D modifiables à partir d'entrées 2D, transformant par exemple une vidéo de danse dans un jardin en un squelette 3D réaliste. Cela permet aux créateurs d'ajuster les poses, l'éclairage et les environnements après la génération, traitant l'IA comme un outil plutôt que comme un produit fini. « Le résultat de notre système est conçu pour être édité. Il est conçu pour être touché et manipulé, et nous ne voulons pas que quelqu'un tape quelque chose pour obtenir directement une animation terminée. Ce n'est pas le but. C'est ennuyeux, qui voudrait regarder ça ? » a déclaré Carr. Les fondateurs ont souligné la rareté des données de mouvement 3D par rapport à l'abondance de textes, d'images et de vidéos utilisés par les géants de la technologie. « Nous savions que ce serait difficile, mais il s'avère que c'est dix ou cent fois plus ardu que prévu pour obtenir ces données », a noté Jarvis. Cartwheel cartographie les mouvements humains pour construire des modèles de performance nuancés. À l'avenir, l'entreprise imagine une IA alimentant des personnages réactifs en temps réel pour le jeu vidéo et les réseaux sociaux, favorisant ainsi la construction de mondes ouverts. Carr a partagé une hypothèse clé : « tout le monde travaillera en 3D, même si le contenu est créé en 2D, et même si le résultat final n'est qu'une vidéo 2D » d'ici trois ans. En se concentrant sous la couche des pixels, Cartwheel vise à automatiser les tâches techniques tout en préservant la créativité humaine en matière de timing et de style.