A Cartwheel, uma nova startup de animação 3D fundada pelo ex-cientista da OpenAI Andrew Carr e pelo ex-diretor criativo do Google Jonathan Jarvis, busca tornar as animações geradas por IA mais editáveis e controláveis. A empresa foca em converter vídeos 2D simples em esqueletos 3D precisos, permitindo que artistas refinem os resultados em vez de depender de prompts do tipo 'caixa preta' impossíveis de editar. Os fundadores enfatizam o fornecimento de uma 'camada de controle' para evitar a uniformidade da IA e permitir uma narrativa aberta.
Andrew Carr e Jonathan Jarvis lançaram a Cartwheel para abordar as limitações nas ferramentas atuais de animação por IA generativa, onde prompts frequentemente produzem resultados falhos, como pés distorcidos que são difíceis de corrigir sem começar do zero. A abordagem deles gera dados 3D editáveis a partir de entradas 2D, como um vídeo de dança no quintal transformado em um esqueleto 3D realista. Isso permite que os criadores ajustem poses, iluminação e ambientes após a geração, tratando a IA como uma ferramenta em vez de uma substituta do produto final. "O resultado do nosso sistema foi projetado para que as pessoas possam editar. Ele foi feito para ser tocado e manipulado, e não queremos que alguém digite algo e apenas espere que o sistema crie uma animação finalizada. Esse não é o ponto. Isso é entediante, quem iria assistir a algo assim?", disse Carr. Os fundadores destacaram a escassez de dados de movimento 3D em comparação com a abundância de textos, imagens e vídeos usados pelas grandes empresas de tecnologia. "Sabíamos que seria difícil, mas acabou sendo provavelmente de 10 a 100 vezes mais difícil do que pensávamos para obter esses dados", observou Jarvis. A Cartwheel mapeia movimentos humanos para construir modelos de performance detalhados. Olhando para o futuro, a empresa vislumbra a IA alimentando personagens reativos em tempo real para jogos e redes sociais, apoiando a construção de mundos de forma aberta. Carr compartilhou uma hipótese fundamental: "todos trabalharão em 3D, mesmo que a autoria seja em 2D e mesmo que o resultado final seja apenas um vídeo 2D" nos próximos três anos. Ao focar abaixo da camada de pixels, a Cartwheel visa automatizar tarefas técnicas enquanto preserva a criatividade humana no timing e no estilo.