Cartwheel, ett nytt startupbolag inom 3D-animation grundat av den tidigare OpenAI-forskaren Andrew Carr och den tidigare kreativa chefen på Google, Jonathan Jarvis, vill göra AI-genererade animationer mer redigerbara och kontrollerbara. Företaget fokuserar på att omvandla enkla 2D-videor till precisa 3D-skelett, vilket gör det möjligt för konstnärer att förfina resultaten istället för att förlita sig på svårredigerade 'black box'-prompter. Grundarna betonar vikten av att erbjuda ett 'kontrollager' för att förhindra likriktad AI-produktion och möjliggöra fritt berättande.
Andrew Carr och Jonathan Jarvis lanserade Cartwheel för att adressera begränsningar i nuvarande generativa AI-animationsverktyg, där prompter ofta producerar bristfälliga resultat som förvrängda fötter som är svåra att korrigera utan att börja om från början. Deras metod genererar redigerbar 3D-data från 2D-underlag, exempelvis en dansvideo från trädgården som omvandlas till ett realistiskt 3D-skelett. Detta låter kreatörer justera poser, ljussättning och miljöer efter genereringen, och behandlar AI som ett verktyg snarare än en ersättning för en färdig produkt. 'Resultatet från vårt system är utformat för att redigeras. Det är designat för att människor ska kunna röra och manipulera det, och vi vill inte att någon bara ska skriva in något och sedan låta det generera en färdig animation. Det är inte poängen. Det är tråkigt, vem vill titta på det?' säger Carr. Grundarna lyfte fram bristen på 3D-rörelsedata jämfört med den stora mängd text, bilder och videor som storföretagen använder. 'Vi visste att det skulle bli svårt, men det visar sig vara förmodligen 10 eller 100 gånger svårare än vi trodde att få fram den datan', noterade Jarvis. Cartwheel mappar mänskliga rörelser för att bygga nyanserade prestandamodeller. Framåt ser företaget framför sig att AI driver realtidsbaserade, reaktiva karaktärer för spel och sociala medier, vilket stödjer öppet världsbyggande. Carr delade med sig av en nyckeltes: 'alla kommer att arbeta i 3D även om det skapas i 2D, även om slutresultatet bara är 2D-video' inom de närmaste tre åren. Genom att fokusera under pixelnivån strävar Cartwheel efter att automatisera tekniska uppgifter samtidigt som mänsklig kreativitet vad gäller timing och smak bevaras.