Cartwheel, sebuah startup animasi 3D baru yang didirikan oleh mantan ilmuwan OpenAI Andrew Carr dan mantan direktur kreatif Google Jonathan Jarvis, berupaya membuat animasi yang dihasilkan AI menjadi lebih mudah disunting dan dikendalikan. Perusahaan ini berfokus pada konversi video 2D sederhana menjadi kerangka 3D yang presisi, memungkinkan seniman untuk menyempurnakan hasil daripada bergantung pada perintah 'kotak hitam' yang tidak dapat diedit. Para pendiri menekankan penyediaan 'lapisan kontrol' untuk mencegah keseragaman AI dan memungkinkan penceritaan yang lebih terbuka.
Andrew Carr dan Jonathan Jarvis meluncurkan Cartwheel untuk mengatasi keterbatasan dalam alat animasi AI generatif saat ini, di mana perintah sering kali menghasilkan hasil yang cacat seperti kaki yang terdistorsi yang sulit diperbaiki tanpa harus memulai dari awal. Pendekatan mereka menghasilkan data 3D yang dapat disunting dari input 2D, seperti video tarian di halaman belakang yang diubah menjadi kerangka 3D yang realistis. Hal ini memungkinkan kreator untuk menyesuaikan pose, pencahayaan, dan lingkungan pasca-generasi, memperlakukan AI sebagai alat alih-alih sebagai pengganti produk akhir. "Output sistem kami dirancang untuk diedit oleh pengguna. Sistem ini dirancang agar dapat disentuh dan dimanipulasi oleh orang-orang, dan kami tidak ingin seseorang hanya mengetik sesuatu lalu membiarkan sistem menyelesaikannya menjadi animasi jadi. Bukan itu tujuannya. Itu membosankan, siapa yang akan menontonnya?" kata Carr. Para pendiri menyoroti kelangkaan data gerak 3D dibandingkan dengan teks, gambar, dan video berlimpah yang digunakan oleh perusahaan teknologi besar. "Kami tahu ini akan sulit, tetapi ternyata 10 hingga 100 kali lebih sulit dari yang kami bayangkan untuk mendapatkan data tersebut," catat Jarvis. Cartwheel memetakan gerakan manusia untuk membangun model performa yang bernuansa. Ke depannya, perusahaan membayangkan AI mendukung karakter yang reaktif dan real-time untuk permainan dan media sosial, serta mendukung pembangunan dunia yang terbuka. Carr membagikan hipotesis utama: "semua orang akan bekerja dalam 3D meskipun proses pembuatannya dalam 2D, bahkan jika hasil akhirnya hanya berupa video 2D" dalam tiga tahun ke depan. Dengan berfokus pada tingkat di bawah piksel, Cartwheel bertujuan untuk mengotomatiskan tugas teknis sekaligus mempertahankan kreativitas manusia dalam hal waktu dan selera.