Para ahli memprediksi 2026 sebagai tahun penting bagi model dunia, sistem AI yang dirancang untuk memahami dunia fisik lebih dalam daripada model bahasa besar. Model ini bertujuan untuk membumikan AI dalam realitas, memungkinkan kemajuan dalam robotika dan kendaraan otonom. Pemimpin industri seperti Yann LeCun dan Fei-Fei Li menyoroti potensinya untuk merevolusi kecerdasan spasial.
Lanskap AI sedang bergeser dari model bahasa besar penghasil teks, seperti yang menjalankan ChatGPT dan Gemini, menuju model dunia yang menginterpretasikan lingkungan fisik. Sistem ini menerjemahkan elemen seperti hukum fisika, deteksi objek, dan gerakan menjadi format digital yang dapat diproses AI, membentuk dasar untuk AI fisik—teknologi yang mampu tidak hanya memahami tetapi bertindak di dunia nyata. Tidak seperti chatbot interaktif, model dunia akan menjadi dasar aplikasi termasuk pembuatan video realistis, robot bedah, dan pengemudian otonom yang lebih baik. Perkembangannya menandakan pergeseran dari halusinasi sesekali AI menuju keluaran yang lebih andal dan berbasis realitas. Tokoh-tokoh terkemuka mendorong transisi ini. Yann LeCun, peneliti AI kunci, baru-baru ini meninggalkan kepemimpinan inisiatif AI Meta untuk bergabung dengan startup yang didedikasikan untuk model dunia. Fei-Fei Li, sering disebut ibu baptis AI, menekankan dalam posting blog November pentingnya kecerdasan spasial: «Kecerdasan spasial akan mengubah cara kita menciptakan dan berinteraksi dengan dunia nyata dan virtual—merevolusi bercerita, kreativitas, robotika, penemuan ilmiah, dan seterusnya.» CEO Nvidia Jensen Huang membahas model dunia dalam keynote CES 2026-nya, menekankan peran data pelatihan: «Membangun model AI yang berbasis pada hukum fisika kita dan kebenaran dasar dimulai dengan data yang digunakan untuk pelatihan.» Platform Cosmos Nvidia memperagukannya, menggunakan sensor kendaraan untuk memetakan lingkungan secara real-time dan mensimulasikan skenario seperti kecelakaan untuk meningkatkan keselamatan. Model semacam itu bergantung pada dataset besar, termasuk konten buatan manusia dan simulasi, meskipun yang terakhir membantu mengatasi kekhawatiran hukum atas penggunaan data dan kasus tepi langka melalui data sintetis. Fokus pada model dunia ini menunjukkan bahwa industri AI memprioritaskan integrasi dengan dunia fisik daripada memperluas kemampuan teks virtual.