Tesla merilis presentasi AI tentang kemajuan FSD

Wakil Presiden AI Tesla, Ashok Elluswamy, telah merilis presentasi berdurasi 30 menit yang merinci kemajuan dalam perangkat lunak Full Self-Driving (FSD), pengembangan AI, dan inovasi terbaru tim. Disampaikan melalui International Conference on Computer Vision (ICCV), presentasi ini menyoroti sumber daya data luas Tesla dan alat simulasi baru. Pembicaraan tersebut menekankan upaya menuju penskalaan robotaxi global dan otonomi armada penuh.

Dalam presentasi tersebut, Elluswamy menekankan keunggulan data Tesla yang tak tertandingi, menyatakan bahwa armada kendaraan perusahaan menghasilkan '500 tahun data mengemudi setiap hari'. Ia menggambarkannya sebagai 'Air Terjun Niagara data', yang terdiri dari ratusan tahun pengemudian armada kolektif, ditangkap melalui pemicu data pintar untuk kasus sudut langka seperti persimpangan kompleks dan perilaku tak terduga. Pendekatan ini memungkinkan Tesla untuk mengekstrak hanya data esensial untuk pelatihan model yang efisien, mengatasi 'kutukan dimensi' di mana delapan kamera berkecepatan frame tinggi menghasilkan miliaran token per 30 detik konteks mengemudi.

Meskipun sistem jaringan saraf end-to-end, Tesla mempertahankan interpretabilitas untuk debugging. Para insinyur dapat meminta model untuk menghasilkan prediksi tambahan seperti okupansi 3D, batas jalan, objek, tanda, dan lampu lalu lintas, yang tidak mengendalikan kendaraan tetapi membantu pemeriksaan keselamatan. Kueri bahasa alami memungkinkan pertanyaan seperti mengapa keputusan tertentu dibuat. Selain itu, Tesla mengembangkan sistem splatting Gaussian khusus yang super cepat untuk merekonstruksi adegan 3D yang tajam dari tampilan kamera terbatas, mengungguli metode NeRF dan splatting standar untuk debugging visual.

Evaluasi tetap menjadi tantangan utama, dengan model unggul secara offline tetapi kesulitan dalam kasus tepi dunia nyata. Untuk mengatasinya, Tesla menciptakan simulator dunia yang dipelajari—mesin video yang dihasilkan jaringan saraf yang mensimulasikan delapan umpan kamera Tesla secara bersamaan di lingkungan sintetik penuh. Ia mendukung pengujian, pelatihan, pembelajaran penguatan, injeksi peristiwa adversarial (misalnya, pejalan kaki memotong), dan memutar ulang kegagalan masa lalu, berjalan hampir real-time untuk simulasi mengemudi.

Melihat ke depan, Elluswamy menguraikan rencana untuk menskalakan layanan robotaxi secara global, mencapai otonomi penuh di seluruh armada Tesla, dan memperkenalkan Cybercab—kendaraan dua kursi generasi berikutnya yang dioptimalkan untuk penggunaan robotaxi, dengan target biaya transportasi lebih rendah daripada transportasi umum. Jaringan saraf yang sama akan memberi daya pada robot humanoid Optimus, dengan sistem generasi video sekarang diterapkan untuk mensimulasikan dan merencanakan gerakan robot.

Situs web ini menggunakan cookie

Kami menggunakan cookie untuk analisis guna meningkatkan situs kami. Baca kebijakan privasi kami kebijakan privasi untuk informasi lebih lanjut.
Tolak