Startup Prancis Mistral AI telah merilis Devstral 2, model AI open-weights dengan 123 miliar parameter untuk pengkodean, mencetak 72,2 persen pada benchmark SWE-bench Verified. Bersamaan dengan itu, perusahaan memperkenalkan Mistral Vibe, antarmuka baris perintah untuk tugas rekayasa perangkat lunak otonom. Versi yang lebih kecil, Devstral Small 2, juga diluncurkan untuk penggunaan lokal pada perangkat keras konsumen.
Pada 10 Desember 2025, Mistral AI mengumumkan Devstral 2, dirancang untuk berfungsi dalam agen rekayasa perangkat lunak otonom. Model ini unggul dalam menyelesaikan isu GitHub nyata, mencapai skor 72,2 persen pada SWE-bench Verified, uji yang melibatkan 500 masalah dari repositori Python populer. Benchmark ini mengharuskan AI membaca deskripsi isu, menavigasi basis kode, dan menghasilkan patch yang lulus uji unit—tugas yang sering dianggap sebagai perbaikan bug sederhana oleh insinyur berpengalaman.
Melengkapi model tersebut adalah Mistral Vibe, alat CLI berlisensi Apache 2.0. Ini memungkinkan pengembang berinteraksi dengan model Devstral langsung di terminal mereka, memindai struktur file dan status Git untuk konteks proyek secara keseluruhan. Alat ini dapat memodifikasi beberapa file dan menjalankan perintah shell secara independen, mirip dengan antarmuka seperti Claude Code atau OpenAI Codex.
Mistral juga meluncurkan Devstral Small 2, varian 24 miliar parameter yang mencetak 68 persen pada benchmark. Ia beroperasi offline pada laptop dan kedua model menangani jendela konteks 256.000 token untuk basis kode besar. Devstral 2 menggunakan lisensi MIT yang dimodifikasi, sementara yang lebih kecil di bawah Apache 2.0.
Harga dimulai gratis melalui API Mistral, beralih ke $0,40 per juta token input dan $2,00 per juta token output untuk Devstral 2—disebutkan tujuh kali lebih efisien daripada Claude Sonnet 4.5 milik Anthropic, yang membebankan $3 dan $15 per juta token masing-masing.
Peluncuran ini terkait dengan 'vibe coding', istilah yang diciptakan oleh Andrej Karpathy pada Februari 2025, yang menggambarkan prompt bahasa alami untuk kode yang dihasilkan AI tanpa tinjauan mendalam. Pengembang Simon Willison memuji untuk prototyping: “Saya benar-benar menikmati vibe coding. Ini cara menyenangkan untuk mencoba ide dan membuktikan apakah bisa berhasil.” Namun ia memperingatkan, “vibe coding menuju codebase produksi jelas berisiko,” menekankan kebutuhan kualitas kode pada sistem yang berkembang.
Mistral menyatakan Devstral 2 dapat mempertahankan koherensi proyek, memperbaiki bug, memodernisasi kode lama, dan mengelola dependensi secara skala besar, berpotensi memperluas vibe coding melampaui prototipe.