Mistral AI meluncurkan model pengkodean Devstral 2 dan alat Vibe

Startup Prancis Mistral AI telah merilis Devstral 2, model AI open-weights dengan 123 miliar parameter untuk pengkodean, mencetak 72,2 persen pada benchmark SWE-bench Verified. Bersamaan dengan itu, perusahaan memperkenalkan Mistral Vibe, antarmuka baris perintah untuk tugas rekayasa perangkat lunak otonom. Versi yang lebih kecil, Devstral Small 2, juga diluncurkan untuk penggunaan lokal pada perangkat keras konsumen.

Pada 10 Desember 2025, Mistral AI mengumumkan Devstral 2, dirancang untuk berfungsi dalam agen rekayasa perangkat lunak otonom. Model ini unggul dalam menyelesaikan isu GitHub nyata, mencapai skor 72,2 persen pada SWE-bench Verified, uji yang melibatkan 500 masalah dari repositori Python populer. Benchmark ini mengharuskan AI membaca deskripsi isu, menavigasi basis kode, dan menghasilkan patch yang lulus uji unit—tugas yang sering dianggap sebagai perbaikan bug sederhana oleh insinyur berpengalaman.

Melengkapi model tersebut adalah Mistral Vibe, alat CLI berlisensi Apache 2.0. Ini memungkinkan pengembang berinteraksi dengan model Devstral langsung di terminal mereka, memindai struktur file dan status Git untuk konteks proyek secara keseluruhan. Alat ini dapat memodifikasi beberapa file dan menjalankan perintah shell secara independen, mirip dengan antarmuka seperti Claude Code atau OpenAI Codex.

Mistral juga meluncurkan Devstral Small 2, varian 24 miliar parameter yang mencetak 68 persen pada benchmark. Ia beroperasi offline pada laptop dan kedua model menangani jendela konteks 256.000 token untuk basis kode besar. Devstral 2 menggunakan lisensi MIT yang dimodifikasi, sementara yang lebih kecil di bawah Apache 2.0.

Harga dimulai gratis melalui API Mistral, beralih ke $0,40 per juta token input dan $2,00 per juta token output untuk Devstral 2—disebutkan tujuh kali lebih efisien daripada Claude Sonnet 4.5 milik Anthropic, yang membebankan $3 dan $15 per juta token masing-masing.

Peluncuran ini terkait dengan 'vibe coding', istilah yang diciptakan oleh Andrej Karpathy pada Februari 2025, yang menggambarkan prompt bahasa alami untuk kode yang dihasilkan AI tanpa tinjauan mendalam. Pengembang Simon Willison memuji untuk prototyping: “Saya benar-benar menikmati vibe coding. Ini cara menyenangkan untuk mencoba ide dan membuktikan apakah bisa berhasil.” Namun ia memperingatkan, “vibe coding menuju codebase produksi jelas berisiko,” menekankan kebutuhan kualitas kode pada sistem yang berkembang.

Mistral menyatakan Devstral 2 dapat mempertahankan koherensi proyek, memperbaiki bug, memodernisasi kode lama, dan mengelola dependensi secara skala besar, berpotensi memperluas vibe coding melampaui prototipe.

Artikel Terkait

Photo illustration of Google executives unveiling the Gemini 3 AI model and Antigravity IDE in a conference setting.
Gambar dihasilkan oleh AI

Google meluncurkan model AI Gemini 3 dan IDE Antigravity

Dilaporkan oleh AI Gambar dihasilkan oleh AI

Google telah merilis Gemini 3 Pro, model AI unggulan terbarunya, yang menekankan peningkatan penalaran, keluaran visual, dan kemampuan pengkodean. Perusahaan juga memperkenalkan Antigravity, lingkungan pengembangan terintegrasi yang berbasis AI pertama. Keduanya tersedia dalam pratinjau terbatas mulai hari ini.

Agen pengkodean AI dari perusahaan seperti OpenAI, Anthropic, dan Google memungkinkan pekerjaan yang lebih panjang pada proyek perangkat lunak, termasuk menulis aplikasi dan memperbaiki bug di bawah pengawasan manusia. Alat-alat ini bergantung pada model bahasa besar tetapi menghadapi tantangan seperti pemrosesan konteks terbatas dan biaya komputasi tinggi. Memahami mekanismenya membantu pengembang memutuskan kapan menerapkannya secara efektif.

Dilaporkan oleh AI

Eksperimen CNET membandingkan model Gemini 3 Pro dan Gemini 2.5 Flash milik Google untuk vibe coding, pendekatan kasual untuk menghasilkan kode melalui obrolan AI. Model pemikir terbukti lebih mudah dan komprehensif, sementara model cepat memerlukan lebih banyak intervensi manual. Hasil menunjukkan pilihan model sangat memengaruhi pengalaman pengembangan.

In 2025, AI agents became central to artificial intelligence progress, enabling systems to use tools and act autonomously. From theory to everyday applications, they transformed human interactions with large language models. Yet, they also brought challenges like security risks and regulatory gaps.

Dilaporkan oleh AI

Dalam evaluasi perbandingan model AI terkemuka, Gemini 3.2 Fast milik Google menunjukkan kekuatan dalam akurasi faktual dibandingkan ChatGPT 5.2 milik OpenAI, terutama dalam tugas informasional. Tes tersebut, yang dipicu oleh kemitraan Apple dengan Google untuk meningkatkan Siri, menyoroti kemampuan yang berkembang dalam AI generatif sejak 2023. Meskipun hasilnya ketat, Gemini menghindari kesalahan signifikan yang merusak keandalan ChatGPT.

Peneliti di Icahn School of Medicine at Mount Sinai telah mengembangkan sistem kecerdasan buatan bernama V2P yang tidak hanya menilai apakah mutasi genetik kemungkinan berbahaya tetapi juga memprediksi kategori penyakit luas yang mungkin disebabkan. Pendekatan ini, yang dijelaskan dalam makalah di Nature Communications, dimaksudkan untuk mempercepat diagnosis genetik dan mendukung pengobatan yang lebih personal, terutama untuk kondisi langka dan kompleks.

Dilaporkan oleh AI

Google has introduced a new AI 'world model' known as Project Genie, which is already influencing the games industry. However, it draws criticism for aspects of artificial intelligence that some dislike. The development was highlighted in a TechRadar article published on February 2, 2026.

 

 

 

Situs web ini menggunakan cookie

Kami menggunakan cookie untuk analisis guna meningkatkan situs kami. Baca kebijakan privasi kami untuk informasi lebih lanjut.
Tolak