Mistral AI meluncurkan model pengkodean Devstral 2 dan alat Vibe

Startup Prancis Mistral AI telah merilis Devstral 2, model AI open-weights dengan 123 miliar parameter untuk pengkodean, mencetak 72,2 persen pada benchmark SWE-bench Verified. Bersamaan dengan itu, perusahaan memperkenalkan Mistral Vibe, antarmuka baris perintah untuk tugas rekayasa perangkat lunak otonom. Versi yang lebih kecil, Devstral Small 2, juga diluncurkan untuk penggunaan lokal pada perangkat keras konsumen.

Pada 10 Desember 2025, Mistral AI mengumumkan Devstral 2, dirancang untuk berfungsi dalam agen rekayasa perangkat lunak otonom. Model ini unggul dalam menyelesaikan isu GitHub nyata, mencapai skor 72,2 persen pada SWE-bench Verified, uji yang melibatkan 500 masalah dari repositori Python populer. Benchmark ini mengharuskan AI membaca deskripsi isu, menavigasi basis kode, dan menghasilkan patch yang lulus uji unit—tugas yang sering dianggap sebagai perbaikan bug sederhana oleh insinyur berpengalaman.

Melengkapi model tersebut adalah Mistral Vibe, alat CLI berlisensi Apache 2.0. Ini memungkinkan pengembang berinteraksi dengan model Devstral langsung di terminal mereka, memindai struktur file dan status Git untuk konteks proyek secara keseluruhan. Alat ini dapat memodifikasi beberapa file dan menjalankan perintah shell secara independen, mirip dengan antarmuka seperti Claude Code atau OpenAI Codex.

Mistral juga meluncurkan Devstral Small 2, varian 24 miliar parameter yang mencetak 68 persen pada benchmark. Ia beroperasi offline pada laptop dan kedua model menangani jendela konteks 256.000 token untuk basis kode besar. Devstral 2 menggunakan lisensi MIT yang dimodifikasi, sementara yang lebih kecil di bawah Apache 2.0.

Harga dimulai gratis melalui API Mistral, beralih ke $0,40 per juta token input dan $2,00 per juta token output untuk Devstral 2—disebutkan tujuh kali lebih efisien daripada Claude Sonnet 4.5 milik Anthropic, yang membebankan $3 dan $15 per juta token masing-masing.

Peluncuran ini terkait dengan 'vibe coding', istilah yang diciptakan oleh Andrej Karpathy pada Februari 2025, yang menggambarkan prompt bahasa alami untuk kode yang dihasilkan AI tanpa tinjauan mendalam. Pengembang Simon Willison memuji untuk prototyping: “Saya benar-benar menikmati vibe coding. Ini cara menyenangkan untuk mencoba ide dan membuktikan apakah bisa berhasil.” Namun ia memperingatkan, “vibe coding menuju codebase produksi jelas berisiko,” menekankan kebutuhan kualitas kode pada sistem yang berkembang.

Mistral menyatakan Devstral 2 dapat mempertahankan koherensi proyek, memperbaiki bug, memodernisasi kode lama, dan mengelola dependensi secara skala besar, berpotensi memperluas vibe coding melampaui prototipe.

Artikel Terkait

Illustration depicting Anthropic and OpenAI launching AI agent teams amid a $285B software stock drop.
Gambar dihasilkan oleh AI

Anthropic dan OpenAI rilis alat manajemen agen AI

Dilaporkan oleh AI Gambar dihasilkan oleh AI

Pada 5 Februari 2026, Anthropic dan OpenAI secara bersamaan meluncurkan produk yang menggeser pengguna dari mengobrol dengan AI ke mengelola tim agen AI. Anthropic memperkenalkan Claude Opus 4.6 dengan tim agen untuk pengembang, sementara OpenAI mengumumkan Frontier dan GPT-5.3-Codex untuk alur kerja perusahaan. Peluncuran ini bertepatan dengan penurunan saham perangkat lunak sebesar $285 miliar di tengah kekhawatiran AI mengganggu vendor SaaS tradisional.

Startup Prancis Mistral AI telah mengumumkan keluarga model AI baru yang dirancang untuk terjemahan cepat. Perusahaan ini memposisikan peluncuran ini sebagai tantangan bagi perusahaan AI besar AS dengan menekankan efisiensi daripada penggunaan sumber daya yang berat. Mistral mengklaim model tersebut membuka jalan untuk percakapan multibahasa yang lancar.

Dilaporkan oleh AI

Pengembang AI Prancis Mistral AI telah meluncurkan dua model transkripsi baru yang dirancang untuk berjalan langsung di perangkat pengguna, memprioritaskan privasi dan kecepatan. Model-model tersebut, Voxtral Mini Transcribe 2 dan Voxtral Realtime, bertujuan menjaga percakapan sensitif di luar internet. Mereka memungkinkan transkripsi cepat dan akurat tanpa bergantung pada server cloud.

Apple telah merilis Xcode 26.3, meningkatkan lingkungan pengembangan terintegrasinya dengan integrasi lebih dalam untuk agen pengkodean AI seperti Claude dan Codex milik OpenAI. Pembaruan ini memanfaatkan Protokol Konteks Model untuk memungkinkan agen-agen ini mengakses dokumentasi, struktur file, dan pengaturan proyek secara lebih efektif. Ini membangun atas fitur AI yang diperkenalkan di Xcode 26 pada WWDC 2025.

Dilaporkan oleh AI

Google telah merilis Gemini 3.1 Pro, versi terbaru dari model AI unggulannya, yang menekankan peningkatan dalam pemecahan masalah dan penalaran. Model ini tersedia dalam pratinjau untuk pengembang dan konsumen mulai hari ini. Model ini dibangun di atas rilis Gemini 3 dari November.

OpenAI sedang mengalihkan sumber daya untuk meningkatkan chatbot unggulannya ChatGPT, menyebabkan kepergian beberapa peneliti senior. Perusahaan San Francisco ini menghadapi persaingan sengit dari Google dan Anthropic, mendorong perubahan strategis dari penelitian jangka panjang. Perubahan ini menimbulkan kekhawatiran tentang masa depan eksplorasi AI inovatif di perusahaan tersebut.

Dilaporkan oleh AI

Developer Grolaf has released a demo for Codex Mortis, a bullet hell game styled after Vampire Survivors, claiming it as the world's first fully playable title created entirely through AI tools. The project, built over three months without a traditional game engine, uses AI for everything from code and assets to music and animations. While the demo garners mixed reviews, it sparks debate on AI's role in game development.

 

 

 

Situs web ini menggunakan cookie

Kami menggunakan cookie untuk analisis guna meningkatkan situs kami. Baca kebijakan privasi kami untuk informasi lebih lanjut.
Tolak