Mistral AI meluncurkan model pengkodean Devstral 2 dan alat Vibe

Rabu, 10 Desember 2025

Dilaporkan oleh AI

Startup Prancis Mistral AI telah merilis Devstral 2, model AI open-weights dengan 123 miliar parameter untuk pengkodean, mencetak 72,2 persen pada benchmark SWE-bench Verified. Bersamaan dengan itu, perusahaan memperkenalkan Mistral Vibe, antarmuka baris perintah untuk tugas rekayasa perangkat lunak otonom. Versi yang lebih kecil, Devstral Small 2, juga diluncurkan untuk penggunaan lokal pada perangkat keras konsumen.

Pada 10 Desember 2025, Mistral AI mengumumkan Devstral 2, dirancang untuk berfungsi dalam agen rekayasa perangkat lunak otonom. Model ini unggul dalam menyelesaikan isu GitHub nyata, mencapai skor 72,2 persen pada SWE-bench Verified, uji yang melibatkan 500 masalah dari repositori Python populer. Benchmark ini mengharuskan AI membaca deskripsi isu, menavigasi basis kode, dan menghasilkan patch yang lulus uji unit—tugas yang sering dianggap sebagai perbaikan bug sederhana oleh insinyur berpengalaman.

Melengkapi model tersebut adalah Mistral Vibe, alat CLI berlisensi Apache 2.0. Ini memungkinkan pengembang berinteraksi dengan model Devstral langsung di terminal mereka, memindai struktur file dan status Git untuk konteks proyek secara keseluruhan. Alat ini dapat memodifikasi beberapa file dan menjalankan perintah shell secara independen, mirip dengan antarmuka seperti Claude Code atau OpenAI Codex.

Mistral juga meluncurkan Devstral Small 2, varian 24 miliar parameter yang mencetak 68 persen pada benchmark. Ia beroperasi offline pada laptop dan kedua model menangani jendela konteks 256.000 token untuk basis kode besar. Devstral 2 menggunakan lisensi MIT yang dimodifikasi, sementara yang lebih kecil di bawah Apache 2.0.

Harga dimulai gratis melalui API Mistral, beralih ke $0,40 per juta token input dan $2,00 per juta token output untuk Devstral 2—disebutkan tujuh kali lebih efisien daripada Claude Sonnet 4.5 milik Anthropic, yang membebankan $3 dan $15 per juta token masing-masing.

Peluncuran ini terkait dengan 'vibe coding', istilah yang diciptakan oleh Andrej Karpathy pada Februari 2025, yang menggambarkan prompt bahasa alami untuk kode yang dihasilkan AI tanpa tinjauan mendalam. Pengembang Simon Willison memuji untuk prototyping: “Saya benar-benar menikmati vibe coding. Ini cara menyenangkan untuk mencoba ide dan membuktikan apakah bisa berhasil.” Namun ia memperingatkan, “vibe coding menuju codebase produksi jelas berisiko,” menekankan kebutuhan kualitas kode pada sistem yang berkembang.

Mistral menyatakan Devstral 2 dapat mempertahankan koherensi proyek, memperbaiki bug, memodernisasi kode lama, dan mengelola dependensi secara skala besar, berpotensi memperluas vibe coding melampaui prototipe.

Google meluncurkan model AI Gemini 3 dan IDE Antigravity

Selasa, 18 November 2025 Dilaporkan oleh AI Gambar dihasilkan oleh AI

Google telah merilis Gemini 3 Pro, model AI unggulan terbarunya, yang menekankan peningkatan penalaran, keluaran visual, dan kemampuan pengkodean. Perusahaan juga memperkenalkan Antigravity, lingkungan pengembangan terintegrasi yang berbasis AI pertama. Keduanya tersedia dalam pratinjau terbatas mulai hari ini.

Bagaimana agen pengkodean AI berfungsi dan keterbatasannya

Agen pengkodean AI dari perusahaan seperti OpenAI, Anthropic, dan Google memungkinkan pekerjaan yang lebih panjang pada proyek perangkat lunak, termasuk menulis aplikasi dan memperbaiki bug di bawah pengawasan manusia. Alat-alat ini bergantung pada model bahasa besar tetapi menghadapi tantangan seperti pemrosesan konteks terbatas dan biaya komputasi tinggi. Memahami mekanismenya membantu pengembang memutuskan kapan menerapkannya secara efektif.

Pengujian model Gemini menyoroti perbedaan dalam vibe coding

Rabu, 24 Desember 2025 Dilaporkan oleh AI

Eksperimen CNET membandingkan model Gemini 3 Pro dan Gemini 2.5 Flash milik Google untuk vibe coding, pendekatan kasual untuk menghasilkan kode melalui obrolan AI. Model pemikir terbukti lebih mudah dan komprehensif, sementara model cepat memerlukan lebih banyak intervensi manual. Hasil menunjukkan pilihan model sangat memengaruhi pengalaman pengembangan.

Amerika

AI models surpass cutoff scores in Chile's PAES 2026 test

Teknologi

Anthropic meluncurkan fitur Cowork untuk Claude AI

Linux

Linus Torvalds gunakan AI untuk proyek pengkodean pribadi

AI agents arrived in 2025

In 2025, AI agents became central to artificial intelligence progress, enabling systems to use tools and act autonomously. From theory to everyday applications, they transformed human interactions with large language models. Yet, they also brought challenges like security risks and regulatory gaps.

Gemini milik Google unggul atas ChatGPT dalam tes AI kunci

Rabu, 21 Januari 2026 Dilaporkan oleh AI

Dalam evaluasi perbandingan model AI terkemuka, Gemini 3.2 Fast milik Google menunjukkan kekuatan dalam akurasi faktual dibandingkan ChatGPT 5.2 milik OpenAI, terutama dalam tugas informasional. Tes tersebut, yang dipicu oleh kemitraan Apple dengan Google untuk meningkatkan Siri, menyoroti kemampuan yang berkembang dalam AI generatif sejak 2023. Meskipun hasilnya ketat, Gemini menghindari kesalahan signifikan yang merusak keandalan ChatGPT.

Alat AI menghubungkan mutasi genetik dengan kategori penyakit yang mungkin

Peneliti di Icahn School of Medicine at Mount Sinai telah mengembangkan sistem kecerdasan buatan bernama V2P yang tidak hanya menilai apakah mutasi genetik kemungkinan berbahaya tetapi juga memprediksi kategori penyakit luas yang mungkin disebabkan. Pendekatan ini, yang dijelaskan dalam makalah di Nature Communications, dimaksudkan untuk mempercepat diagnosis genetik dan mendukung pengobatan yang lebih personal, terutama untuk kondisi langka dan kompleks.

Google's new AI world model affects games industry

Senin, 02 Februari 2026 Dilaporkan oleh AI

Google has introduced a new AI 'world model' known as Project Genie, which is already influencing the games industry. However, it draws criticism for aspects of artificial intelligence that some dislike. The development was highlighted in a TechRadar article published on February 2, 2026.

31 Januari 2026 02.14

Mistral AI meluncurkan model pengkodean Devstral 2 dan alat Vibe

Artikel Terkait

Google meluncurkan model AI Gemini 3 dan IDE Antigravity

Bagaimana agen pengkodean AI berfungsi dan keterbatasannya

Pengujian model Gemini menyoroti perbedaan dalam vibe coding

AI models surpass cutoff scores in Chile's PAES 2026 test

Anthropic meluncurkan fitur Cowork untuk Claude AI

Linus Torvalds gunakan AI untuk proyek pengkodean pribadi

AI agents arrived in 2025

Gemini milik Google unggul atas ChatGPT dalam tes AI kunci

Alat AI menghubungkan mutasi genetik dengan kategori penyakit yang mungkin

Google's new AI world model affects games industry

OpenClaw gains rapid traction as AI execution engine for crypto

Asisten AI OpenClaw bertahan dari ketenaran viral dan rebranding di tengah kekacauan

cURL hapus program bug bounty karena konten sampah buatan AI

Linus Torvalds menggunakan alat AI untuk proyek audio pribadi

Larian elaborates on machine learning for Divinity amid generative AI ban

Clair Obscur: Expedition 33 AI row expands: Industry debates and sales soar

Sandfall clarifies brief AI use in Expedition 33 amid IGA disqualification fallout

Clair Obscur: Expedition 33 AI controversy: Indie Game Awards revokes wins over generative AI use

Codex Mortis debuts as fully AI-generated playable game

OpenAI merilis ChatGPT-5.2 untuk meningkatkan produktivitas kerja

Situs web ini menggunakan cookie