Det franska startupföretaget Mistral AI har släppt Devstral 2, en öppenvikts-AI-modell med 123 miljarder parametrar för kodning som scorer 72,2 procent på SWE-bench Verified-benchmarken. Tillsammans med den introducerade företaget Mistral Vibe, ett kommandoradsgränssnitt för autonoma mjukvaruutvecklingsuppgifter. En mindre version, Devstral Small 2, debuterade också för lokal användning på konsumenthårdvara.
Den 10 december 2025 presenterade Mistral AI Devstral 2, utvecklad för att fungera inom en autonom mjukvaruutvecklingsagent. Denna modell utmärker sig i att lösa verkliga GitHub-problem och uppnår 72,2 procent på SWE-bench Verified, ett test med 500 problem från populära Python-repositorier. Benchmarken kräver att AI:n läser problembeskrivningar, navigerar kodbaser och producerar patchar som passerar enhetstester – uppgifter som ofta ses som enkla buggfixar av erfarna ingenjörer.
Som komplement till modellen finns Mistral Vibe, ett CLI-verktyg licensierat under Apache 2.0. Det låter utvecklare interagera med Devstral-modeller direkt i terminalen, genom att skanna filstrukturer och Git-status för projektövergripande kontext. Verktyget kan ändra flera filer och köra shell-kommandon självständigt, liknande gränssnitt som Claude Code eller OpenAI Codex.
Mistral lanserade även Devstral Small 2, en variant med 24 miljarder parametrar som scorer 68 procent på benchmarken. Den fungerar offline på laptops och båda modellerna hanterar en kontextfönster på 256 000 token för stora kodbaser. Devstral 2 använder en modifierad MIT-licens, medan den mindre versionen ligger under Apache 2.0.
Prissättningen börjar gratis via Mistral API, övergående till 0,40 USD per miljon inkommande token och 2,00 USD per miljon utgående token för Devstral 2 – påstås vara sju gånger effektivare än Anthropics Claude Sonnet 4.5, som tar 3 och 15 USD per miljon token respektive.
Utgåvan knyter an till 'vibe coding', ett begrepp myntat av Andrej Karpathy i februari 2025, som beskriver naturliga språkprompts för AI-genererad kod utan djup granskning. Utvecklaren Simon Willison berömde det för prototypning: «Jag gillar verkligen vibe coding. Det är ett kul sätt att testa en idé och bevisa om den fungerar.» Men han varnade: «att vibe coda sig till en produktionskodbas är uppenbart riskabelt», och betonade behovet av kodkvalitet i evoluerande system.
Mistral hävdar att Devstral 2 kan upprätthålla projektkoherens, fixa buggar, modernisera äldre kod och hantera beroenden i stor skala, vilket potentiellt utökar vibe coding bortom prototyper.