Mistral AI lanserar kodningsmodellen Devstral 2 och Vibe-verktyget

Det franska startupföretaget Mistral AI har släppt Devstral 2, en öppenvikts-AI-modell med 123 miljarder parametrar för kodning som scorer 72,2 procent på SWE-bench Verified-benchmarken. Tillsammans med den introducerade företaget Mistral Vibe, ett kommandoradsgränssnitt för autonoma mjukvaruutvecklingsuppgifter. En mindre version, Devstral Small 2, debuterade också för lokal användning på konsumenthårdvara.

Den 10 december 2025 presenterade Mistral AI Devstral 2, utvecklad för att fungera inom en autonom mjukvaruutvecklingsagent. Denna modell utmärker sig i att lösa verkliga GitHub-problem och uppnår 72,2 procent på SWE-bench Verified, ett test med 500 problem från populära Python-repositorier. Benchmarken kräver att AI:n läser problembeskrivningar, navigerar kodbaser och producerar patchar som passerar enhetstester – uppgifter som ofta ses som enkla buggfixar av erfarna ingenjörer.

Som komplement till modellen finns Mistral Vibe, ett CLI-verktyg licensierat under Apache 2.0. Det låter utvecklare interagera med Devstral-modeller direkt i terminalen, genom att skanna filstrukturer och Git-status för projektövergripande kontext. Verktyget kan ändra flera filer och köra shell-kommandon självständigt, liknande gränssnitt som Claude Code eller OpenAI Codex.

Mistral lanserade även Devstral Small 2, en variant med 24 miljarder parametrar som scorer 68 procent på benchmarken. Den fungerar offline på laptops och båda modellerna hanterar en kontextfönster på 256 000 token för stora kodbaser. Devstral 2 använder en modifierad MIT-licens, medan den mindre versionen ligger under Apache 2.0.

Prissättningen börjar gratis via Mistral API, övergående till 0,40 USD per miljon inkommande token och 2,00 USD per miljon utgående token för Devstral 2 – påstås vara sju gånger effektivare än Anthropics Claude Sonnet 4.5, som tar 3 och 15 USD per miljon token respektive.

Utgåvan knyter an till 'vibe coding', ett begrepp myntat av Andrej Karpathy i februari 2025, som beskriver naturliga språkprompts för AI-genererad kod utan djup granskning. Utvecklaren Simon Willison berömde det för prototypning: «Jag gillar verkligen vibe coding. Det är ett kul sätt att testa en idé och bevisa om den fungerar.» Men han varnade: «att vibe coda sig till en produktionskodbas är uppenbart riskabelt», och betonade behovet av kodkvalitet i evoluerande system.

Mistral hävdar att Devstral 2 kan upprätthålla projektkoherens, fixa buggar, modernisera äldre kod och hantera beroenden i stor skala, vilket potentiellt utökar vibe coding bortom prototyper.

Relaterade artiklar

Photo illustration of Google executives unveiling the Gemini 3 AI model and Antigravity IDE in a conference setting.
Bild genererad av AI

Google presenterar Gemini 3 AI-modell och Antigravity IDE

Rapporterad av AI Bild genererad av AI

Google har släppt Gemini 3 Pro, sin senaste flaggskeppsmodell för AI, med tonvikt på förbättrat resonemang, visuella utdata och kodningsförmågor. Företaget har också introducerat Antigravity, en AI-först integrerad utvecklingsmiljö. Båda är tillgängliga i begränsad förhandsvisning från och med idag.

AI-kodningsagenter från företag som OpenAI, Anthropic och Google möjliggör utökat arbete på mjukvaruprojekt, inklusive att skriva appar och fixa buggar under mänsklig översyn. Dessa verktyg bygger på stora språkmodeller men står inför utmaningar som begränsad kontextbehandling och höga beräkningskostnader. Att förstå deras mekanik hjälper utvecklare att besluta när de ska användas effektivt.

Rapporterad av AI

Ett CNET-experiment jämförde Googles Gemini 3 Pro- och Gemini 2.5 Flash-modeller för vibe coding, ett avslappnat sätt att generera kod via AI-chatt. Tänkningsmodellen visade sig vara enklare och mer heltäckande, medan den snabba modellen krävde mer manuell intervention. Resultaten tyder på att valet av modell påverkar utvecklingsupplevelsen avsevärt.

In 2025, AI agents became central to artificial intelligence progress, enabling systems to use tools and act autonomously. From theory to everyday applications, they transformed human interactions with large language models. Yet, they also brought challenges like security risks and regulatory gaps.

Rapporterad av AI

I en jämförande utvärdering av ledande AI-modeller visade Googles Gemini 3.2 Fast styrkor i faktisk noggrannhet över OpenAIs ChatGPT 5.2, särskilt i informationsuppgifter. Testerna, som utlöstes av Apples partnerskap med Google för att förbättra Siri, belyser utvecklande förmågor i generativ AI sedan 2023. Även om resultaten var jämna undvek Gemini betydande fel som undergrävde ChatGPT:s tillförlitlighet.

Forskare vid Icahn School of Medicine at Mount Sinai har utvecklat ett artificiellt intelligenssystem kallat V2P som inte bara bedömer om genetiska mutationer troligen är skadliga utan också förutsäger de breda sjukdomskategorier de kan orsaka. Metoden, som beskrivs i en artikel i Nature Communications, syftar till att påskynda genetisk diagnostik och stödja mer personanpassad behandling, särskilt för sällsynta och komplexa tillstånd.

Rapporterad av AI

Google har introducerat en ny AI 'världmodell' känd som Project Genie, som redan påverkar spelindustrin. Den väcker dock kritik för aspekter av artificiell intelligens som vissa ogillar. Utvecklingen belystes i en TechRadar-artikel publicerad den 2 februari 2026.

 

 

 

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj