Mistral AI lanserar kodningsmodellen Devstral 2 och Vibe-verktyget

Det franska startupföretaget Mistral AI har släppt Devstral 2, en öppenvikts-AI-modell med 123 miljarder parametrar för kodning som scorer 72,2 procent på SWE-bench Verified-benchmarken. Tillsammans med den introducerade företaget Mistral Vibe, ett kommandoradsgränssnitt för autonoma mjukvaruutvecklingsuppgifter. En mindre version, Devstral Small 2, debuterade också för lokal användning på konsumenthårdvara.

Den 10 december 2025 presenterade Mistral AI Devstral 2, utvecklad för att fungera inom en autonom mjukvaruutvecklingsagent. Denna modell utmärker sig i att lösa verkliga GitHub-problem och uppnår 72,2 procent på SWE-bench Verified, ett test med 500 problem från populära Python-repositorier. Benchmarken kräver att AI:n läser problembeskrivningar, navigerar kodbaser och producerar patchar som passerar enhetstester – uppgifter som ofta ses som enkla buggfixar av erfarna ingenjörer.

Som komplement till modellen finns Mistral Vibe, ett CLI-verktyg licensierat under Apache 2.0. Det låter utvecklare interagera med Devstral-modeller direkt i terminalen, genom att skanna filstrukturer och Git-status för projektövergripande kontext. Verktyget kan ändra flera filer och köra shell-kommandon självständigt, liknande gränssnitt som Claude Code eller OpenAI Codex.

Mistral lanserade även Devstral Small 2, en variant med 24 miljarder parametrar som scorer 68 procent på benchmarken. Den fungerar offline på laptops och båda modellerna hanterar en kontextfönster på 256 000 token för stora kodbaser. Devstral 2 använder en modifierad MIT-licens, medan den mindre versionen ligger under Apache 2.0.

Prissättningen börjar gratis via Mistral API, övergående till 0,40 USD per miljon inkommande token och 2,00 USD per miljon utgående token för Devstral 2 – påstås vara sju gånger effektivare än Anthropics Claude Sonnet 4.5, som tar 3 och 15 USD per miljon token respektive.

Utgåvan knyter an till 'vibe coding', ett begrepp myntat av Andrej Karpathy i februari 2025, som beskriver naturliga språkprompts för AI-genererad kod utan djup granskning. Utvecklaren Simon Willison berömde det för prototypning: «Jag gillar verkligen vibe coding. Det är ett kul sätt att testa en idé och bevisa om den fungerar.» Men han varnade: «att vibe coda sig till en produktionskodbas är uppenbart riskabelt», och betonade behovet av kodkvalitet i evoluerande system.

Mistral hävdar att Devstral 2 kan upprätthålla projektkoherens, fixa buggar, modernisera äldre kod och hantera beroenden i stor skala, vilket potentiellt utökar vibe coding bortom prototyper.

Relaterade artiklar

Illustration depicting Anthropic and OpenAI launching AI agent teams amid a $285B software stock drop.
Bild genererad av AI

Anthropic och OpenAI släpper verktyg för hantering av AI-agenter

Rapporterad av AI Bild genererad av AI

Den 5 februari 2026 lanserade Anthropic och OpenAI samtidigt produkter som skiftar användare från att chatta med AI till att hantera team av AI-agenter. Anthropic introducerade Claude Opus 4.6 med agentteam för utvecklare, medan OpenAI avslöjade Frontier och GPT-5.3-Codex för företagsarbetsflöden. Dessa lanseringar sammanfaller med ett fall på 285 miljarder dollar i mjukvaruaktier mitt i rädslor för att AI stör traditionella SaaS-leverantörer.

Det franska startupföretaget Mistral AI har presenterat en ny familj av AI-modeller utformade för snabb översättning. Företaget ställer detta släpp som en utmaning till stora amerikanska AI-företag genom att betona effektivitet framför tung resursanvändning. Mistral hävdar att modellerna banar väg för sömlösa flerspråkiga samtal.

Rapporterad av AI

Den franska AI-utvecklaren Mistral AI har släppt två nya transkriptionsmodeller utformade för att köras direkt på användarens enheter, med fokus på integritet och hastighet. Modellerna, Voxtral Mini Transcribe 2 och Voxtral Realtime, syftar till att hålla känsliga samtal borta från internet. De möjliggör snabb och noggrann transkription utan att förlita sig på molnservrar.

Apple har släppt Xcode 26.3, vilket förbättrar dess integrerade utvecklingsmiljö med djupare integration för AI-kodningsagenter som Claude och OpenAI:s Codex. Uppdateringen utnyttjar Model Context Protocol för att låta dessa agenter få bättre tillgång till dokumentation, filstrukturer och projektinställningar. Detta bygger vidare på AI-funktioner som introducerades i Xcode 26 vid WWDC 2025.

Rapporterad av AI

Google har släppt Gemini 3.1 Pro, en uppdaterad version av sin flaggskepps-AI-modell, med fokus på förbättringar i problemlösning och resonemang. Modellen är tillgänglig i förhandsvisning för utvecklare och konsumenter från och med idag. Den bygger på Gemini 3-släppet från november.

OpenAI flyttar resurser mot förbättringar av sin flaggskeppschattbot ChatGPT, vilket leder till att flera seniorforskare lämnar. San Francisco-företaget står inför intensiv konkurrens från Google och Anthropic, vilket driver en strategisk vändning från långsiktig forskning. Denna förändring väcker oro för framtiden för innovativ AI-utforskning på företaget.

Rapporterad av AI

Utvecklaren Grolaf har släppt en demo för Codex Mortis, ett bullet hell-spel i stil med Vampire Survivors, som påstås vara världens första fullt spelbara titel skapad helt med AI-verktyg. Projektet, byggt på tre månader utan traditionell spel-motor, använder AI för allt från kod och tillgångar till musik och animationer. Medan demot får blandade recensioner väcker det debatt om AI:s roll i spelutveckling.

 

 

 

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj