La startup française Mistral AI a publié Devstral 2, un modèle d'IA open-weights de 123 milliards de paramètres pour le codage, obtenant 72,2 % sur le benchmark SWE-bench Verified. Parallèlement, l'entreprise a introduit Mistral Vibe, une interface en ligne de commande pour les tâches d'ingénierie logicielle autonomes. Une version plus petite, Devstral Small 2, a également été lancée pour un usage local sur du matériel grand public.
Le 10 décembre 2025, Mistral AI a dévoilé Devstral 2, conçu pour fonctionner au sein d'un agent d'ingénierie logicielle autonome. Ce modèle excelle dans la résolution de problèmes réels sur GitHub, atteignant un score de 72,2 % sur SWE-bench Verified, un test impliquant 500 problèmes issus de dépôts Python populaires. Le benchmark exige que l'IA lise les descriptions des problèmes, navigue dans les bases de code et produise des correctifs passant les tests unitaires — des tâches souvent considérées comme des corrections de bugs simples par les ingénieurs expérimentés.
Complémentant le modèle, Mistral Vibe est un outil CLI sous licence Apache 2.0. Il permet aux développeurs d'interagir directement avec les modèles Devstral dans leur terminal, en scannant les structures de fichiers et l'état Git pour un contexte à l'échelle du projet. L'outil peut modifier plusieurs fichiers et exécuter des commandes shell de manière indépendante, à l'image d'interfaces comme Claude Code ou OpenAI Codex.
Mistral a également lancé Devstral Small 2, une variante de 24 milliards de paramètres scorant 68 % sur le benchmark. Il fonctionne hors ligne sur les ordinateurs portables et les deux modèles gèrent une fenêtre de contexte de 256 000 jetons pour des bases de code importantes. Devstral 2 utilise une licence MIT modifiée, tandis que la version plus petite est sous Apache 2.0.
La tarification commence gratuitement via l'API de Mistral, passant à 0,40 $ par million de jetons d'entrée et 2,00 $ par million de jetons de sortie pour Devstral 2 — prétendument sept fois plus efficace que Claude Sonnet 4.5 d'Anthropic, qui facture 3 $ et 15 $ par million de jetons respectivement.
La sortie est liée au « vibe coding », un terme inventé par Andrej Karpathy en février 2025, décrivant des invites en langage naturel pour du code généré par IA sans examen approfondi. Le développeur Simon Willison l'a loué pour le prototypage : « J'adore vraiment le vibe coding. C'est une façon amusante d'essayer une idée et de vérifier si elle fonctionne. » Mais il a mis en garde : « coder en vibe jusqu'à une base de code de production est clairement risqué », soulignant le besoin de qualité de code dans les systèmes en évolution.
Mistral affirme que Devstral 2 peut maintenir la cohérence du projet, corriger les bugs, moderniser le code legacy et gérer les dépendances à grande échelle, potentiellement étendant le vibe coding au-delà des prototypes.