Mistral AI lance le modèle de codage Devstral 2 et l'outil Vibe

La startup française Mistral AI a publié Devstral 2, un modèle d'IA open-weights de 123 milliards de paramètres pour le codage, obtenant 72,2 % sur le benchmark SWE-bench Verified. Parallèlement, l'entreprise a introduit Mistral Vibe, une interface en ligne de commande pour les tâches d'ingénierie logicielle autonomes. Une version plus petite, Devstral Small 2, a également été lancée pour un usage local sur du matériel grand public.

Le 10 décembre 2025, Mistral AI a dévoilé Devstral 2, conçu pour fonctionner au sein d'un agent d'ingénierie logicielle autonome. Ce modèle excelle dans la résolution de problèmes réels sur GitHub, atteignant un score de 72,2 % sur SWE-bench Verified, un test impliquant 500 problèmes issus de dépôts Python populaires. Le benchmark exige que l'IA lise les descriptions des problèmes, navigue dans les bases de code et produise des correctifs passant les tests unitaires — des tâches souvent considérées comme des corrections de bugs simples par les ingénieurs expérimentés.

Complémentant le modèle, Mistral Vibe est un outil CLI sous licence Apache 2.0. Il permet aux développeurs d'interagir directement avec les modèles Devstral dans leur terminal, en scannant les structures de fichiers et l'état Git pour un contexte à l'échelle du projet. L'outil peut modifier plusieurs fichiers et exécuter des commandes shell de manière indépendante, à l'image d'interfaces comme Claude Code ou OpenAI Codex.

Mistral a également lancé Devstral Small 2, une variante de 24 milliards de paramètres scorant 68 % sur le benchmark. Il fonctionne hors ligne sur les ordinateurs portables et les deux modèles gèrent une fenêtre de contexte de 256 000 jetons pour des bases de code importantes. Devstral 2 utilise une licence MIT modifiée, tandis que la version plus petite est sous Apache 2.0.

La tarification commence gratuitement via l'API de Mistral, passant à 0,40 $ par million de jetons d'entrée et 2,00 $ par million de jetons de sortie pour Devstral 2 — prétendument sept fois plus efficace que Claude Sonnet 4.5 d'Anthropic, qui facture 3 $ et 15 $ par million de jetons respectivement.

La sortie est liée au « vibe coding », un terme inventé par Andrej Karpathy en février 2025, décrivant des invites en langage naturel pour du code généré par IA sans examen approfondi. Le développeur Simon Willison l'a loué pour le prototypage : « J'adore vraiment le vibe coding. C'est une façon amusante d'essayer une idée et de vérifier si elle fonctionne. » Mais il a mis en garde : « coder en vibe jusqu'à une base de code de production est clairement risqué », soulignant le besoin de qualité de code dans les systèmes en évolution.

Mistral affirme que Devstral 2 peut maintenir la cohérence du projet, corriger les bugs, moderniser le code legacy et gérer les dépendances à grande échelle, potentiellement étendant le vibe coding au-delà des prototypes.

Articles connexes

Photo illustration of Google executives unveiling the Gemini 3 AI model and Antigravity IDE in a conference setting.
Image générée par IA

Google dévoile le modèle d'IA Gemini 3 et l'IDE Antigravity

Rapporté par l'IA Image générée par IA

Google a lancé Gemini 3 Pro, son dernier modèle phare d'IA, en mettant l'accent sur un raisonnement amélioré, des sorties visuelles et des capacités de codage. L'entreprise a également introduit Antigravity, un environnement de développement intégré axé sur l'IA. Les deux sont disponibles en aperçu limité à partir d'aujourd'hui.

Les agents de codage IA de sociétés comme OpenAI, Anthropic et Google permettent un travail prolongé sur des projets logiciels, y compris l'écriture d'applications et la correction de bugs sous surveillance humaine. Ces outils reposent sur de grands modèles de langage mais font face à des défis comme un traitement de contexte limité et des coûts computationnels élevés. Comprendre leur fonctionnement aide les développeurs à décider quand les déployer efficacement.

Rapporté par l'IA

Une expérience de CNET a comparé les modèles Gemini 3 Pro et Gemini 2.5 Flash de Google pour le vibe coding, une approche décontractée pour générer du code via chat IA. Le modèle de réflexion s'est avéré plus facile et plus complet, tandis que le modèle rapide a requis plus d'interventions manuelles. Les résultats suggèrent que le choix du modèle affecte significativement l'expérience de développement.

Anthropic a introduit Cowork, un nouvel outil qui étend son IA Claude pour gérer des tâches de bureau générales en accédant aux dossiers des utilisateurs sur les ordinateurs Mac. Conçu pour les non-développeurs, il permet des instructions en langage courant pour organiser des fichiers, créer des rapports, et plus. La fonctionnalité est disponible en aperçu de recherche pour les abonnés Claude Max.

Rapporté par l'IA

Linus Torvalds, créateur de Linux, a commencé à expérimenter la 'codification vibe' assistée par IA pour un outil audio sous-marin personnel. Bien qu connu comme sceptique de l'IA, il a employé la technologie pour surmonter son manque de familiarité avec Python. Cela marque une adoption prudente de l'IA dans le développement de logiciels non critiques.

Sandfall Interactive a détaillé son expérimentation limitée avec l’IA générative pour des textures temporaires dans Clair Obscur: Expedition 33, après la disqualification du jeu dans les catégories Jeu de l’année et Meilleur jeu débutant aux Indie Game Awards 2025. Le studio, qui a retiré les assets peu après le lancement via un patch, promet que tous ses projets futurs seront entièrement réalisés par des humains.

Rapporté par l'IA

Après la révocation la semaine dernière de son prix de Jeu indie de l'année pour usage d'IA, Clair Obscur: Expedition 33 s'est vendu à plus de cinq millions d'exemplaires en 2025 au milieu de discussions enflammées dans l'industrie sur le rôle de l'IA dans le développement de jeux, les règles de divulgation et les critères de prix.

 

 

 

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser