La startup francesa Mistral AI ha lanzado Devstral 2, un modelo de IA de pesos abiertos con 123.000 millones de parámetros para codificación, que obtiene un 72,2 % en el benchmark SWE-bench Verified. Junto a él, la compañía presentó Mistral Vibe, una interfaz de línea de comandos para tareas de ingeniería de software autónomas. También debutó una versión más pequeña, Devstral Small 2, para uso local en hardware de consumo.
El 10 de diciembre de 2025, Mistral AI presentó Devstral 2, diseñado para funcionar dentro de un agente de ingeniería de software autónomo. Este modelo destaca en la resolución de problemas reales de GitHub, logrando una puntuación del 72,2 % en SWE-bench Verified, una prueba que incluye 500 problemas de repositorios populares de Python. El benchmark requiere que la IA lea descripciones de problemas, navegue por bases de código y produzca parches que pasen las pruebas unitarias, tareas que los ingenieros experimentados suelen considerar correcciones de errores sencillas.
Complementando el modelo está Mistral Vibe, una herramienta CLI con licencia Apache 2.0. Permite a los desarrolladores interactuar directamente con los modelos Devstral en su terminal, escaneando estructuras de archivos y el estado de Git para obtener contexto a nivel de proyecto. La herramienta puede modificar múltiples archivos y ejecutar comandos de shell de forma independiente, similar a interfaces como Claude Code o OpenAI Codex.
Mistral también lanzó Devstral Small 2, una variante de 24.000 millones de parámetros que obtiene un 68 % en el benchmark. Funciona sin conexión en portátiles y ambos modelos manejan una ventana de contexto de 256.000 tokens para bases de código considerables. Devstral 2 utiliza una licencia MIT modificada, mientras que la versión más pequeña está bajo Apache 2.0.
Los precios comienzan gratis a través de la API de Mistral, pasando a 0,40 dólares por millón de tokens de entrada y 2,00 dólares por millón de tokens de salida para Devstral 2, lo que se afirma es siete veces más eficiente que Claude Sonnet 4.5 de Anthropic, que cobra 3 y 15 dólares por millón de tokens respectivamente.
El lanzamiento se vincula con el 'vibe coding', un término acuñado por Andrej Karpathy en febrero de 2025, que describe indicaciones en lenguaje natural para código generado por IA sin revisión profunda. El desarrollador Simon Willison lo elogió para prototipado: «Realmente disfruto el vibe coding. Es una forma divertida de probar una idea y demostrar si puede funcionar». Sin embargo, advirtió: «codificar con vibe hasta llegar a un codebase de producción es claramente arriesgado», enfatizando la necesidad de calidad de código en sistemas en evolución.
Mistral afirma que Devstral 2 puede mantener la coherencia del proyecto, corregir errores, modernizar código heredado y gestionar dependencias a escala, extendiendo potencialmente el vibe coding más allá de los prototipos.