Mistral AI lanza el modelo de codificación Devstral 2 y la herramienta Vibe

La startup francesa Mistral AI ha lanzado Devstral 2, un modelo de IA de pesos abiertos con 123.000 millones de parámetros para codificación, que obtiene un 72,2 % en el benchmark SWE-bench Verified. Junto a él, la compañía presentó Mistral Vibe, una interfaz de línea de comandos para tareas de ingeniería de software autónomas. También debutó una versión más pequeña, Devstral Small 2, para uso local en hardware de consumo.

El 10 de diciembre de 2025, Mistral AI presentó Devstral 2, diseñado para funcionar dentro de un agente de ingeniería de software autónomo. Este modelo destaca en la resolución de problemas reales de GitHub, logrando una puntuación del 72,2 % en SWE-bench Verified, una prueba que incluye 500 problemas de repositorios populares de Python. El benchmark requiere que la IA lea descripciones de problemas, navegue por bases de código y produzca parches que pasen las pruebas unitarias, tareas que los ingenieros experimentados suelen considerar correcciones de errores sencillas.

Complementando el modelo está Mistral Vibe, una herramienta CLI con licencia Apache 2.0. Permite a los desarrolladores interactuar directamente con los modelos Devstral en su terminal, escaneando estructuras de archivos y el estado de Git para obtener contexto a nivel de proyecto. La herramienta puede modificar múltiples archivos y ejecutar comandos de shell de forma independiente, similar a interfaces como Claude Code o OpenAI Codex.

Mistral también lanzó Devstral Small 2, una variante de 24.000 millones de parámetros que obtiene un 68 % en el benchmark. Funciona sin conexión en portátiles y ambos modelos manejan una ventana de contexto de 256.000 tokens para bases de código considerables. Devstral 2 utiliza una licencia MIT modificada, mientras que la versión más pequeña está bajo Apache 2.0.

Los precios comienzan gratis a través de la API de Mistral, pasando a 0,40 dólares por millón de tokens de entrada y 2,00 dólares por millón de tokens de salida para Devstral 2, lo que se afirma es siete veces más eficiente que Claude Sonnet 4.5 de Anthropic, que cobra 3 y 15 dólares por millón de tokens respectivamente.

El lanzamiento se vincula con el 'vibe coding', un término acuñado por Andrej Karpathy en febrero de 2025, que describe indicaciones en lenguaje natural para código generado por IA sin revisión profunda. El desarrollador Simon Willison lo elogió para prototipado: «Realmente disfruto el vibe coding. Es una forma divertida de probar una idea y demostrar si puede funcionar». Sin embargo, advirtió: «codificar con vibe hasta llegar a un codebase de producción es claramente arriesgado», enfatizando la necesidad de calidad de código en sistemas en evolución.

Mistral afirma que Devstral 2 puede mantener la coherencia del proyecto, corregir errores, modernizar código heredado y gestionar dependencias a escala, extendiendo potencialmente el vibe coding más allá de los prototipos.

Artículos relacionados

Photo illustration of Google executives unveiling the Gemini 3 AI model and Antigravity IDE in a conference setting.
Imagen generada por IA

Google presenta el modelo de IA Gemini 3 y el IDE Antigravity

Reportado por IA Imagen generada por IA

Google ha lanzado Gemini 3 Pro, su último modelo insignia de IA, que enfatiza un razonamiento mejorado, salidas visuales y capacidades de codificación. La compañía también introdujo Antigravity, un entorno de desarrollo integrado centrado en IA. Ambos están disponibles en vista previa limitada a partir de hoy.

Los agentes de codificación con IA de empresas como OpenAI, Anthropic y Google permiten trabajos prolongados en proyectos de software, incluyendo la escritura de aplicaciones y la corrección de errores bajo supervisión humana. Estas herramientas se basan en modelos de lenguaje grandes pero enfrentan desafíos como el procesamiento limitado de contexto y altos costos computacionales. Comprender su mecánica ayuda a los desarrolladores a decidir cuándo desplegarlos de manera efectiva.

Reportado por IA

Un experimento de CNET comparó los modelos Gemini 3 Pro y Gemini 2.5 Flash de Google para codificación vibe, un enfoque casual para generar código mediante chat de IA. El modelo de razonamiento resultó más fácil y completo, mientras que el modelo rápido requirió más intervención manual. Los resultados sugieren que la elección del modelo afecta significativamente la experiencia de desarrollo.

En 2025, los agentes de IA se convirtieron en el centro del progreso de la inteligencia artificial, permitiendo que los sistemas usen herramientas y actúen de manera autónoma. Desde la teoría hasta las aplicaciones cotidianas, transformaron las interacciones humanas con los grandes modelos de lenguaje. Sin embargo, también trajeron desafíos como riesgos de seguridad y lagunas regulatorias.

Reportado por IA

En una evaluación comparativa de modelos líderes de IA, el Gemini 3.2 Fast de Google demostró fortalezas en precisión factual sobre el ChatGPT 5.2 de OpenAI, particularmente en tareas informativas. Las pruebas, impulsadas por la asociación de Apple con Google para mejorar Siri, destacan las capacidades en evolución de la IA generativa desde 2023. Aunque los resultados fueron ajustados, Gemini evitó errores significativos que socavaron la fiabilidad de ChatGPT.

Investigadores de la Icahn School of Medicine at Mount Sinai han desarrollado un sistema de inteligencia artificial llamado V2P que no solo evalúa si las mutaciones genéticas son probablemente perjudiciales, sino que también predice las amplias categorías de enfermedades que pueden causar. El enfoque, descrito en un artículo en Nature Communications, busca acelerar el diagnóstico genético y respaldar tratamientos más personalizados, especialmente para afecciones raras y complejas.

Reportado por IA

Google ha introducido un nuevo 'modelo de mundo' de IA conocido como Project Genie, que ya está influyendo en la industria de los juegos. Sin embargo, atrae críticas por aspectos de la inteligencia artificial que algunos detestan. El desarrollo fue destacado en un artículo de TechRadar publicado el 2 de febrero de 2026.

 

 

 

Este sitio web utiliza cookies

Utilizamos cookies para análisis con el fin de mejorar nuestro sitio. Lee nuestra política de privacidad para más información.
Rechazar