A startup francesa Mistral AI lançou o Devstral 2, um modelo de IA de pesos abertos com 123 bilhões de parâmetros para codificação, registrando 72,2% no benchmark SWE-bench Verified. Ao lado dele, a empresa introduziu o Mistral Vibe, uma interface de linha de comando para tarefas de engenharia de software autônomas. Uma versão menor, Devstral Small 2, também estreou para uso local em hardware de consumo.
Em 10 de dezembro de 2025, a Mistral AI revelou o Devstral 2, projetado para funcionar dentro de um agente de engenharia de software autônomo. Este modelo se destaca na resolução de problemas reais do GitHub, alcançando 72,2% no SWE-bench Verified, um teste com 500 problemas de repositórios Python populares. O benchmark exige que a IA leia descrições de problemas, navegue por bases de código e produza patches que passem em testes unitários—tarefas frequentemente vistas como correções de bugs simples por engenheiros experientes.
Complementando o modelo está o Mistral Vibe, uma ferramenta CLI licenciada sob Apache 2.0. Ela permite que desenvolvedores interajam com modelos Devstral diretamente no terminal, escaneando estruturas de arquivos e status do Git para contexto em nível de projeto. A ferramenta pode modificar múltiplos arquivos e executar comandos shell de forma independente, semelhante a interfaces como Claude Code ou OpenAI Codex.
A Mistral também lançou o Devstral Small 2, uma variante de 24 bilhões de parâmetros com 68% no benchmark. Ele opera offline em laptops e ambos os modelos lidam com uma janela de contexto de 256.000 tokens para bases de código consideráveis. O Devstral 2 usa uma licença MIT modificada, enquanto o menor está sob Apache 2.0.
Os preços começam grátis via API da Mistral, passando para US$ 0,40 por milhão de tokens de entrada e US$ 2,00 por milhão de tokens de saída para o Devstral 2—afirmado ser sete vezes mais eficiente que o Claude Sonnet 4.5 da Anthropic, que cobra US$ 3 e US$ 15 por milhão de tokens, respectivamente.
O lançamento está ligado ao 'vibe coding', termo cunhado por Andrej Karpathy em fevereiro de 2025, descrevendo prompts em linguagem natural para código gerado por IA sem revisão profunda. O desenvolvedor Simon Willison elogiou para prototipagem: “Eu realmente gosto de vibe coding. É uma forma divertida de experimentar uma ideia e provar se funciona.” No entanto, ele alertou: “vibe coding até um codebase de produção é claramente arriscado”, enfatizando a necessidade de qualidade de código em sistemas em evolução.
A Mistral afirma que o Devstral 2 pode manter a coerência do projeto, corrigir bugs, modernizar código legado e gerenciar dependências em escala, potencialmente estendendo o vibe coding além de protótipos.