Mistral AI lança modelo de codificação Devstral 2 e ferramenta Vibe

A startup francesa Mistral AI lançou o Devstral 2, um modelo de IA de pesos abertos com 123 bilhões de parâmetros para codificação, registrando 72,2% no benchmark SWE-bench Verified. Ao lado dele, a empresa introduziu o Mistral Vibe, uma interface de linha de comando para tarefas de engenharia de software autônomas. Uma versão menor, Devstral Small 2, também estreou para uso local em hardware de consumo.

Em 10 de dezembro de 2025, a Mistral AI revelou o Devstral 2, projetado para funcionar dentro de um agente de engenharia de software autônomo. Este modelo se destaca na resolução de problemas reais do GitHub, alcançando 72,2% no SWE-bench Verified, um teste com 500 problemas de repositórios Python populares. O benchmark exige que a IA leia descrições de problemas, navegue por bases de código e produza patches que passem em testes unitários—tarefas frequentemente vistas como correções de bugs simples por engenheiros experientes.

Complementando o modelo está o Mistral Vibe, uma ferramenta CLI licenciada sob Apache 2.0. Ela permite que desenvolvedores interajam com modelos Devstral diretamente no terminal, escaneando estruturas de arquivos e status do Git para contexto em nível de projeto. A ferramenta pode modificar múltiplos arquivos e executar comandos shell de forma independente, semelhante a interfaces como Claude Code ou OpenAI Codex.

A Mistral também lançou o Devstral Small 2, uma variante de 24 bilhões de parâmetros com 68% no benchmark. Ele opera offline em laptops e ambos os modelos lidam com uma janela de contexto de 256.000 tokens para bases de código consideráveis. O Devstral 2 usa uma licença MIT modificada, enquanto o menor está sob Apache 2.0.

Os preços começam grátis via API da Mistral, passando para US$ 0,40 por milhão de tokens de entrada e US$ 2,00 por milhão de tokens de saída para o Devstral 2—afirmado ser sete vezes mais eficiente que o Claude Sonnet 4.5 da Anthropic, que cobra US$ 3 e US$ 15 por milhão de tokens, respectivamente.

O lançamento está ligado ao 'vibe coding', termo cunhado por Andrej Karpathy em fevereiro de 2025, descrevendo prompts em linguagem natural para código gerado por IA sem revisão profunda. O desenvolvedor Simon Willison elogiou para prototipagem: “Eu realmente gosto de vibe coding. É uma forma divertida de experimentar uma ideia e provar se funciona.” No entanto, ele alertou: “vibe coding até um codebase de produção é claramente arriscado”, enfatizando a necessidade de qualidade de código em sistemas em evolução.

A Mistral afirma que o Devstral 2 pode manter a coerência do projeto, corrigir bugs, modernizar código legado e gerenciar dependências em escala, potencialmente estendendo o vibe coding além de protótipos.

Artigos relacionados

Photo illustration of Google executives unveiling the Gemini 3 AI model and Antigravity IDE in a conference setting.
Imagem gerada por IA

Google apresenta modelo de IA Gemini 3 e IDE Antigravity

Reportado por IA Imagem gerada por IA

O Google lançou o Gemini 3 Pro, seu mais recente modelo principal de IA, enfatizando raciocínio aprimorado, saídas visuais e capacidades de codificação. A empresa também introduziu o Antigravity, um ambiente de desenvolvimento integrado com foco em IA. Ambos estão disponíveis em visualização limitada a partir de hoje.

Agentes de codificação com IA de empresas como OpenAI, Anthropic e Google permitem trabalhos prolongados em projetos de software, incluindo a escrita de aplicativos e correção de bugs sob supervisão humana. Essas ferramentas dependem de modelos de linguagem grandes, mas enfrentam desafios como processamento de contexto limitado e altos custos computacionais. Entender sua mecânica ajuda os desenvolvedores a decidir quando implantá-los de forma eficaz.

Reportado por IA

Um experimento da CNET comparou os modelos Gemini 3 Pro e Gemini 2.5 Flash do Google para vibe coding, uma abordagem casual para gerar código via chat de IA. O modelo de raciocínio provou ser mais fácil e abrangente, enquanto o modelo rápido exigiu mais intervenção manual. Os resultados sugerem que a escolha do modelo afeta significativamente a experiência de desenvolvimento.

In 2025, AI agents became central to artificial intelligence progress, enabling systems to use tools and act autonomously. From theory to everyday applications, they transformed human interactions with large language models. Yet, they also brought challenges like security risks and regulatory gaps.

Reportado por IA

Em uma avaliação comparativa de modelos líderes de IA, o Gemini 3.2 Fast do Google demonstrou forças em precisão factual sobre o ChatGPT 5.2 da OpenAI, particularmente em tarefas informacionais. Os testes, motivados pela parceria da Apple com o Google para aprimorar o Siri, destacam as capacidades em evolução da IA generativa desde 2023. Embora os resultados fossem próximos, o Gemini evitou erros significativos que comprometeram a confiabilidade do ChatGPT.

Pesquisadores da Icahn School of Medicine at Mount Sinai desenvolveram um sistema de inteligência artificial chamado V2P que não só avalia se mutações genéticas são provavelmente prejudiciais, mas também prevê as amplas categorias de doenças que podem causar. A abordagem, descrita em um artigo na Nature Communications, visa acelerar o diagnóstico genético e apoiar tratamentos mais personalizados, especialmente para condições raras e complexas.

Reportado por IA

Google has introduced a new AI 'world model' known as Project Genie, which is already influencing the games industry. However, it draws criticism for aspects of artificial intelligence that some dislike. The development was highlighted in a TechRadar article published on February 2, 2026.

 

 

 

Este site usa cookies

Usamos cookies para análise para melhorar nosso site. Leia nossa política de privacidade para mais informações.
Recusar