フランスのスタートアップMistral AIは、コーディング向け1230億パラメータのオープンウェイトAIモデルDevstral 2をリリースし、SWE-bench Verifiedベンチマークで72.2%を記録した。これに伴い、同社は自律型ソフトウェアエンジニアリングタスク向けCLIツールMistral Vibeを導入した。また、消費者向けハードウェアでのローカル使用を想定した小型版Devstral Small 2も登場した。
2025年12月10日、Mistral AIは自律型ソフトウェアエンジニアリングエージェント内で動作するよう設計されたDevstral 2を発表した。このモデルは実際のGitHubイシューを解決することに優れ、人気のPythonリポジトリからの500問の問題を含むSWE-bench Verifiedで72.2%のスコアを達成した。このベンチマークでは、AIがイシュー記述を読み込み、コードベースをナビゲートし、ユニットテストに合格するパッチを生成する必要があり、経験豊富なエンジニアにとっては単純なバグ修正と見なされるタスクである。
モデルを補完するのがApache 2.0ライセンスのCLIツールMistral Vibeだ。開発者はターミナル上でDevstralモデルと直接やり取りでき、ファイル構造やGitステータスをスキャンしてプロジェクト全体のコンテキストを得られる。このツールは複数のファイルを修正したり、シェルコマンドを独立して実行したりでき、Claude CodeやOpenAI Codexのようなインターフェースに類似している。
Mistralはまた、ベンチマークで68%を記録した240億パラメータのバリエーションDevstral Small 2もリリースした。これはラップトップでオフライン動作可能で、両モデルとも大規模コードベース向けに256,000トークンのコンテキストウィンドウを扱う。Devstral 2は修正MITライセンスを使用し、小型版はApache 2.0だ。
価格はMistralのAPI経由で無料から始まり、Devstral 2では入力トークンあたり100万で0.40ドル、出力トークンあたり2.00ドルに移行—AnthropicのClaude Sonnet 4.5(それぞれ3ドルと15ドル)より7倍効率的とされる。
このリリースは2025年2月にAndrej Karpathyが造語した「vibe coding」と結びつき、深いレビューなしにAI生成コードのための自然言語プロンプトを指す。開発者のSimon Willisonはプロトタイピングで称賛:「vibe codingは本当に楽しい。アイデアを試して動作するかを証明する素晴らしい方法だ。」しかし警告:「vibe codingで本番コードベースに至るのは明らかにリスクが高い」と、進化するシステムでのコード品質の必要性を強調した。
Mistralによると、Devstral 2はプロジェクトの整合性を維持し、バグ修正、レガシーコードの近代化、大規模依存関係管理が可能で、vibe codingをプロトタイプを超えて拡張する可能性がある。