Mistral AIがDevstral 2コーディングモデルとVibeツールをリリース

フランスのスタートアップMistral AIは、コーディング向け1230億パラメータのオープンウェイトAIモデルDevstral 2をリリースし、SWE-bench Verifiedベンチマークで72.2%を記録した。これに伴い、同社は自律型ソフトウェアエンジニアリングタスク向けCLIツールMistral Vibeを導入した。また、消費者向けハードウェアでのローカル使用を想定した小型版Devstral Small 2も登場した。

2025年12月10日、Mistral AIは自律型ソフトウェアエンジニアリングエージェント内で動作するよう設計されたDevstral 2を発表した。このモデルは実際のGitHubイシューを解決することに優れ、人気のPythonリポジトリからの500問の問題を含むSWE-bench Verifiedで72.2%のスコアを達成した。このベンチマークでは、AIがイシュー記述を読み込み、コードベースをナビゲートし、ユニットテストに合格するパッチを生成する必要があり、経験豊富なエンジニアにとっては単純なバグ修正と見なされるタスクである。

モデルを補完するのがApache 2.0ライセンスのCLIツールMistral Vibeだ。開発者はターミナル上でDevstralモデルと直接やり取りでき、ファイル構造やGitステータスをスキャンしてプロジェクト全体のコンテキストを得られる。このツールは複数のファイルを修正したり、シェルコマンドを独立して実行したりでき、Claude CodeやOpenAI Codexのようなインターフェースに類似している。

Mistralはまた、ベンチマークで68%を記録した240億パラメータのバリエーションDevstral Small 2もリリースした。これはラップトップでオフライン動作可能で、両モデルとも大規模コードベース向けに256,000トークンのコンテキストウィンドウを扱う。Devstral 2は修正MITライセンスを使用し、小型版はApache 2.0だ。

価格はMistralのAPI経由で無料から始まり、Devstral 2では入力トークンあたり100万で0.40ドル、出力トークンあたり2.00ドルに移行—AnthropicのClaude Sonnet 4.5(それぞれ3ドルと15ドル)より7倍効率的とされる。

このリリースは2025年2月にAndrej Karpathyが造語した「vibe coding」と結びつき、深いレビューなしにAI生成コードのための自然言語プロンプトを指す。開発者のSimon Willisonはプロトタイピングで称賛:「vibe codingは本当に楽しい。アイデアを試して動作するかを証明する素晴らしい方法だ。」しかし警告:「vibe codingで本番コードベースに至るのは明らかにリスクが高い」と、進化するシステムでのコード品質の必要性を強調した。

Mistralによると、Devstral 2はプロジェクトの整合性を維持し、バグ修正、レガシーコードの近代化、大規模依存関係管理が可能で、vibe codingをプロトタイプを超えて拡張する可能性がある。

関連記事

Illustration depicting Anthropic and OpenAI launching AI agent teams amid a $285B software stock drop.
AIによって生成された画像

AnthropicとOpenAI、AIエージェント管理ツールをリリース

AIによるレポート AIによって生成された画像

2026年2月5日、AnthropicとOpenAIは同時に製品を発売し、ユーザーをAIとのチャットからAIエージェントチームの管理へ移行させるものだ。Anthropicは開発者向けエージェントチーム付きClaude Opus 4.6を導入し、OpenAIは企業ワークフロー向けFrontierとGPT-5.3-Codexを発表した。これらのリリースは、AIが伝統的なSaaSベンダーを混乱させる懸念の中でソフトウェア株が2850億ドル下落するのに重なる。

フランスのスタートアップ Mistral AI は、迅速な翻訳向けに設計された新しい AI モデルファミリーを公開しました。同社はこのリリースを、大量の資源使用ではなく効率性を強調することで、主要な米国 AI 企業への挑戦として位置づけています。Mistral は、これらのモデルがシームレスな多言語会話への道を開くと主張しています。

AIによるレポート

フランスのAI開発企業 Mistral AI は、ユーザーデバイス上で直接動作するよう設計された2つの新しい転写モデルをリリースし、プライバシーと速度を優先。Voxtral Mini Transcribe 2 と Voxtral Realtime は、機密会話インターネットから守ることを目的とする。クラウドサーバーに依存せずに迅速で正確な転写を可能にする。

AppleはXcode 26.3をリリースし、統合開発環境をClaudeやOpenAIのCodexなどのAIコーディングエージェントとのより深い統合で強化しました。このアップデートはModel Context Protocolを活用し、これらのエージェントがドキュメント、ファイル構造、プロジェクト設定により効果的にアクセスできるようにします。これはWWDC 2025で導入されたXcode 26のAI機能の上に構築されています。

AIによるレポート

GoogleはフラッグシップAIモデルの更新版であるGemini 3.1 Proをリリースしました。問題解決と推論の改善を強調しています。このモデルは本日から開発者と消費者向けにプレビュー版として利用可能です。11月のGemini 3リリースを基盤としています。

OpenAIは主力チャットボットChatGPTの改善にリソースをシフトしており、数名のシニア研究者の離脱を招いている。サンフランシスコの同社はGoogleやAnthropicからの激しい競争に直面し、長期研究からの戦略的ピボットを促している。この変化は、同社の革新的なAI探求の将来に対する懸念を引き起こしている。

AIによるレポート

開発者のGrolafがCodex Mortisのデモをリリースしました。これはVampire Survivorsに似たbullet hellゲームで、世界初の完全にAIツールで作成されたプレイ可能なタイトルだと主張しています。このプロジェクトは伝統的なゲームエンジンを使わず3ヶ月で構築され、コードやアセットから音楽、动画まですべてAIを使用。デモは賛否両論ですが、ゲーム開発におけるAIの役割についての議論を呼んでいます。

 

 

 

このウェブサイトはCookieを使用します

サイトを改善するための分析にCookieを使用します。詳細については、プライバシーポリシーをお読みください。
拒否