フランスのAI開発企業 Mistral AI は、ユーザーデバイス上で直接動作するよう設計された2つの新しい転写モデルをリリースし、プライバシーと速度を優先。Voxtral Mini Transcribe 2 と Voxtral Realtime は、機密会話インターネットから守ることを目的とする。クラウドサーバーに依存せずに迅速で正確な転写を可能にする。
Mistral AI は水曜日に最新の転写モデルを発表し、デバイス上処理に焦点を当ててユーザー・プライバシーを強化。これらのツールは、医師や弁護士との議論、ジャーナリスティックなインタビューなどの機密シナリオに特に適しており、データセキュリティが最優先される。Voxtral Mini Transcribe 2 は Mistral の科学運用副社長 Pierre Stock により「超、超小さい」と形容される。このコンパクトさにより、スマートフォン、ラップトップ、スマートウォッチなどのウェアラブルで動作可能となり、リモートデータセンターへのオーディオ送信が不要となる。第2のモデル Voxtral Realtime は、クローズドキャプションに似たリアルタイム転写をサポートし、200ミリ秒未満のレイテンシ — 読書速度に追いつき、2〜3秒の遅延を避けるのに十分な速さ — を実現。Stock はエッジコンピューティングの利点を強調:「欲しいのは転写が超、超あなたに近いところで起こること。あなたに最も近いのはエッジデバイス、例えばラップトップ、スマホ、スマートウォッチなどのウェアラブルだ。」ローカル処理によりレイテンシを低減し、会話がデバイスを離れないためプライバシーを保護。両モデルとも13言語対応で、Mistral の API、Hugging Face、または同社の AI Studio で利用可能。テストでは Voxtral Realtime が英語と一部スペイン語を正確かつ迅速に転写したが、固有名詞を時折誤り、「Mistral AI」を「Mr. Lay Eye」、「Voxtral」を「VoxTroll」とした。Stock は、特定のジャーゴンや名前の扱いを改善するためユーザーによるカスタマイズが可能と指摘。Mistral はベンチマークで競合より低いエラー率を示すと強調。Stock の説明:「小さいモデルを作るだけじゃ不十分。小さいモデルでも大きいモデルと同じ品質が必要だよね?」このサイズ、速度、精度のバランスが、アクセス可能な AI 転写の前進となる。