Mistral AI が高速でプライベートなデバイス上転写モデルを公開

フランスのAI開発企業 Mistral AI は、ユーザーデバイス上で直接動作するよう設計された2つの新しい転写モデルをリリースし、プライバシーと速度を優先。Voxtral Mini Transcribe 2 と Voxtral Realtime は、機密会話インターネットから守ることを目的とする。クラウドサーバーに依存せずに迅速で正確な転写を可能にする。

Mistral AI は水曜日に最新の転写モデルを発表し、デバイス上処理に焦点を当ててユーザー・プライバシーを強化。これらのツールは、医師や弁護士との議論、ジャーナリスティックなインタビューなどの機密シナリオに特に適しており、データセキュリティが最優先される。Voxtral Mini Transcribe 2 は Mistral の科学運用副社長 Pierre Stock により「超、超小さい」と形容される。このコンパクトさにより、スマートフォン、ラップトップ、スマートウォッチなどのウェアラブルで動作可能となり、リモートデータセンターへのオーディオ送信が不要となる。第2のモデル Voxtral Realtime は、クローズドキャプションに似たリアルタイム転写をサポートし、200ミリ秒未満のレイテンシ — 読書速度に追いつき、2〜3秒の遅延を避けるのに十分な速さ — を実現。Stock はエッジコンピューティングの利点を強調:「欲しいのは転写が超、超あなたに近いところで起こること。あなたに最も近いのはエッジデバイス、例えばラップトップ、スマホ、スマートウォッチなどのウェアラブルだ。」ローカル処理によりレイテンシを低減し、会話がデバイスを離れないためプライバシーを保護。両モデルとも13言語対応で、Mistral の API、Hugging Face、または同社の AI Studio で利用可能。テストでは Voxtral Realtime が英語と一部スペイン語を正確かつ迅速に転写したが、固有名詞を時折誤り、「Mistral AI」を「Mr. Lay Eye」、「Voxtral」を「VoxTroll」とした。Stock は、特定のジャーゴンや名前の扱いを改善するためユーザーによるカスタマイズが可能と指摘。Mistral はベンチマークで競合より低いエラー率を示すと強調。Stock の説明:「小さいモデルを作るだけじゃ不十分。小さいモデルでも大きいモデルと同じ品質が必要だよね?」このサイズ、速度、精度のバランスが、アクセス可能な AI 転写の前進となる。

関連記事

Realistic illustration of a user experiencing Google's live translation feature via headphones on Android, with multilingual speech bubbles in an airport setting.
AIによって生成された画像

Google、ライブ翻訳を任意のヘッドホンに拡張

AIによるレポート AIによって生成された画像

GoogleはTranslateアプリを更新し、Androidデバイスに接続された任意のヘッドホンを使ったリアルタイム音声対音声翻訳を可能にします。Gemini AI駆動のベータ機能は70言語以上をサポートし、慣用句やスラングの処理を改善します。最初は米国、メキシコ、インドで展開され、iOS対応は後で予定されています。

フランスのスタートアップ Mistral AI は、迅速な翻訳向けに設計された新しい AI モデルファミリーを公開しました。同社はこのリリースを、大量の資源使用ではなく効率性を強調することで、主要な米国 AI 企業への挑戦として位置づけています。Mistral は、これらのモデルがシームレスな多言語会話への道を開くと主張しています。

AIによるレポート

フランスのスタートアップMistral AIは、コーディング向け1230億パラメータのオープンウェイトAIモデルDevstral 2をリリースし、SWE-bench Verifiedベンチマークで72.2%を記録した。これに伴い、同社は自律型ソフトウェアエンジニアリングタスク向けCLIツールMistral Vibeを導入した。また、消費者向けハードウェアでのローカル使用を想定した小型版Devstral Small 2も登場した。

主要AIモデルの比較評価で、GoogleのGemini 3.2 FastはOpenAIのChatGPT 5.2に対し、事実精度で優位性を示した。特に情報タスクで顕著だった。これらのテストは、AppleがGoogleと提携してSiriを強化したことを受けて行われ、2023年以来の生成AIの進化を強調している。結果は僅差だったが、GeminiはChatGPTの信頼性を損なう重大な誤りを避けた。

AIによるレポート

Signalメッセージングアプリの作成者であるMoxie Marlinspike氏が、大規模言語モデルとの会話でユーザーのプライバシーを優先するオープンソースのAIアシスタントConferを発表した。このツールは、ユーザーデータとやり取りを暗号化し、アカウント保有者のみがアクセス可能とし、プラットフォーム運営者、ハッカー、法執行機関から保護する。この発売は、AIプラットフォームでのデータ収集に対する懸念の高まりに対応する。

ExpressVPNは、AIチャットボットから流出した370万件のデータを発見した。流出した情報には、音声やテキストメッセージのほか、最大4時間のプライベートな音声録音も含まれている。この発見は、暗号化の重要性を再認識させるものである。

AIによるレポート

Appleは、ウェアラブル向けAIインターフェースの唇読み技術を開発するイスラエルスタートアップQ.aiを買収した。この取引は約20億ドルと評価され、メガネやイヤーバッドなどのデバイスとのユーザーインタラクションの潜在的な変化を示唆している。この動きは、Appleが製品に先進センシング技術を統合してきた歴史の上に成り立っている。

 

 

 

このウェブサイトはCookieを使用します

サイトを改善するための分析にCookieを使用します。詳細については、プライバシーポリシーをお読みください。
拒否