Mistral AI が高速でプライベートなデバイス上転写モデルを公開

2026年02月04日(水)

AIによるレポート

フランスのAI開発企業 Mistral AI は、ユーザーデバイス上で直接動作するよう設計された2つの新しい転写モデルをリリースし、プライバシーと速度を優先。Voxtral Mini Transcribe 2 と Voxtral Realtime は、機密会話インターネットから守ることを目的とする。クラウドサーバーに依存せずに迅速で正確な転写を可能にする。

Mistral AI は水曜日に最新の転写モデルを発表し、デバイス上処理に焦点を当ててユーザー・プライバシーを強化。これらのツールは、医師や弁護士との議論、ジャーナリスティックなインタビューなどの機密シナリオに特に適しており、データセキュリティが最優先される。Voxtral Mini Transcribe 2 は Mistral の科学運用副社長 Pierre Stock により「超、超小さい」と形容される。このコンパクトさにより、スマートフォン、ラップトップ、スマートウォッチなどのウェアラブルで動作可能となり、リモートデータセンターへのオーディオ送信が不要となる。第2のモデル Voxtral Realtime は、クローズドキャプションに似たリアルタイム転写をサポートし、200ミリ秒未満のレイテンシ — 読書速度に追いつき、2〜3秒の遅延を避けるのに十分な速さ — を実現。Stock はエッジコンピューティングの利点を強調：「欲しいのは転写が超、超あなたに近いところで起こること。あなたに最も近いのはエッジデバイス、例えばラップトップ、スマホ、スマートウォッチなどのウェアラブルだ。」ローカル処理によりレイテンシを低減し、会話がデバイスを離れないためプライバシーを保護。両モデルとも13言語対応で、Mistral の API、Hugging Face、または同社の AI Studio で利用可能。テストでは Voxtral Realtime が英語と一部スペイン語を正確かつ迅速に転写したが、固有名詞を時折誤り、「Mistral AI」を「Mr. Lay Eye」、「Voxtral」を「VoxTroll」とした。Stock は、特定のジャーゴンや名前の扱いを改善するためユーザーによるカスタマイズが可能と指摘。Mistral はベンチマークで競合より低いエラー率を示すと強調。Stock の説明：「小さいモデルを作るだけじゃ不十分。小さいモデルでも大きいモデルと同じ品質が必要だよね？」このサイズ、速度、精度のバランスが、アクセス可能な AI 転写の前進となる。

Realistic illustration of a user experiencing Google's live translation feature via headphones on Android, with multilingual speech bubbles in an airport setting.

Google、ライブ翻訳を任意のヘッドホンに拡張

2025年12月12日(金) AIによるレポート AIによって生成された画像

GoogleはTranslateアプリを更新し、Androidデバイスに接続された任意のヘッドホンを使ったリアルタイム音声対音声翻訳を可能にします。Gemini AI駆動のベータ機能は70言語以上をサポートし、慣用句やスラングの処理を改善します。最初は米国、メキシコ、インドで展開され、iOS対応は後で予定されています。

Mistral AI が新しい超高速翻訳モデルをリリース

フランスのスタートアップ Mistral AI は、迅速な翻訳向けに設計された新しい AI モデルファミリーを公開しました。同社はこのリリースを、大量の資源使用ではなく効率性を強調することで、主要な米国 AI 企業への挑戦として位置づけています。Mistral は、これらのモデルがシームレスな多言語会話への道を開くと主張しています。

Mistral AIがDevstral 2コーディングモデルとVibeツールをリリース

2025年12月10日(水) AIによるレポート

フランスのスタートアップMistral AIは、コーディング向け1230億パラメータのオープンウェイトAIモデルDevstral 2をリリースし、SWE-bench Verifiedベンチマークで72.2%を記録した。これに伴い、同社は自律型ソフトウェアエンジニアリングタスク向けCLIツールMistral Vibeを導入した。また、消費者向けハードウェアでのローカル使用を想定した小型版Devstral Small 2も登場した。

技術

Apple、Siriの次期アップグレードにGoogleのGeminiを採用

技術

AIチャットボット、女性の健康に関する緊急クエリの60％で失敗

技術

Appleが唇読み技術でイスラエルスタートアップQ.aiを買収

OpenAI、業務生産性を高めるChatGPT-5.2をリリース

OpenAIはChatGPT-5.2をリリースしました。これは推論と生産性を強化する新しいAIモデルファミリーで、特にプロフェッショナルタスク向けです。このリリースは、CEOのSam Altman氏からのGoogleのGemini 3との競争に関する内部アラートに続くものです。アップデートには異なるユーザー需要に対応した3つのバリエーションが含まれており、有料サブスクライバーから開始されます。

SenseTime bets on multimodal AI to regain its edge

2025年12月10日(水) AIによるレポート

Chinese AI pioneer SenseTime is leveraging its computer vision roots to lead the next phase of AI, shifting towards multimodal systems and embodied intelligence in the physical world. Co-founder and chief scientist Lin Dahua stated that this approach mirrors Google's, starting with vision capabilities as the core and adding language to build true multimodal systems.

Google、AI Ultra 加入者に Genie 3 へのアクセスを拡大

Googleは、実験的なAIプロトタイプであるGenie 3を最上位のAIプラン加入者に提供すると発表した。このツールは、シンプルなテキストプロンプトを使ってインタラクティブな3Dワールドを生成・探索できる。以前は信頼できるテスターに限定されていたが、この拡大は18歳以上のユーザーへのより広範なアクセスに向けた一歩となる。

AIコーディングエージェントの仕組みとその限界

2025年12月24日(水) AIによるレポート

OpenAI、Anthropic、Googleなどの企業のAIコーディングエージェントは、人間の監督下でソフトウェアプロジェクトの長期作業を可能にし、アプリの作成やバグ修正を含みます。これらのツールは大規模言語モデルに依存しますが、文脈処理の制限や高い計算コストなどの課題に直面しています。それらの仕組みを理解することで、開発者は効果的に展開するタイミングを判断できます。

2026/02/04 10:16

Mistral AI が高速でプライベートなデバイス上転写モデルを公開

関連記事

Google、ライブ翻訳を任意のヘッドホンに拡張

Mistral AI が新しい超高速翻訳モデルをリリース

Mistral AIがDevstral 2コーディングモデルとVibeツールをリリース

Apple、Siriの次期アップグレードにGoogleのGeminiを採用

AIチャットボット、女性の健康に関する緊急クエリの60％で失敗

Appleが唇読み技術でイスラエルスタートアップQ.aiを買収

OpenAI、業務生産性を高めるChatGPT-5.2をリリース

SenseTime bets on multimodal AI to regain its edge

Google、AI Ultra 加入者に Genie 3 へのアクセスを拡大

AIコーディングエージェントの仕組みとその限界

Moltbook AIソーシャルネットワークがシンギュラリティ警報を鳴らすが人間の入力が関与

GoogleのGeminiが主要AIテストでChatGPTを上回る

Moxie Marlinspike氏、プライバシーを重視したAIアシスタントConferを公開

PlaudがCES 2026でNotePin S AIウェアラブルを発売

Handyアプリが無料のAI駆動スピーチtoテキストを提供

AI処理が速度とプライバシーのためにデバイスに移行

OpenAIのGPT Image 1.5、会話型写真編集を進化させるが倫理的懸念も

OpenAI、ChatGPTの画像を高速生成と精密編集向けにアップグレード

Meta、会話フォーカスとSpotify AIでスマートグラスを更新

GoogleがGemini 3 AIモデルとAntigravity IDEを発表

このウェブサイトはCookieを使用します