Canonical、Ubuntu向けのローカルAI音声入力ツールを開発

Canonicalは、Ubuntu上で完全にローカル環境で動作する音声入力用AIツール「Myna」の初期段階版を発表した。この機能は10月にリリース予定のUbuntu 26.10に搭載される計画である。プッシュ・トゥ・トーク方式を採用しており、すべての処理をデバイス内で行うことでプライバシーを重視している。

このツールは、CanonicalのUbuntuデスクトップ担当エンジニアリングディレクターであるJean-Baptiste Lallement氏によって発表された。これは、4月にJon Seager氏が概説した、音声認識(Speech-to-Text)機能を含むUbuntuの暗黙的なAI機能の計画に基づくものである。

MynaはWayland上のGNOME向けに設計されている。ユーザーがホットキーを押しながら音声入力を行うと、カーソル位置に文字起こしされたテキストが表示される。認識処理はサンドボックス化された「Canonical Inference Snap」内で行われ、CPU、NVIDIA製GPU、またはIntel製NPU上でさまざまなサイズのモデルをサポートする。

モデルのインストール後はインターネット接続を必要としない。音声データは一時的なバッファにのみ保持され、セッション終了後に破棄される。現段階では、ウェイクワード機能やパスワード入力欄での音声入力には対応していない。

プロジェクトは開発初期段階にあり、GitHub上には現在基本的なファイルのみが公開されている。Canonicalは音声入力ツールを必要とするユーザーからのフィードバックを求めており、今後数週間のうちにUbuntu 26.10のデイリービルドにMynaが含まれる可能性がある。

関連記事

Tech leaders announcing Linux Foundation's AI-powered cybersecurity initiative for open source software with major partners.
AIによって生成された画像

Linux Foundation announces AI security initiative with tech partners

AIによるレポート AIによって生成された画像

The Linux Foundation has launched a new initiative using Anthropic's Claude Mythos preview for defensive cybersecurity in open source software. Partners include AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, Microsoft, NVIDIA, and Palo Alto Networks. The effort aims to secure critical software amid the rise of AI for open source maintainers.

Canonical has outlined an AI roadmap for Ubuntu emphasizing local inference and open-weight models. Jon Seager, the company's vice president of engineering, detailed the plans in a post on Ubuntu Discourse. The approach prioritizes on-device processing over cloud services.

AIによるレポート

Google has introduced Gemini 3.5 Live Translate, an AI model that enables near-instant voice-to-voice translation during multilingual conversations. The tool supports more than 70 languages and aims to reduce delays common in traditional systems. It became available to developers on Tuesday.

OpenAI has introduced AI-generated pets as optional animated companions for its Codex coding app. These pets provide updates on Codex's tasks without interrupting the user's workflow. The feature is now available on Windows and macOS.

AIによるレポート

Google has released a dedicated native app for its Gemini AI on macOS, allowing users quick access via a keyboard shortcut. The free app supports screen sharing, file uploads, and generative features like image and video creation. It is available for download from Google's website for macOS 15 and later.

このウェブサイトはCookieを使用します

サイトを改善するための分析にCookieを使用します。詳細については、プライバシーポリシーをお読みください。
拒否