Canonicalは、Ubuntu上で完全にローカル環境で動作する音声入力用AIツール「Myna」の初期段階版を発表した。この機能は10月にリリース予定のUbuntu 26.10に搭載される計画である。プッシュ・トゥ・トーク方式を採用しており、すべての処理をデバイス内で行うことでプライバシーを重視している。
このツールは、CanonicalのUbuntuデスクトップ担当エンジニアリングディレクターであるJean-Baptiste Lallement氏によって発表された。これは、4月にJon Seager氏が概説した、音声認識(Speech-to-Text)機能を含むUbuntuの暗黙的なAI機能の計画に基づくものである。
MynaはWayland上のGNOME向けに設計されている。ユーザーがホットキーを押しながら音声入力を行うと、カーソル位置に文字起こしされたテキストが表示される。認識処理はサンドボックス化された「Canonical Inference Snap」内で行われ、CPU、NVIDIA製GPU、またはIntel製NPU上でさまざまなサイズのモデルをサポートする。
モデルのインストール後はインターネット接続を必要としない。音声データは一時的なバッファにのみ保持され、セッション終了後に破棄される。現段階では、ウェイクワード機能やパスワード入力欄での音声入力には対応していない。
プロジェクトは開発初期段階にあり、GitHub上には現在基本的なファイルのみが公開されている。Canonicalは音声入力ツールを必要とするユーザーからのフィードバックを求めており、今後数週間のうちにUbuntu 26.10のデイリービルドにMynaが含まれる可能性がある。