A Canonical apresentou o Myna, uma ferramenta de IA em estágio inicial para ditado por voz no Ubuntu que é executada inteiramente em hardware local. O recurso está planejado para o Ubuntu 26.10, com lançamento previsto para outubro. Ele utiliza um sistema de "pressionar para falar" (push-to-talk) e prioriza a privacidade mantendo todo o processamento no dispositivo.
A ferramenta foi anunciada por Jean-Baptiste Lallement, diretor de engenharia da Canonical para o Ubuntu Desktop. Ela se baseia em planos delineados em abril por Jon Seager para recursos de IA implícitos no Ubuntu, incluindo capacidades de conversão de fala em texto.
O Myna foi projetado para o GNOME no Wayland. Os usuários mantêm uma tecla de atalho pressionada para ditar, após o que o texto transcrito aparece na posição do cursor. O reconhecimento ocorre em um Canonical Inference Snap isolado (sandboxed) que suporta modelos de tamanhos variados em CPUs, GPUs NVIDIA ou NPUs Intel.
Nenhuma conexão com a internet é necessária após a instalação do modelo. Os dados de áudio permanecem em um buffer temporário e são descartados após cada sessão. Recursos como palavras de ativação e ditado em campos de senha não estão incluídos nesta fase.
O projeto permanece em estágio inicial de desenvolvimento, com apenas arquivos básicos disponíveis no GitHub até o momento. A Canonical busca feedback de usuários que dependem de ferramentas de ditado, e as compilações diárias (daily builds) do Ubuntu 26.10 poderão incluir o Myna nas próximas semanas.