Canonical ha presentado Myna, una herramienta de IA en fase inicial para dictado por voz en Ubuntu que se ejecuta completamente en el hardware local. La función está prevista para Ubuntu 26.10, cuyo lanzamiento está programado para octubre. Utiliza un sistema de pulsar para hablar y se centra en la privacidad al mantener todo el procesamiento en el dispositivo.
La herramienta fue anunciada por Jean-Baptiste Lallement, Director de Ingeniería de Ubuntu Desktop en Canonical. Se basa en los planes esbozados en abril por Jon Seager sobre funciones de IA implícitas en Ubuntu, incluidas las capacidades de voz a texto.
Myna está diseñada para GNOME en Wayland. Los usuarios mantienen presionada una tecla de acceso rápido para dictar, tras lo cual el texto transcrito aparece en la posición del cursor. El reconocimiento se produce en un Canonical Inference Snap aislado que admite modelos de distintos tamaños en CPUs, GPUs NVIDIA o NPUs Intel.
No se requiere conexión a internet una vez instalado el modelo. Los datos de audio permanecen en un búfer temporal y se descartan después de cada sesión. Funciones como las palabras de activación y el dictado en campos de contraseña no están incluidas en esta etapa.
El proyecto permanece en fase de desarrollo temprano, con solo archivos básicos en GitHub hasta el momento. Canonical busca comentarios de los usuarios que dependen de herramientas de dictado, y las versiones diarias de Ubuntu 26.10 podrían incluir Myna en las próximas semanas.