Canonical a présenté Myna, un outil d'IA en phase de développement pour la dictée vocale sur Ubuntu qui fonctionne entièrement sur le matériel local. Cette fonctionnalité est prévue pour Ubuntu 26.10, dont la sortie est programmée pour octobre. Elle utilise un système « push-to-talk » et privilégie la confidentialité en conservant tout le traitement sur l'appareil.
L'outil a été annoncé par Jean-Baptiste Lallement, directeur de l'ingénierie pour Ubuntu Desktop chez Canonical. Il s'appuie sur les projets évoqués en avril par Jon Seager concernant l'intégration de fonctionnalités d'IA implicites dans Ubuntu, notamment des capacités de transcription vocale.
Myna est conçu pour GNOME sur Wayland. Les utilisateurs maintiennent une touche de raccourci enfoncée pour dicter, après quoi le texte transcrit apparaît à l'emplacement du curseur. La reconnaissance s'effectue dans un Canonical Inference Snap en environnement isolé, qui prend en charge des modèles de tailles variables sur CPU, GPU NVIDIA ou NPU Intel.
Aucune connexion internet n'est requise une fois le modèle installé. Les données audio restent dans une mémoire tampon temporaire et sont supprimées après chaque session. Des fonctionnalités telles que les mots d'activation et la dictée dans les champs de mot de passe ne sont pas incluses à ce stade.
Le projet reste à un stade précoce de développement, avec seulement des fichiers de base disponibles sur GitHub pour le moment. Canonical sollicite les retours des utilisateurs dépendant des outils de dictée, et les versions quotidiennes (« daily builds ») d'Ubuntu 26.10 pourraient inclure Myna dans les semaines à venir.