Canonical développe un outil de dictée IA local pour Ubuntu

Canonical a présenté Myna, un outil d'IA en phase de développement pour la dictée vocale sur Ubuntu qui fonctionne entièrement sur le matériel local. Cette fonctionnalité est prévue pour Ubuntu 26.10, dont la sortie est programmée pour octobre. Elle utilise un système « push-to-talk » et privilégie la confidentialité en conservant tout le traitement sur l'appareil.

L'outil a été annoncé par Jean-Baptiste Lallement, directeur de l'ingénierie pour Ubuntu Desktop chez Canonical. Il s'appuie sur les projets évoqués en avril par Jon Seager concernant l'intégration de fonctionnalités d'IA implicites dans Ubuntu, notamment des capacités de transcription vocale.

Myna est conçu pour GNOME sur Wayland. Les utilisateurs maintiennent une touche de raccourci enfoncée pour dicter, après quoi le texte transcrit apparaît à l'emplacement du curseur. La reconnaissance s'effectue dans un Canonical Inference Snap en environnement isolé, qui prend en charge des modèles de tailles variables sur CPU, GPU NVIDIA ou NPU Intel.

Aucune connexion internet n'est requise une fois le modèle installé. Les données audio restent dans une mémoire tampon temporaire et sont supprimées après chaque session. Des fonctionnalités telles que les mots d'activation et la dictée dans les champs de mot de passe ne sont pas incluses à ce stade.

Le projet reste à un stade précoce de développement, avec seulement des fichiers de base disponibles sur GitHub pour le moment. Canonical sollicite les retours des utilisateurs dépendant des outils de dictée, et les versions quotidiennes (« daily builds ») d'Ubuntu 26.10 pourraient inclure Myna dans les semaines à venir.

Articles connexes

Tech leaders announcing Linux Foundation's AI-powered cybersecurity initiative for open source software with major partners.
Image générée par IA

Linux Foundation announces AI security initiative with tech partners

Rapporté par l'IA Image générée par IA

The Linux Foundation has launched a new initiative using Anthropic's Claude Mythos preview for defensive cybersecurity in open source software. Partners include AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, Microsoft, NVIDIA, and Palo Alto Networks. The effort aims to secure critical software amid the rise of AI for open source maintainers.

Canonical has outlined an AI roadmap for Ubuntu emphasizing local inference and open-weight models. Jon Seager, the company's vice president of engineering, detailed the plans in a post on Ubuntu Discourse. The approach prioritizes on-device processing over cloud services.

Rapporté par l'IA

Google has introduced Gemini 3.5 Live Translate, an AI model that enables near-instant voice-to-voice translation during multilingual conversations. The tool supports more than 70 languages and aims to reduce delays common in traditional systems. It became available to developers on Tuesday.

OpenAI has introduced AI-generated pets as optional animated companions for its Codex coding app. These pets provide updates on Codex's tasks without interrupting the user's workflow. The feature is now available on Windows and macOS.

Rapporté par l'IA

Google has released a dedicated native app for its Gemini AI on macOS, allowing users quick access via a keyboard shortcut. The free app supports screen sharing, file uploads, and generative features like image and video creation. It is available for download from Google's website for macOS 15 and later.

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser