Canonical desarrolla una herramienta local de dictado con IA para Ubuntu

Canonical ha presentado Myna, una herramienta de IA en fase inicial para dictado por voz en Ubuntu que se ejecuta completamente en el hardware local. La función está prevista para Ubuntu 26.10, cuyo lanzamiento está programado para octubre. Utiliza un sistema de pulsar para hablar y se centra en la privacidad al mantener todo el procesamiento en el dispositivo.

La herramienta fue anunciada por Jean-Baptiste Lallement, Director de Ingeniería de Ubuntu Desktop en Canonical. Se basa en los planes esbozados en abril por Jon Seager sobre funciones de IA implícitas en Ubuntu, incluidas las capacidades de voz a texto.

Myna está diseñada para GNOME en Wayland. Los usuarios mantienen presionada una tecla de acceso rápido para dictar, tras lo cual el texto transcrito aparece en la posición del cursor. El reconocimiento se produce en un Canonical Inference Snap aislado que admite modelos de distintos tamaños en CPUs, GPUs NVIDIA o NPUs Intel.

No se requiere conexión a internet una vez instalado el modelo. Los datos de audio permanecen en un búfer temporal y se descartan después de cada sesión. Funciones como las palabras de activación y el dictado en campos de contraseña no están incluidas en esta etapa.

El proyecto permanece en fase de desarrollo temprano, con solo archivos básicos en GitHub hasta el momento. Canonical busca comentarios de los usuarios que dependen de herramientas de dictado, y las versiones diarias de Ubuntu 26.10 podrían incluir Myna en las próximas semanas.

Artículos relacionados

Tech leaders announcing Linux Foundation's AI-powered cybersecurity initiative for open source software with major partners.
Imagen generada por IA

Linux Foundation announces AI security initiative with tech partners

Reportado por IA Imagen generada por IA

The Linux Foundation has launched a new initiative using Anthropic's Claude Mythos preview for defensive cybersecurity in open source software. Partners include AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, Microsoft, NVIDIA, and Palo Alto Networks. The effort aims to secure critical software amid the rise of AI for open source maintainers.

Canonical has outlined an AI roadmap for Ubuntu emphasizing local inference and open-weight models. Jon Seager, the company's vice president of engineering, detailed the plans in a post on Ubuntu Discourse. The approach prioritizes on-device processing over cloud services.

Reportado por IA

Google has introduced Gemini 3.5 Live Translate, an AI model that enables near-instant voice-to-voice translation during multilingual conversations. The tool supports more than 70 languages and aims to reduce delays common in traditional systems. It became available to developers on Tuesday.

OpenAI has introduced AI-generated pets as optional animated companions for its Codex coding app. These pets provide updates on Codex's tasks without interrupting the user's workflow. The feature is now available on Windows and macOS.

Reportado por IA

Google has released a dedicated native app for its Gemini AI on macOS, allowing users quick access via a keyboard shortcut. The free app supports screen sharing, file uploads, and generative features like image and video creation. It is available for download from Google's website for macOS 15 and later.

Este sitio web utiliza cookies

Utilizamos cookies para análisis con el fin de mejorar nuestro sitio. Lee nuestra política de privacidad para más información.
Rechazar