Canonical desenvolve ferramenta local de ditado por IA para o Ubuntu

A Canonical apresentou o Myna, uma ferramenta de IA em estágio inicial para ditado por voz no Ubuntu que é executada inteiramente em hardware local. O recurso está planejado para o Ubuntu 26.10, com lançamento previsto para outubro. Ele utiliza um sistema de "pressionar para falar" (push-to-talk) e prioriza a privacidade mantendo todo o processamento no dispositivo.

A ferramenta foi anunciada por Jean-Baptiste Lallement, diretor de engenharia da Canonical para o Ubuntu Desktop. Ela se baseia em planos delineados em abril por Jon Seager para recursos de IA implícitos no Ubuntu, incluindo capacidades de conversão de fala em texto.

O Myna foi projetado para o GNOME no Wayland. Os usuários mantêm uma tecla de atalho pressionada para ditar, após o que o texto transcrito aparece na posição do cursor. O reconhecimento ocorre em um Canonical Inference Snap isolado (sandboxed) que suporta modelos de tamanhos variados em CPUs, GPUs NVIDIA ou NPUs Intel.

Nenhuma conexão com a internet é necessária após a instalação do modelo. Os dados de áudio permanecem em um buffer temporário e são descartados após cada sessão. Recursos como palavras de ativação e ditado em campos de senha não estão incluídos nesta fase.

O projeto permanece em estágio inicial de desenvolvimento, com apenas arquivos básicos disponíveis no GitHub até o momento. A Canonical busca feedback de usuários que dependem de ferramentas de ditado, e as compilações diárias (daily builds) do Ubuntu 26.10 poderão incluir o Myna nas próximas semanas.

Artigos relacionados

Tech leaders announcing Linux Foundation's AI-powered cybersecurity initiative for open source software with major partners.
Imagem gerada por IA

Linux Foundation announces AI security initiative with tech partners

Reportado por IA Imagem gerada por IA

The Linux Foundation has launched a new initiative using Anthropic's Claude Mythos preview for defensive cybersecurity in open source software. Partners include AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, Microsoft, NVIDIA, and Palo Alto Networks. The effort aims to secure critical software amid the rise of AI for open source maintainers.

Canonical has outlined an AI roadmap for Ubuntu emphasizing local inference and open-weight models. Jon Seager, the company's vice president of engineering, detailed the plans in a post on Ubuntu Discourse. The approach prioritizes on-device processing over cloud services.

Reportado por IA

Google has introduced Gemini 3.5 Live Translate, an AI model that enables near-instant voice-to-voice translation during multilingual conversations. The tool supports more than 70 languages and aims to reduce delays common in traditional systems. It became available to developers on Tuesday.

OpenAI has introduced AI-generated pets as optional animated companions for its Codex coding app. These pets provide updates on Codex's tasks without interrupting the user's workflow. The feature is now available on Windows and macOS.

Reportado por IA

Google has released a dedicated native app for its Gemini AI on macOS, allowing users quick access via a keyboard shortcut. The free app supports screen sharing, file uploads, and generative features like image and video creation. It is available for download from Google's website for macOS 15 and later.

Este site usa cookies

Usamos cookies para análise para melhorar nosso site. Leia nossa política de privacidade para mais informações.
Recusar