Canonical utvecklar lokalt AI-diktatverktyg för Ubuntu

Canonical har introducerat Myna, ett tidigt AI-verktyg för röststyrd diktering på Ubuntu som körs helt lokalt på hårdvaran. Funktionen planeras för Ubuntu 26.10, som är schemalagd för release i oktober. Verktyget använder ett push-to-talk-system och fokuserar på integritet genom att all bearbetning sker direkt på enheten.

Verktyget tillkännagavs av Jean-Baptiste Lallement, Canonical's Director of Engineering för Ubuntu Desktop. Det bygger vidare på planer som Jon Seager presenterade i april gällande implicita AI-funktioner i Ubuntu, inklusive funktioner för tal-till-text.

Myna är utvecklat för GNOME på Wayland. Användare håller ner en snabbknapp för att diktera, varpå den transkriberade texten visas vid markörens position. Igenkänningen sker i en sandlådeisolerad Canonical Inference Snap som har stöd för modeller av varierande storlek på processorer, NVIDIA-grafikkort eller Intel NPU-enheter.

Ingen internetanslutning krävs när modellen väl är installerad. Ljuddata stannar i en temporär buffert och raderas efter varje session. Funktioner som aktiveringsord eller diktering i lösenordsfält ingår inte i detta skede.

Projektet befinner sig fortfarande i ett tidigt utvecklingsstadium och det finns än så länge bara grundläggande filer på GitHub. Canonical söker feedback från användare som är beroende av dikteringsverktyg, och dagliga versioner av Ubuntu 26.10 kan komma att inkludera Myna under de kommande veckorna.

Relaterade artiklar

Tech leaders announcing Linux Foundation's AI-powered cybersecurity initiative for open source software with major partners.
Bild genererad av AI

Linux Foundation announces AI security initiative with tech partners

Rapporterad av AI Bild genererad av AI

The Linux Foundation has launched a new initiative using Anthropic's Claude Mythos preview for defensive cybersecurity in open source software. Partners include AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, Microsoft, NVIDIA, and Palo Alto Networks. The effort aims to secure critical software amid the rise of AI for open source maintainers.

Canonical has outlined an AI roadmap for Ubuntu emphasizing local inference and open-weight models. Jon Seager, the company's vice president of engineering, detailed the plans in a post on Ubuntu Discourse. The approach prioritizes on-device processing over cloud services.

Rapporterad av AI

Google has introduced Gemini 3.5 Live Translate, an AI model that enables near-instant voice-to-voice translation during multilingual conversations. The tool supports more than 70 languages and aims to reduce delays common in traditional systems. It became available to developers on Tuesday.

OpenAI has introduced AI-generated pets as optional animated companions for its Codex coding app. These pets provide updates on Codex's tasks without interrupting the user's workflow. The feature is now available on Windows and macOS.

Rapporterad av AI

Google has released a dedicated native app for its Gemini AI on macOS, allowing users quick access via a keyboard shortcut. The free app supports screen sharing, file uploads, and generative features like image and video creation. It is available for download from Google's website for macOS 15 and later.

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj