Mistral AI lanserar snabba privata transkriptionsmodeller på enheten

Den franska AI-utvecklaren Mistral AI har släppt två nya transkriptionsmodeller utformade för att köras direkt på användarens enheter, med fokus på integritet och hastighet. Modellerna, Voxtral Mini Transcribe 2 och Voxtral Realtime, syftar till att hålla känsliga samtal borta från internet. De möjliggör snabb och noggrann transkription utan att förlita sig på molnservrar.

Mistral AI tillkännagav sina senaste transkriptionsmodeller på onsdagen, med fokus på enhetsbaserad bearbetning för att förbättra användarens integritet. Dessa verktyg är särskilt lämpade för känsliga situationer, såsom samtal med läkare, advokater eller journalistiska intervjuer, där dataskydd är avgörande. Voxtral Mini Transcribe 2 beskrivs som «super, super liten» av Pierre Stock, Mistral's vice president för vetenskapliga operationer. Denna kompaktitet gör att den kan köras på telefoner, bärbara datorer eller till och med wearables som smartklockor, vilket eliminerar behovet av att skicka ljud till avlägsna datacenter. Den andra modellen, Voxtral Realtime, stöder live-transkription liknande sluten undertextning, med en latens på mindre än 200 millisekunder — tillräckligt snabbt för att matcha läshastighet och undvika förseningar på två eller tre sekunder. Stock betonade fördelarna med edge computing: «Det du vill är att transkriptionen ska ske super, super nära dig. Och det närmaste vi kan hitta är vilken edge-enhet som helst, som en bärbar dator, en telefon, en wearable som en smartklocka, till exempel.» Genom lokal bearbetning minskar modellerna latensen och skyddar integriteten, eftersom samtalen aldrig lämnar enheten. Båda modellerna stöder 13 språk och är tillgängliga via Mistral's API, Hugging Face eller företagets AI Studio. I tester transkriberade Voxtral Realtime engelska med lite spanska korrekt och snabbt, även om den ibland hanterade egna namn fel, som att återge «Mistral AI» som «Mr. Lay Eye» och «Voxtral» som «VoxTroll.» Stock noterade att användare kan anpassa modellerna för bättre hantering av specifik jargong eller namn. Mistral framhöll benchmark-prestanda som visar lägre felgrader än konkurrenter. Som Stock förklarade: «Det räcker inte med att säga, OK, jag gör en liten modell. Du behöver en liten modell med samma kvalitet som större modeller, eller hur?» Denna balans mellan storlek, hastighet och noggrannhet positionerar modellerna som ett steg framåt i tillgänglig AI-transkription.

Relaterade artiklar

Realistic illustration of a user experiencing Google's live translation feature via headphones on Android, with multilingual speech bubbles in an airport setting.
Bild genererad av AI

Google utökar liveöversättning till valfria hörlurar

Rapporterad av AI Bild genererad av AI

Google uppdaterar sin Translate-app för att möjliggöra realtids tal-till-tal-översättningar med valfria anslutna hörlurar på Android-enheter. Betafunktionen, driven av Gemini AI, stöder över 70 språk och förbättrar hanteringen av idiomatiska uttryck och slang. Den rullas ut initialt i USA, Mexiko och Indien, med iOS-stöd planerat senare.

Det franska startupföretaget Mistral AI har presenterat en ny familj av AI-modeller utformade för snabb översättning. Företaget ställer detta släpp som en utmaning till stora amerikanska AI-företag genom att betona effektivitet framför tung resursanvändning. Mistral hävdar att modellerna banar väg för sömlösa flerspråkiga samtal.

Rapporterad av AI

Det franska startupföretaget Mistral AI har släppt Devstral 2, en öppenvikts-AI-modell med 123 miljarder parametrar för kodning som scorer 72,2 procent på SWE-bench Verified-benchmarken. Tillsammans med den introducerade företaget Mistral Vibe, ett kommandoradsgränssnitt för autonoma mjukvaruutvecklingsuppgifter. En mindre version, Devstral Small 2, debuterade också för lokal användning på konsumenthårdvara.

I en jämförande utvärdering av ledande AI-modeller visade Googles Gemini 3.2 Fast styrkor i faktisk noggrannhet över OpenAIs ChatGPT 5.2, särskilt i informationsuppgifter. Testerna, som utlöstes av Apples partnerskap med Google för att förbättra Siri, belyser utvecklande förmågor i generativ AI sedan 2023. Även om resultaten var jämna undvek Gemini betydande fel som undergrävde ChatGPT:s tillförlitlighet.

Rapporterad av AI

Moxie Marlinspike, skaparen av Signal-meddelandeappen, har introducerat Confer, en öppen källkods-AI-assistent utformad för att prioritera användarintegritet i samtal med stora språkmodeller. Verktyget krypterar användardata och interaktioner så att endast kontoinnehavare kan komma åt dem, och skyddar dem från plattformsoperatörer, hackare och rättsväsende. Denna lansering adresserar växande oro kring datainsamling på AI-plattformar.

ExpressVPN har upptäckt 3,7 miljoner objekt med läckt data från en AI-chatbot. Den läckta informationen inkluderar röst- och textmeddelanden samt privata ljudinspelningar som är upp till fyra timmar långa. Upptäckten fungerar som en påminnelse om krypteringens betydelse.

Rapporterad av AI

Apple har förvärvat Q.ai, en israelisk startup som utvecklar läppavläsnings-teknik för AI-gränssnitt i wearables. Affären, värd cirka 2 miljarder dollar, signalerar potentiella skiften i hur användare interagerar med enheter som glasögon och öronsnäckor. Detta bygger på Apples historia av att integrera avancerad sensorteknik i sina produkter.

 

 

 

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj