Mistral AI lanza modelos de transcripción rápidos y privados en el dispositivo

El desarrollador francés de IA Mistral AI ha lanzado dos nuevos modelos de transcripción diseñados para ejecutarse directamente en los dispositivos de los usuarios, priorizando la privacidad y la velocidad. Los modelos, Voxtral Mini Transcribe 2 y Voxtral Realtime, buscan mantener las conversaciones sensibles fuera de internet. Permiten una transcripción rápida y precisa sin depender de servidores en la nube.

Mistral AI anunció sus últimos modelos de transcripción el miércoles, con un enfoque en el procesamiento en el dispositivo para mejorar la privacidad del usuario. Estas herramientas son particularmente adecuadas para escenarios sensibles, como discusiones con médicos, abogados o entrevistas periodísticas, donde la seguridad de los datos es primordial. Voxtral Mini Transcribe 2 es descrito como «súper, súper pequeño» por Pierre Stock, vicepresidente de operaciones científicas de Mistral. Esta compacidad permite que funcione en teléfonos, ordenadores portátiles o incluso wearables como relojes inteligentes, eliminando la necesidad de enviar audio a centros de datos remotos. El segundo modelo, Voxtral Realtime, permite la transcripción en vivo similar a los subtítulos cerrados, con una latencia de menos de 200 milisegundos —lo suficientemente rápido para igualar la velocidad de lectura y evitar retrasos de dos o tres segundos—. Stock enfatizó los beneficios de la computación en el borde: «Lo que quieres es que la transcripción ocurra súper, súper cerca de ti. Y lo más cerca que podemos encontrar de ti es cualquier dispositivo en el borde, como un portátil, un teléfono, un wearable como un reloj inteligente, por ejemplo». Al procesar localmente, los modelos reducen la latencia y protegen la privacidad, ya que las conversaciones nunca abandonan el dispositivo. Ambos modelos soportan 13 idiomas y están disponibles a través de la API de Mistral, Hugging Face o el AI Studio de la compañía. En pruebas, Voxtral Realtime transcribió inglés con algo de español de manera precisa y rápida, aunque ocasionalmente manejó mal nombres propios, como convirtiendo «Mistral AI» en «Mr. Lay Eye» y «Voxtral» en «VoxTroll». Stock señaló que los usuarios pueden personalizar los modelos para un mejor manejo de jerga específica o nombres. Mistral destacó el rendimiento en benchmarks que muestra tasas de error más bajas que las de los competidores. Como explicó Stock: «No es suficiente decir: OK, haré un modelo pequeño. Lo que necesitas es un modelo pequeño que tenga la misma calidad que los modelos grandes, ¿verdad?». Este equilibrio de tamaño, velocidad y precisión posiciona a los modelos como un avance en la transcripción accesible con IA.

Artículos relacionados

Realistic illustration of a user experiencing Google's live translation feature via headphones on Android, with multilingual speech bubbles in an airport setting.
Imagen generada por IA

Google amplía la traducción en vivo a cualquier auriculares

Reportado por IA Imagen generada por IA

Google está actualizando su app Translate para permitir traducciones en tiempo real de voz a voz utilizando cualquier auriculares conectados en dispositivos Android. La función beta, impulsada por Gemini AI, soporta más de 70 idiomas y mejora el manejo de idiotismos y jerga. Se lanza inicialmente en EE.UU., México e India, con soporte para iOS planeado para más adelante.

La startup francesa Mistral AI ha desvelado una nueva familia de modelos de IA diseñados para la traducción rápida. La empresa posiciona este lanzamiento como un desafío a las grandes firmas de IA estadounidenses al enfatizar la eficiencia sobre el uso intensivo de recursos. Mistral afirma que los modelos allanan el camino para conversaciones multilingües fluidas.

Reportado por IA

La startup francesa Mistral AI ha lanzado Devstral 2, un modelo de IA de pesos abiertos con 123.000 millones de parámetros para codificación, que obtiene un 72,2 % en el benchmark SWE-bench Verified. Junto a él, la compañía presentó Mistral Vibe, una interfaz de línea de comandos para tareas de ingeniería de software autónomas. También debutó una versión más pequeña, Devstral Small 2, para uso local en hardware de consumo.

En una evaluación comparativa de modelos líderes de IA, el Gemini 3.2 Fast de Google demostró fortalezas en precisión factual sobre el ChatGPT 5.2 de OpenAI, particularmente en tareas informativas. Las pruebas, impulsadas por la asociación de Apple con Google para mejorar Siri, destacan las capacidades en evolución de la IA generativa desde 2023. Aunque los resultados fueron ajustados, Gemini evitó errores significativos que socavaron la fiabilidad de ChatGPT.

Reportado por IA

Moxie Marlinspike, creador de la app de mensajería Signal, ha lanzado Confer, un asistente de IA de código abierto diseñado para priorizar la privacidad del usuario en conversaciones con modelos de lenguaje grandes. La herramienta cifra los datos e interacciones del usuario para que solo los titulares de la cuenta puedan acceder a ellos, protegiéndolos de operadores de plataformas, hackers y fuerzas del orden. Este lanzamiento aborda las crecientes preocupaciones sobre la recopilación de datos en plataformas de IA.

ExpressVPN ha descubierto 3,7 millones de datos filtrados de un chatbot de IA. La información filtrada incluye mensajes de voz y de texto, así como grabaciones de audio privadas de hasta cuatro horas de duración. El hallazgo sirve para recordar la importancia del cifrado.

Reportado por IA

Apple ha adquirido Q.ai, una startup israelí que desarrolla tecnología de lectura labial para interfaces de IA en wearables. El acuerdo, valorado en unos 2.000 millones de dólares, señala posibles cambios en la forma en que los usuarios interactúan con dispositivos como gafas y auriculares. Este movimiento se basa en la trayectoria de Apple de integrar tecnologías de sensores avanzados en sus productos.

 

 

 

Este sitio web utiliza cookies

Utilizamos cookies para análisis con el fin de mejorar nuestro sitio. Lee nuestra política de privacidad para más información.
Rechazar