Google ha presentado Gemini 3.5 Live Translate, un modelo de inteligencia artificial que permite la traducción de voz a voz casi instantánea durante conversaciones multilingües. La herramienta admite más de 70 idiomas y tiene como objetivo reducir las demoras habituales en los sistemas tradicionales. Estuvo disponible para los desarrolladores a partir del martes.
El modelo realiza una traducción por transmisión continua en lugar de procesar el habla por turnos. Este enfoque permite que las conversaciones avancen con solo unos segundos de demora, preservando al mismo tiempo el ritmo, la entonación y el tono emocional del hablante original. Google afirmó que el sistema maneja entornos ruidosos, voces superpuestas y lenguaje informal. Detecta automáticamente los idiomas y admite miles de combinaciones dentro de una misma conversación. Los desarrolladores pueden acceder al modelo a través de una vista previa pública en la API de Gemini Live y en AI Studio. Algunos clientes empresariales seleccionados lo recibirán en Google Meet este mes, y se planea un lanzamiento más amplio posteriormente. La herramienta también llegará pronto a la aplicación Google Translate en dispositivos Android e iOS. Todas las transmisiones de audio incluyen marcas de agua SynthID para indicar que han sido generadas por inteligencia artificial. La compañía destacó que la tecnología está diseñada para un uso práctico en entornos como atención al cliente, visitas guiadas y aulas.