O Google introduziu o Gemini 3.5 Live Translate, um modelo de IA que permite tradução de voz para voz quase instantânea durante conversas multilíngues. A ferramenta suporta mais de 70 idiomas e visa reduzir os atrasos comuns em sistemas tradicionais. Ela foi disponibilizada para desenvolvedores na terça-feira.
O modelo realiza tradução por streaming contínuo em vez de processar a fala em turnos. Essa abordagem permite que as conversas prossigam com apenas alguns segundos de atraso, preservando o ritmo, a entonação e o tom emocional do falante original. O Google afirmou que o sistema lida com ambientes ruidosos, vozes sobrepostas e fala informal. Ele detecta idiomas automaticamente e suporta milhares de combinações dentro de uma única conversa. Desenvolvedores podem acessar o modelo por meio de uma prévia pública na API do Gemini Live e no AI Studio. Clientes corporativos selecionados o receberão no Google Meet este mês, com um lançamento mais amplo planejado para mais tarde. A ferramenta também chegará ao aplicativo Google Tradutor em dispositivos Android e iOS em breve. Todos os fluxos de áudio incluem marcas d'água SynthID para indicar que foram gerados por IA. A empresa enfatizou que a tecnologia foi projetada para uso prático em ambientes como suporte ao cliente, passeios e salas de aula.