Google a présenté Gemini 3.5 Live Translate, un modèle d'IA permettant une traduction vocale quasi instantanée lors de conversations multilingues. L'outil prend en charge plus de 70 langues et vise à réduire les délais habituels des systèmes traditionnels. Il est devenu accessible aux développeurs mardi.
Le modèle effectue une traduction en flux continu plutôt que de traiter la parole par tours de parole. Cette approche permet aux conversations de se dérouler avec seulement quelques secondes de décalage tout en préservant le rythme, l'intonation et le ton émotionnel de l'orateur original. Google a déclaré que le système gère les environnements bruyants, les voix qui se chevauchent et le langage informel. Il détecte automatiquement les langues et prend en charge des milliers de combinaisons au sein d'une même conversation. Les développeurs peuvent accéder au modèle via une version préliminaire publique dans l'API Gemini Live et AI Studio. Certains clients entreprises en bénéficieront dans Google Meet ce mois-ci, avec un déploiement plus large prévu ultérieurement. L'outil sera également bientôt disponible dans l'application Google Translate sur les appareils Android et iOS. Tous les flux audio incluent des filigranes SynthID pour indiquer qu'ils sont générés par l'IA. L'entreprise a souligné que la technologie est conçue pour une utilisation pratique dans des contextes tels que le support client, le tourisme et les salles de classe.