Google telah memperkenalkan Gemini 3.5 Live Translate, sebuah model AI yang memungkinkan penerjemahan suara-ke-suara yang hampir instan selama percakapan multibahasa. Alat ini mendukung lebih dari 70 bahasa dan bertujuan untuk mengurangi jeda yang umum terjadi pada sistem tradisional. Layanan ini tersedia bagi pengembang mulai Selasa.
Model ini melakukan penerjemahan streaming berkelanjutan alih-alih memproses ucapan secara bergantian. Pendekatan ini memungkinkan percakapan berlangsung hanya dengan jeda beberapa detik sambil tetap mempertahankan kecepatan, intonasi, dan nada emosional pembicara asli. Google menyatakan bahwa sistem ini mampu menangani lingkungan yang bising, suara yang tumpang tindih, dan bahasa percakapan informal. Sistem ini secara otomatis mendeteksi bahasa dan mendukung ribuan pasangan bahasa dalam satu percakapan. Pengembang dapat mengakses model ini melalui pratinjau publik di Gemini Live API dan AI Studio. Pelanggan perusahaan tertentu akan menerimanya di Google Meet bulan ini, dengan peluncuran yang lebih luas direncanakan di kemudian hari. Alat ini juga akan segera hadir di aplikasi Google Translate pada perangkat Android dan iOS. Semua streaming audio menyertakan penanda air SynthID untuk menunjukkan bahwa konten tersebut dihasilkan oleh AI. Perusahaan menekankan bahwa teknologi ini dirancang untuk penggunaan praktis dalam berbagai situasi seperti dukungan pelanggan, tur, dan ruang kelas.