Google har introducerat Gemini 3.5 Live Translate, en AI-modell som möjliggör nästan omedelbar röst-till-röst-översättning under flerspråkiga samtal. Verktyget har stöd för fler än 70 språk och syftar till att minska fördröjningar som är vanliga i traditionella system. Det blev tillgängligt för utvecklare under tisdagen.
Modellen utför kontinuerlig strömmande översättning istället för att bearbeta tal i turer. Detta tillvägagångssätt gör att samtal kan fortlöpa med endast några få sekunders fördröjning samtidigt som den ursprungliga talarens tempo, intonation och emotionella ton bevaras. Google uppger att systemet hanterar bullriga miljöer, överlappande röster och informellt tal. Det detekterar automatiskt språk och stöder tusentals kombinationer inom ett och samma samtal. Utvecklare kan få tillgång till modellen via en publik förhandsgranskning i Gemini Live API och AI Studio. Utvalda företagskunder kommer att få tillgång till den i Google Meet under denna månad, med en bredare lansering planerad vid ett senare tillfälle. Verktyget kommer även snart till Google Översätt-appen på Android- och iOS-enheter. Alla ljudströmmar innehåller SynthID-vattenstämplar för att indikera att de är AI-genererade. Företaget betonade att tekniken är utformad för praktisk användning i miljöer som kundtjänst, rundturer och klassrum.