أطلقت جوجل نموذج Gemini 3.5 Live Translate، وهو نموذج ذكاء اصطناعي يتيح الترجمة الصوتية الفورية للمحادثات متعددة اللغات. تدعم الأداة أكثر من 70 لغة وتهدف إلى تقليل التأخير الشائع في الأنظمة التقليدية، وقد أصبحت متاحة للمطورين يوم الثلاثاء.
يعمل النموذج على ترجمة البث المستمر بدلاً من معالجة الكلام بالتناوب، مما يسمح باستمرار المحادثات بتأخير لا يتجاوز بضع ثوانٍ مع الحفاظ على إيقاع المتحدث الأصلي ونبرة صوته وانفعالاته. وأوضحت جوجل أن النظام قادر على التعامل مع البيئات الصاخبة وتداخل الأصوات واللغة غير الرسمية، كما يقوم باكتشاف اللغات تلقائياً ويدعم آلاف الثنائيات اللغوية داخل المحادثة الواحدة. يمكن للمطورين الوصول إلى النموذج عبر معاينة عامة في واجهة برمجة تطبيقات Gemini Live وAI Studio. وسيحصل عملاء المؤسسات المختارون على الخدمة في Google Meet هذا الشهر، مع التخطيط لإطلاقها على نطاق أوسع لاحقاً. كما ستصل الأداة قريباً إلى تطبيق Google Translate على أجهزة أندرويد وiOS. وتتضمن جميع مسارات الصوت علامات مائية من SynthID للإشارة إلى أنها مولدة بواسطة الذكاء الاصطناعي. وأكدت الشركة أن التقنية مصممة للاستخدام العملي في مجالات مثل دعم العملاء والجولات السياحية والفصول الدراسية.