في تقييم مقارن لنماذج الذكاء الاصطناعي الرائدة، أظهر جيميناي 3.2 فاست من جوجل تفوقاً في الدقة الواقعية على شات جي بي تي 5.2 من أوبن إيه آي، خاصة في المهام المعلوماتية. أبرزت الاختبارات، التي دفعها الشراكة بين أبل وجوجل لتعزيز سيري، التطورات في قدرات الذكاء الاصطناعي التوليدي منذ 2023. رغم قرب النتائج، تجنب جيميناي الأخطاء الكبيرة التي أضعفت موثوقية شات جي بي تي.
أجرت Ars Technica سلسلة من الاختبارات في 21 يناير 2026، مقارنة بين جيميناي 3.2 فاست من جوجل وشات جي بي تي 5.2 من أوبن إيه آي، النماذج الافتراضية المتاحة بدون اشتراكات. تأتي هذه التقييم بعد قرار أبل بدمج جيميناي في النسخة القادمة من مساعدها سيري، مما يمثل تحولاً عن المقارنات السابقة عندما كانت ذكاء جوجل الاصطناعي يُعرف ببارد في أواخر 2023. شملت الاستعلامات سيناريوهات إبداعية وعملية، بما في ذلك توليد نكات أبوية، حل لغز رياضياتي حول وضع ويندوز 11 على أقراص مرنة 3.5 إنش، صياغة قصة خيالية عن إبراهام لنكولن يخترع كرة السلة، كتابة سيرة ذاتية للصحفي كايل أورلاند، صياغة رسائل بريد إلكتروني للتعامل مع مواعيد عمل غير واقعية، تقييم ادعاءات طبية حول بلورات الشفاء للسرطان، تقديم إرشادات لإكمال مستوى 8-2 في سوبر ماريو بروس دون الركض، وتحديد خطوات لإقلاع بوينغ 737-800 للمبتدئ. حقق جيميناي الفوز في أربع فئات: حساب القرص المرن، حيث قدم تفسيرات أوضح و سياقاً تاريخياً؛ السيرة الذاتية، متجنباً الهلوسات حول بداية مسيرة أورلاند في 2012 وربط المصادر؛ نصائح البريد الإلكتروني، مقدمًا ثلاث خيارات مخصصة مع نصائح الاستخدام؛ واستراتيجية الألعاب، مقترحاً حلولاً مبتكرة مثل قفزات الأعداء للفجوات. تفوق شات جي بي تي في نكات الأب لأصالة طفيفة، الكتابة الإبداعية لجاذبية التفاصيل مثل استخدام لنكولن قبعة أنبوب الموقد للتسجيل، واستعلام الإقلاع بالطائرة، الذي اعتبره خبير الطيران لي هتشينسون أكثر عملية لتوصيته بالمساعدة المهنية بدلاً من الإجراءات الفردية الخطرة. انتهى استعلام النصيحة الطبية بالتعادل، مع رفض كلا النموذجين فعالية البلورات مع الإشارة إلى الفوائد النفسية وتوصية استشارة الأطباء. بشكل عام، حصل جيميناي على أربع نقاط مقابل ثلاث لشات جي بي تي، مع تعادل واحد. تؤكد الاختبارات تفوق جيميناي في الموثوقية الواقعية، مما يقلل من عدم الثقة الناتج عن أخطاء مثل تلك في سيرة أورلاند ومستوى اللعبة. من المحتمل أن يكون هذا التقدم قد أثر في اختيار شراكة أبل، مشيراً إلى مكاسب جوجل في مشهد الذكاء الاصطناعي.