يتفوق جيميناي جوجل على شات جي بي تي في اختبارات ذكاء اصطناعي رئيسية

في تقييم مقارن لنماذج الذكاء الاصطناعي الرائدة، أظهر جيميناي 3.2 فاست من جوجل تفوقاً في الدقة الواقعية على شات جي بي تي 5.2 من أوبن إيه آي، خاصة في المهام المعلوماتية. أبرزت الاختبارات، التي دفعها الشراكة بين أبل وجوجل لتعزيز سيري، التطورات في قدرات الذكاء الاصطناعي التوليدي منذ 2023. رغم قرب النتائج، تجنب جيميناي الأخطاء الكبيرة التي أضعفت موثوقية شات جي بي تي.

أجرت Ars Technica سلسلة من الاختبارات في 21 يناير 2026، مقارنة بين جيميناي 3.2 فاست من جوجل وشات جي بي تي 5.2 من أوبن إيه آي، النماذج الافتراضية المتاحة بدون اشتراكات. تأتي هذه التقييم بعد قرار أبل بدمج جيميناي في النسخة القادمة من مساعدها سيري، مما يمثل تحولاً عن المقارنات السابقة عندما كانت ذكاء جوجل الاصطناعي يُعرف ببارد في أواخر 2023. شملت الاستعلامات سيناريوهات إبداعية وعملية، بما في ذلك توليد نكات أبوية، حل لغز رياضياتي حول وضع ويندوز 11 على أقراص مرنة 3.5 إنش، صياغة قصة خيالية عن إبراهام لنكولن يخترع كرة السلة، كتابة سيرة ذاتية للصحفي كايل أورلاند، صياغة رسائل بريد إلكتروني للتعامل مع مواعيد عمل غير واقعية، تقييم ادعاءات طبية حول بلورات الشفاء للسرطان، تقديم إرشادات لإكمال مستوى 8-2 في سوبر ماريو بروس دون الركض، وتحديد خطوات لإقلاع بوينغ 737-800 للمبتدئ. حقق جيميناي الفوز في أربع فئات: حساب القرص المرن، حيث قدم تفسيرات أوضح و سياقاً تاريخياً؛ السيرة الذاتية، متجنباً الهلوسات حول بداية مسيرة أورلاند في 2012 وربط المصادر؛ نصائح البريد الإلكتروني، مقدمًا ثلاث خيارات مخصصة مع نصائح الاستخدام؛ واستراتيجية الألعاب، مقترحاً حلولاً مبتكرة مثل قفزات الأعداء للفجوات. تفوق شات جي بي تي في نكات الأب لأصالة طفيفة، الكتابة الإبداعية لجاذبية التفاصيل مثل استخدام لنكولن قبعة أنبوب الموقد للتسجيل، واستعلام الإقلاع بالطائرة، الذي اعتبره خبير الطيران لي هتشينسون أكثر عملية لتوصيته بالمساعدة المهنية بدلاً من الإجراءات الفردية الخطرة. انتهى استعلام النصيحة الطبية بالتعادل، مع رفض كلا النموذجين فعالية البلورات مع الإشارة إلى الفوائد النفسية وتوصية استشارة الأطباء. بشكل عام، حصل جيميناي على أربع نقاط مقابل ثلاث لشات جي بي تي، مع تعادل واحد. تؤكد الاختبارات تفوق جيميناي في الموثوقية الواقعية، مما يقلل من عدم الثقة الناتج عن أخطاء مثل تلك في سيرة أورلاند ومستوى اللعبة. من المحتمل أن يكون هذا التقدم قد أثر في اختيار شراكة أبل، مشيراً إلى مكاسب جوجل في مشهد الذكاء الاصطناعي.

مقالات ذات صلة

Illustration of Google's native Gemini AI app on a MacBook Pro, showcasing screen sharing, file uploads, and image generation features.
صورة مولدة بواسطة الذكاء الاصطناعي

Google launches native Gemini app for macOS

من إعداد الذكاء الاصطناعي صورة مولدة بواسطة الذكاء الاصطناعي

Google has released a dedicated native app for its Gemini AI on macOS, allowing users quick access via a keyboard shortcut. The free app supports screen sharing, file uploads, and generative features like image and video creation. It is available for download from Google's website for macOS 15 and later.

Google has released Gemini 3.1 Pro, an updated version of its flagship AI model, emphasizing improvements in problem-solving and reasoning. The model is available in preview for developers and consumers starting today. It builds on the Gemini 3 release from November.

من إعداد الذكاء الاصطناعي

OpenAI has begun rolling out GPT-5.5 Instant as the new default model for ChatGPT, promising greater factual accuracy and improved personalization. The update reduces hallucinations and inaccurate claims while enhancing response clarity. A new memory sources feature gives users more control over personalized context.

OpenAI has released ChatGPT 5.4, which includes new features focused on spreadsheets. The update brings specialized tools for Microsoft Excel and Google Sheets. This development highlights an emphasis on productivity applications.

من إعداد الذكاء الاصطناعي

OpenAI has decided to pause its planned 'adult mode' for ChatGPT indefinitely, focusing instead on core products. The move comes days after discontinuing its Sora video tool. CEO Sam Altman is prioritizing ChatGPT, Codex, and the Atlas AI browser amid competitive pressures.

يستخدم هذا الموقع ملفات تعريف الارتباط

نستخدم ملفات تعريف الارتباط للتحليلات لتحسين موقعنا. اقرأ سياسة الخصوصية الخاصة بنا سياسة الخصوصية لمزيد من المعلومات.
رفض