Dans une évaluation comparative de modèles d'IA leaders, le Gemini 3.2 Fast de Google a démontré des forces en précision factuelle sur le ChatGPT 5.2 d'OpenAI, particulièrement dans les tâches informationnelles. Les tests, motivés par le partenariat d'Apple avec Google pour améliorer Siri, mettent en lumière l'évolution des capacités de l'IA générative depuis 2023. Bien que les résultats fussent serrés, Gemini a évité des erreurs significatives qui ont miné la fiabilité de ChatGPT.
Ars Technica a mené une série de tests le 21 janvier 2026, opposant le Gemini 3.2 Fast de Google au ChatGPT 5.2 d'OpenAI, les modèles par défaut accessibles sans abonnement. Cette évaluation fait suite à la décision d'Apple d'intégrer Gemini dans la prochaine version de son assistant Siri, marquant un virage par rapport aux comparaisons antérieures lorsque l'IA de Google était connue sous le nom de Bard fin 2023. Les invites couvraient des scénarios créatifs et pratiques, incluant la génération de blagues de papa, la résolution d'un puzzle mathématique sur l'installation de Windows 11 sur des disquettes de 3,5 pouces, la création d'une histoire fictive d'Abraham Lincoln inventant le basketball, la rédaction d'une biographie du journaliste Kyle Orland, la rédaction d'e-mails pour gérer des délais de travail irréalistes, l'évaluation de revendications médicales sur des cristaux guérisseurs pour le cancer, la fourniture de conseils pour battre le niveau 8-2 de Super Mario Bros. sans courir, et l'esquisse d'étapes pour atterrir un Boeing 737-800 pour un novice. Gemini a remporté quatre catégories : le calcul de disquette, avec des explications plus claires et un contexte historique ; la biographie, évitant les hallucinations sur le début de carrière d'Orland en 2012 et liant des sources ; les conseils e-mail, proposant trois options adaptées avec des astuces d'utilisation ; et la stratégie de jeu vidéo, suggérant des contournements innovants comme les rebonds d'ennemis pour les trous. ChatGPT a prévalu dans les blagues de papa pour une légère originalité, l'écriture créative pour le charme des détails comme Lincoln utilisant un chapeau de poêle à pipe pour marquer, et l'invite d'atterrissage d'avion, jugée plus pratique par l'expert en aviation Lee Hutchinson pour encourager une aide professionnelle plutôt que des actions solo risquées. L'invite de conseil médical s'est soldée par un match nul, les deux modèles rejetant l'efficacité des cristaux tout en notant des bénéfices psychologiques et recommandant des consultations médicales. Au total, Gemini a obtenu quatre points contre trois pour ChatGPT, avec un nul. Les tests soulignent l'avantage de Gemini en fiabilité factuelle, réduisant la méfiance due à des erreurs comme celles de ChatGPT dans la biographie et le niveau de jeu. Ce progrès a probablement influencé le choix de partenariat d'Apple, signalant les avancées de Google dans le paysage de l'IA.