Le Gemini de Google surpasse ChatGPT dans des tests IA clés

Dans une évaluation comparative de modèles d'IA leaders, le Gemini 3.2 Fast de Google a démontré des forces en précision factuelle sur le ChatGPT 5.2 d'OpenAI, particulièrement dans les tâches informationnelles. Les tests, motivés par le partenariat d'Apple avec Google pour améliorer Siri, mettent en lumière l'évolution des capacités de l'IA générative depuis 2023. Bien que les résultats fussent serrés, Gemini a évité des erreurs significatives qui ont miné la fiabilité de ChatGPT.

Ars Technica a mené une série de tests le 21 janvier 2026, opposant le Gemini 3.2 Fast de Google au ChatGPT 5.2 d'OpenAI, les modèles par défaut accessibles sans abonnement. Cette évaluation fait suite à la décision d'Apple d'intégrer Gemini dans la prochaine version de son assistant Siri, marquant un virage par rapport aux comparaisons antérieures lorsque l'IA de Google était connue sous le nom de Bard fin 2023. Les invites couvraient des scénarios créatifs et pratiques, incluant la génération de blagues de papa, la résolution d'un puzzle mathématique sur l'installation de Windows 11 sur des disquettes de 3,5 pouces, la création d'une histoire fictive d'Abraham Lincoln inventant le basketball, la rédaction d'une biographie du journaliste Kyle Orland, la rédaction d'e-mails pour gérer des délais de travail irréalistes, l'évaluation de revendications médicales sur des cristaux guérisseurs pour le cancer, la fourniture de conseils pour battre le niveau 8-2 de Super Mario Bros. sans courir, et l'esquisse d'étapes pour atterrir un Boeing 737-800 pour un novice. Gemini a remporté quatre catégories : le calcul de disquette, avec des explications plus claires et un contexte historique ; la biographie, évitant les hallucinations sur le début de carrière d'Orland en 2012 et liant des sources ; les conseils e-mail, proposant trois options adaptées avec des astuces d'utilisation ; et la stratégie de jeu vidéo, suggérant des contournements innovants comme les rebonds d'ennemis pour les trous. ChatGPT a prévalu dans les blagues de papa pour une légère originalité, l'écriture créative pour le charme des détails comme Lincoln utilisant un chapeau de poêle à pipe pour marquer, et l'invite d'atterrissage d'avion, jugée plus pratique par l'expert en aviation Lee Hutchinson pour encourager une aide professionnelle plutôt que des actions solo risquées. L'invite de conseil médical s'est soldée par un match nul, les deux modèles rejetant l'efficacité des cristaux tout en notant des bénéfices psychologiques et recommandant des consultations médicales. Au total, Gemini a obtenu quatre points contre trois pour ChatGPT, avec un nul. Les tests soulignent l'avantage de Gemini en fiabilité factuelle, réduisant la méfiance due à des erreurs comme celles de ChatGPT dans la biographie et le niveau de jeu. Ce progrès a probablement influencé le choix de partenariat d'Apple, signalant les avancées de Google dans le paysage de l'IA.

Articles connexes

Illustration of Google's native Gemini AI app on a MacBook Pro, showcasing screen sharing, file uploads, and image generation features.
Image générée par IA

Google lance une application Gemini native pour macOS

Rapporté par l'IA Image générée par IA

Google a publié une application native dédiée à son IA Gemini sur macOS, permettant aux utilisateurs un accès rapide via un raccourci clavier. L'application gratuite prend en charge le partage d'écran, le téléchargement de fichiers et des fonctionnalités génératives comme la création d'images et de vidéos. Elle est disponible au téléchargement sur le site web de Google pour macOS 15 et versions ultérieures.

OpenAI a commencé le déploiement de GPT-5.5 Instant en tant que nouveau modèle par défaut pour ChatGPT, promettant une meilleure exactitude factuelle et une personnalisation améliorée. Cette mise à jour réduit les hallucinations et les affirmations inexactes tout en renforçant la clarté des réponses. Une nouvelle fonctionnalité de sources de mémoire offre aux utilisateurs un meilleur contrôle sur le contexte personnalisé.

Rapporté par l'IA

Une analyse du New York Times montre que les aperçus par IA de Google, propulsés par Gemini, ne répondent correctement qu'à 90 % à 91 % des questions posées lors d'un test de référence standard. Cela se traduit par des dizaines de millions de réponses erronées chaque jour dans les recherches. Google conteste la pertinence de ce test.

Google étend le déploiement de son modèle d'IA Gemini, en introduisant de nouvelles fonctionnalités pour les appareils domotiques et une utilisation locale dans Chrome.

Rapporté par l'IA

Les détails tarifaires des principaux chatbots d'IA sont comparés dans une nouvelle analyse.

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser