Le Gemini de Google surpasse ChatGPT dans des tests IA clés

Dans une évaluation comparative de modèles d'IA leaders, le Gemini 3.2 Fast de Google a démontré des forces en précision factuelle sur le ChatGPT 5.2 d'OpenAI, particulièrement dans les tâches informationnelles. Les tests, motivés par le partenariat d'Apple avec Google pour améliorer Siri, mettent en lumière l'évolution des capacités de l'IA générative depuis 2023. Bien que les résultats fussent serrés, Gemini a évité des erreurs significatives qui ont miné la fiabilité de ChatGPT.

Ars Technica a mené une série de tests le 21 janvier 2026, opposant le Gemini 3.2 Fast de Google au ChatGPT 5.2 d'OpenAI, les modèles par défaut accessibles sans abonnement. Cette évaluation fait suite à la décision d'Apple d'intégrer Gemini dans la prochaine version de son assistant Siri, marquant un virage par rapport aux comparaisons antérieures lorsque l'IA de Google était connue sous le nom de Bard fin 2023. Les invites couvraient des scénarios créatifs et pratiques, incluant la génération de blagues de papa, la résolution d'un puzzle mathématique sur l'installation de Windows 11 sur des disquettes de 3,5 pouces, la création d'une histoire fictive d'Abraham Lincoln inventant le basketball, la rédaction d'une biographie du journaliste Kyle Orland, la rédaction d'e-mails pour gérer des délais de travail irréalistes, l'évaluation de revendications médicales sur des cristaux guérisseurs pour le cancer, la fourniture de conseils pour battre le niveau 8-2 de Super Mario Bros. sans courir, et l'esquisse d'étapes pour atterrir un Boeing 737-800 pour un novice. Gemini a remporté quatre catégories : le calcul de disquette, avec des explications plus claires et un contexte historique ; la biographie, évitant les hallucinations sur le début de carrière d'Orland en 2012 et liant des sources ; les conseils e-mail, proposant trois options adaptées avec des astuces d'utilisation ; et la stratégie de jeu vidéo, suggérant des contournements innovants comme les rebonds d'ennemis pour les trous. ChatGPT a prévalu dans les blagues de papa pour une légère originalité, l'écriture créative pour le charme des détails comme Lincoln utilisant un chapeau de poêle à pipe pour marquer, et l'invite d'atterrissage d'avion, jugée plus pratique par l'expert en aviation Lee Hutchinson pour encourager une aide professionnelle plutôt que des actions solo risquées. L'invite de conseil médical s'est soldée par un match nul, les deux modèles rejetant l'efficacité des cristaux tout en notant des bénéfices psychologiques et recommandant des consultations médicales. Au total, Gemini a obtenu quatre points contre trois pour ChatGPT, avec un nul. Les tests soulignent l'avantage de Gemini en fiabilité factuelle, réduisant la méfiance due à des erreurs comme celles de ChatGPT dans la biographie et le niveau de jeu. Ce progrès a probablement influencé le choix de partenariat d'Apple, signalant les avancées de Google dans le paysage de l'IA.

Articles connexes

Illustration depicting OpenAI's ChatGPT-5.2 launch, showing professionals using the AI to enhance workplace productivity amid rivalry with Google's Gemini.
Image générée par IA

OpenAI lance ChatGPT-5.2 pour booster la productivité au travail

Rapporté par l'IA Image générée par IA

OpenAI a lancé ChatGPT-5.2, une nouvelle famille de modèles d’IA conçus pour renforcer le raisonnement et la productivité, en particulier pour les tâches professionnelles. Ce lancement fait suite à une alerte interne du PDG Sam Altman concernant la concurrence de Gemini 3 de Google. La mise à jour comprend trois variantes adaptées à différents besoins des utilisateurs, à partir des abonnés payants.

Google a publié Gemini 3.1 Pro, une version mise à jour de son modèle d'IA phare, mettant l'accent sur les améliorations en résolution de problèmes et en raisonnement. Le modèle est disponible en aperçu pour les développeurs et les consommateurs dès aujourd'hui. Il s'appuie sur la sortie de Gemini 3 en novembre.

Rapporté par l'IA

Apple a sélectionné les modèles d'IA Gemini de Google pour améliorer son assistant virtuel Siri dans une mise à jour à venir. Cette décision, annoncée dans un communiqué commun, marque un virage par rapport aux intégrations précédentes avec ChatGPT d'OpenAI. Ce partenariat pluriannuel vise à offrir des expériences d'IA plus performantes tout en respectant les normes de confidentialité d'Apple.

Google a lancé Personal Intelligence, une nouvelle fonctionnalité pour son IA Gemini qui intègre des données de Gmail, Photos, Search et YouTube pour fournir des réponses plus personnalisées. Disponible initialement pour les abonnés payants aux États-Unis, cet outil opt-in met l'accent sur les contrôles de confidentialité des utilisateurs et évite l'entraînement direct sur les données personnelles. Le déploiement commence en bêta, avec des plans pour un accès plus large à l'avenir.

Rapporté par l'IA

Google remanie ses applications Workspace en intégrant des capacités plus poussées de l’IA Gemini pour aider à la création et à la modification de documents. Les mises à jour permettent à Gemini d’extraire le contexte des e-mails, fichiers et autres sources pour générer des brouillons et affiner le contenu. Ces fonctionnalités visent à rationaliser les flux de travail des utilisateurs dans Docs, Sheets, Slides et Drive.

Le Pentagone américain a dévoilé une nouvelle plateforme d’intelligence artificielle construite sur le modèle Gemini de Google. Ce développement équipe l’armée d’outils IA avancés. Pourtant, les réactions sont mitigées, certains exprimant leur malaise quant à ses implications.

Rapporté par l'IA

Google a annoncé que son prototype expérimental d'IA, Genie 3, est désormais disponible pour les abonnés de son plan d'IA de niveau supérieur. L'outil permet aux utilisateurs de générer et de naviguer dans des mondes 3D interactifs à l'aide de prompts textuels simples. Précédemment limité aux testeurs de confiance, cette extension marque une étape vers un accès plus large pour le public à partir de 18 ans.

 

 

 

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser