Le Gemini de Google surpasse ChatGPT dans des tests IA clés

Dans une évaluation comparative de modèles d'IA leaders, le Gemini 3.2 Fast de Google a démontré des forces en précision factuelle sur le ChatGPT 5.2 d'OpenAI, particulièrement dans les tâches informationnelles. Les tests, motivés par le partenariat d'Apple avec Google pour améliorer Siri, mettent en lumière l'évolution des capacités de l'IA générative depuis 2023. Bien que les résultats fussent serrés, Gemini a évité des erreurs significatives qui ont miné la fiabilité de ChatGPT.

Ars Technica a mené une série de tests le 21 janvier 2026, opposant le Gemini 3.2 Fast de Google au ChatGPT 5.2 d'OpenAI, les modèles par défaut accessibles sans abonnement. Cette évaluation fait suite à la décision d'Apple d'intégrer Gemini dans la prochaine version de son assistant Siri, marquant un virage par rapport aux comparaisons antérieures lorsque l'IA de Google était connue sous le nom de Bard fin 2023. Les invites couvraient des scénarios créatifs et pratiques, incluant la génération de blagues de papa, la résolution d'un puzzle mathématique sur l'installation de Windows 11 sur des disquettes de 3,5 pouces, la création d'une histoire fictive d'Abraham Lincoln inventant le basketball, la rédaction d'une biographie du journaliste Kyle Orland, la rédaction d'e-mails pour gérer des délais de travail irréalistes, l'évaluation de revendications médicales sur des cristaux guérisseurs pour le cancer, la fourniture de conseils pour battre le niveau 8-2 de Super Mario Bros. sans courir, et l'esquisse d'étapes pour atterrir un Boeing 737-800 pour un novice. Gemini a remporté quatre catégories : le calcul de disquette, avec des explications plus claires et un contexte historique ; la biographie, évitant les hallucinations sur le début de carrière d'Orland en 2012 et liant des sources ; les conseils e-mail, proposant trois options adaptées avec des astuces d'utilisation ; et la stratégie de jeu vidéo, suggérant des contournements innovants comme les rebonds d'ennemis pour les trous. ChatGPT a prévalu dans les blagues de papa pour une légère originalité, l'écriture créative pour le charme des détails comme Lincoln utilisant un chapeau de poêle à pipe pour marquer, et l'invite d'atterrissage d'avion, jugée plus pratique par l'expert en aviation Lee Hutchinson pour encourager une aide professionnelle plutôt que des actions solo risquées. L'invite de conseil médical s'est soldée par un match nul, les deux modèles rejetant l'efficacité des cristaux tout en notant des bénéfices psychologiques et recommandant des consultations médicales. Au total, Gemini a obtenu quatre points contre trois pour ChatGPT, avec un nul. Les tests soulignent l'avantage de Gemini en fiabilité factuelle, réduisant la méfiance due à des erreurs comme celles de ChatGPT dans la biographie et le niveau de jeu. Ce progrès a probablement influencé le choix de partenariat d'Apple, signalant les avancées de Google dans le paysage de l'IA.

Articles connexes

Illustration of Google's native Gemini AI app on a MacBook Pro, showcasing screen sharing, file uploads, and image generation features.
Image générée par IA

Google launches native Gemini app for macOS

Rapporté par l'IA Image générée par IA

Google has released a dedicated native app for its Gemini AI on macOS, allowing users quick access via a keyboard shortcut. The free app supports screen sharing, file uploads, and generative features like image and video creation. It is available for download from Google's website for macOS 15 and later.

Google has released Gemini 3.1 Pro, an updated version of its flagship AI model, emphasizing improvements in problem-solving and reasoning. The model is available in preview for developers and consumers starting today. It builds on the Gemini 3 release from November.

Rapporté par l'IA

OpenAI has begun rolling out GPT-5.5 Instant as the new default model for ChatGPT, promising greater factual accuracy and improved personalization. The update reduces hallucinations and inaccurate claims while enhancing response clarity. A new memory sources feature gives users more control over personalized context.

Google has begun rolling out a new 'Skills' feature in its Chrome browser on desktop, enabling users to save and quickly reuse custom Gemini AI prompts. The update makes it easier to repeat tasks like calculating protein in recipes or comparing products across tabs. Skills sync across devices when signed into a Google account and include a library of premade prompts.

Rapporté par l'IA

OpenAI has released ChatGPT 5.4, which includes new features focused on spreadsheets. The update brings specialized tools for Microsoft Excel and Google Sheets. This development highlights an emphasis on productivity applications.

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser