Une étude révèle que les aperçus par IA de Google se trompent dans 10 % des cas

Une analyse du New York Times montre que les aperçus par IA de Google, propulsés par Gemini, ne répondent correctement qu'à 90 % à 91 % des questions posées lors d'un test de référence standard. Cela se traduit par des dizaines de millions de réponses erronées chaque jour dans les recherches. Google conteste la pertinence de ce test.

Le New York Times, en collaboration avec la startup Oumi, a testé les aperçus par IA à l'aide de SimpleQA, un test de référence composé de plus de 4 000 questions publié par OpenAI en 2024. Les premiers tests effectués avec Gemini 2.5 ont révélé un taux de précision de 85 %, qui est monté à 91 % après la mise à jour Gemini 3. Extrapolé au volume de recherche de Google, cela signifie que des dizaines de millions de mauvaises réponses sont générées chaque jour, soit des millions par heure, comme le soulignent les rapports sur ces résultats.

Articles connexes

Illustration of a smartphone screen featuring Google's AI Overviews upgraded to Gemini 3 with conversational chat interface.
Image générée par IA

Google met à niveau les résumés IA vers le modèle Gemini 3

Rapporté par l'IA Image générée par IA

Google a annoncé des améliorations de ses Résumés IA dans Search, désormais alimentés par défaut par le modèle Gemini 3. La mise à jour permet aux utilisateurs de poser des questions de suivi via une interface de chat menant à des conversations en mode IA. Ce déploiement vise à rendre les recherches plus conversationnelles et précises à l'échelle mondiale sur les appareils mobiles.

Dans une évaluation comparative de modèles d'IA leaders, le Gemini 3.2 Fast de Google a démontré des forces en précision factuelle sur le ChatGPT 5.2 d'OpenAI, particulièrement dans les tâches informationnelles. Les tests, motivés par le partenariat d'Apple avec Google pour améliorer Siri, mettent en lumière l'évolution des capacités de l'IA générative depuis 2023. Bien que les résultats fussent serrés, Gemini a évité des erreurs significatives qui ont miné la fiabilité de ChatGPT.

Rapporté par l'IA

Google a publié Gemini 3.1 Pro, une version mise à jour de son modèle d'IA phare, mettant l'accent sur les améliorations en résolution de problèmes et en raisonnement. Le modèle est disponible en aperçu pour les développeurs et les consommateurs dès aujourd'hui. Il s'appuie sur la sortie de Gemini 3 en novembre.

Google a lancé une fonctionnalité expérimentale « Personal Intelligence » pour son Mode IA dans Recherche, permettant aux utilisateurs de connecter Gmail et Google Photos pour des réponses plus adaptées. Cet outil opt-in, propulsé par Gemini 3, vise à rendre les résultats de recherche plus pertinents en s'appuyant sur des données personnelles sans entraîner les modèles sur des boîtes de réception complètes. Il est déployé en premier pour les abonnés payants aux États-Unis.

Rapporté par l'IA

Google remanie ses applications Workspace en intégrant des capacités plus poussées de l’IA Gemini pour aider à la création et à la modification de documents. Les mises à jour permettent à Gemini d’extraire le contexte des e-mails, fichiers et autres sources pour générer des brouillons et affiner le contenu. Ces fonctionnalités visent à rationaliser les flux de travail des utilisateurs dans Docs, Sheets, Slides et Drive.

Apple a sélectionné les modèles d'IA Gemini de Google pour améliorer son assistant virtuel Siri dans une mise à jour à venir. Cette décision, annoncée dans un communiqué commun, marque un virage par rapport aux intégrations précédentes avec ChatGPT d'OpenAI. Ce partenariat pluriannuel vise à offrir des expériences d'IA plus performantes tout en respectant les normes de confidentialité d'Apple.

Rapporté par l'IA

Google a annoncé que son prototype expérimental d'IA, Genie 3, est désormais disponible pour les abonnés de son plan d'IA de niveau supérieur. L'outil permet aux utilisateurs de générer et de naviguer dans des mondes 3D interactifs à l'aide de prompts textuels simples. Précédemment limité aux testeurs de confiance, cette extension marque une étape vers un accès plus large pour le public à partir de 18 ans.

 

 

 

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser