Un estudio revela que los AI Overviews de Google fallan en el 10% de los casos

Un análisis del New York Times muestra que los AI Overviews de Google, impulsados por Gemini, responden correctamente solo entre el 90% y el 91% de las preguntas en una prueba de referencia estándar. Esto se traduce en decenas de millones de respuestas incorrectas al día en las búsquedas. Google cuestiona la relevancia de la prueba.

El New York Times, en colaboración con la startup Oumi, evaluó los AI Overviews utilizando SimpleQA, un conjunto de referencia de más de 4,000 preguntas publicado por OpenAI en 2024. Las pruebas iniciales con Gemini 2.5 mostraron una precisión del 85%, la cual mejoró hasta el 91% tras la actualización a Gemini 3. Extrapolando estos datos al volumen de búsqueda de Google, esto significa que se generan decenas de millones de respuestas erróneas cada día, o millones por hora, tal como destacan los informes sobre los hallazgos.

Artículos relacionados

Illustration of a smartphone screen featuring Google's AI Overviews upgraded to Gemini 3 with conversational chat interface.
Imagen generada por IA

Google actualiza los resúmenes de IA al modelo Gemini 3

Reportado por IA Imagen generada por IA

Google ha anunciado mejoras en sus resúmenes de IA en Search, ahora impulsados por defecto por el modelo Gemini 3. La actualización permite a los usuarios plantear preguntas de seguimiento mediante una interfaz de chat que deriva en conversaciones en modo IA. Este despliegue busca hacer las búsquedas más conversacionales y precisas a nivel global en dispositivos móviles.

En una evaluación comparativa de modelos líderes de IA, el Gemini 3.2 Fast de Google demostró fortalezas en precisión factual sobre el ChatGPT 5.2 de OpenAI, particularmente en tareas informativas. Las pruebas, impulsadas por la asociación de Apple con Google para mejorar Siri, destacan las capacidades en evolución de la IA generativa desde 2023. Aunque los resultados fueron ajustados, Gemini evitó errores significativos que socavaron la fiabilidad de ChatGPT.

Reportado por IA

Google ha lanzado Gemini 3.1 Pro, una versión actualizada de su modelo de IA insignia, que enfatiza mejoras en la resolución de problemas y el razonamiento. El modelo está disponible en versión preliminar para desarrolladores y consumidores a partir de hoy. Se basa en el lanzamiento de Gemini 3 de noviembre.

Google ha lanzado una función experimental llamada 'Personal Intelligence' para su Modo IA en Búsqueda, que permite a los usuarios conectar Gmail y Google Photos para obtener respuestas más personalizadas. Esta herramienta opt-in, impulsada por Gemini 3, busca hacer los resultados de búsqueda más relevantes utilizando datos personales sin entrenar modelos con bandejas de entrada completas. Se implementa primero para suscriptores de pago en EE.UU.

Reportado por IA

Google está renovando sus aplicaciones Workspace al integrar capacidades más profundas de IA Gemini para ayudar en la creación y edición de documentos. Las actualizaciones permiten que Gemini extraiga contexto de correos electrónicos, archivos y otras fuentes para generar borradores y refinar contenido. Estas funciones buscan agilizar los flujos de trabajo para los usuarios en Docs, Sheets, Slides y Drive.

Apple ha seleccionado los modelos de IA Gemini de Google para mejorar su asistente virtual Siri en una actualización próxima. La decisión, anunciada en un comunicado conjunto, marca un cambio respecto a las integraciones previas con ChatGPT de OpenAI. Esta asociación a varios años busca ofrecer experiencias de IA más capaces manteniendo los estándares de privacidad de Apple.

Reportado por IA

Google ha anunciado que su prototipo experimental de IA, Genie 3, está ahora disponible para los suscriptores de su plan de IA de mayor nivel. La herramienta permite a los usuarios generar y navegar mundos 3D interactivos usando simples indicaciones de texto. Anteriormente limitada a probadores de confianza, esta expansión marca un paso hacia un acceso más amplio para mayores de 18 años.

 

 

 

Este sitio web utiliza cookies

Utilizamos cookies para análisis con el fin de mejorar nuestro sitio. Lee nuestra política de privacidad para más información.
Rechazar