El Gemini de Google supera a ChatGPT en pruebas clave de IA

En una evaluación comparativa de modelos líderes de IA, el Gemini 3.2 Fast de Google demostró fortalezas en precisión factual sobre el ChatGPT 5.2 de OpenAI, particularmente en tareas informativas. Las pruebas, impulsadas por la asociación de Apple con Google para mejorar Siri, destacan las capacidades en evolución de la IA generativa desde 2023. Aunque los resultados fueron ajustados, Gemini evitó errores significativos que socavaron la fiabilidad de ChatGPT.

Ars Technica realizó una serie de pruebas el 21 de enero de 2026, enfrentando al Gemini 3.2 Fast de Google contra el ChatGPT 5.2 de OpenAI, los modelos predeterminados accesibles sin suscripciones. Esta evaluación sigue a la decisión de Apple de integrar Gemini en la próxima versión de su asistente Siri, marcando un cambio respecto a comparaciones anteriores cuando la IA de Google era conocida como Bard a finales de 2023. Los prompts abarcaron escenarios creativos y prácticos, incluyendo generar chistes de papá, resolver un rompecabezas matemático sobre ajustar Windows 11 en disquetes de 3,5 pulgadas, crear una historia ficticia de Abraham Lincoln inventando el baloncesto, escribir una biografía del periodista Kyle Orland, redactar correos electrónicos para abordar plazos de trabajo poco realistas, evaluar afirmaciones médicas sobre cristales curativos para el cáncer, proporcionar guías para completar el nivel 8-2 de Super Mario Bros. sin correr, y delinear pasos para aterrizar un Boeing 737-800 para un novato. Gemini obtuvo victorias en cuatro categorías: el cálculo de disquetes, donde ofreció explicaciones más claras y contexto histórico; la biografía, evitando alucinaciones sobre el inicio de carrera de Orland en 2012 y enlazando fuentes; consejos de correo electrónico, proporcionando tres opciones personalizadas con consejos de uso; y estrategia de videojuegos, sugiriendo soluciones innovadoras como rebotes de enemigos para huecos. ChatGPT prevaleció en chistes de papá por ligera originalidad, escritura creativa por encanto en detalles como Lincoln usando un sombrero de pipa de estufa para anotar, y el prompt de aterrizaje de avión, considerado más práctico por el experto en aviación Lee Hutchinson por recomendar ayuda profesional sobre acciones solitarias riesgosas. El prompt de consejos médicos terminó en empate, con ambos modelos descartando la eficacia de los cristales mientras notaban beneficios psicológicos y recomendaban consultas médicas. En general, Gemini obtuvo cuatro puntos frente a los tres de ChatGPT, con un empate. Las pruebas subrayan la ventaja de Gemini en fiabilidad factual, reduciendo la desconfianza por errores como los de ChatGPT en la biografía y el nivel de juego. Este progreso probablemente influyó en la elección de asociación de Apple, señalando las ganancias de Google en el panorama de la IA.

Artículos relacionados

Illustration of Google's native Gemini AI app on a MacBook Pro, showcasing screen sharing, file uploads, and image generation features.
Imagen generada por IA

Google lanza una aplicación nativa de Gemini para macOS

Reportado por IA Imagen generada por IA

Google ha lanzado una aplicación nativa dedicada para su IA Gemini en macOS, permitiendo a los usuarios un acceso rápido mediante un atajo de teclado. La aplicación gratuita admite el uso compartido de pantalla, la carga de archivos y funciones generativas como la creación de imágenes y videos. Está disponible para descargar desde el sitio web de Google para macOS 15 y versiones posteriores.

OpenAI ha comenzado a implementar GPT-5.5 Instant como el nuevo modelo predeterminado para ChatGPT, prometiendo una mayor precisión fáctica y una personalización mejorada. La actualización reduce las alucinaciones y las afirmaciones inexactas al tiempo que mejora la claridad de las respuestas. Una nueva función de fuentes de memoria brinda a los usuarios más control sobre el contexto personalizado.

Reportado por IA

Un análisis del New York Times muestra que los AI Overviews de Google, impulsados por Gemini, responden correctamente solo entre el 90% y el 91% de las preguntas en una prueba de referencia estándar. Esto se traduce en decenas de millones de respuestas incorrectas al día en las búsquedas. Google cuestiona la relevancia de la prueba.

Google está implementando su modelo de IA Gemini de forma más amplia, con nuevas funciones para dispositivos domésticos inteligentes y uso local en Chrome.

Reportado por IA

Un nuevo análisis compara los detalles de precios de los principales chatbots de IA.

Este sitio web utiliza cookies

Utilizamos cookies para análisis con el fin de mejorar nuestro sitio. Lee nuestra política de privacidad para más información.
Rechazar