Gemini do Google supera ChatGPT em testes chave de IA

Em uma avaliação comparativa de modelos líderes de IA, o Gemini 3.2 Fast do Google demonstrou forças em precisão factual sobre o ChatGPT 5.2 da OpenAI, particularmente em tarefas informacionais. Os testes, motivados pela parceria da Apple com o Google para aprimorar o Siri, destacam as capacidades em evolução da IA generativa desde 2023. Embora os resultados fossem próximos, o Gemini evitou erros significativos que comprometeram a confiabilidade do ChatGPT.

A Ars Technica realizou uma série de testes em 21 de janeiro de 2026, colocando o Gemini 3.2 Fast do Google contra o ChatGPT 5.2 da OpenAI, os modelos padrão acessíveis sem assinaturas. Esta avaliação segue a decisão da Apple de integrar o Gemini na próxima versão de seu assistente Siri, marcando uma mudança em relação a comparações anteriores quando a IA do Google era conhecida como Bard no final de 2023. Os prompts abrangiam cenários criativos e práticos, incluindo gerar piadas de pai, resolver um quebra-cabeça matemático sobre instalar o Windows 11 em disquetes de 3,5 polegadas, criar uma história fictícia de Abraham Lincoln inventando o basquete, escrever uma biografia do jornalista Kyle Orland, redigir e-mails para lidar com prazos de trabalho irreais, avaliar alegações médicas sobre cristais curativos para câncer, fornecer orientação para completar o nível 8-2 de Super Mario Bros. sem correr, e delinear passos para pousar um Boeing 737-800 para um novato. O Gemini venceu em quatro categorias: o cálculo do disquete, onde ofereceu explicações mais claras e contexto histórico; a biografia, evitando alucinações sobre o início da carreira de Orland em 2012 e vinculando fontes; conselhos de e-mail, fornecendo três opções personalizadas com dicas de uso; e estratégia de videogame, sugerindo soluções inovadoras como saltos de inimigos para lacunas. O ChatGPT prevaleceu em piadas de pai por leve originalidade, escrita criativa por charme em detalhes como Lincoln usando um chapéu de cachimbo para pontuar, e o prompt de pouso de avião, considerado mais prático pelo especialista em aviação Lee Hutchinson por incentivar ajuda profissional em vez de ações solo arriscadas. O prompt de conselho médico terminou em empate, com ambos os modelos descartando a eficácia dos cristais enquanto notavam benefícios psicológicos e recomendavam consultas médicas. No geral, o Gemini conquistou quatro pontos contra três do ChatGPT, com um empate. Os testes destacam a vantagem do Gemini em confiabilidade factual, reduzindo a desconfiança de erros como os do ChatGPT na biografia e no nível do jogo. Esse progresso provavelmente influenciou a escolha de parceria da Apple, sinalizando os ganhos do Google no cenário de IA.

Artigos relacionados

Illustration of Google's native Gemini AI app on a MacBook Pro, showcasing screen sharing, file uploads, and image generation features.
Imagem gerada por IA

Google launches native Gemini app for macOS

Reportado por IA Imagem gerada por IA

Google has released a dedicated native app for its Gemini AI on macOS, allowing users quick access via a keyboard shortcut. The free app supports screen sharing, file uploads, and generative features like image and video creation. It is available for download from Google's website for macOS 15 and later.

Google has released Gemini 3.1 Pro, an updated version of its flagship AI model, emphasizing improvements in problem-solving and reasoning. The model is available in preview for developers and consumers starting today. It builds on the Gemini 3 release from November.

Reportado por IA

OpenAI has begun rolling out GPT-5.5 Instant as the new default model for ChatGPT, promising greater factual accuracy and improved personalization. The update reduces hallucinations and inaccurate claims while enhancing response clarity. A new memory sources feature gives users more control over personalized context.

OpenAI has released ChatGPT 5.4, which includes new features focused on spreadsheets. The update brings specialized tools for Microsoft Excel and Google Sheets. This development highlights an emphasis on productivity applications.

Reportado por IA

OpenAI has decided to pause its planned 'adult mode' for ChatGPT indefinitely, focusing instead on core products. The move comes days after discontinuing its Sora video tool. CEO Sam Altman is prioritizing ChatGPT, Codex, and the Atlas AI browser amid competitive pressures.

quinta-feira, 30 de abril de 2026, 06:14h

Google's Gemini AI generates files directly in chats

quinta-feira, 23 de abril de 2026, 12:11h

OpenAI releases GPT-5.5 model for ChatGPT

terça-feira, 21 de abril de 2026, 15:43h

OpenAI launches ChatGPT Images 2 image generation model

quarta-feira, 08 de abril de 2026, 01:31h

Study finds Google's AI Overviews wrong in 10% of cases

quarta-feira, 11 de março de 2026, 08:00h

Google enhances Workspace with advanced Gemini AI features

Este site usa cookies

Usamos cookies para análise para melhorar nosso site. Leia nossa política de privacidade para mais informações.
Recusar