Em uma avaliação comparativa de modelos líderes de IA, o Gemini 3.2 Fast do Google demonstrou forças em precisão factual sobre o ChatGPT 5.2 da OpenAI, particularmente em tarefas informacionais. Os testes, motivados pela parceria da Apple com o Google para aprimorar o Siri, destacam as capacidades em evolução da IA generativa desde 2023. Embora os resultados fossem próximos, o Gemini evitou erros significativos que comprometeram a confiabilidade do ChatGPT.
A Ars Technica realizou uma série de testes em 21 de janeiro de 2026, colocando o Gemini 3.2 Fast do Google contra o ChatGPT 5.2 da OpenAI, os modelos padrão acessíveis sem assinaturas. Esta avaliação segue a decisão da Apple de integrar o Gemini na próxima versão de seu assistente Siri, marcando uma mudança em relação a comparações anteriores quando a IA do Google era conhecida como Bard no final de 2023. Os prompts abrangiam cenários criativos e práticos, incluindo gerar piadas de pai, resolver um quebra-cabeça matemático sobre instalar o Windows 11 em disquetes de 3,5 polegadas, criar uma história fictícia de Abraham Lincoln inventando o basquete, escrever uma biografia do jornalista Kyle Orland, redigir e-mails para lidar com prazos de trabalho irreais, avaliar alegações médicas sobre cristais curativos para câncer, fornecer orientação para completar o nível 8-2 de Super Mario Bros. sem correr, e delinear passos para pousar um Boeing 737-800 para um novato. O Gemini venceu em quatro categorias: o cálculo do disquete, onde ofereceu explicações mais claras e contexto histórico; a biografia, evitando alucinações sobre o início da carreira de Orland em 2012 e vinculando fontes; conselhos de e-mail, fornecendo três opções personalizadas com dicas de uso; e estratégia de videogame, sugerindo soluções inovadoras como saltos de inimigos para lacunas. O ChatGPT prevaleceu em piadas de pai por leve originalidade, escrita criativa por charme em detalhes como Lincoln usando um chapéu de cachimbo para pontuar, e o prompt de pouso de avião, considerado mais prático pelo especialista em aviação Lee Hutchinson por incentivar ajuda profissional em vez de ações solo arriscadas. O prompt de conselho médico terminou em empate, com ambos os modelos descartando a eficácia dos cristais enquanto notavam benefícios psicológicos e recomendavam consultas médicas. No geral, o Gemini conquistou quatro pontos contra três do ChatGPT, com um empate. Os testes destacam a vantagem do Gemini em confiabilidade factual, reduzindo a desconfiança de erros como os do ChatGPT na biografia e no nível do jogo. Esse progresso provavelmente influenciou a escolha de parceria da Apple, sinalizando os ganhos do Google no cenário de IA.