Estudo aponta que as Visões Gerais por IA do Google estão incorretas em 10% dos casos

Uma análise do The New York Times mostra que as Visões Gerais por IA do Google, impulsionadas pelo Gemini, respondem corretamente apenas entre 90% e 91% das perguntas em um benchmark padrão. Isso se traduz em dezenas de milhões de respostas incorretas diariamente nas buscas. O Google contesta a relevância do teste.

O The New York Times, em parceria com a startup Oumi, testou as Visões Gerais por IA usando o SimpleQA, um benchmark de mais de 4.000 perguntas lançado pela OpenAI em 2024. Os testes iniciais com o Gemini 2.5 mostraram 85% de precisão, subindo para 91% após a atualização do Gemini 3. Extrapolando para o volume de buscas do Google, isso significa dezenas de milhões de respostas erradas geradas a cada dia, ou milhões por hora, conforme destacado em relatórios sobre as descobertas.

Artigos relacionados

Illustration of a smartphone screen featuring Google's AI Overviews upgraded to Gemini 3 with conversational chat interface.
Imagem gerada por IA

Google atualiza resumos de IA para o modelo Gemini 3

Reportado por IA Imagem gerada por IA

Google anunciou atualizações nos seus Resumos de IA no Search, agora alimentados por defeito pelo modelo Gemini 3. A atualização permite que os utilizadores façam perguntas de acompanhamento através de uma interface de chat que leva a conversas no modo IA. Este lançamento visa tornar as pesquisas mais conversacionais e precisas globalmente em dispositivos móveis.

Em uma avaliação comparativa de modelos líderes de IA, o Gemini 3.2 Fast do Google demonstrou forças em precisão factual sobre o ChatGPT 5.2 da OpenAI, particularmente em tarefas informacionais. Os testes, motivados pela parceria da Apple com o Google para aprimorar o Siri, destacam as capacidades em evolução da IA generativa desde 2023. Embora os resultados fossem próximos, o Gemini evitou erros significativos que comprometeram a confiabilidade do ChatGPT.

Reportado por IA

Google lançou o Gemini 3.1 Pro, uma versão atualizada de seu modelo de IA principal, enfatizando melhorias na resolução de problemas e raciocínio. O modelo está disponível em pré-visualização para desenvolvedores e consumidores a partir de hoje. Ele se baseia no lançamento do Gemini 3 em novembro.

O Google lançou uma funcionalidade experimental 'Personal Intelligence' para o Modo IA na Pesquisa, permitindo que os usuários conectem o Gmail e o Google Photos para respostas mais personalizadas. A ferramenta opt-in, alimentada pelo Gemini 3, visa tornar os resultados de pesquisa mais relevantes usando dados pessoais sem treinar modelos em caixas de entrada completas. É lançada primeiro para assinantes pagos nos EUA.

Reportado por IA

O Google está reformulando seus aplicativos Workspace ao integrar capacidades mais profundas de IA Gemini para auxiliar na criação e edição de documentos. As atualizações permitem que o Gemini extraia contexto de e-mails, arquivos e outras fontes para gerar rascunhos e refinar conteúdo. Esses recursos visam otimizar fluxos de trabalho para usuários em Docs, Sheets, Slides e Drive.

A Apple selecionou os modelos de IA Gemini do Google para aprimorar o seu assistente virtual Siri numa atualização futura. A decisão, anunciada num comunicado conjunto, marca uma mudança em relação às integrações anteriores com o ChatGPT da OpenAI. Esta parceria de vários anos visa oferecer experiências de IA mais capazes, mantendo os padrões de privacidade da Apple.

Reportado por IA

Google anunciou que seu protótipo experimental de IA, Genie 3, agora está disponível para assinantes de seu plano de IA de nível mais alto. A ferramenta permite que os usuários gerem e naveguem por mundos 3D interativos usando prompts de texto simples. Anteriormente limitada a testadores confiáveis, essa expansão marca um passo em direção a um acesso mais amplo para o público a partir de 18 anos.

 

 

 

Este site usa cookies

Usamos cookies para análise para melhorar nosso site. Leia nossa política de privacidade para mais informações.
Recusar