Studie visar att Googles AI Overviews har fel i 10 procent av fallen

En analys från New York Times visar att Googles AI Overviews, som drivs av Gemini, endast svarar korrekt på 90 till 91 procent av frågorna i ett standardiserat test. Detta innebär tiotals miljoner felaktiga svar varje dag i sökresultaten. Google ifrågasätter testets relevans.

New York Times testade i samarbete med startup-företaget Oumi tjänsten AI Overviews med hjälp av SimpleQA, ett testverktyg med över 4 000 frågor som OpenAI släppte 2024. Inledande tester med Gemini 2.5 visade en noggrannhet på 85 procent, vilket förbättrades till 91 procent efter uppdateringen till Gemini 3. Om man extrapolerar detta till Googles totala sökvolym innebär det tiotals miljoner felaktiga svar varje dag, eller miljontals per timme, vilket framhålls i rapporter om resultaten.

Relaterade artiklar

Illustration of a smartphone screen featuring Google's AI Overviews upgraded to Gemini 3 with conversational chat interface.
Bild genererad av AI

Google uppgraderar AI-översikter till Gemini 3-modellen

Rapporterad av AI Bild genererad av AI

Google har meddelat uppgraderingar av sina AI-översikter i Search, som nu drivs som standard av Gemini 3-modellen. Uppdateringen låter användare ställa uppföljningsfrågor via en chattgränssnitt som leder till samtal i AI-läge. Den här utrullningen syftar till att göra sökningar mer konversationella och korrekta globalt på mobila enheter.

I en jämförande utvärdering av ledande AI-modeller visade Googles Gemini 3.2 Fast styrkor i faktisk noggrannhet över OpenAIs ChatGPT 5.2, särskilt i informationsuppgifter. Testerna, som utlöstes av Apples partnerskap med Google för att förbättra Siri, belyser utvecklande förmågor i generativ AI sedan 2023. Även om resultaten var jämna undvek Gemini betydande fel som undergrävde ChatGPT:s tillförlitlighet.

Rapporterad av AI

Google har släppt Gemini 3.1 Pro, en uppdaterad version av sin flaggskepps-AI-modell, med fokus på förbättringar i problemlösning och resonemang. Modellen är tillgänglig i förhandsvisning för utvecklare och konsumenter från och med idag. Den bygger på Gemini 3-släppet från november.

Google har lanserat en experimentell funktion 'Personal Intelligence' för sitt AI-läge i Sök, som låter användare koppla Gmail och Google Photos för mer skräddarsydda svar. Den opt-in-verktyget, drivet av Gemini 3, syftar till att göra sökresultat mer relevanta genom att dra nytta av personlig data utan att träna modeller på fulla inkorgar. Den rullas ut först till betalabonnenter i USA.

Rapporterad av AI

Google rustar om sina Workspace-appar genom att integrera djupare Gemini AI-kapaciteter för att underlätta skapande och redigering av dokument. Uppdateringarna gör det möjligt för Gemini att hämta kontext från e-post, filer och andra källor för att generera utkast och förfina innehåll. Dessa funktioner syftar till att förenkla arbetsflöden för användare i Docs, Sheets, Slides och Drive.

Apple har valt Googles Gemini AI-modeller för att förbättra sin virtuella assistent Siri i en kommande uppdatering. Beslutet, som tillkännagavs i ett gemensamt uttalande, markerar en förändring från tidigare integrationer med OpenAIs ChatGPT. Detta fleråriga partnerskap syftar till att leverera mer kapabla AI-upplevelser samtidigt som Apples integritetsstandarder upprätthålls.

Rapporterad av AI

Google har meddelat att dess experimentella AI-prototyp, Genie 3, nu är tillgänglig för prenumeranter på företagets högsta AI-plan. Verktyget låter användare skapa och navigera interaktiva 3D-världar med enkla textkommandon. Tidigare begränsat till betrodda testare markerar denna utökning ett steg mot bredare tillgång för personer från 18 år och uppåt.

 

 

 

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj