I en jämförande utvärdering av ledande AI-modeller visade Googles Gemini 3.2 Fast styrkor i faktisk noggrannhet över OpenAIs ChatGPT 5.2, särskilt i informationsuppgifter. Testerna, som utlöstes av Apples partnerskap med Google för att förbättra Siri, belyser utvecklande förmågor i generativ AI sedan 2023. Även om resultaten var jämna undvek Gemini betydande fel som undergrävde ChatGPT:s tillförlitlighet.
Ars Technica genomförde en serie tester den 21 januari 2026, där Googles Gemini 3.2 Fast ställdes mot OpenAIs ChatGPT 5.2, de standardmodeller som är tillgängliga utan prenumeration. Denna utvärdering följer Apples beslut att integrera Gemini i nästa version av sin assistent Siri, vilket markerar en förändring från tidigare jämförelser när Googles AI var känd som Bard i slutet av 2023. Prompts spände över kreativa och praktiska scenarier, inklusive att generera pappaskämt, lösa ett matematiskt pussel om att få in Windows 11 på 3,5-tums disketter, skapa en fiktiv berättelse om Abraham Lincoln som uppfann basket, skriva en biografi om journalisten Kyle Orland, utforma e-postmeddelanden för att hantera orealistiska arbetsfrister, bedöma medicinska påståenden om helande kristaller för cancer, ge vägledning för att klara Super Mario Bros nivå 8-2 utan att springa, och skissa steg för att landa en Boeing 737-800 för en nybörjare. Gemini vann i fyra kategorier: disketträkningen, med tydligare förklaringar och historisk kontext; biografin, undvikande hallucinationer om Orlands karriärstart 2012 och länkande källor; e-postråd, med tre anpassade alternativ och användningstips; och spelstrategi, föreslående innovativa lösningar som fiendestuds för luckor. ChatGPT vann i pappaskämt för lätt originalitet, kreativt skrivande för charm i detaljer som Lincoln använder en spisrörshatt för poäng, och flygplanslandningsprompten, som ansågs mer praktisk av flygeksperten Lee Hutchinson för att uppmana professionell hjälp istället för riskfyllda solohandlingar. Medicinrådsprompten slutade oavgjort, med båda modellerna avvisande kristallernas effektivitet men noterande psykologiska fördelar och rekommenderande läkarbesök. Sammantaget fick Gemini fyra poäng mot ChatGPT:s tre, med en oavgjord. Testerna understryker Geminis fördel i faktisk tillförlitlighet, minskande misstro från fel som ChatGPT:s i biografin och spelnivån. Denna framsteg påverkade troligen Apples partner-val, signalerande Googles vinster i AI-landskapet.