Googles Gemini överträffar ChatGPT i viktiga AI-tester

21 januari 2026

Rapporterad av AI

I en jämförande utvärdering av ledande AI-modeller visade Googles Gemini 3.2 Fast styrkor i faktisk noggrannhet över OpenAIs ChatGPT 5.2, särskilt i informationsuppgifter. Testerna, som utlöstes av Apples partnerskap med Google för att förbättra Siri, belyser utvecklande förmågor i generativ AI sedan 2023. Även om resultaten var jämna undvek Gemini betydande fel som undergrävde ChatGPT:s tillförlitlighet.

Ars Technica genomförde en serie tester den 21 januari 2026, där Googles Gemini 3.2 Fast ställdes mot OpenAIs ChatGPT 5.2, de standardmodeller som är tillgängliga utan prenumeration. Denna utvärdering följer Apples beslut att integrera Gemini i nästa version av sin assistent Siri, vilket markerar en förändring från tidigare jämförelser när Googles AI var känd som Bard i slutet av 2023. Prompts spände över kreativa och praktiska scenarier, inklusive att generera pappaskämt, lösa ett matematiskt pussel om att få in Windows 11 på 3,5-tums disketter, skapa en fiktiv berättelse om Abraham Lincoln som uppfann basket, skriva en biografi om journalisten Kyle Orland, utforma e-postmeddelanden för att hantera orealistiska arbetsfrister, bedöma medicinska påståenden om helande kristaller för cancer, ge vägledning för att klara Super Mario Bros nivå 8-2 utan att springa, och skissa steg för att landa en Boeing 737-800 för en nybörjare. Gemini vann i fyra kategorier: disketträkningen, med tydligare förklaringar och historisk kontext; biografin, undvikande hallucinationer om Orlands karriärstart 2012 och länkande källor; e-postråd, med tre anpassade alternativ och användningstips; och spelstrategi, föreslående innovativa lösningar som fiendestuds för luckor. ChatGPT vann i pappaskämt för lätt originalitet, kreativt skrivande för charm i detaljer som Lincoln använder en spisrörshatt för poäng, och flygplanslandningsprompten, som ansågs mer praktisk av flygeksperten Lee Hutchinson för att uppmana professionell hjälp istället för riskfyllda solohandlingar. Medicinrådsprompten slutade oavgjort, med båda modellerna avvisande kristallernas effektivitet men noterande psykologiska fördelar och rekommenderande läkarbesök. Sammantaget fick Gemini fyra poäng mot ChatGPT:s tre, med en oavgjord. Testerna understryker Geminis fördel i faktisk tillförlitlighet, minskande misstro från fel som ChatGPT:s i biografin och spelnivån. Denna framsteg påverkade troligen Apples partner-val, signalerande Googles vinster i AI-landskapet.

Googles Gemini överträffar ChatGPT i viktiga AI-tester

Relaterade artiklar

OpenAI rolls out new GPT-Live voice models for ChatGPT

Google releases three new Gemini AI models

OpenAI deploys GPT-5.5 Instant as ChatGPT's new default model

OpenAI releases ChatGPT-5.6 models and ChatGPT Work

Google Play Books launches AI chatbot feature for ebooks

Google expands Gemini AI across devices and homes

ChatGPT disproves 30-year-old math conjecture with simple prompts

Google unveils Gemini 3.5 and Gemini Omni at I/O 2026

Google unveils Gemini 3.5 Live Translate for real-time conversations

Google debuts Gemini Spark AI agent at I/O conference

Google's Gemini AI generates files directly in chats

Denna webbplats använder cookies