Googles Gemini överträffar ChatGPT i viktiga AI-tester

I en jämförande utvärdering av ledande AI-modeller visade Googles Gemini 3.2 Fast styrkor i faktisk noggrannhet över OpenAIs ChatGPT 5.2, särskilt i informationsuppgifter. Testerna, som utlöstes av Apples partnerskap med Google för att förbättra Siri, belyser utvecklande förmågor i generativ AI sedan 2023. Även om resultaten var jämna undvek Gemini betydande fel som undergrävde ChatGPT:s tillförlitlighet.

Ars Technica genomförde en serie tester den 21 januari 2026, där Googles Gemini 3.2 Fast ställdes mot OpenAIs ChatGPT 5.2, de standardmodeller som är tillgängliga utan prenumeration. Denna utvärdering följer Apples beslut att integrera Gemini i nästa version av sin assistent Siri, vilket markerar en förändring från tidigare jämförelser när Googles AI var känd som Bard i slutet av 2023. Prompts spände över kreativa och praktiska scenarier, inklusive att generera pappaskämt, lösa ett matematiskt pussel om att få in Windows 11 på 3,5-tums disketter, skapa en fiktiv berättelse om Abraham Lincoln som uppfann basket, skriva en biografi om journalisten Kyle Orland, utforma e-postmeddelanden för att hantera orealistiska arbetsfrister, bedöma medicinska påståenden om helande kristaller för cancer, ge vägledning för att klara Super Mario Bros nivå 8-2 utan att springa, och skissa steg för att landa en Boeing 737-800 för en nybörjare. Gemini vann i fyra kategorier: disketträkningen, med tydligare förklaringar och historisk kontext; biografin, undvikande hallucinationer om Orlands karriärstart 2012 och länkande källor; e-postråd, med tre anpassade alternativ och användningstips; och spelstrategi, föreslående innovativa lösningar som fiendestuds för luckor. ChatGPT vann i pappaskämt för lätt originalitet, kreativt skrivande för charm i detaljer som Lincoln använder en spisrörshatt för poäng, och flygplanslandningsprompten, som ansågs mer praktisk av flygeksperten Lee Hutchinson för att uppmana professionell hjälp istället för riskfyllda solohandlingar. Medicinrådsprompten slutade oavgjort, med båda modellerna avvisande kristallernas effektivitet men noterande psykologiska fördelar och rekommenderande läkarbesök. Sammantaget fick Gemini fyra poäng mot ChatGPT:s tre, med en oavgjord. Testerna understryker Geminis fördel i faktisk tillförlitlighet, minskande misstro från fel som ChatGPT:s i biografin och spelnivån. Denna framsteg påverkade troligen Apples partner-val, signalerande Googles vinster i AI-landskapet.

Relaterade artiklar

Illustration depicting OpenAI's ChatGPT-5.2 launch, showing professionals using the AI to enhance workplace productivity amid rivalry with Google's Gemini.
Bild genererad av AI

OpenAI släpper ChatGPT-5.2 för att öka arbetsproduktiviteten

Rapporterad av AI Bild genererad av AI

OpenAI har lanserat ChatGPT-5.2, en ny familj av AI-modeller utformade för att förbättra resonemang och produktivitet, särskilt för professionella uppgifter. Lanseringen följer ett internt varning från VD Sam Altman om konkurrens från Googles Gemini 3. Uppdateringen inkluderar tre varianter anpassade för olika användarbehov, med start för betalande prenumeranter.

Google har släppt Gemini 3.1 Pro, en uppdaterad version av sin flaggskepps-AI-modell, med fokus på förbättringar i problemlösning och resonemang. Modellen är tillgänglig i förhandsvisning för utvecklare och konsumenter från och med idag. Den bygger på Gemini 3-släppet från november.

Rapporterad av AI

Apple har valt Googles Gemini AI-modeller för att förbättra sin virtuella assistent Siri i en kommande uppdatering. Beslutet, som tillkännagavs i ett gemensamt uttalande, markerar en förändring från tidigare integrationer med OpenAIs ChatGPT. Detta fleråriga partnerskap syftar till att leverera mer kapabla AI-upplevelser samtidigt som Apples integritetsstandarder upprätthålls.

Google har lanserat Personal Intelligence, en ny funktion för sin Gemini AI som integrerar data från Gmail, Photos, Search och YouTube för att ge mer anpassade svar. Tillgänglig initialt för betalande prenumeranter i USA, betonar den opt-in-verktyget användarkontroller för integritet och undviker direkt träning på persondata. Utrullningen börjar i beta, med planer på bredare tillgång i framtiden.

Rapporterad av AI

Google rustar om sina Workspace-appar genom att integrera djupare Gemini AI-kapaciteter för att underlätta skapande och redigering av dokument. Uppdateringarna gör det möjligt för Gemini att hämta kontext från e-post, filer och andra källor för att generera utkast och förfina innehåll. Dessa funktioner syftar till att förenkla arbetsflöden för användare i Docs, Sheets, Slides och Drive.

USA:s Pentagon har presenterat en ny artificiell intelligensplattform byggd på Googles Gemini-modell. Denna utveckling utrustar militären med avancerade AI-verktyg. Reaktionerna är dock blandade, med vissa som uttrycker oro över implikationerna.

Rapporterad av AI

Google har meddelat att dess experimentella AI-prototyp, Genie 3, nu är tillgänglig för prenumeranter på företagets högsta AI-plan. Verktyget låter användare skapa och navigera interaktiva 3D-världar med enkla textkommandon. Tidigare begränsat till betrodda testare markerar denna utökning ett steg mot bredare tillgång för personer från 18 år och uppåt.

 

 

 

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj