Gemini milik Google unggul atas ChatGPT dalam tes AI kunci

Dalam evaluasi perbandingan model AI terkemuka, Gemini 3.2 Fast milik Google menunjukkan kekuatan dalam akurasi faktual dibandingkan ChatGPT 5.2 milik OpenAI, terutama dalam tugas informasional. Tes tersebut, yang dipicu oleh kemitraan Apple dengan Google untuk meningkatkan Siri, menyoroti kemampuan yang berkembang dalam AI generatif sejak 2023. Meskipun hasilnya ketat, Gemini menghindari kesalahan signifikan yang merusak keandalan ChatGPT.

Ars Technica melakukan serangkaian tes pada 21 Januari 2026, mempertemukan Gemini 3.2 Fast milik Google melawan ChatGPT 5.2 milik OpenAI, model default yang dapat diakses tanpa langganan. Evaluasi ini mengikuti keputusan Apple untuk mengintegrasikan Gemini ke versi berikutnya dari asisten Siri-nya, menandai pergeseran dari perbandingan sebelumnya ketika AI Google dikenal sebagai Bard pada akhir 2023. Prompt mencakup skenario kreatif dan praktis, termasuk menghasilkan lelucon ayah, menyelesaikan teka-teki matematika tentang memasang Windows 11 ke disket 3,5 inci, membuat cerita fiksi Abraham Lincoln menemukan bola basket, menulis biografi jurnalis Kyle Orland, menyusun email untuk mengatasi tenggat waktu kerja yang tidak realistis, menilai klaim medis tentang kristal penyembuh kanker, memberikan panduan untuk mengalahkan level 8-2 Super Mario Bros. tanpa lari, dan menguraikan langkah-langkah mendaratkan Boeing 737-800 untuk pemula. Gemini meraih kemenangan di empat kategori: perhitungan disket, di mana memberikan penjelasan lebih jelas dan konteks historis; biografi, menghindari halusinasi tentang awal karir Orland pada 2012 dan menautkan sumber; saran email, menyediakan tiga opsi yang disesuaikan dengan tips penggunaan; dan strategi game, menyarankan solusi inovatif seperti pantulan musuh untuk celah. ChatGPT unggul dalam lelucon ayah untuk keaslian ringan, penulisan kreatif untuk pesona dalam detail seperti Lincoln menggunakan topi pipa kompor untuk mencetak skor, dan prompt pendaratan pesawat, yang dianggap lebih praktis oleh ahli penerbangan Lee Hutchinson karena mendorong bantuan profesional daripada tindakan solo berisiko. Prompt saran medis berakhir seri, dengan kedua model menolak efektivitas kristal sambil mencatat manfaat psikologis dan merekomendasikan konsultasi dokter. Secara keseluruhan, Gemini memperoleh empat poin dibandingkan tiga poin ChatGPT, dengan satu seri. Tes ini menekankan keunggulan Gemini dalam keandalan faktual, mengurangi ketidakpercayaan dari kesalahan seperti yang dilakukan ChatGPT dalam biografi dan level game. Kemajuan ini kemungkinan memengaruhi pilihan kemitraan Apple, menandakan keuntungan Google di lanskap AI.

Artikel Terkait

Illustration depicting OpenAI's ChatGPT-5.2 launch, showing professionals using the AI to enhance workplace productivity amid rivalry with Google's Gemini.
Gambar dihasilkan oleh AI

OpenAI merilis ChatGPT-5.2 untuk meningkatkan produktivitas kerja

Dilaporkan oleh AI Gambar dihasilkan oleh AI

OpenAI telah meluncurkan ChatGPT-5.2, keluarga model AI baru yang dirancang untuk meningkatkan penalaran dan produktivitas, khususnya untuk tugas profesional. Peluncuran ini menyusul peringatan internal dari CEO Sam Altman tentang persaingan dari Gemini 3 milik Google. Pembaruan ini mencakup tiga varian yang ditargetkan untuk kebutuhan pengguna berbeda, dimulai dengan pelanggan berbayar.

Google telah merilis Gemini 3.1 Pro, versi terbaru dari model AI unggulannya, yang menekankan peningkatan dalam pemecahan masalah dan penalaran. Model ini tersedia dalam pratinjau untuk pengembang dan konsumen mulai hari ini. Model ini dibangun di atas rilis Gemini 3 dari November.

Dilaporkan oleh AI

Apple telah memilih model AI Gemini milik Google untuk meningkatkan asisten virtual Siri-nya dalam pembaruan mendatang. Keputusan ini, yang diumumkan dalam pernyataan bersama, menandai pergeseran dari integrasi sebelumnya dengan ChatGPT milik OpenAI. Kemitraan multi-tahun ini bertujuan memberikan pengalaman AI yang lebih mampu sambil menjunjung standar privasi Apple.

Google telah meluncurkan Personal Intelligence, fitur baru untuk AI Gemini-nya yang mengintegrasikan data dari Gmail, Photos, Search, dan YouTube untuk memberikan respons yang lebih disesuaikan. Awalnya tersedia untuk pelanggan berbayar di AS, alat opt-in ini menekankan kontrol privasi pengguna dan menghindari pelatihan langsung pada data pribadi. Penyebaran dimulai dalam beta, dengan rencana akses lebih luas di masa depan.

Dilaporkan oleh AI

Google sedang merombak aplikasi Workspace-nya dengan mengintegrasikan kemampuan AI Gemini yang lebih mendalam untuk membantu pembuatan dan pengeditan dokumen. Pembaruan ini memungkinkan Gemini menarik konteks dari email, file, dan sumber lain untuk menghasilkan draf serta menyempurnakan konten. Fitur-fitur ini bertujuan menyederhanakan alur kerja pengguna di Docs, Sheets, Slides, dan Drive.

Pentagon AS telah mengumumkan platform kecerdasan buatan baru yang dibangun berdasarkan model Gemini milik Google. Perkembangan ini melengkapi militer dengan alat AI canggih. Namun, reaksi bercampur aduk, dengan sebagian orang menyatakan kekhawatiran atas implikasinya.

Dilaporkan oleh AI

Google mengumumkan bahwa prototipe AI eksperimentalnya, Genie 3, kini tersedia bagi pelanggan paket AI tingkat tertinggi. Alat ini memungkinkan pengguna menghasilkan dan menjelajahi dunia 3D interaktif menggunakan perintah teks sederhana. Sebelumnya terbatas pada penguji tepercaya, perluasan ini menandai langkah menuju akses lebih luas bagi audiens berusia 18 tahun ke atas.

 

 

 

Situs web ini menggunakan cookie

Kami menggunakan cookie untuk analisis guna meningkatkan situs kami. Baca kebijakan privasi kami untuk informasi lebih lanjut.
Tolak