Studi temukan AI Overviews Google salah dalam 10% kasus

Analisis New York Times menunjukkan bahwa AI Overviews Google, yang ditenagai oleh Gemini, hanya menjawab pertanyaan dengan benar sebesar 90% hingga 91% dalam tolok ukur standar. Hal ini setara dengan puluhan juta jawaban yang salah setiap harinya dalam penelusuran. Google membantah relevansi pengujian tersebut.

The New York Times, bekerja sama dengan startup Oumi, menguji AI Overviews menggunakan SimpleQA, sebuah tolok ukur yang terdiri dari lebih dari 4.000 pertanyaan yang dirilis oleh OpenAI pada tahun 2024. Pengujian awal dengan Gemini 2.5 menunjukkan tingkat akurasi 85%, yang meningkat menjadi 91% setelah pembaruan Gemini 3. Jika diekstrapolasikan ke volume penelusuran Google, ini berarti puluhan juta jawaban salah dihasilkan setiap harinya, atau jutaan per jam sebagaimana disorot dalam laporan temuan tersebut.

Artikel Terkait

Illustration of a smartphone screen featuring Google's AI Overviews upgraded to Gemini 3 with conversational chat interface.
Gambar dihasilkan oleh AI

Google tingkatkan ringkasan AI ke model Gemini 3

Dilaporkan oleh AI Gambar dihasilkan oleh AI

Google mengumumkan peningkatan untuk Ringkasan AI di Search, kini didukung secara default oleh model Gemini 3. Pembaruan ini memungkinkan pengguna mengajukan pertanyaan lanjutan melalui antarmuka obrolan yang mengarah ke percakapan Mode AI. Peluncuran ini bertujuan membuat pencarian lebih percakapan dan akurat secara global di perangkat seluler.

Dalam evaluasi perbandingan model AI terkemuka, Gemini 3.2 Fast milik Google menunjukkan kekuatan dalam akurasi faktual dibandingkan ChatGPT 5.2 milik OpenAI, terutama dalam tugas informasional. Tes tersebut, yang dipicu oleh kemitraan Apple dengan Google untuk meningkatkan Siri, menyoroti kemampuan yang berkembang dalam AI generatif sejak 2023. Meskipun hasilnya ketat, Gemini menghindari kesalahan signifikan yang merusak keandalan ChatGPT.

Dilaporkan oleh AI

Google telah merilis Gemini 3.1 Pro, versi terbaru dari model AI unggulannya, yang menekankan peningkatan dalam pemecahan masalah dan penalaran. Model ini tersedia dalam pratinjau untuk pengembang dan konsumen mulai hari ini. Model ini dibangun di atas rilis Gemini 3 dari November.

Google telah meluncurkan fitur eksperimental 'Personal Intelligence' untuk Mode AI di Pencarian, memungkinkan pengguna menghubungkan Gmail dan Google Photos untuk respons yang lebih disesuaikan. Alat opt-in yang didukung Gemini 3 bertujuan membuat hasil pencarian lebih relevan dengan memanfaatkan data pribadi tanpa melatih model pada kotak masuk penuh. Diluncurkan pertama kali untuk pelanggan berbayar di AS.

Dilaporkan oleh AI

Google sedang merombak aplikasi Workspace-nya dengan mengintegrasikan kemampuan AI Gemini yang lebih mendalam untuk membantu pembuatan dan pengeditan dokumen. Pembaruan ini memungkinkan Gemini menarik konteks dari email, file, dan sumber lain untuk menghasilkan draf serta menyempurnakan konten. Fitur-fitur ini bertujuan menyederhanakan alur kerja pengguna di Docs, Sheets, Slides, dan Drive.

Apple telah memilih model AI Gemini milik Google untuk meningkatkan asisten virtual Siri-nya dalam pembaruan mendatang. Keputusan ini, yang diumumkan dalam pernyataan bersama, menandai pergeseran dari integrasi sebelumnya dengan ChatGPT milik OpenAI. Kemitraan multi-tahun ini bertujuan memberikan pengalaman AI yang lebih mampu sambil menjunjung standar privasi Apple.

Dilaporkan oleh AI

Google mengumumkan bahwa prototipe AI eksperimentalnya, Genie 3, kini tersedia bagi pelanggan paket AI tingkat tertinggi. Alat ini memungkinkan pengguna menghasilkan dan menjelajahi dunia 3D interaktif menggunakan perintah teks sederhana. Sebelumnya terbatas pada penguji tepercaya, perluasan ini menandai langkah menuju akses lebih luas bagi audiens berusia 18 tahun ke atas.

 

 

 

Situs web ini menggunakan cookie

Kami menggunakan cookie untuk analisis guna meningkatkan situs kami. Baca kebijakan privasi kami untuk informasi lebih lanjut.
Tolak