GoogleのAI概要、10%の確率で誤情報を生成との調査結果

ニューヨーク・タイムズ紙の分析により、Geminiを搭載したGoogleの「AI概要(AI Overviews)」が、標準的なベンチマークテストにおいて、質問に対して90%から91%の確率でしか正しく回答していないことが判明した。これは、1日あたり数千万件の誤った回答が検索結果として表示されていることを意味する。なお、Googleはこのテストの妥当性に異議を唱えている。

ニューヨーク・タイムズ紙は、スタートアップ企業のOumiと共同で、OpenAIが2024年に公開した4,000以上の質問からなるベンチマーク「SimpleQA」を用いてAI概要のテストを実施した。Gemini 2.5を用いた初期テストでは正答率が85%であったが、Gemini 3へのアップデートにより91%まで改善した。この結果をGoogleの検索ボリュームに当てはめると、毎日数千万件、時間あたりに換算して数百万件の誤った回答が生成されている計算になり、その影響の大きさが指摘されている。

関連記事

Illustration of a smartphone screen featuring Google's AI Overviews upgraded to Gemini 3 with conversational chat interface.
AIによって生成された画像

GoogleがAI概要をGemini 3モデルにアップグレード

AIによるレポート AIによって生成された画像

GoogleはSearchのAI概要をデフォルトでGemini 3モデルで強化したと発表しました。この更新により、ユーザーはチャットインターフェースを通じてフォローアップ質問ができ、AIモードの会話につながります。この展開は、モバイルデバイスでの検索を世界的により会話型で正確にすることを目的としています。

主要AIモデルの比較評価で、GoogleのGemini 3.2 FastはOpenAIのChatGPT 5.2に対し、事実精度で優位性を示した。特に情報タスクで顕著だった。これらのテストは、AppleがGoogleと提携してSiriを強化したことを受けて行われ、2023年以来の生成AIの進化を強調している。結果は僅差だったが、GeminiはChatGPTの信頼性を損なう重大な誤りを避けた。

AIによるレポート

GoogleはフラッグシップAIモデルの更新版であるGemini 3.1 Proをリリースしました。問題解決と推論の改善を強調しています。このモデルは本日から開発者と消費者向けにプレビュー版として利用可能です。11月のGemini 3リリースを基盤としています。

Googleは、検索のAIモード向けに実験的な「Personal Intelligence」機能をリリースしました。これにより、ユーザーはGmailとGoogle Photosを接続してよりパーソナライズされた応答を得られます。Gemini 3で駆動されるオプトイン機能は、完全な受信箱でモデルを訓練せずに個人データを活用し、検索結果をより関連性が高くすることを目指します。まず米国有料サブスクライバー向けに展開されます。

AIによるレポート

Googleは、ドキュメントの作成と編集を支援するため、より深いGemini AI機能を統合することでWorkspaceアプリを刷新しています。更新によりGeminiはメール、ファイル、その他のソースからコンテキストを引き出し、ドラフト生成やコンテンツの洗練が可能になります。これらの機能はDocs、Sheets、Slides、Driveのユーザー向けワークフローを合理化することを目指しています。

Appleは、今後のアップデートで仮想アシスタントのSiriを強化するため、GoogleのGemini AIモデルを選択しました。この決定は共同声明で発表され、OpenAIのChatGPTとの以前の統合からの転換を示しています。この複数年にわたるパートナーシップは、Appleのプライバシー基準を維持しつつ、より高度なAI体験を提供することを目的としています。

AIによるレポート

Googleは、実験的なAIプロトタイプであるGenie 3を最上位のAIプラン加入者に提供すると発表した。このツールは、シンプルなテキストプロンプトを使ってインタラクティブな3Dワールドを生成・探索できる。以前は信頼できるテスターに限定されていたが、この拡大は18歳以上のユーザーへのより広範なアクセスに向けた一歩となる。

 

 

 

このウェブサイトはCookieを使用します

サイトを改善するための分析にCookieを使用します。詳細については、プライバシーポリシーをお読みください。
拒否