GoogleのGeminiが主要AIテストでChatGPTを上回る

主要AIモデルの比較評価で、GoogleのGemini 3.2 FastはOpenAIのChatGPT 5.2に対し、事実精度で優位性を示した。特に情報タスクで顕著だった。これらのテストは、AppleがGoogleと提携してSiriを強化したことを受けて行われ、2023年以来の生成AIの進化を強調している。結果は僅差だったが、GeminiはChatGPTの信頼性を損なう重大な誤りを避けた。

Ars Technicaは2026年1月21日に一連のテストを実施し、GoogleのGemini 3.2 FastをOpenAIのChatGPT 5.2と対決させた。これらはサブスクリプションなしでアクセス可能なデフォルトモデルである。この評価は、Appleが次期SiriアシスタントにGeminiを統合する決定に続くものであり、2023年末にGoogleのAIがBardとして知られていた頃の以前の比較からの転換点を示している。 プロンプトは創造的および実用的シナリオを網羅し、パパジョークの生成、Windows 11を3.5インチフロッピーディスクに収める数学パズルの解決、Abraham Lincolnがバスケットボールを考案するという架空の物語作成、ジャーナリストKyle Orlandの伝記執筆、非現実的な仕事の締め切りへの対応メール作成、がん治療のヒーリングクリスタルに関する医療主張の評価、走らずにSuper Mario Bros.の8-2レベルをクリアするガイダンス、初心者向けBoeing 737-800の着陸手順の概要などを含んだ。 Geminiは4つのカテゴリで勝利を収めた:フロッピーディスク計算では、より明確な説明と歴史的文脈を提供;伝記ではOrlandの2012年のキャリア開始に関する幻覚を避け、ソースをリンク;メールアドバイスでは3つのカスタマイズオプションと使用Tipsを提供;ビデオゲーム戦略では、敵のバウンスを活用したギャップ越えなどの革新的な回避策を提案。ChatGPTはパパジョークでわずかな独創性、創造的執筆でLincolnがストーブパイプハットで得点するなどの魅力的な詳細、飛行機着陸プロンプトで勝利し、後者は航空専門家Lee Hutchinsonにより、危険な単独行動よりプロの助けを促す点でより実用的と評価された。医療アドバイスのプロンプトは引き分けで、両モデルともクリスタルの有効性を否定しつつ心理的利益を指摘し、医師相談を推奨。 全体としてGeminiが4ポイント、ChatGPTが3ポイント、1引き分け。テストはGeminiの事実信頼性の優位性を強調し、伝記やゲームレベルでのChatGPTの誤りによる不信を低減。この進歩はAppleのパートナーシップ選択に影響を与え、GoogleのAI分野での進展を示唆している。

関連記事

Illustration depicting OpenAI's ChatGPT-5.2 launch, showing professionals using the AI to enhance workplace productivity amid rivalry with Google's Gemini.
AIによって生成された画像

OpenAI、業務生産性を高めるChatGPT-5.2をリリース

AIによるレポート AIによって生成された画像

OpenAIはChatGPT-5.2をリリースしました。これは推論と生産性を強化する新しいAIモデルファミリーで、特にプロフェッショナルタスク向けです。このリリースは、CEOのSam Altman氏からのGoogleのGemini 3との競争に関する内部アラートに続くものです。アップデートには異なるユーザー需要に対応した3つのバリエーションが含まれており、有料サブスクライバーから開始されます。

GoogleはフラッグシップAIモデルの更新版であるGemini 3.1 Proをリリースしました。問題解決と推論の改善を強調しています。このモデルは本日から開発者と消費者向けにプレビュー版として利用可能です。11月のGemini 3リリースを基盤としています。

AIによるレポート

Appleは、今後のアップデートで仮想アシスタントのSiriを強化するため、GoogleのGemini AIモデルを選択しました。この決定は共同声明で発表され、OpenAIのChatGPTとの以前の統合からの転換を示しています。この複数年にわたるパートナーシップは、Appleのプライバシー基準を維持しつつ、より高度なAI体験を提供することを目的としています。

GoogleはGemini AI向けの新機能Personal Intelligenceをリリースしました。この機能はGmail、Photos、Search、YouTubeのデータを統合し、よりパーソナライズされた応答を提供します。最初は米国有料購読者向けで、オプトイン形式でユーザー主導のプライバシー制御を強調し、個人データの直接訓練を避けます。ベータ版から展開開始し、今後より広範なアクセスを計画。

AIによるレポート

Googleは、ドキュメントの作成と編集を支援するため、より深いGemini AI機能を統合することでWorkspaceアプリを刷新しています。更新によりGeminiはメール、ファイル、その他のソースからコンテキストを引き出し、ドラフト生成やコンテンツの洗練が可能になります。これらの機能はDocs、Sheets、Slides、Driveのユーザー向けワークフローを合理化することを目指しています。

米ペンタゴンはGoogleのGeminiモデルを基盤とした新しい人工知能プラットフォームを公開した。この開発により、軍は先進的なAIツールを装備することになる。しかし、反応はまちまちで、一部ではその影響に対する懸念が表明されている。

AIによるレポート

Googleは、実験的なAIプロトタイプであるGenie 3を最上位のAIプラン加入者に提供すると発表した。このツールは、シンプルなテキストプロンプトを使ってインタラクティブな3Dワールドを生成・探索できる。以前は信頼できるテスターに限定されていたが、この拡大は18歳以上のユーザーへのより広範なアクセスに向けた一歩となる。

 

 

 

このウェブサイトはCookieを使用します

サイトを改善するための分析にCookieを使用します。詳細については、プライバシーポリシーをお読みください。
拒否