OpenAIのGPT-5.2モデルが物議を醸すトピックでGrokipediaを引用

ガーディアン紙の報道によると、OpenAIの最新AIモデルGPT-5.2は、ホロコーストやイラン政治などの敏感な問題を扱う際に、xAI駆動のオンライン百科事典Grokipediaを参照していることが明らかになった。プロフェッショナルなタスク向けに宣伝されているが、テストではソースの信頼性が疑問視されている。OpenAIは広範なウェブ検索と安全対策を強調して対応を擁護している。

OpenAIは12月にGPT-5.2を「プロフェッショナルワーク向けの最先端モデル」として発売し、スプレッドシートの作成や複雑な操作などのタスクを処理するよう設計された。しかし、ガーディアン紙の調査は情報ソースの潜在的な欠陥を浮き彫りにした。レポートは、ChatGPT経由でアクセスしたモデルが、論争の的となる主題への回答でGrokipediaを参照した詳細を述べている。これにはイラン政府と通信会社MTN-Irancellのつながり、およびホロコースト否認者デイビッド・アーヴィングに対する名誉毀損訴訟で専門家証人として証言した英国歴史家リチャード・エヴァンズに関するクエリが含まれる。注目すべきことに、モデルがドナルド・トランプに対するメディアバイアスや同様の政治的に過熱したトピックについて促された際、Grokipediaはソースとして現れなかった。xAIが開発しGPT-5.2以前にリリースされたGrokipedia自身も精査を受けている。新ナチフォーラムからの引用を含んで批判されており、米研究者による研究ではAI生成百科事典に「疑わしい」「問題ある」ソースへの引用が特定された。ガーディアン紙の発見に対するOpenAIの回答として、GPT-5.2は「公開されている幅広いソースと見解をウェブ検索し」、高深刻度の害に関連するリンクの表面化リスクを低減するための「安全フィルターを適用する」と述べた。この事件は、AI出力の正確性と中立性を確保する継続的な課題、特に歴史的・地政学的問題において強調している。モデルリリース直後に実施されたガーディアン紙のテストは、先進機能が向上している一方で、ソース検証が洗練の重要な領域であることを示唆している。

関連記事

Elon Musk on stage launching Grokipedia, with a screen showing the AI encyclopedia rivaling Wikipedia, in a modern tech setting.
AIによって生成された画像

マスクのGrokipediaがWikipediaのAI構築ライバルとしてローンチ

AIによるレポート AIによって生成された画像 事実確認済み

イーロン・マスクはGrokipediaをローンチし、これは彼のxAIチャットボットGrokに関連するAI生成のオンライ百科事典で、Wikipediaへの挑戦者として位置づけている。マスクはXで、「すべての知識のオープンソースで包括的なコレクションを構築する」のが目標だと述べ、Wikipediaの左寄りバイアスと繰り返し批判した後だ。

xAIのGrokが数百万枚の虐待画像を生成したスキャンダルの後、競合のOpenAIとGoogleは同様の悪用を防ぐための新措置を実施した。この事件はAI画像ツールの脆弱性を浮き彫りにし、業界の迅速な対応を促した。これらのステップは、同意のない親密な画像からユーザーを保護することを目的としている。

AIによるレポート

OpenAIは、ThinkingとProのバリエーションを含むGPT-5.4をリリースし、エージェント的タスクと知識労働の改善を目指す。このアップデートは、コンピュータ使用機能の強化と事実誤認の減少を特徴とし、米国防総省との契約論争後のAnthropicとの競争の中で行われた。モデルは有料ユーザーと開発者に即時提供される。

xAIのGrokチャットボットは、オーストラリアのボンダイビーチで最近起きた銃撃事件について、誤解を招く回答やトピック外の応答を提供しています。この事件はハヌカ祭の最中に発生し、傍観者が英雄的に介入しました。Grokは無関係の出来事と詳細を混同しており、AIの信頼性への懸念が高まっています。

AIによるレポート

OpenAIは主力チャットボットChatGPTの改善にリソースをシフトしており、数名のシニア研究者の離脱を招いている。サンフランシスコの同社はGoogleやAnthropicからの激しい競争に直面し、長期研究からの戦略的ピボットを促している。この変化は、同社の革新的なAI探求の将来に対する懸念を引き起こしている。

OpenAIのCEO、サム・アルトマン氏は同社のGPT-5.4モデルをやり取りするのに一番のお気に入りと評した。一方で、同氏はOpenAIがこの技術の3つの主要な弱点をまだ解決する必要があると認めている。この発言は、AIの会話能力の継続的な改善を強調している。

AIによるレポート

ChatGPTやGeminiを含む一般的なAIモデルは、女性の健康に関する緊急の問題に対する適切なアドバイスを提供できないことが多く、新しいベンチマークテストによる。研究者らは、専門クエリに対する応答の60%が不十分だったことを発見し、AI訓練データのバイアスを強調した。この研究は、これらのギャップを埋めるための医療コンテンツの改善を求めている。

 

 

 

このウェブサイトはCookieを使用します

サイトを改善するための分析にCookieを使用します。詳細については、プライバシーポリシーをお読みください。
拒否