新たな研究論文が、大規模言語モデルが匿名オンライン用户名の背後にある実身份を高精度で特定できることを実証。1人あたりわずか4ドルの手法で投稿を分析し手がかりを探り、インターネット全体で照合する。ETH Zurich、Anthropic、MATSの研究者らはオンライン・プライバシーの低下を警告。
2026年2月26日公開の論文「LLMによる大規模オンライン・ディ匿名化」は、RedditやHacker Newsなどのプラットフォーム上の偽名背後の実在人物を、先進的なAIチャットボットがどう暴くかを探る。 ETH Zurich、Anthropic(Claudeの親会社)およびMATS研究グループの研究者らによるこの研究は、ESRC(Clue Extraction, Search, Reasoning, Calibration)と呼ぶ手法を導入する。AIはまず投稿を実在の手がかり(Pythonゲームコーディングへの関心、Marvel映画、学校のシアトルでの不満、独特の文体など)で調べる。次にLinkedIn、Google、その他のRedditアカウントなどを検索して一致するプロファイルを特定。最後にスタイル、趣味、投稿タイミングの一致を論理的に評価し、信頼度を算出、人間介入なしでマッチングを達成する。 Hacker Newsの実ユーザーでのテストでは、秘密の用户名を実身份に結びつける成功率67%、AIが予測した場合90%の精度。異なる年やグループにわたる同一ユーザーのReddit投稿では成功率68%。プロセスは安価で、ChatGPTやClaudeの将来版などのアクセス可能なチャットボットを使い、1人あたり最大4ドル。 主著者の一人Simon Lermen氏はプライバシーへの影響を指摘。従来、オンライン匿名性は手動捜査の労力(数時間~数日)に依存していた。今、この自動化により個人・企業・当局が数千アカウントを瞬時に解析、数コメントから名前、学校、都市、職歴を暴露可能。研究者らはこれを「実用的曖昧さ」の終焉と形容、技術的可能性があっても曖昧さが保てた時代が終わったことを示す。