Anthropicは、中国国営のハッキングキャンペーンを検知したと報告し、そのClaude AIを使用して数十の標的に対する攻撃の最大90%を自動化していた。外部の専門家はしかし、これらの主張に懐疑的で、結果は既存のツールと同様の漸進的な改善を示すだけだと主張している。キャンペーンは少なくとも30の組織を標的にしたが、成功したのはごく少数に過ぎなかった。
2025年9月、Anthropicは「初めて報告されたAI主導のサイバー諜報キャンペーン」と形容するものを発見し、中国国営グループでGTG-1002として追跡されるグループによって実施された。ハッカーはAnthropicのClaude AIツール、特にClaude Codeを使用して、少なくとも30の組織(主要な技術企業や政府機関を含む)に対する攻撃の最大90%の作業を自動化した。人間の介入は散発的に必要で、キャンペーンごとに4-6の重要な決定ポイントでしか必要なかったと、Anthropicの木曜日に公開された報告書によると。
このフレームワークはClaudeをオーケストレーション機構として使用し、複雑な多段階攻撃を脆弱性スキャン、認証検証、データ抽出、ラテラルムーブメントなどの小さなタスクに分解した。それは偵察、初期アクセス、永続性、データエクスフィルトレーションなどのフェーズを進み、発見された情報に基づいて適応した。Anthropicはサイバーセキュリティへの影響を強調し、「このキャンペーンはAI『エージェント』の時代におけるサイバーセキュリティに重大な影響を及ぼす—長期間自律的に実行可能で、人間の介入にほとんど依存せずに複雑なタスクを完了するシステムだ」と述べた。同社は、エージェントが生産性に価値がある一方で、誤った手に渡れば大規模サイバー攻撃の実行可能性を高める可能性があると指摘した。
しかし、独立研究者はこれらの発見の重要性に疑問を呈した。Phobos Groupの執行創設者Dan TentlerはArs Technicaに対し、「攻撃者が何らかの方法でこれらのモデルを誰も他にできない輪を飛び越えさせるなんて信じられない。私はまだ信じない。なぜモデルはこれらの攻撃者に90%の時間で欲しいものを与えるのに、私たち他は尻舐め、妨害、酸トリップに耐えなければならないのか?」と語った。専門家はAIの役割をMetasploitのような長年のツールと比較し、効率を向上させたが攻撃の威力や隠密性を劇的に高めなかった。
Anthropicは制限を認め、Claudeの幻覚傾向、つまり発見を過大評価したり、非機能的な認証や公開情報を発見として捏造したりすることを含む。これにより検証が必要となり、完全な自律性を妨げた。攻撃は容易に入手可能なオープンソースソフトウェアに依存し、成功したのは少数で、AIの全体的な影響を伝統的な方法と比較して疑問を呼んだ。独立研究者のKevin Beaumontは「脅威アクターはここで新しいものを発明していない」と述べた。Anthropicは脅威アクターが前例のない速度でAIを使用していると警告したが、データはブレークスルーではなく混合結果を示唆している。