OpenAIは、検証済みのサイバーセキュリティ専門家限定で、新しいAIモデル「GPT-5.4-Cyber」を公開しました。これはGPT-5.4を微調整したモデルで、脱獄(ジェイルブレイク)や敵対的攻撃に対する防御力のテストを目的としています。今回の動きは、Anthropicによる強力な新モデルの発表に続くものです。
OpenAIは火曜日のブログ記事でGPT-5.4-Cyberを発表し、同社の「Trusted Access for Cyber」プログラムの拡大版に参加する専門家に限定してアクセス権を付与しました。同社によると、テスターはセキュリティの欠陥や潜在的な脱獄手法、リスクを特定し、敵対的攻撃への耐性と防御能力の向上に寄与するとのことです。OpenAIは、AI同士が対峙するサイバーセキュリティ環境において、モデルの利点を把握しつつ害を軽減するためにフィードバックを活用することの重要性を強調しています。このモデルはGPT-5.4の微調整版であり、サイバーセキュリティ関連タスク向けにガードレールが緩和されているため、セキュリティ上のリスクを伴うリクエストを拒否する可能性が低くなっています。これにより、専門家は悪意のある攻撃者がAIをどのように武器化し得るかを評価できます。今回のOpenAIのリリースは、先週Anthropicが発表した「Project Glasswing」および「Claude Mythos Preview」への対抗措置と見られます。Anthropicはそのモデルを使用して、主要なOSやWebブラウザすべてにセキュリティ上の脆弱性を発見したと報告していました。OpenAIは、政府や企業との契約を巡りAnthropicとの競争が激化する中、現時点では自社のセーフガードでサイバーリスクは十分に低減されていると説明しています。モデルの性能向上に伴い、両社はAIセキュリティの強化を進めており、サイバーセキュリティ専門家が早期アクセスを通じて防御力の向上に取り組んでいます。