OpenAI、サイバーセキュリティ専門家向けモデル「GPT-5.4-Cyber」を発表

OpenAIは、検証済みのサイバーセキュリティ専門家限定で、新しいAIモデル「GPT-5.4-Cyber」を公開しました。これはGPT-5.4を微調整したモデルで、脱獄(ジェイルブレイク)や敵対的攻撃に対する防御力のテストを目的としています。今回の動きは、Anthropicによる強力な新モデルの発表に続くものです。

OpenAIは火曜日のブログ記事でGPT-5.4-Cyberを発表し、同社の「Trusted Access for Cyber」プログラムの拡大版に参加する専門家に限定してアクセス権を付与しました。同社によると、テスターはセキュリティの欠陥や潜在的な脱獄手法、リスクを特定し、敵対的攻撃への耐性と防御能力の向上に寄与するとのことです。OpenAIは、AI同士が対峙するサイバーセキュリティ環境において、モデルの利点を把握しつつ害を軽減するためにフィードバックを活用することの重要性を強調しています。このモデルはGPT-5.4の微調整版であり、サイバーセキュリティ関連タスク向けにガードレールが緩和されているため、セキュリティ上のリスクを伴うリクエストを拒否する可能性が低くなっています。これにより、専門家は悪意のある攻撃者がAIをどのように武器化し得るかを評価できます。今回のOpenAIのリリースは、先週Anthropicが発表した「Project Glasswing」および「Claude Mythos Preview」への対抗措置と見られます。Anthropicはそのモデルを使用して、主要なOSやWebブラウザすべてにセキュリティ上の脆弱性を発見したと報告していました。OpenAIは、政府や企業との契約を巡りAnthropicとの競争が激化する中、現時点では自社のセーフガードでサイバーリスクは十分に低減されていると説明しています。モデルの性能向上に伴い、両社はAIセキュリティの強化を進めており、サイバーセキュリティ専門家が早期アクセスを通じて防御力の向上に取り組んでいます。

関連記事

Illustration of Anthropic restricting Claude Mythos AI and launching Project Glasswing consortium with tech giants to address cybersecurity vulnerabilities.
AIによって生成された画像

Anthropic restricts Claude Mythos AI release and launches Project Glasswing over cybersecurity risks

AIによるレポート AIによって生成された画像

Anthropic has limited access to its Claude Mythos Preview AI model due to its superior ability to detect and exploit software vulnerabilities, while launching Project Glasswing—a consortium with over 45 tech firms including Apple, Google, and Microsoft—to collaboratively patch flaws and bolster defenses. The announcement follows recent data leaks at the firm.

OpenAI has launched GPT-5.5, its latest AI model integrated into ChatGPT, seven weeks after GPT-5.4. The update focuses on coding, computer use, and research, with enhanced agentic capabilities for independent task completion. Paying ChatGPT and Codex users can access it now, with API rollout planned soon.

AIによるレポート

Anthropic has released a new cyber-focused AI model called Mythos, capable of detecting software flaws faster than humans and generating exploits. The model has raised alarms among governments and companies for potentially turbocharging hacking by exposing vulnerabilities quicker than they can be patched. Officials worldwide are scrambling to assess the risks.

OpenAI announced ChatGPT Images 2, its new AI image model, on Tuesday. The upgrade focuses on creating text-heavy professional visuals like infographics and study guides. It rolls out to all ChatGPT users with generation limits based on subscription plans.

AIによるレポート

OpenAI intends to launch a text-only adult mode for ChatGPT, enabling adult-themed conversations but not erotic media, despite unanimous opposition from its wellbeing advisers. The company describes the content as 'smut rather than pornography,' according to a spokesperson cited by The Wall Street Journal. Launch has been delayed from early 2026 amid concerns over minors' access and emotional dependence.

このウェブサイトはCookieを使用します

サイトを改善するための分析にCookieを使用します。詳細については、プライバシーポリシーをお読みください。
拒否