OpenAI lança o GPT-5.4-Cyber para testadores de cibersegurança

A OpenAI lançou um novo modelo de IA, o GPT-5.4-Cyber, exclusivamente para profissionais de cibersegurança verificados. A versão ajustada do seu modelo GPT-5.4 tem como objetivo testar defesas contra jailbreaks e ataques adversários. Este movimento segue o recente anúncio da Anthropic sobre seu próprio modelo poderoso.

A OpenAI anunciou o GPT-5.4-Cyber na terça-feira por meio de uma postagem em seu blog, limitando o acesso aos participantes do seu programa ampliado Trusted Access for Cyber. A empresa afirmou que os testadores ajudarão a identificar lacunas, possíveis jailbreaks e riscos, enquanto melhoram a resiliência a ataques adversários e capacidades defensivas. A OpenAI enfatizou o uso de feedback para entender os benefícios do modelo e mitigar danos em um cenário de cibersegurança de IA contra IA. O modelo é uma variante ajustada do GPT-5.4, adaptada para tarefas de cibersegurança com filtros de segurança menos restritivos, tornando menos provável que recuse solicitações arriscadas relacionadas à segurança. Isso permite que especialistas avaliem como ele poderia ser transformado em arma por agentes mal-intencionados. O lançamento da OpenAI parece ser uma resposta ao Project Glasswing da Anthropic, revelado na semana passada, que introduziu o Claude Mythos Preview. A Anthropic relatou ter encontrado vulnerabilidades de segurança em todos os principais sistemas operacionais e navegadores web com aquele modelo. A OpenAI descreveu suas próprias salvaguardas como suficientes para reduzir o risco cibernético por enquanto, em meio à concorrência contínua com a Anthropic por contratos governamentais e empresariais. Ambas as empresas estão aprimorando a segurança da IA à medida que os modelos se tornam mais poderosos, com profissionais de cibersegurança ganhando acesso antecipado para fortalecer as defesas.

Artigos relacionados

Illustration of Anthropic restricting Claude Mythos AI and launching Project Glasswing consortium with tech giants to address cybersecurity vulnerabilities.
Imagem gerada por IA

Anthropic restricts Claude Mythos AI release and launches Project Glasswing over cybersecurity risks

Reportado por IA Imagem gerada por IA

Anthropic has limited access to its Claude Mythos Preview AI model due to its superior ability to detect and exploit software vulnerabilities, while launching Project Glasswing—a consortium with over 45 tech firms including Apple, Google, and Microsoft—to collaboratively patch flaws and bolster defenses. The announcement follows recent data leaks at the firm.

OpenAI has launched GPT-5.5, its latest AI model integrated into ChatGPT, seven weeks after GPT-5.4. The update focuses on coding, computer use, and research, with enhanced agentic capabilities for independent task completion. Paying ChatGPT and Codex users can access it now, with API rollout planned soon.

Reportado por IA

Anthropic has released a new cyber-focused AI model called Mythos, capable of detecting software flaws faster than humans and generating exploits. The model has raised alarms among governments and companies for potentially turbocharging hacking by exposing vulnerabilities quicker than they can be patched. Officials worldwide are scrambling to assess the risks.

OpenAI announced ChatGPT Images 2, its new AI image model, on Tuesday. The upgrade focuses on creating text-heavy professional visuals like infographics and study guides. It rolls out to all ChatGPT users with generation limits based on subscription plans.

Reportado por IA

OpenAI intends to launch a text-only adult mode for ChatGPT, enabling adult-themed conversations but not erotic media, despite unanimous opposition from its wellbeing advisers. The company describes the content as 'smut rather than pornography,' according to a spokesperson cited by The Wall Street Journal. Launch has been delayed from early 2026 amid concerns over minors' access and emotional dependence.

Este site usa cookies

Usamos cookies para análise para melhorar nosso site. Leia nossa política de privacidade para mais informações.
Recusar