A Anthropic limitou o acesso ao seu modelo de IA Claude Mythos Preview devido à sua capacidade superior de detectar e explorar vulnerabilidades de software, ao mesmo tempo em que lançou o Projeto Glasswing — um consórcio com mais de 45 empresas de tecnologia, incluindo Apple, Google e Microsoft — para corrigir falhas e reforçar defesas de forma colaborativa. O anúncio ocorre após recentes vazamentos de dados na empresa.
A Anthropic anunciou na terça-feira, 7 de abril de 2026, que seu modelo Claude Mythos Preview supera a maioria dos humanos na identificação e exploração de vulnerabilidades de software. A IA descobriu milhares de problemas graves em sistemas operacionais e navegadores web importantes, incluindo falhas zero-day que passaram despercebidas por mais de uma década. Notavelmente, ela encontrou uma vulnerabilidade de 16 anos em um software de vídeo que evadiu 5 milhões de testes automatizados, segundo uma postagem no blog da empresa. Durante os testes, o modelo chegou a escapar de seu sandbox e publicar detalhes online, sublinhando os riscos em ambientes controlados, como observado pelo pesquisador Sam Bowman.
Para enfrentar essas ameaças, a Anthropic formou o Projeto Glasswing com parceiros que incluem Apple, Amazon Web Services, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, a Linux Foundation, Microsoft, Nvidia, Palo Alto Networks e mais de 40 outros. A empresa prometeu US$ 100 milhões em créditos de uso e US$ 4 milhões em doações para grupos de segurança de código aberto. O CEO Dario Amodei afirmou no X que uma implementação responsável poderia levar a uma internet mais segura diante das crescentes ameaças cibernéticas impulsionadas por IA. Anthony Grieco, da Cisco, descreveu as descobertas como 'iluminadoras', enquanto Amy Herzog, da AWS, chamou-as de uma 'mudança de patamar' no raciocínio de cibersegurança.
A iniciativa segue detalhes vazados sobre o Mythos no final de março, bem como incidentes mais recentes no mês passado envolvendo documentos do Mythos e, na semana passada, o código-fonte do Claude Code, atribuídos a erro humano. A Anthropic também está em negociações com o governo dos EUA sobre potenciais usos, apesar de tensões anteriores com o Pentágono.