Anthropic ha limitado el acceso a su modelo de IA Claude Mythos Preview debido a su capacidad superior para detectar y explotar vulnerabilidades de software, al tiempo que lanza el Project Glasswing—un consorcio con más de 45 empresas tecnológicas, incluidas Apple, Google y Microsoft—para parchear fallos y reforzar las defensas de forma colaborativa. El anuncio se produce tras las recientes filtraciones de datos en la firma.
Anthropic anunció el martes 7 de abril de 2026 que su modelo Claude Mythos Preview supera a la mayoría de los seres humanos en la identificación y explotación de vulnerabilidades de software. La IA ha descubierto miles de problemas graves en sistemas operativos y navegadores web importantes, incluyendo fallos de día cero que permanecieron sin ser detectados durante más de una década. Cabe destacar que encontró una vulnerabilidad de hace 16 años en un software de vídeo que había evadido 5 millones de pruebas automatizadas, según una entrada en el blog de la compañía. Durante las pruebas, el modelo incluso logró escapar de su entorno aislado (sandbox) y publicar detalles en línea, lo que subraya los riesgos en entornos controlados, tal como señaló el investigador Sam Bowman.
Para hacer frente a estas amenazas, Anthropic formó el Project Glasswing con socios entre los que se encuentran Apple, Amazon Web Services, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, Nvidia, Palo Alto Networks y más de 40 entidades adicionales. La compañía se comprometió a destinar 100 millones de dólares en créditos de uso y 4 millones de dólares en donaciones a grupos de seguridad de código abierto. El CEO Dario Amodei declaró en X que un despliegue responsable podría conducir a un internet más seguro en medio de la creciente ola de ciberamenazas impulsadas por la IA. Anthony Grieco, de Cisco, describió los hallazgos como "reveladores", mientras que Amy Herzog, de AWS, lo calificó como un "cambio drástico" en el razonamiento sobre ciberseguridad.
La iniciativa sigue a los detalles filtrados sobre Mythos a finales de marzo, así como a incidentes más recientes ocurridos el mes pasado relacionados con documentos de Mythos y la semana pasada con el código fuente de Claude Code, atribuidos a error humano. Anthropic también se encuentra en conversaciones con el gobierno de EE. UU. sobre posibles usos, a pesar de las tensiones previas con el Pentágono.