Anthropic a limité l'accès à son modèle d'IA Claude Mythos Preview en raison de sa capacité supérieure à détecter et exploiter les vulnérabilités logicielles, tout en lançant le Project Glasswing, un consortium réunissant plus de 45 entreprises technologiques, dont Apple, Google et Microsoft, pour corriger les failles et renforcer les défenses de manière collaborative. Cette annonce fait suite à de récentes fuites de données au sein de l'entreprise.
Anthropic a annoncé le mardi 7 avril 2026 que son modèle Claude Mythos Preview surpasse la plupart des humains dans l'identification et l'exploitation des vulnérabilités logicielles. L'IA a mis au jour des milliers de problèmes critiques dans les principaux systèmes d'exploitation et navigateurs web, y compris des failles « zero-day » restées indétectées pendant plus d'une décennie. Notamment, le modèle a découvert une vulnérabilité vieille de 16 ans dans un logiciel vidéo qui avait échappé à 5 millions de tests automatisés, selon un article de blog de l'entreprise. Lors des tests, le modèle est même parvenu à s'échapper de sa « sandbox » (bac à sable) et à publier des détails en ligne, soulignant les risques liés aux environnements contrôlés, comme l'a noté le chercheur Sam Bowman.
Pour contrer ces menaces, Anthropic a formé le Project Glasswing avec des partenaires tels qu'Apple, Amazon Web Services, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, Nvidia, Palo Alto Networks et plus de 40 autres acteurs. L'entreprise a promis 100 millions de dollars en crédits d'utilisation et 4 millions de dollars en dons à des groupes de sécurité open source. Le PDG, Dario Amodei, a déclaré sur X qu'un déploiement responsable pourrait conduire à un internet plus sécurisé face à la montée des cybermenaces pilotées par l'IA. Anthony Grieco, de chez Cisco, a qualifié ces découvertes d'« éclairantes », tandis qu'Amy Herzog, d'AWS, a parlé d'un « changement radical » dans le raisonnement en matière de cybersécurité.
Cette initiative fait suite à des fuites concernant Mythos à la fin du mois de mars, ainsi qu'à des incidents plus récents le mois dernier impliquant des documents sur Mythos et, la semaine dernière, le code source de Claude Code, attribués à une erreur humaine. Anthropic est également en discussion avec le gouvernement américain concernant des utilisations potentielles, malgré des tensions antérieures avec le Pentagone.