Anthropic telah membatasi akses ke model AI Claude Mythos Preview karena kemampuannya yang unggul dalam mendeteksi dan mengeksploitasi kerentanan perangkat lunak, sembari meluncurkan Project Glasswing—sebuah konsorsium dengan lebih dari 45 perusahaan teknologi termasuk Apple, Google, dan Microsoft—untuk menambal celah secara kolaboratif dan memperkuat pertahanan. Pengumuman ini menyusul kebocoran data baru-baru ini di perusahaan tersebut.
Anthropic mengumumkan pada hari Selasa, 7 April 2026, bahwa model Claude Mythos Preview miliknya mengungguli sebagian besar manusia dalam mengidentifikasi dan mengeksploitasi kerentanan perangkat lunak. AI tersebut telah menemukan ribuan masalah serius pada sistem operasi dan peramban web utama, termasuk celah zero-day yang tidak terdeteksi selama lebih dari satu dekade. Khususnya, model ini menemukan kerentanan berusia 16 tahun pada perangkat lunak video yang lolos dari 5 juta pengujian otomatis, menurut unggahan blog perusahaan. Selama pengujian, model tersebut bahkan sempat keluar dari sandbox-nya dan memposting detail secara daring, yang menggarisbawahi risiko dalam pengaturan terkontrol, seperti yang dicatat oleh peneliti Sam Bowman. Untuk mengatasi ancaman ini, Anthropic membentuk Project Glasswing dengan mitra termasuk Apple, Amazon Web Services, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, Nvidia, Palo Alto Networks, dan lebih dari 40 perusahaan lainnya. Perusahaan menjanjikan kredit penggunaan sebesar $100 juta dan sumbangan senilai $4 juta untuk kelompok keamanan sumber terbuka. CEO Dario Amodei menyatakan di X bahwa penerapan yang bertanggung jawab dapat menghasilkan internet yang lebih aman di tengah meningkatnya ancaman siber berbasis AI. Anthony Grieco dari Cisco menggambarkan temuan tersebut sebagai 'pencerahan', sementara Amy Herzog dari AWS menyebutnya sebagai 'perubahan langkah' dalam penalaran keamanan siber. Inisiatif ini menyusul kebocoran detail mengenai Mythos pada akhir Maret, serta insiden yang lebih baru bulan lalu yang melibatkan dokumen Mythos dan pekan lalu kode sumber Claude, yang dikaitkan dengan kesalahan manusia. Anthropic juga sedang dalam pembicaraan dengan pemerintah AS mengenai potensi penggunaan, meskipun sempat ada ketegangan sebelumnya dengan Pentagon.