Institut Keamanan AI pemerintah Inggris telah merilis evaluasi terhadap model AI Mythos Preview dari Anthropic, yang mengonfirmasi kinerja kuatnya dalam tantangan infiltrasi siber bertahap. Mythos menjadi model pertama yang berhasil menyelesaikan simulasi serangan jaringan 32 langkah yang menantang, yang dikenal sebagai 'The Last Ones'. Institut tersebut memperingatkan bahwa pertahanan di dunia nyata dapat membatasi ancaman otomatis semacam itu.
Anthropic pekan lalu membatasi perilisan awal model Mythos Preview mereka kepada kelompok mitra industri kritis terpilih, dengan alasan kemampuan keamanan komputernya yang canggih. Institut Keamanan AI (AISI) Inggris melakukan pengujian independen menggunakan tantangan Capture the Flag yang dirancang untuk menilai potensi serangan siber AI. Evaluasi ini, yang telah berlangsung sejak awal 2023, menunjukkan Mythos mampu menyelesaikan lebih dari 85 persen tugas tingkat pemula, serupa dengan model terkini seperti GPT-5.4, Opus 4.6, dan Codex 5.3. AISI menyatakan model ini setara dengan para pesaingnya dalam tugas-tugas individu, namun menonjol dalam merangkai tugas-tugas tersebut untuk operasi yang kompleks. Model milik Anthropic ini berhasil menyelesaikan 'The Last Ones' (TLO) secara utuh, yakni serangan ekstraksi data 32 langkah yang menyimulasikan 20 jam upaya manusia di berbagai host. Model ini menyelesaikan tantangan tersebut dari awal hingga akhir dalam 3 dari 10 percobaan dan rata-rata mencapai 22 langkah, jauh melampaui rata-rata 16 langkah milik Claude 4.6. AISI mencatat bahwa hal ini menunjukkan Mythos dapat secara otonom menargetkan sistem perusahaan kecil dengan pertahanan lemah di mana akses jaringan awal telah didapatkan. Mythos mengalami kesulitan dalam ujian 'Cooling Tower', yaitu skenario gangguan kontrol pembangkit listrik tujuh langkah. Institut tersebut menekankan bahwa pengujian menggunakan anggaran 100 juta token dan tidak melibatkan pertahanan aktif atau mekanisme deteksi di dunia nyata. AISI memperingatkan bahwa sistem dengan pertahanan yang baik mungkin dapat menahan serangan semacam itu, dan mendesak penggunaan AI untuk memperkuat perlindungan seiring dengan kemajuan model.