Den brittiska regeringens AI Security Institute har publicerat en utvärdering av Anthropics AI-modell Mythos Preview, som bekräftar dess starka prestanda i utmaningar gällande cyberinfiltration i flera steg. Mythos blev den första modellen att fullt ut slutföra en krävande 32-stegs simulerad nätverksattack kallad "The Last Ones". Institutet varnar för att verkliga försvarssystem kan begränsa sådana automatiserade hot.
Anthropic begränsade förra veckan den initiala lanseringen av sin Mythos Preview-modell till en utvald grupp av viktiga industripartners med hänvisning till dess avancerade kapacitet inom datorsäkerhet. Storbritanniens AI Security Institute (AISI) genomförde oberoende tester med Capture the Flag-utmaningar utformade för att bedöma AI-potential för cyberattacker. Dessa utvärderingar, som pågått sedan början av 2023, visar att Mythos slutför över 85 procent av uppgifterna på lärlingsnivå, liknande nyare modeller som GPT-5.4, Opus 4.6 och Codex 5.3. AISI uppger att modellen matchar konkurrenter på enskilda uppgifter men sticker ut genom sin förmåga att länka samman dem för komplexa operationer. Anthropics modell lyckades fullt ut lösa "The Last Ones" (TLO), en 32-stegs attack för dataextraktion som simulerar 20 timmars mänskligt arbete över flera värdar. Den slutförde utmaningen från start till mål i 3 av 10 försök och genomsnittligt 22 steg, vilket vida överstiger Claude 4.6:s genomsnitt på 16 steg. AISI noterade att detta tyder på att Mythos autonomt kan rikta in sig på små, svagt försvarade företagssystem där initial nätverksåtkomst har erhållits. Mythos fick problem med "Cooling Tower"-testet, ett scenario med sju steg för att störa kontrollen av ett kraftverk. Institutet betonade att testerna använde en budget på 100 miljoner tokens och saknade verkliga aktiva försvarare eller detektionsmekanismer. AISI varnade för att välförsvarade system kan stå emot sådana attacker och uppmanade till användning av AI för att stärka skyddet i takt med att modellerna utvecklas.