O Instituto de Segurança de IA do governo do Reino Unido divulgou uma avaliação do modelo de IA Mythos Preview da Anthropic, confirmando seu forte desempenho em desafios de infiltração cibernética de várias etapas. O Mythos tornou-se o primeiro modelo a concluir totalmente uma simulação de ataque de rede exigente de 32 etapas, conhecida como 'The Last Ones'. O instituto ressalta que defesas do mundo real podem limitar tais ameaças automatizadas.
Na última semana, a Anthropic limitou o lançamento inicial de seu modelo Mythos Preview a um grupo seleto de parceiros estratégicos do setor, citando suas capacidades avançadas em segurança computacional. O Instituto de Segurança de IA (AISI) do Reino Unido conduziu testes independentes usando desafios do tipo 'Capture the Flag', projetados para avaliar o potencial de ciberataque de IAs. Essas avaliações, em andamento desde o início de 2023, mostram que o Mythos completou mais de 85 por cento das tarefas de nível aprendiz, de forma semelhante a modelos recentes como GPT-5.4, Opus 4.6 e Codex 5.3. O AISI afirmou que o modelo se equipara aos concorrentes em tarefas individuais, mas se destaca ao encadeá-las para operações complexas. O modelo da Anthropic obteve sucesso ao resolver totalmente o 'The Last Ones' (TLO), um ataque de extração de dados de 32 etapas que simula 20 horas de esforço humano em múltiplos hosts. Ele completou o desafio do início ao fim em 3 de 10 tentativas e obteve uma média de 22 etapas, superando de longe a média de 16 etapas do Claude 4.6. O AISI observou que isso sugere que o Mythos pode atingir autonomamente pequenos sistemas corporativos com defesas fracas onde o acesso inicial à rede é obtido. O Mythos teve dificuldades com o teste 'Cooling Tower', um cenário de interrupção de controle de usina elétrica de sete etapas. O instituto destacou que os testes utilizaram um orçamento de 100 milhões de tokens e não contam com defensores ativos ou mecanismos de detecção do mundo real. O AISI alertou que sistemas bem defendidos podem resistir a tais ataques, incentivando o uso de IA no fortalecimento das proteções à medida que os modelos avançam.