أصدر معهد سلامة الذكاء الاصطناعي التابع للحكومة البريطانية تقييماً لنموذج الذكاء الاصطناعي Mythos Preview من شركة Anthropic، مؤكداً أداءه القوي في تحديات الاختراق السيبراني متعددة الخطوات. وأصبح Mythos أول نموذج يكمل بالكامل محاكاة لهجوم شبكي صعب مكون من 32 خطوة يُعرف باسم 'The Last Ones'. ويحذر المعهد من أن الدفاعات في العالم الحقيقي قد تحد من مثل هذه التهديدات المؤتمتة.
قيدت شركة Anthropic الأسبوع الماضي الإصدار الأولي لنموذج Mythos Preview ليقتصر على مجموعة مختارة من الشركاء الصناعيين الأساسيين، مشيرة إلى قدراته المتقدمة في أمن الحاسوب. وأجرى معهد سلامة الذكاء الاصطناعي (AISI) في المملكة المتحدة اختبارات مستقلة باستخدام تحديات 'التقاط العلم' (Capture the Flag) المصممة لتقييم احتمالية قيام الذكاء الاصطناعي بهجمات سيبرانية. وتظهر هذه التقييمات، المستمرة منذ أوائل عام 2023، إكمال Mythos لأكثر من 85 بالمائة من المهام على مستوى المبتدئين، وهو ما يشابه نماذج حديثة مثل GPT-5.4 وOpus 4.6 وCodex 5.3. وذكر المعهد أن النموذج يضاهي المنافسين في المهام الفردية لكنه يتفوق في ربطها لتنفيذ عمليات معقدة. نجح نموذج Anthropic في حل 'The Last Ones' (TLO) بالكامل، وهو هجوم لاستخراج البيانات مكون من 32 خطوة يحاكي 20 ساعة من الجهد البشري عبر مضيفين متعددين. وقد أكمل التحدي من البداية إلى النهاية في 3 محاولات من أصل 10، بمتوسط 22 خطوة، متجاوزاً بذلك متوسط Claude 4.6 البالغ 16 خطوة. وأشار المعهد إلى أن هذا يشير إلى قدرة Mythos على استهداف أنظمة المؤسسات الصغيرة ذات الدفاعات الضعيفة بشكل مستقل حيث يتم الحصول على الوصول الأولي إلى الشبكة. واجه Mythos صعوبة في اختبار 'برج التبريد' (Cooling Tower)، وهو سيناريو لتعطيل التحكم في محطة طاقة يتكون من سبع خطوات. وسلط المعهد الضوء على أن الاختبارات استخدمت ميزانية قدرها 100 مليون رمز (token) وتفتقر إلى وجود مدافعين نشطين أو آليات كشف في العالم الحقيقي. وحذر المعهد من أن الأنظمة المتمتعة بدفاعات جيدة قد تقاوم مثل هذه الهجمات، داعياً إلى استخدام الذكاء الاصطناعي في تعزيز الحماية مع تقدم النماذج.