La startup Anthropic ha revelado Claude Mythos, un modelo de IA con capacidad para identificar y explotar brechas de ciberseguridad en sistemas operativos y navegadores. Ante el riesgo de uso por ciberdelincuentes, no lo liberará públicamente y lo restringe a una coalición de empresas tecnológicas. El secretario del Tesoro de EE UU ha convocado a bancos para alertar sobre estos peligros.
Anthropic, startup rival de OpenAI, anunció esta semana Claude Mythos, un modelo de IA general que destaca por su habilidad en codificación. Según la compañía, supera a la mayoría de humanos en encontrar y explotar vulnerabilidades de software, habiendo detectado miles de fallos en grandes sistemas operativos y navegadores web, incluido un bug de 27 años en OpenBSD.
"Los modelos de IA han alcanzado un nivel de capacidad de codificación que les permite superar a todos, salvo a los humanos más habilidosos", afirma Anthropic en su comunicado. Logan Graham, del equipo de pruebas, lo califica de “punto de inflexión” para la industria. Por temor a ciberdelincuentes, Anthropic no lo libera al público y lo despliega vía Project Glasswing, coalición de 40 organizaciones como Apple, Amazon, Microsoft, Google y Linux Foundation, para parchear brechas.
El debate escaló cuando el secretario del Tesoro, Scott Bessent, convocó esta semana a directivos de Bank of America, Citigroup, Goldman Sachs, Morgan Stanley y Wells Fargo, más Jay Powell de la Fed. Fuentes citadas por Financial Times indican que alertó sobre riesgos de IA en ciberataques. Jamie Dimon de JPMorgan, ausente, había advertido previamente de estos peligros agravados por IA.
No obstante, el analista Gary Marcus cuestiona el anuncio como “inflado” por marketing, señalando que pruebas en Firefox desactivaron sandboxing y que modelos abiertos ya logran similares hazañas.