Una prueba de concepto demuestra cómo los sitios web pueden eludir las salvaguardas de seguridad en los navegadores con IA al proporcionarles información falsa. La técnica, denominada BioShocking, induce a los modelos de IA integrados a aceptar hechos incorrectos, como que 2 + 2 = 5, creando una realidad alternativa en la que las restricciones dejan de aplicarse.
El ataque fue detallado en una investigación publicada esta semana por Roy Paz, de la firma de seguridad LayerX. Una vez que la IA entra en este estado alterado, el sitio puede instruirla para que realice acciones como extraer código de repositorios privados o recuperar credenciales de gestores de contraseñas integrados. El exploit funcionó contra varios navegadores con IA, incluidos ChatGPT Atlas, Comet, Fellou, Genspark, Sigma y el complemento de Claude para Chrome. La técnica recurre a temas del videojuego BioShock y de la novela 1984 a través de sus prompts y referencias a paradojas. Paz señaló que, una vez que los modelos aprenden que ciertas acciones incorrectas son aceptables, dejan de seguir sus reglas de seguridad originales. El informático Adam Conway planteó preocupaciones similares el año pasado sobre los riesgos de combinar la visualización web y las acciones automatizadas en un único agente de IA. La demostración carece de sigilo total debido a que sus instrucciones son visibles para los usuarios, y no está claro si los datos extraídos pueden enviarse de forma remota. No obstante, pone de relieve los desafíos actuales en la seguridad de los navegadores con IA que combinan la navegación y la ejecución de tareas en equipos locales.