Une preuve de concept démontre comment des sites web peuvent contourner les garde-fous de sécurité des navigateurs IA en leur transmettant de fausses informations. Cette technique, baptisée BioShocking, incite les modèles d'IA intégrés à accepter des faits erronés, comme 2 + 2 = 5, créant ainsi une réalité alternative où les restrictions ne s'appliquent plus.
L'attaque a été détaillée dans des recherches publiées cette semaine par Roy Paz, de la société de sécurité LayerX. Une fois que l'IA entre dans cet état altéré, le site peut lui ordonner d'effectuer des actions telles que l'extraction de code depuis des dépôts privés ou la récupération d'identifiants dans des gestionnaires de mots de passe intégrés. L'exploitation a fonctionné contre plusieurs navigateurs IA, notamment ChatGPT Atlas, Comet, Fellou, Genspark, Sigma et le plugin Chrome de Claude. Elle s'inspire de thèmes issus du jeu vidéo BioShock et du roman 1984 à travers ses instructions et ses références au paradoxe. Paz a souligné qu'une fois que les modèles ont appris que des actions incorrectes étaient acceptables, ils ne respectaient plus leurs règles de sécurité initiales. L'informaticien Adam Conway avait soulevé des inquiétudes similaires l'an dernier concernant les risques liés à la fusion de l'affichage web et des actions automatisées au sein d'un agent IA unique. La démonstration manque d'une totale discrétion, car ses instructions sont visibles par les utilisateurs, et il n'est pas établi si les données extraites peuvent être envoyées à distance. Elle souligne néanmoins les défis persistants pour sécuriser les navigateurs IA qui combinent navigation et exécution de tâches sur des machines locales.