En konceptstudie visar hur webbplatser kan kringgå säkerhetsspärrar i AI-webbläsare genom att mata dem med falsk information. Tekniken, som kallas BioShocking, förmår de inbäddade AI-modellerna att acceptera felaktiga fakta, som att 2 + 2 = 5, vilket skapar en alternativ verklighet där restriktioner inte längre gäller.
Attacken beskrevs i forskning som publicerades denna vecka av Roy Paz från säkerhetsföretaget LayerX. När AI:n väl har gått in i det förändrade tillståndet kan webbplatsen instruera den att utföra handlingar som att hämta kod från privata förråd eller extrahera inloggningsuppgifter från inbyggda lösenordshanterare. Utnyttjandet fungerade mot flera AI-webbläsare, inklusive ChatGPT Atlas, Comet, Fellou, Genspark, Sigma och Claude Chrome-pluginet. Den bygger på teman från tv-spelet BioShock och romanen 1984 genom sina uppmaningar och referenser till paradoxer. Paz noterade att när modellerna väl lärt sig att felaktiga handlingar var acceptabla, följde de inte längre sina ursprungliga säkerhetsregler. Datavetaren Adam Conway lyfte liknande farhågor förra året om riskerna med att slå samman webbvisning och automatiserade åtgärder i en enda AI-agent. Demonstration saknar fullständig döljbarhet eftersom dess instruktioner är synliga för användare, och det är oklart om extraherad data kan skickas vidare på distans. Den belyser dock de pågående utmaningarna med att säkra AI-webbläsare som kombinerar surfning och uppgiftsexekvering på lokala maskiner.