Forskare har upptäckt att polygena riskpoäng, som sammanfattar en persons sannolikhet att utveckla sjukdomar som diabetes och cancer, kan återskapas för att avslöja underliggande genetiska data. Denna sårbarhet väcker oro för integritet och kan potentiellt möjliggöra identifiering via offentliga databaser eller rekonstruktion av försäkringsbolag. Upptäckten belyser risker med att dela sådana poäng, även anonymt.
Polygena riskpoäng (PRS) sammanväger effekterna av otaliga enkelnukleotidpolymorfismer (SNPs) i genomet för att uppskatta sjukdomspredispositioner. Företag som 23andMe och forskare använder dessa poäng för att beskriva hälsorisker, och individer delar ibland dem offentligt för att få råd om tolkning. Traditionellt betraktade som låg risk för integritet på grund av den beräkningsmässiga komplexiteten i ryggsäcksproblemet – liknande att härleda ett telefonnummer från summan av dess siffror – visar det sig nu att PRS kan utnyttjas. Nyckeln ligger i de precisa vikterna, upp till 16 siffror långa, som tilldelas varje SNPs bidrag till sjukdomsrisk, särskilt i mindre modeller. Gamze Gürsoy vid Columbia University i New York förklarade: “Eftersom den slutgiltiga polygena riskpoängen är begränsad av ett ändligt antal sätt att komma fram till det talet, och en statistiskt sannolik arrangement av de underliggande SNPs, kan den härledas med hög noggrannhet.” Tillsammans med Kirill Nikitin testade Gürsoy 298 PRS-modeller med 50 eller färre SNPs på genetiska data från 2353 individer. Genom att beräkna möjliga genom och filtrera osannolika mutationer kedjade de attacker över modeller och uppnådde 94,6 procents noggrannhet i att rekonstruera genotyper och förutsäga 2450 SNPs per person. Anmärkningsvärt räckte bara 27 SNPs för att identifiera någon i en databas med 500 000 prover, med upp till 90 procents precision för släktingar. Individer av afrikansk och östasiatisk härkomst löpte högre identifieringsrisker på grund av underrepresentation i genetiska databaser. Gürsoy noterade att 447 små, högprecisionsmodeller i en offentlig databas är sårbara. “Vi ville påpeka att risken är låg, men under [vissa förhållanden] kan det fortfarande finnas viss läckage,” sade Gürsoy och uppmanade till försiktighet i forskningsdesigner som involverar sårbara grupper. Ying Wang vid Massachusetts General Hospital erkände befintliga dataskydd och beräkningsbegränsningar men rekommenderade att behandla små modeller som känsliga i kliniska sammanhang och samtyckesprocesser. Resultaten kommer från ett preprint på bioRxiv (DOI: 10.64898/2026.02.16.706191).