Para peneliti menemukan bahwa skor risiko poligenik, yang merangkum kemungkinan seseorang mengembangkan penyakit seperti diabetes dan kanker, dapat direkayasa balik untuk mengungkap data genetik mendasar. Kerentanan ini menimbulkan kekhawatiran privasi, yang berpotensi memungkinkan identifikasi melalui basis data publik atau rekonstruksi oleh perusahaan asuransi. Penemuan ini menyoroti risiko dalam berbagi skor tersebut, bahkan secara anonim.
Skor risiko poligenik (PRS) merangkum efek dari berbagai polimorfisme nukleotida tunggal (SNP) dalam genom untuk memperkirakan predisposisi penyakit. Perusahaan seperti 23andMe dan para peneliti menggunakan skor ini untuk menguraikan risiko kesehatan, dan individu terkadang membagikannya secara publik untuk mendapatkan saran interpretasi. Skor ini secara tradisional dianggap berisiko rendah bagi privasi karena kompleksitas komputasi masalah ransel—mirip dengan mendeduksi nomor telepon dari jumlah digitnya—namun kini terbukti dapat dieksploitasi. Kuncinya terletak pada bobot presisi hingga 16 digit yang diberikan pada kontribusi setiap SNP terhadap risiko penyakit, terutama pada model yang lebih kecil. Gamze Gürsoy di Universitas Columbia di New York menjelaskan: “Karena skor risiko poligenik akhir dibatasi oleh jumlah cara terbatas untuk mencapai angka tersebut, dan susunan SNP mendasar yang secara statistik mungkin, skor tersebut dapat disimpulkan dengan tingkat akurasi yang tinggi.” Bersama Kirill Nikitin, Gürsoy menguji 298 model PRS yang menggunakan 50 atau lebih sedikit SNP pada data genetik dari 2353 individu. Dengan menghitung kemungkinan genom dan menyaring mutasi yang tidak mungkin, mereka melakukan serangan berantai lintas model, mencapai akurasi 94,6 persen dalam merekonstruksi genotipe dan memprediksi 2450 SNP per orang. Secara khusus, hanya 27 SNP sudah cukup untuk mengidentifikasi seseorang dalam basis data 500.000 sampel, dengan presisi hingga 90 persen untuk kerabat. Individu keturunan Afrika dan Asia Timur menghadapi risiko identifikasi lebih tinggi karena kurangnya representasi di basis data genetik. Gürsoy mencatat bahwa 447 model kecil berpresisi tinggi di basis data publik rentan. “Kami ingin menunjukkan bahwa risikonya rendah, tetapi dalam [kondisi tertentu], masih ada kemungkinan kebocoran,” kata Gürsoy, mendorong kehati-hatian dalam desain penelitian yang melibatkan kelompok rentan. Ying Wang di Massachusetts General Hospital mengakui perlindungan data yang ada dan batasan komputasi tetapi merekomendasikan untuk memperlakukan model kecil sebagai sensitif dalam konteks klinis dan proses persetujuan. Temuan ini berasal dari preprint di bioRxiv (DOI: 10.64898/2026.02.16.706191).