Los investigadores han descubierto que las puntuaciones de riesgo poligénico, que resumen la probabilidad de que una persona desarrolle enfermedades como la diabetes y el cáncer, pueden reconstruirse inversamente para descubrir datos genéticos subyacentes. Esta vulnerabilidad plantea preocupaciones sobre la privacidad, permitiendo potencialmente la identificación a través de bases de datos públicas o la reconstrucción por parte de aseguradoras. El descubrimiento resalta los riesgos de compartir dichas puntuaciones, incluso de forma anónima.
Las puntuaciones de riesgo poligénico (PRS) agregan los efectos de numerosos polimorfismos de nucleótido simple (SNPs) en el genoma para estimar predisposiciones a enfermedades. Empresas como 23andMe y los investigadores utilizan estas puntuaciones para delinear riesgos de salud, e individuos a veces las comparten públicamente para obtener consejos de interpretación. nnTradicionamente consideradas de bajo riesgo para la privacidad debido a la complejidad computacional del problema de la mochila —similar a deducir un número de teléfono a partir de la suma de sus dígitos—, las PRS ahora se han demostrado explotables. La clave radica en los pesos precisos, de hasta 16 dígitos, asignados a la contribución de cada SNP al riesgo de enfermedad, particularmente en modelos más pequeños. nnGamze Gürsoy, de la Universidad de Columbia en Nueva York, explicó: «Porque la puntuación de riesgo poligénico final está limitada por un número finito de formas de llegar a ese número, y una disposición estadísticamente probable de los SNPs subyacentes, puede deducirse con un alto grado de precisión». Junto con Kirill Nikitin, Gürsoy probó 298 modelos PRS que utilizaban 50 o menos SNPs en datos genéticos de 2353 individuos. Calculando genomas posibles y filtrando mutaciones improbables, encadenaron ataques a través de modelos, logrando una precisión del 94,6 por ciento en la reconstrucción de genotipos y la predicción de 2450 SNPs por persona. nnDe manera notable, solo 27 SNPs bastaron para identificar a alguien en una base de datos de 500.000 muestras, con hasta un 90 por ciento de precisión para parientes. Los individuos de ascendencia africana y de Asia Oriental enfrentaron mayores riesgos de identificación debido a la subrepresentación en las bases de datos genéticas. Gürsoy señaló que 447 modelos pequeños de alta precisión en una base de datos pública son vulnerables. nn«Queríamos señalar que el riesgo es bajo, pero bajo [algunas condiciones], podría haber aún alguna filtración», dijo Gürsoy, instando a la precaución en los diseños de investigación que involucren grupos vulnerables. Ying Wang, del Massachusetts General Hospital, reconoció las protecciones existentes para los datos y los límites computacionales, pero recomendó tratar los modelos pequeños como sensibles en contextos clínicos y procesos de consentimiento. nnLos hallazgos provienen de un preprint en bioRxiv (DOI: 10.64898/2026.02.16.706191).