Un nouveau article de recherche démontre que les grands modèles de langage peuvent identifier les identités réelles derrière les pseudonymes anonymes en ligne avec une grande précision. La méthode, coûtant seulement 4 dollars par personne, analyse les publications à la recherche d’indices et les recoupe sur Internet. Des chercheurs de ETH Zurich, Anthropic et MATS mettent en garde contre une réduction de la vie privée en ligne.
Publié le 26 février 2026, l’article intitulé «Désanonymisation en ligne à grande échelle avec les LLM» explore comment les chatbots IA avancés peuvent révéler les personnes réelles derrière les pseudonymes sur des plateformes comme Reddit et Hacker News. L’étude, menée par des chercheurs de ETH Zurich, Anthropic—la société mère de Claude—et le groupe de recherche MATS, introduit une technique appelée ESRC : Extraire les indices, Rechercher, Raisonner et Calibrer. L’IA examine d’abord les publications pour des indices personnels, comme des intérêts pour la programmation de jeux en Python, les films Marvel, des plaintes sur l’école à Seattle ou des styles d’écriture distinctifs. Elle recherche ensuite des sites comme LinkedIn, Google et d’autres comptes Reddit pour trouver des profils correspondants. Enfin, elle raisonne sur les alignements de style, hobbies et horaires pour évaluer les niveaux de confiance, obtenant des correspondances sans intervention humaine. Les tests sur de vrais utilisateurs de Hacker News ont donné un taux de succès de 67 % pour relier les pseudonymes secrets aux identités réelles, avec 90 % de précision lorsque l’IA faisait des prédictions. Pour les publications Reddit du même utilisateur sur différentes années ou groupes, le taux de succès a atteint 68 %. Le processus est peu coûteux, nécessitant jusqu’à 4 dollars par individu en utilisant des chatbots accessibles comme les futures versions de ChatGPT ou Claude. Simon Lermen, l’un des principaux chercheurs, a souligné les implications pour la vie privée. Auparavant, le maintien de l’anonymat en ligne reposait sur l’effort requis pour des enquêtes manuelles, qui pouvaient prendre des heures ou des jours. Désormais, cette automatisation permet aux individus, entreprises ou autorités d’analyser rapidement des milliers de comptes, révélant potentiellement des noms, écoles, villes ou emplois à partir de quelques commentaires. Les chercheurs décrivent cela comme la fin de l’« obscurité pratique », où l’obscurité était autrefois réalisable malgré les possibilités techniques.