Deloitte remboursera le gouvernement australien pour un rapport halluciné par l'IA
Deloitte Australia a accepté de rembourser partiellement le gouvernement pour un rapport de 440 000 dollars truffé de citations fabriquées générées par l'IA. La firme a discrètement admis avoir utilisé GPT-4o après la découverte d'erreurs dans le document examinant les systèmes de conformité aux aides sociales. Les critiques remettent en question la fiabilité du rapport malgré les assurances officielles que ses conclusions principales restent intactes.
En juillet 2025, Deloitte Australia a finalisé son « Targeted Compliance Framework Assurance Review », un document de 273 pages commandé par le Département de l'Emploi et des Relations du Travail (DEWR) pour évaluer le système automatisé de pénalités du gouvernement en matière de conformité aux aides sociales. Coûtant près de 440 000 AUD (environ 290 000 USD) aux contribuables, le rapport a été publié en août.
Peu après la publication, Chris Rudge, directeur adjoint du droit de la santé à l'Université de Sydney, a identifié plusieurs citations inexistantes, y compris des références fabriquées à des articles de la professeure de l'Université de Sydney Lisa Burton Crawford. « Il est préoccupant de voir une recherche attribuée à moi de cette manière », a déclaré Crawford à l'Australian Financial Review en août. « Je voudrais voir une explication de Deloitte sur la façon dont les citations ont été générées. »
Une version mise à jour du rapport, publiée le 3 octobre 2025, a corrigé « un petit nombre de références et de notes de bas de page ». À la page 58, Deloitte a divulgué l'utilisation d'une « chaîne d'outils basée sur un modèle de langage large génératif d'IA (Azure OpenAI GPT-4o) » pour évaluer si le code du système s'aligne sur les exigences métier et les besoins de conformité. Le rapport original citait 141 sources, mais la mise à jour les a réduites à 127, en supprimant les références fictives au travail de Crawford et une citation fabriquée de la juge fédérale Jennifer Davies (initialement mal orthographiée comme « Davis »).
Deloitte remboursera la dernière tranche de son contrat, bien que le montant exact ne soit pas clair. Un porte-parole du DEWR a déclaré que « la substance de l'examen indépendant est conservée, et il n'y a pas de changements dans les recommandations ». Cependant, Rudge a critiqué le processus, affirmant : « on ne peut pas faire confiance aux recommandations quand la base même du rapport repose sur une méthodologie défectueuse, initialement non divulguée et non experte... Deloitte a admis avoir utilisé une IA générative pour une tâche analytique centrale ; mais elle a échoué à la divulguer au départ. »
Cet incident met en lumière les préoccupations croissantes concernant l'utilisation de l'IA dans les services professionnels, en particulier les applications non divulguées dans des travaux gouvernementaux à haut risque.