Deloitte återbetalar australiska regeringen för AI-hallusinerad rapport
Deloitte Australia har gått med på att delvis återbetala regeringen för en rapport på 440 000 dollar full av fabricerade citat genererade av AI. Företaget erkände tyst användning av GPT-4o efter att fel upptäckts i dokumentet som granskade välfärdsöverensstämmelsesystem. Kritiker ifrågasätter rapportens tillförlitlighet trots officiella försäkringar om att dess kärnslutsatser förblir intakta.
I juli 2025 slutförde Deloitte Australia sin "Targeted Compliance Framework Assurance Review", ett 273-sidigt dokument beställt av Department of Employment and Workplace Relations (DEWR) för att utvärdera regeringens automatiserade bötesystem för välfärdsöverensstämmelse. Rapporten kostade skattebetalarna nästan 440 000 AUD (cirka 290 000 USD) och publicerades i augusti.
Kort efter publiceringen identifierade Chris Rudge, biträdande direktör för hälsojuridik vid Sydney University, flera icke-existerande citat, inklusive fabricerade referenser till artiklar av professor Lisa Burton Crawford vid University of Sydney. "Det är oroande att se forskning tillskriven mig på det här sättet", sade Crawford till Australian Financial Review i augusti. "Jag skulle vilja se en förklaring från Deloitte om hur citaten genererades."
En uppdaterad version av rapporten, släppt den 3 oktober 2025, hanterade "ett litet antal korrigeringar av referenser och fotnoter". På sida 58 avslöjade Deloitte användningen av "en verktygskedja baserad på en generativ AI-stor språkmodell (Azure OpenAI GPT-4o)" för att bedöma om systemkoden stämmer överens med affärs-krav och efterlevnadsbehov. Den ursprungliga rapporten citerade 141 källor, men uppdateringen minskade detta till 127, genom att ta bort falska referenser till Crawfords arbete och en fabricerad citat från federala domaren Jennifer Davies (ursprungligen felstavat som "Davis").
Deloitte kommer att betala tillbaka den sista ratan av sitt kontrakt, även om det exakta beloppet är oklart. En talesperson för DEWR uppgav att "substansen i den oberoende granskningen behålls, och det finns inga ändringar i rekommendationerna". Rudge kritiserade dock processen och sade: "du kan inte lita på rekommendationerna när rapportens grund byggs på en bristfällig, ursprungligen icke-upplyst och icke-expert metod... Deloitte har erkänt användning av generativ AI för en kärnanalytisk uppgift; men de misslyckades med att upplysa om det från början."
Denna händelse belyser växande oro över AI-användning i professionella tjänster, särskilt icke-upplysta tillämpningar i högriskregeringsarbete.