Deloitte akan mengembalikan dana kepada pemerintah Australia untuk laporan yang dihalusinasikan oleh AI
Deloitte Australia telah menyetujui untuk mengembalikan sebagian dana kepada pemerintah atas laporan senilai $440.000 yang penuh dengan kutipan palsu yang dihasilkan oleh AI. Perusahaan tersebut diam-diam mengakui penggunaan GPT-4o setelah kesalahan ditemukan dalam dokumen yang meninjau sistem kepatuhan kesejahteraan. Kritikus mempertanyakan keandalan laporan tersebut meskipun ada jaminan resmi bahwa temuan intinya tetap utuh.
Pada Juli 2025, Deloitte Australia menyelesaikan "Targeted Compliance Framework Assurance Review", sebuah dokumen 273 halaman yang dipesan oleh Departemen Ketenagakerjaan dan Hubungan Kerja (DEWR) untuk mengevaluasi sistem penalti otomatis pemerintah untuk kepatuhan kesejahteraan. Biayanya hampir $440.000 AUD (sekitar $290.000 USD) bagi wajib pajak, laporan tersebut diterbitkan pada Agustus.
Tak lama setelah diterbitkan, Chris Rudge, wakil direktur hukum kesehatan di Universitas Sydney, mengidentifikasi beberapa kutipan yang tidak ada, termasuk referensi palsu ke makalah oleh profesor Universitas Sydney Lisa Burton Crawford. "Menyedihkan melihat penelitian yang dikaitkan dengan saya dengan cara ini," kata Crawford kepada Australian Financial Review pada Agustus. "Saya ingin melihat penjelasan dari Deloitte tentang bagaimana kutipan tersebut dihasilkan."
Versi terbaru laporan, dirilis pada 3 Oktober 2025, membahas "sejumlah kecil koreksi untuk referensi dan catatan kaki." Pada halaman 58, Deloitte mengungkapkan penggunaan "rantai alat berbasis model bahasa besar AI generatif (Azure OpenAI GPT-4o)" untuk menilai apakah kode sistem selaras dengan persyaratan bisnis dan kebutuhan kepatuhan. Laporan asli mengutip 141 sumber, tetapi pembaruan menguranginya menjadi 127, menghapus referensi palsu ke karya Crawford dan kutipan palsu dari hakim federal Jennifer Davies (awalnya salah eja sebagai "Davis").
Deloitte akan mengembalikan angsuran terakhir dari kontraknya, meskipun jumlah pastinya tidak jelas. Seorang juru bicara DEWR menyatakan bahwa "substansi tinjauan independen dipertahankan, dan tidak ada perubahan pada rekomendasi." Namun, Rudge mengkritik proses tersebut, mengatakan, "Anda tidak bisa mempercayai rekomendasi ketika fondasi laporan itu sendiri dibangun di atas metodologi yang cacat, awalnya tidak diungkapkan, dan tidak ahli... Deloitte telah mengakui menggunakan AI generatif untuk tugas analitis inti; tetapi gagal mengungkapkannya sejak awal."
Insiden ini menyoroti kekhawatiran yang semakin besar tentang penggunaan AI dalam layanan profesional, terutama aplikasi yang tidak diungkapkan dalam pekerjaan pemerintah berisiko tinggi.