Pekerja yang dibayar untuk melatih model AI canggih semakin mengandalkan chatbot seperti ChatGPT untuk menghasilkan percakapan dan pengujian yang diperlukan. Jalan pintas ini, yang digambarkan oleh berbagai sumber sudah tersebar luas, berisiko menurunkan kualitas model di masa depan melalui pelatihan rekursif pada data sintetis.
Beberapa pihak yang melapor kepada New Scientist mengatakan bahwa praktik tersebut tetap terjadi meskipun ada kebijakan perusahaan yang secara eksplisit melarangnya. Upah rendah dan kontrak jangka pendek bagi pekerja pihak ketiga menciptakan insentif untuk menyelesaikan tugas lebih cepat dengan menggunakan alat AI.
Seorang pekerja, yang disebut sebagai Alice, mengatakan dia tidak merasa bersalah dan menghindari deteksi dengan menginstruksikan chatbot untuk melewati penanda penulisan AI yang umum seperti tanda pisah (em-dashes). Dia mencatat bahwa hanya pengguna yang kurang berhati-hati yang tertangkap.
Pekerja lain, Bob, awalnya menggunakan AI saat melatih model untuk Outlier, sebuah platform milik Scale AI, dan kemudian dipromosikan untuk mendeteksi aktivitas serupa melalui tangkapan layar desktop yang diambil oleh perangkat lunak pemantau. Pekerja ketiga, Carol, mulai menggunakan model bahasa besar untuk memeriksa hasil kerjanya agar tidak melanggar pedoman dan sekarang menggunakannya untuk menghasilkan skenario serta berkas.
Mark Lee dari University of Birmingham memperingatkan bahwa model yang dilatih secara intensif pada konten yang dihasilkan AI dapat kehilangan kemampuan, meskipun data manusia yang terbatas mungkin mengurangi efek tersebut.