Los trabajadores remunerados para entrenar modelos avanzados de IA dependen cada vez más de chatbots como ChatGPT para generar las conversaciones y pruebas requeridas. Este atajo, descrito como generalizado por múltiples fuentes, corre el riesgo de degradar la calidad de futuros modelos mediante el entrenamiento recursivo con datos sintéticos.
Varios denunciantes informaron a New Scientist que la práctica ocurre a pesar de las políticas explícitas de las empresas que la prohíben. Los salarios bajos y los contratos a corto plazo para trabajadores externos crean incentivos para completar las tareas más rápidamente utilizando herramientas de IA. Una trabajadora, a la que llamaremos Alice, dijo que no siente culpa y evita ser detectada instruyendo a los chatbots para que omitan marcadores comunes de escritura de IA, como las rayas. Señaló que solo los usuarios menos cuidadosos son descubiertos. Otro trabajador, Bob, utilizó inicialmente IA mientras entrenaba modelos para Outlier, una plataforma propiedad de Scale AI, y más tarde fue ascendido para detectar actividades similares a través de capturas de pantalla del escritorio tomadas por un software de monitoreo. Una tercera trabajadora, Carol, comenzó a usar modelos de lenguaje extenso para verificar si su trabajo infringía las directrices y ahora los utiliza para generar escenarios y archivos. Mark Lee, de la Universidad de Birmingham, advirtió que los modelos entrenados en gran medida con contenido generado por IA pueden perder capacidades, aunque el uso limitado de datos humanos podría reducir este efecto.