Trabalhadores remunerados para treinar modelos avançados de IA estão recorrendo cada vez mais a chatbots como o ChatGPT para gerar as conversas e testes necessários. Esse atalho, descrito como difundido por diversas fontes, corre o risco de degradar a qualidade de futuros modelos por meio do treinamento recursivo em dados sintéticos.
Vários denunciantes disseram à New Scientist que a prática ocorre apesar de políticas explícitas das empresas contra ela. A baixa remuneração e os contratos de curto prazo para trabalhadores terceirizados criam incentivos para completar tarefas mais rapidamente usando ferramentas de IA.
Uma trabalhadora, chamada Alice, disse que não sente culpa e evita a detecção instruindo chatbots a ignorar marcadores comuns de escrita de IA, como travessões. Ela observou que apenas os usuários menos cuidadosos são pegos.
Outro trabalhador, Bob, usou IA inicialmente enquanto treinava modelos para a Outlier, uma plataforma de propriedade da Scale AI, e foi posteriormente promovido para detectar atividades semelhantes por meio de capturas de tela da área de trabalho feitas por software de monitoramento. Uma terceira trabalhadora, Carol, começou a usar grandes modelos de linguagem para verificar se sua produção violava diretrizes e agora os utiliza para gerar cenários e arquivos.
Mark Lee, da Universidade de Birmingham, alertou que modelos treinados pesadamente em conteúdo gerado por IA podem perder capacidades, embora dados humanos limitados possam reduzir o efeito.