高度なAIモデルの学習報酬を得ている作業者が、ChatGPTなどのチャットボットを利用して必要な会話やテストを作成するケースが増えている。複数の情報筋によると、こうした近道は広く行われており、AIが生成したデータを再学習することで将来のモデルの品質が低下するリスクがあるという。
数人の内部告発者がニュー・サイエンティスト誌に対し、会社が明示的に禁止しているにもかかわらず、こうした行為が行われていると語った。外部委託された作業者の低賃金と短期契約が、AIツールを使ってタスクを迅速に完了させようとする動機を生んでいる。
アリス(仮名)と呼ばれるある作業者は、罪悪感は感じておらず、エムダッシュのようなAI特有の記述マーカーを避けるようチャットボットに指示することで発覚を免れていると述べた。彼女は、注意を怠ったユーザーだけが摘発されると指摘している。
別の作業者であるボブ(仮名)は、Scale AIが所有するプラットフォーム「Outlier」でモデルの学習中にAIを使い始め、後に監視ソフトウェアが撮影したデスクトップのスクリーンショットを通じて同様の行為を検出する役割に昇進した。3人目の作業者キャロル(仮名)は、当初はAIが作成した回答がガイドラインに違反していないかを確認するために大規模言語モデルを使い始めたが、現在はそれらを使ってシナリオやファイルの生成を行っている。
バーミンガム大学のマーク・リー氏は、AIが生成したコンテンツを大量に学習したモデルは性能が低下する可能性があると警告したが、人間のデータが限られている場合はその影響が軽減される可能性もあると述べている。