オープンソースPythonライブラリchardetのバージョン7.0リリースが、AI支援による書き換えで元の制限的なライセンスを変更できるかどうかの論争を引き起こした。メンテナDan BlanchardはAnthropicのClaudeツールを使用して高速でMITライセンス版を作成したが、オリジナル作者Mark PilgrimはこれがLGPL条件に違反すると主張。この事例はAI生成コードに関する新たな法的・倫理的問題を浮き彫りにしている。
chardetライブラリは、2006年にMark Pilgrimによって最初に開発され、GNU Lesser General Public License(LGPL)の下でリリースされたもので、テキストの文字エンコーディングを検出します。Dan Blanchardは2012年にメンテナンスを引き継ぎ、先週バージョン7.0を公開しました。これはより緩やかなMITライセンスの下での完全な書き換えだと説明されています。AnthropicのClaudeコーディングツールの支援により構築されたこの更新版は、約5日で48倍の性能向上と高い精度を実現することを約束しています。 Blanchardは、ライセンス、速度、精度の問題を解決することでchardetをPython標準ライブラリへの組み込みに適したものにすることを目指しました。彼は空のレポジトリから始め、構造を概説した設計ドキュメントを作成し、ClaudeにLGPLまたはGPLライセンスの素材に基づかないコードを作成するよう指示しました。生成後、Blanchardはコードを手書きせずにすべての部分をレビュー、テスト、イテレーションしました。 しかし、GitHubのコメントでMark Pilgrimという名前を使用した人物が、再ライセンスを異議申し立てし、書き換えにもかかわらず新バージョンが元のLGPLコードに由来すると主張しました。「「完全な書き換え」という彼らの主張は無関係です。なぜなら、彼らは元ライセンスのコードに十分な露出があったからです(つまり、これは「クリーンルーム」実装ではありません)」、とPilgrimは書きました。「派手なコードジェネレータを混ぜても、追加の権利を与えるものではありません。私は敬意を持って、プロジェクトを元のライセンスに戻すよう主張します。」 Blanchardは以前のコードベースに精通していることを認めましたが、AIの出力は構造的に独立していると主張しました。JPlagによる類似性解析では、バージョン7.0のファイルとその前身との重複は最大1.29%で、以前の更新では最大80%でした。彼は、古いバージョンのメタデータファイルへの依存と、Claudeの公開データ(chardetのコードを含む可能性)での訓練を潜在的な問題として指摘しました。 この論争はオープンソースコミュニティでより広範な議論を呼んでいます。Free Software FoundationのエグゼクティブディレクターZoë KooymanはThe Registerに、「再実装を求められたコードを摂取した大規模言語モデルに「クリーン」なものは何もない」と語りました。オープンソース開発者のArmin Ronacherはブログ投稿で、すべての元のコードを破棄することは新作を生み出し、これをテセウスの船に例えました。イタリアのコーダーSalvatore “antirez” Sanfilippoは、AIがソフトウェアにもたらす変革的な影響に適応することを提案し、伝道者のBruce Perensは、印刷機の影響に例えて深刻な経済的変動を警告しました。