Rilis versi 7.0 pustaka Python open source chardet telah memicu kontroversi mengenai apakah penulisan ulang berbantuan AI dapat mengubah lisensi aslinya yang membatasi. Pemelihara Dan Blanchard menggunakan alat Claude milik Anthropic untuk membuat versi yang lebih cepat berlisensi MIT, tetapi pengarang asli Mark Pilgrim berpendapat itu melanggar ketentuan LGPL. Kasus ini menyoroti pertanyaan hukum dan etika yang muncul terkait kode yang dihasilkan AI.
Pustaka chardet, pertama kali dikembangkan oleh Mark Pilgrim pada 2006 dan dirilis di bawah GNU Lesser General Public License (LGPL), mendeteksi pengkodean karakter dalam teks. Dan Blanchard mengambil alih pemeliharaan pada 2012 dan minggu lalu mengumumkan versi 7.0, yang digambarkannya sebagai penulisan ulang lengkap di bawah lisensi MIT yang lebih permisif. Dibangun dengan bantuan alat pengkodean Claude milik Anthropic, pembaruan ini menjanjikan peningkatan performa 48 kali lipat dan akurasi lebih tinggi, yang dicapai dalam waktu sekitar lima hari saja. Dan Blanchard bertujuan membuat chardet cocok untuk dimasukkan ke pustaka standar Python dengan mengatasi masalah lisensi, kecepatan, dan akurasinya. Ia memulai dengan repositori kosong, menyusun dokumen desain yang menguraikan arsitektur, dan menginstruksikan Claude agar tidak mendasarkan kode pada materi berlisensi LGPL atau GPL. Setelah kode dihasilkan, Blanchard meninjau, menguji, dan mengiterasi setiap bagiannya tanpa menulis kode secara manual. Namun, seorang komentator GitHub dengan nama Mark Pilgrim mempertanyakan perubahan lisensi tersebut, mengklaim bahwa versi baru berasal dari kode LGPL asli meskipun telah ditulis ulang. “Klaim mereka bahwa itu adalah ‘penulisan ulang lengkap’ tidak relevan, karena mereka telah terpapar secara melimpah pada kode berlisensi asli (yaitu, ini bukan implementasi ‘clean room’),” tulis Pilgrim. “Menambahkan generator kode canggih ke dalam campuran tidak memberi mereka hak tambahan. Saya dengan hormat menuntut agar mereka mengembalikan proyek ke lisensi aslinya.” Blanchard mengakui keakrabannya dengan basis kode sebelumnya tetapi tetap mempertahankan bahwa keluaran AI secara struktural independen. Analisis kesamaan melalui JPlag menunjukkan tumpang tindih paling banyak 1,29 persen antara file versi 7.0 dan pendahulunya, dibandingkan hingga 80 persen pada pembaruan sebelumnya. Ia mencatat ketergantungan pada file metadata dari versi lama dan pelatihan Claude pada data publik, termasuk kemungkinan kode chardet, sebagai komplikasi potensial. Sengketa ini telah memicu diskusi lebih luas di komunitas open source. Direktur Eksekutif Free Software Foundation Zoë Kooyman mengatakan kepada The Register, “Tidak ada yang ‘bersih’ dari Model Bahasa Besar yang telah menyerap kode yang diminta untuk diimplementasikan ulang.” Pengembang open source Armin Ronacher berpendapat dalam posting blog bahwa membuang semua kode asli menciptakan karya baru, membandingkannya dengan Kapal Theseus. Pengkode Italia Salvatore “antirez” Sanfilippo menyarankan untuk beradaptasi dengan dampak transformatif AI terhadap perangkat lunak, sementara evangelis Bruce Perens memperingatkan pergeseran ekonomi mendalam, membandingkannya dengan efek mesin cetak.