A disponibilização da versão 7.0 da biblioteca Python open-source chardet provocou controvérsia sobre se uma reescrita assistida por IA pode alterar sua licença original restritiva. O mantenedor Dan Blanchard usou a ferramenta Claude da Anthropic para criar uma versão mais rápida, licenciada sob MIT, mas o autor original Mark Pilgrim argumenta que viola os termos do LGPL. O caso destaca questões legais e éticas emergentes em código gerado por IA.
A biblioteca chardet, desenvolvida inicialmente por Mark Pilgrim em 2006 e lançada sob a GNU Lesser General Public License (LGPL), detecta codificações de caracteres em texto. Dan Blanchard assumiu a manutenção em 2012 e na semana passada lançou a versão 7.0, descrevendo-a como uma reescrita completa sob a licença MIT mais permissiva. Construída com assistência da ferramenta de codificação Claude da Anthropic, a atualização promete uma melhoria de desempenho de 48 vezes e maior precisão, alcançada em cerca de cinco dias. Blanchard visava tornar o chardet adequado para inclusão na biblioteca padrão do Python, abordando problemas com sua licença, velocidade e precisão. Ele começou com um repositório vazio, elaborou um documento de design delineando a arquitetura e instruiu o Claude a evitar basear o código em material licenciado sob LGPL ou GPL. Após a geração, Blanchard revisou, testou e iterou em cada parte sem escrever o código manualmente. No entanto, um comentarista no GitHub usando o nome Mark Pilgrim contestou o rellicenciamento, alegando que a nova versão deriva do código LGPL original apesar da reescrita. «A alegação de que é uma ‘reescrita completa’ é irrelevante, pois eles tiveram ampla exposição ao código originalmente licenciado (ou seja, isso não é uma implementação ‘clean room’),» escreveu Pilgrim. «Adicionar um gerador de código sofisticado à mistura não lhes concede direitos adicionais de alguma forma. Eu insisto respeitosamente que revertam o projeto à sua licença original.» Blanchard reconheceu sua familiaridade com o codebase anterior, mas manteve que a saída da IA é estruturalmente independente. Análise de similaridade via JPlag mostrou no máximo 1,29% de sobreposição entre os arquivos da versão 7.0 e seus predecessores, comparado a até 80% em atualizações anteriores. Ele observou dependência de arquivos de metadados de versões antigas e o treinamento do Claude em dados públicos, incluindo possivelmente o código do chardet, como complicações potenciais. A disputa alimentou discussões mais amplas na comunidade open-source. A diretora executiva da Free Software Foundation, Zoë Kooyman, disse ao The Register: «Não há nada de ‘limpo’ em um Large Language Model que ingeriu o código que está sendo pedido para reimplementar.» O desenvolvedor open-source Armin Ronacher argumentou em um post de blog que descartar todo o código original cria uma nova obra, comparando-a ao Navio de Teseu. O codificador italiano Salvatore «antirez» Sanfilippo sugeriu adaptar-se ao impacto transformador da IA no software, enquanto o evangelista Bruce Perens alertou para mudanças econômicas profundas, comparando-o aos efeitos da imprensa.