O GitHub anunciou uma mudança para a cobrança baseada em uso para seu serviço de IA Copilot, com vigência a partir de 1º de junho, para alinhar os custos ao consumo real de IA. Os assinantes receberão Créditos de IA mensais equivalentes às suas taxas de assinatura, com o uso excedente sendo cobrado por taxas de tokens. A medida visa lidar com o aumento dos custos de inferência gerados por usuários intensivos.
O GitHub, de propriedade da Microsoft, revelou planos para substituir seu atual sistema baseado em solicitações do Copilot por um atrelado diretamente ao uso de recursos de IA. No modelo existente, os usuários recebem alocações mensais fixas de solicitações e solicitações premium, independentemente das demandas computacionais variáveis de tarefas como consultas rápidas ou sessões extensas de codificação. O GitHub afirmou que um chat simples e uma sessão autônoma de várias horas custam o mesmo para os usuários atualmente, uma disparidade que a empresa subsidiou até agora, mas que não pode mais sustentar diante da crescente demanda por recursos de IA. O novo sistema oferece a cada assinante do Copilot Créditos de IA equivalentes ao seu pagamento mensal. Além disso, serão aplicadas cobranças com base nos tokens processados — entrada, saída e cache — usando taxas de API publicadas para os modelos. Por exemplo, as variantes do GPT da OpenAI variam de US$ 4,50 a US$ 30 por milhão de tokens de saída. Recursos básicos, como preenchimento de código e Next Edit, permanecem livres de créditos, enquanto revisões de código incorrerão em custos via minutos do GitHub Actions. Os usuários podem visualizar suas faturas no novo modelo antes do lançamento em 1º de junho. Isso segue ações recentes do GitHub, incluindo a pausa em novas assinaturas, o endurecimento de limites e a remoção dos modelos avançados Claude Opus dos planos Pro para garantir a confiabilidade do serviço. O GitHub descreveu a mudança como uma forma de promover a sustentabilidade ao ajustar o preço ao uso e aos custos reais, reduzindo a necessidade de restringir usuários intensivos. Ajustes semelhantes estão em andamento em outros locais, com a Anthropic cobrando dos usuários corporativos os custos totais de processamento e ajustando os limites durante os horários de pico.