Aprendizado de Máquina

Seguir

DeepSeek testa atenção esparsa para reduzir custos de IA

01 de outubro de 2025 Reportado por IA

A empresa chinesa de IA DeepSeek está experimentando mecanismos de atenção esparsa para reduzir significativamente os custos de processamento de modelos de linguagem grandes. A abordagem concentra os cálculos em partes chave dos dados de entrada, potencialmente reduzindo pela metade as demandas de recursos. Esse desenvolvimento pode tornar a IA avançada mais acessível em meio a preocupações crescentes com energia.

Anthropic lança modelo de IA Claude Sonnet 4.5

30 de setembro de 2025 Reportado por IA

A Anthropic lançou seu modelo de IA mais recente, Claude Sonnet 4.5, alegando que ele se destaca em aplicações do mundo real. O modelo demonstrou foco sustentado por até 30 horas em tarefas complexas de múltiplos passos. Benchmarks independentes, incluindo um da OpenAI, mostram que ele supera rivais em cenários de trabalho práticos.

Thinking Machines Lab lança primeiro produto de IA Fine-Tune

02 de outubro de 2025 Reportado por IA

Thinking Machines Lab, uma startup fundada por ex-pesquisadores da OpenAI, lançou seu produto inaugural, Fine-Tune, voltado para simplificar a personalização de grandes modelos de linguagem. A plataforma promete tornar o fine-tuning acessível a desenvolvedores sem recursos extensos. Este lançamento marca um passo significativo para a empresa no competitivo mercado de ferramentas de IA.