Aprendizado de Máquina

Photo illustration of Google executives unveiling the Gemini 3 AI model and Antigravity IDE in a conference setting.

Google apresenta modelo de IA Gemini 3 e IDE Antigravity

18 de novembro de 2025 Reportado por IA Imagem gerada por IA

O Google lançou o Gemini 3 Pro, seu mais recente modelo principal de IA, enfatizando raciocínio aprimorado, saídas visuais e capacidades de codificação. A empresa também introduziu o Antigravity, um ambiente de desenvolvimento integrado com foco em IA. Ambos estão disponíveis em visualização limitada a partir de hoje.

Aprendizado por transferência acelera pesquisas em cosmologia, mas traz o risco de ignorar novas leis da física

Um novo estudo mostra que o aprendizado por transferência pode reduzir em mais de dez vezes os custos computacionais da busca por física além do modelo cosmológico padrão. A abordagem treina a IA primeiro em simulações mais simples antes de passar para as complexas. No entanto, ela pode levar a uma transferência negativa que prejudica a detecção de efeitos genuinamente novos.

OpenAI atribui obsessão do ChatGPT por goblins a treinamento de personalidade 'nerd'

30 de abril de 2026 Reportado por IA

A OpenAI explicou por que seus modelos ChatGPT desenvolveram uma afinidade incomum em mencionar goblins e gremlins. O problema surgiu do aprendizado por reforço no recurso de personalidade 'nerd'. A empresa resolveu a questão retirando a personalidade e ajustando os processos de treinamento.

Tecnologia

Estudo da Anthropic mostra consciência introspectiva não confiável em LLMs

Tecnologia

Pesquisa quantifica problemas de sycophancy em grandes modelos de linguagem

Tecnologia

Anthropic lança modelo de IA Claude Haiku 4.5 eficiente

Thinking Machines Lab lança primeiro produto de IA Fine-Tune

Thinking Machines Lab, uma startup fundada por ex-pesquisadores da OpenAI, lançou seu produto inaugural, Fine-Tune, voltado para simplificar a personalização de grandes modelos de linguagem. A plataforma promete tornar o fine-tuning acessível a desenvolvedores sem recursos extensos. Este lançamento marca um passo significativo para a empresa no competitivo mercado de ferramentas de IA.

DeepSeek testa atenção esparsa para reduzir custos de IA

01 de outubro de 2025 Reportado por IA

A empresa chinesa de IA DeepSeek está experimentando mecanismos de atenção esparsa para reduzir significativamente os custos de processamento de modelos de linguagem grandes. A abordagem concentra os cálculos em partes chave dos dados de entrada, potencialmente reduzindo pela metade as demandas de recursos. Esse desenvolvimento pode tornar a IA avançada mais acessível em meio a preocupações crescentes com energia.

sábado, 10 de janeiro de 2026, 12:20h

Aprendizado de Máquina

Google apresenta modelo de IA Gemini 3 e IDE Antigravity

Aprendizado por transferência acelera pesquisas em cosmologia, mas traz o risco de ignorar novas leis da física

OpenAI atribui obsessão do ChatGPT por goblins a treinamento de personalidade 'nerd'

Estudo da Anthropic mostra consciência introspectiva não confiável em LLMs

Pesquisa quantifica problemas de sycophancy em grandes modelos de linguagem

Anthropic lança modelo de IA Claude Haiku 4.5 eficiente

Thinking Machines Lab lança primeiro produto de IA Fine-Tune

DeepSeek testa atenção esparsa para reduzir custos de IA

Larian elaborates on machine learning for Divinity amid generative AI ban

Bugs do kernel Linux podem se esconder por até 20 anos

Estudo revela que poemas podem fazer jailbreak na IA para orientação sobre bombas nucleares

A teoria dos jogos mostra que algoritmos podem aumentar preços

Estudo isola memorização do raciocínio em modelos de IA

Anthropic lança modelo de IA Claude Sonnet 4.5

Este site usa cookies