Especialistas preveem 2026 como o ano decisivo para modelos do mundo, sistemas de IA projetados para compreender o mundo físico mais profundamente do que grandes modelos de linguagem. Esses modelos visam ancorar a IA na realidade, possibilitando avanços em robótica e veículos autônomos. Líderes da indústria como Yann LeCun e Fei-Fei Li destacam seu potencial para revolucionar a inteligência espacial.
O cenário da IA está mudando dos grandes modelos de linguagem geradores de texto, como os que alimentam ChatGPT e Gemini, para modelos do mundo que interpretam o ambiente físico. Esses sistemas traduzem elementos como as leis da física, detecção de objetos e movimento para formatos digitais que a IA pode processar, formando a base para IA física — tecnologia capaz de não apenas entender, mas atuar no mundo real. Diferentemente de chatbots interativos, os modelos do mundo sustentarão aplicações incluindo geração de vídeo realista, robôs cirúrgicos e direção autônoma aprimorada. Seu desenvolvimento sinaliza uma mudança das alucinações ocasionais da IA para saídas mais confiáveis e baseadas na realidade. Figuras proeminentes estão impulsionando essa transição. Yann LeCun, pesquisador chave em IA, recentemente deixou a liderança das iniciativas de IA da Meta para se juntar a uma startup dedicada a modelos do mundo. Fei-Fei Li, frequentemente chamada de madrinha da IA, enfatizou em um post de blog de novembro a importância da inteligência espacial: «A inteligência espacial transformará como criamos e interagimos com mundos reais e virtuais — revolucionando narrativas, criatividade, robótica, descoberta científica e além.» O CEO da Nvidia, Jensen Huang, abordou modelos do mundo em sua keynote no CES 2026, enfatizando o papel dos dados de treinamento: «Construir um modelo de IA fundamentado em nossas leis da física e na verdade do terreno começa com os dados usados para treinamento.» A plataforma Cosmos da Nvidia exemplifica isso, usando sensores de veículos para mapear arredores em tempo real e simular cenários como acidentes para melhorar a segurança. Tais modelos dependem de vastos conjuntos de dados, incluindo conteúdo gerado por humanos e simulações, embora estas ajudem a lidar com preocupações legais sobre uso de dados e casos de borda raros por meio de dados sintéticos. Esse foco em modelos do mundo indica que a indústria de IA está priorizando a integração com o mundo físico sobre a expansão de capacidades de texto virtual.