Pesquisadores da Universidade Duke desenvolveram uma estrutura de inteligência artificial que revela regras diretas subjacentes a sistemas altamente complexos na natureza e na tecnologia. Publicado em 17 de dezembro na npj Complexity, a ferramenta analisa dados de séries temporais para produzir equações compactas que capturam comportamentos essenciais. Essa abordagem pode preencher lacunas no entendimento científico onde métodos tradicionais falham.
A nova IA, criada por uma equipe liderada por Boyuan Chen, diretor do General Robotics Lab na Universidade Duke, inspira-se em figuras históricas como Isaac Newton, que formulou equações para sistemas em mudança. Ela processa dados sobre como dinâmicas complexas evoluem, destilando milhares de variáveis em modelos mais simples, semelhantes a lineares, que permanecem precisos em relação às observações do mundo real.
Baseando-se na teoria do matemático Bernard Koopman dos anos 1930, que postula que sistemas não lineares podem ser representados linearmente, a estrutura aborda um desafio chave: o volume imenso de equações necessárias para tais representações. Ao integrar aprendizado profundo com restrições baseadas na física, ela identifica padrões cruciais em dados experimentais, resultando em modelos até 10 vezes menores que os de técnicas anteriores de aprendizado de máquina.
Testes em diversas aplicações — como oscilações de pêndulo, circuitos elétricos, modelos climáticos e sinais neurais — demonstraram a capacidade da IA de descobrir um punhado de variáveis governantes para previsões de longo prazo confiáveis. "O que se destaca não é apenas a precisão, mas a interpretabilidade", observou Chen. "Quando um modelo linear é compacto, o processo de descoberta científica pode ser naturalmente conectado às teorias e métodos existentes que cientistas humanos desenvolveram ao longo de milênios."
Além das previsões, o sistema detecta estados estáveis, ou atratores, ajudando os cientistas a avaliar a saúde do sistema e mudanças iminentes. O autor principal, Sam Moore, candidato a PhD no laboratório de Chen, explicou: "Para um dinamista, encontrar essas estruturas é como encontrar os marcos de uma nova paisagem." Ele acrescentou: "Isso não é sobre substituir a física. É sobre estender nossa capacidade de raciocinar usando dados quando a física é desconhecida, oculta ou muito cumbersome para anotar."
Chen enfatizou o impacto mais amplo: "A descoberta científica sempre dependeu de encontrar representações simplificadas de processos complicados. Temos cada vez mais os dados brutos necessários para entender sistemas complexos, mas não as ferramentas para transformar essa informação nas regras simplificadas de que os cientistas dependem. Preencher essa lacuna é essencial."
Financiado pela National Science Foundation, Army Research Office e DARPA, o trabalho avança para "machine scientists" para descoberta automatizada. Planos futuros incluem otimizar a coleta de dados para experimentos e expandir para multimídia como vídeo e áudio de sistemas biológicos.