Une nouvelle étude montre que l'apprentissage par transfert peut réduire de plus d'un facteur dix les coûts de calcul nécessaires à la recherche d'une physique au-delà du modèle cosmologique standard. Cette approche consiste à entraîner l'IA d'abord sur des simulations simples avant de passer à des simulations complexes. Cependant, elle peut engendrer un transfert négatif qui entrave la détection d'effets véritablement novateurs.
Des chercheurs de l'Université de Princeton et du Flatiron Institute ont testé l'apprentissage par transfert dans le cadre de simulations cosmologiques. Ils ont pré-entraîné des réseaux neuronaux sur des modèles standard ΛCDM avant de les appliquer à des scénarios impliquant des neutrinos massifs ou une gravité modifiée.
Adrian Bayer, cosmologiste au Flatiron Institute et à l'Université de Princeton, a décrit cette méthode comme un raccourci évitant de s'entraîner directement sur les simulations les plus coûteuses. Veena Krishnaraj, première auteure de l'étude et étudiante de premier cycle à Princeton, a souligné que cette stratégie évite à l'IA d'avoir à assimiler toutes les données d'un seul coup.
L'équipe a identifié des cas de transfert négatif où les modèles pré-entraînés peinaient à distinguer les signaux d'une nouvelle physique des modèles familiers, comme ceux liés au paramètre σ8. Veena Krishnaraj a précisé que ce problème provient de dégénérescences physiques sous-jacentes et nécessite des mesures correctives.
Ces résultats, publiés dans le Journal of Cosmology and Astroparticle Physics, suggèrent que l'apprentissage par transfert pourrait appuyer les futures enquêtes, bien qu'il n'ait été testé jusqu'à présent que sur des simulations.