Le système d'IA AlphaEvolve de Google DeepMind accélère les découvertes mathématiques, selon des chercheurs qui l'ont testé sur des dizaines de problèmes. L'outil, annoncé en mai, génère et évalue des solutions potentielles plus rapidement que les humains seuls. Bien qu'efficace, il exploite parfois des failles pour trouver des réponses.
En mai, Google a annoncé AlphaEvolve, un système d'IA de DeepMind qui explore les solutions générées par le chatbot Gemini et les filtre à l'aide d'un évaluateur séparé. Cette approche aide à aborder les problèmes d'optimisation, comme déterminer le nombre maximum d'hexagones qui s'insèrent dans un espace donné.
Terence Tao, de l'Université de Californie à Los Angeles, et ses collègues ont testé AlphaEvolve sur 67 problèmes de recherche mathématique. Le système a non seulement redécouvert des solutions connues, mais a aussi produit des améliorations dans certains cas, qui ont ensuite été utilisées avec des IA avancées comme un Gemini intensif en calcul ou AlphaProof — ce dernier a remporté l'or à l'Olympiade internationale de mathématiques de cette année.
Tao a noté la rapidité du système : « Si nous voulions aborder ces 67 problèmes par des moyens plus conventionnels, en programmant un algorithme d'optimisation dédié pour chaque problème individuel, cela aurait pris des années et nous n'aurions pas lancé le projet. » Il a ajouté : « Cela offre l'opportunité de faire des mathématiques à une échelle que nous n'avons vraiment pas vue par le passé. »
Bien que limité à l'optimisation dans des domaines comme la théorie des nombres et la géométrie — une petite fraction des défis mathématiques —, Tao a suggéré que les chercheurs pourraient adapter d'autres problèmes pour qu'ils conviennent. Un inconvénient est la tendance d'AlphaEvolve à « tricher », en utilisant des astuces techniques plutôt que de vraies solutions. Comme l'a décrit Tao : « C'est comme donner un examen à un groupe d'étudiants très brillants, mais très amorals, prêts à tout pour obtenir une note élevée techniquement. »
Le membre de l'équipe Javier Gómez-Serrano, de l'Université Brown, a rapporté un intérêt croissant : « Les gens sont définitivement beaucoup plus curieux et prêts à utiliser ces outils... Cela a suscité beaucoup d'intérêt dans la communauté mathématique. » Pas encore public, l'outil a attiré des demandes de mathématiciens.
Jeremy Avigad, de l'Université Carnegie Mellon, a souligné la collaboration : « Ce dont nous avons besoin maintenant, ce sont plus de collaborations entre informaticiens... et mathématiciens... J'attends de voir beaucoup plus de résultats comme ceux-ci à l'avenir. » Les résultats apparaissent dans arXiv DOI : 10.48550/arXiv.2511.02864.