Un stagiaire se souvient de la création d'AlphaGo à l'occasion de son 10e anniversaire

Dix ans après la victoire de AlphaGo de Google DeepMind sur le champion de Go Lee Sedol, Chris Maddison revient sur son rôle de stagiaire dans le développement de cette IA révolutionnaire. La victoire de 2016 à Séoul a marqué un moment décisif dans l'intelligence artificielle, démontrant le potentiel des réseaux de neurones à surpasser l'intuition humaine dans les jeux complexes. Maddison, aujourd'hui professeur à l'Université de Toronto, met en lumière les principes technologiques durables derrière AlphaGo qui influencent les systèmes modernes comme les grands modèles de langage.

En mars 2016, AlphaGo de Google DeepMind s'est affronté à Lee Sedol, le meilleur joueur mondial de Go, dans une série de cinq matchs à Séoul, en Corée du Sud. L'IA l'a emporté 4-1, choquant les observateurs par son jeu intuitif. Comme l'a noté Sergey Brin à l'époque, « AlphaGo possède réellement une intuition. Il produit des coups magnifiques. Il crée même des coups plus beaux que la plupart d'entre nous ne pourraient en imaginer. » Lee Sedol a déclaré plus tard qu'il était « en état de choc ».Chris Maddison, alors étudiant en master, a rejoint le projet en tant que stagiaire à l'été 2014 après qu'Ilya Sutskever l'ait convaincu en une demi-seconde avec un argument reliant l'expertise en Go aux capacités des réseaux de neurones — comparable à un passage avant du cortex visuel, comme démontré dans ImageNet. Travaillant avec Aja Huang et David Silver, Maddison a construit des réseaux de neurones entraînés sur des parties d'experts pour prédire le coup suivant. Cette approche simple a réussi là où d'autres avaient échoué ; à la fin de l'été, ses réseaux ont battu Thore Graepel, un chercheur de DeepMind et joueur de Go correct.La complexité du Go, avec 10^171 positions possibles — dépassant de loin les 10^80 atomes de l'univers observable —, en faisait un défi redoutable. AlphaGo a progressé en jouant des millions de parties contre lui-même, découvrant des stratégies au-delà du jeu humain, comme l'a expliqué Pushmeet Kohli chez Google DeepMind : « En apprenant au travers de ces parties, il pouvait découvrir de nouvelles connaissances et dépasser les joueurs de niveau humain. »Maddison a quitté l'équipe avant les matchs pour poursuivre son doctorat, mais a consulté à distance. À Séoul, l'atmosphère était électrique ; des foules bordaient les trottoirs pour suivre les parties sur de grands écrans, tandis que des centaines de millions de personnes en Chine étaient branchées. Il se souvient qu'Aja Huang décrivait Lee Sedol comme « une pierre de Dieu », soulignant l'écart qu'ils ont franchi.L'héritage d'AlphaGo perdure. Noam Brown chez OpenAI a déclaré : « AlphaGo a définitivement montré que les réseaux de neurones peuvent exceller en reconnaissance de motifs mieux que les humains. Ils peuvent fondamentalement posséder une intuition surpassant celle des humains. » Sa méthode — pré-entraînement sur de vastes données comme des parties de Go ou du texte internet, suivi d'un apprentissage par renforcement pour s'aligner sur des objectifs — reflète celle des grands modèles de langage. Parmi ses successeurs figurent AlphaFold, qui a obtenu le prix Nobel de chimie pour la prédiction des protéines, et AlphaProof, qui a réalisé une performance de niveau médaille d'or à l'Olympiade internationale de mathématiques.Cependant, des défis subsistent : les réseaux de neurones sont des boîtes noires, comme l'illustre le coup 37 inexpliqué d'AlphaGo, qui a initialement déconcerté les spectateurs. Le progrès dépend de données abondantes et de signaux de récompense clairs, en particulier dans des domaines comme les mathématiques et la programmation. Maddison a exprimé sa sympathie pour Lee Sedol, qui s'est excusé auprès de l'humanité après sa défaite et n'a pas pu analyser traditionnellement la partie avec l'IA. Néanmoins, il voit l'IA enrichir l'appréciation humaine de jeux comme le Go et les échecs, préservant leur vocation culturelle au-delà de la simple victoire.

Articles connexes

Former Go champion Lee Sedol will meet artificial intelligence again on Monday, nearly a decade after his landmark match against Google's AlphaGo. This time, the encounter emphasizes collaboration over competition. Lee will work with an agentic AI to create a Go game model.

Rapporté par l'IA

Le système d'intelligence artificielle AlphaFold de Google DeepMind a célébré son cinquième anniversaire, continuant d'évoluer après avoir révolutionné la biologie et la chimie. Le projet a reçu le prix Nobel de chimie l'an dernier pour ses contributions novatrices. WIRED a récemment discuté de sa trajectoire avec Pushmeet Kohli de DeepMind.

At the AGI-Next summit in Beijing, Alibaba AI scientist Lin Junyang warned that China has less than a 20% chance of exceeding the US in artificial intelligence over the next 3 to 5 years due to resource limits. He pointed out the gap, with US firms like OpenAI pouring massive computational resources into next-generation research while China is stretched thin just meeting daily demands.

Rapporté par l'IA

Une étude appliquant l’examen d’entrée à l’université chilien, PAES 2026, aux modèles d’IA montre que plusieurs systèmes obtiennent des scores suffisamment élevés pour des programmes sélectifs comme la médecine et l’ingénierie civile. Gemini de Google a mené avec des moyennes proches de 950 points, surpassant des rivaux comme ChatGPT. L’expérience souligne les progrès de l’IA et soulève des questions sur l’efficacité des tests standardisés.

 

 

 

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser