Un stagiaire se souvient de la création d'AlphaGo à l'occasion de son 10e anniversaire

Dix ans après la victoire de AlphaGo de Google DeepMind sur le champion de Go Lee Sedol, Chris Maddison revient sur son rôle de stagiaire dans le développement de cette IA révolutionnaire. La victoire de 2016 à Séoul a marqué un moment décisif dans l'intelligence artificielle, démontrant le potentiel des réseaux de neurones à surpasser l'intuition humaine dans les jeux complexes. Maddison, aujourd'hui professeur à l'Université de Toronto, met en lumière les principes technologiques durables derrière AlphaGo qui influencent les systèmes modernes comme les grands modèles de langage.

En mars 2016, AlphaGo de Google DeepMind s'est affronté à Lee Sedol, le meilleur joueur mondial de Go, dans une série de cinq matchs à Séoul, en Corée du Sud. L'IA l'a emporté 4-1, choquant les observateurs par son jeu intuitif. Comme l'a noté Sergey Brin à l'époque, « AlphaGo possède réellement une intuition. Il produit des coups magnifiques. Il crée même des coups plus beaux que la plupart d'entre nous ne pourraient en imaginer. » Lee Sedol a déclaré plus tard qu'il était « en état de choc ».Chris Maddison, alors étudiant en master, a rejoint le projet en tant que stagiaire à l'été 2014 après qu'Ilya Sutskever l'ait convaincu en une demi-seconde avec un argument reliant l'expertise en Go aux capacités des réseaux de neurones — comparable à un passage avant du cortex visuel, comme démontré dans ImageNet. Travaillant avec Aja Huang et David Silver, Maddison a construit des réseaux de neurones entraînés sur des parties d'experts pour prédire le coup suivant. Cette approche simple a réussi là où d'autres avaient échoué ; à la fin de l'été, ses réseaux ont battu Thore Graepel, un chercheur de DeepMind et joueur de Go correct.La complexité du Go, avec 10^171 positions possibles — dépassant de loin les 10^80 atomes de l'univers observable —, en faisait un défi redoutable. AlphaGo a progressé en jouant des millions de parties contre lui-même, découvrant des stratégies au-delà du jeu humain, comme l'a expliqué Pushmeet Kohli chez Google DeepMind : « En apprenant au travers de ces parties, il pouvait découvrir de nouvelles connaissances et dépasser les joueurs de niveau humain. »Maddison a quitté l'équipe avant les matchs pour poursuivre son doctorat, mais a consulté à distance. À Séoul, l'atmosphère était électrique ; des foules bordaient les trottoirs pour suivre les parties sur de grands écrans, tandis que des centaines de millions de personnes en Chine étaient branchées. Il se souvient qu'Aja Huang décrivait Lee Sedol comme « une pierre de Dieu », soulignant l'écart qu'ils ont franchi.L'héritage d'AlphaGo perdure. Noam Brown chez OpenAI a déclaré : « AlphaGo a définitivement montré que les réseaux de neurones peuvent exceller en reconnaissance de motifs mieux que les humains. Ils peuvent fondamentalement posséder une intuition surpassant celle des humains. » Sa méthode — pré-entraînement sur de vastes données comme des parties de Go ou du texte internet, suivi d'un apprentissage par renforcement pour s'aligner sur des objectifs — reflète celle des grands modèles de langage. Parmi ses successeurs figurent AlphaFold, qui a obtenu le prix Nobel de chimie pour la prédiction des protéines, et AlphaProof, qui a réalisé une performance de niveau médaille d'or à l'Olympiade internationale de mathématiques.Cependant, des défis subsistent : les réseaux de neurones sont des boîtes noires, comme l'illustre le coup 37 inexpliqué d'AlphaGo, qui a initialement déconcerté les spectateurs. Le progrès dépend de données abondantes et de signaux de récompense clairs, en particulier dans des domaines comme les mathématiques et la programmation. Maddison a exprimé sa sympathie pour Lee Sedol, qui s'est excusé auprès de l'humanité après sa défaite et n'a pas pu analyser traditionnellement la partie avec l'IA. Néanmoins, il voit l'IA enrichir l'appréciation humaine de jeux comme le Go et les échecs, préservant leur vocation culturelle au-delà de la simple victoire.

Articles connexes

Sony AI robot Ace defeating a professional table tennis player on an Olympic-sized court.
Image générée par IA

Sony's AI robot Ace beats professional table tennis players

Rapporté par l'IA Image générée par IA

Sony AI's table tennis robot Ace has challenged and sometimes defeated professional human players at an expert level. A study published Wednesday in Nature details how it learned via reinforcement learning and performed on an Olympic-sized court at Sony's Tokyo headquarters. The robot uses nine camera eyes to track the ball's spin by its logo.

Former Go champion Lee Sedol will meet artificial intelligence again on Monday, nearly a decade after his landmark match against Google's AlphaGo. This time, the encounter emphasizes collaboration over competition. Lee will work with an agentic AI to create a Go game model.

Rapporté par l'IA

President Lee Jae-myung met Demis Hassabis, co-founder and CEO of Google DeepMind, in Seoul on April 27 to discuss the responsible use of artificial intelligence and global partnerships. They shared views that AI could powerfully address global challenges like low growth, climate crisis, and health care, while posing risks such as abuse in warfare or deepening inequality. The government partnered with DeepMind under its K-Moonshot initiative for AI-led science innovation.

California-based Generalist AI has launched Gen-1, a new physical AI model that enables robots to handle tasks like folding laundry, fixing other robots and stuffing cash into wallets. The model draws on human dexterity data collected worldwide to teach robots 'physical common sense.' Co-founder Pete Florence described it as a major advance for real-world robotics.

Rapporté par l'IA

Google DeepMind has acquired a minority stake in Fenris Creations, the developer of the long-running space simulation Eve Online, to train its AI models on player behavior in the game's complex universe.

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser