Google DeepMindのAlphaGoが囲碁チャンピオンのイ・セドルを破ってから10年、クリス・マディソンは画期的なAI開発におけるインターンとしての役割を振り返る。2016年のソウルでの勝利は人工知能の転機となり、ニューラルネットワークが複雑なゲームで人間の直感を超える可能性を示した。トロント大学の教授となったマディソンは、AlphaGoの背後にある持続的な技術原理が大規模言語モデルなどの現代システムに影響を与えている点を強調する。
2016年3月、Google DeepMindのAlphaGoは韓国ソウルの5番勝負で、世界トップの囲碁棋士イ・セドルと対局した。AIは4-1で勝利し、直感的な棋譜で観戦者を驚愕させた。当時セルゲイ・ブリンは「AlphaGoには実際に直感がある。美しい手を指す。私たちの多くが思いつくよりも美しい手を生み出す」と述べた。イ・セドルは後に「ショックだった」と語った。 んnクリス・マディソン、当時修士学生だった彼は、2014年夏にイリヤ・サツケヴァーの説得でプロジェクトのインターンとして参加した。サツケヴァーは0.5秒で囲碁の専門知識をニューラルネットワークの能力に結びつける議論を展開し、それはImageNetで証明された視覚野のフォワードパスに相当するとした。アジャ・フアンとデイビッド・シルバーらと協力し、マディソンは専門家対局で訓練された次の一手を予測するニューラルネットワークを構築した。このシンプルな手法は他者の失敗した箇所で成功し、夏末にはDeepMind研究者でそこそこの囲碁強者のトーレ・グレープルをネットワークが破った。 んn囲碁の複雑さは可能な局面が10^171——観測宇宙の原子10^80を遥かに超える——で、苛烈な挑戦だった。AlphaGoは自身との数百万局の自己対局で進化、人間を超える戦略を発見した、とGoogle DeepMindのプッシュミート・コリが説明する。「これらの対局を通じて学習することで、新たな知識を発見し、人間レベルを超えることができた。」 んnマディソンは対局前に博士課程のためチームを離れたが、リモートで相談に乗った。ソウルでは熱気が凄く、群衆が歩道に溢れ大型スクリーンで観戦、中国では数億人が視聴した。彼によると、アジャ・フアンはイ・セドルを「神の一子」と評し、彼らが橋渡しした格差を象徴した。 んnAlphaGoの遺産は持続する。OpenAIのノーム・ブラウンは「AlphaGoはニューラルネットが人間より優れたパターン認識が可能で、本質的に人間を超える直感を持てると決定的に示した」と述べる。その手法——囲碁対局やネットテキストのような大量データでの事前学習後、目標適合の強化学習——は大規模言語モデルを鏡写しする。後継に、タンパク質構造予測で化学分野ノーベル賞を受賞したAlphaFold、国際数学オリンピックで金牌級成績のAlphaProofがある。 んnしかし課題は残る:ニューラルネットワークはブラックボックスで、AlphaGoの説明不能な37手目が観客を当初困惑させたように。進展は豊富なデータと明確な報酬信号次第、特に数学・プログラミング分野で。マディソンは敗北後人類に謝罪し、AIとの伝統的棋譜並べができなかったイ・セドルに同情を示した。それでもAIは囲碁やチェスのようなゲームの人間的鑑賞を向上させ、勝利を超えた文化的意義を維持すると見る。