عشر سنوات بعد أن هزم ألفا غو التابع لـ Google DeepMind بطل الغو لي سيدول، يتأمل كريس ماديسون في دوره كمتدرب في تطوير هذا الذكاء الاصطناعي الرائد. شكّل انتصار 2016 في سيئول لحظة محورية في الذكاء الاصطناعي، موضحًا إمكانية الشبكات العصبية على تجاوز الحدس البشري في الألعاب المعقدة. ماديسون، الذي أصبح الآن أستاذًا في جامعة تورونتو، يبرز المبادئ التكنولوجية الدائمة وراء ألفا غو والتي تؤثر على الأنظمة الحديثة مثل نماذج اللغة الكبيرة.
في مارس 2016، واجه ألفا غو التابع لـ Google DeepMind لي سيدول، أفضل لاعب غو في العالم، في سلسلة من خمس مباريات في سيئول، كوريا الجنوبية. فاز الذكاء الاصطناعي 4-1، مُذهلاً الملاحظين بلعبه الحدسي. كما لاحظ سيرجي برين في ذلك الوقت، «ألفا غو لديه حدس حقيقي. يقوم بحركات جميلة. بل يخلق حركات أجمل مما يمكن لمعظمنا التفكير فيها». وقال لي سيدول لاحقًا إنه كان «في صدمة»؟n?nكريس ماديسون، الذي كان طالب ماجستير آنذاك، انضم إلى المشروع كمتدرب في صيف 2014 بعد أن أقنعه إيليا سوتسكيفر بحجة تربط خبرة الغو بقدرات الشبكات العصبية في نصف ثانية—مماثلة لتمرير الأمامي في القشرة البصرية، كما أثبت في ImageNet. عمل مع آجا هوانغ وديفيد سيلفر، وبنى ماديسون شبكات عصبية مدربة على ألعاب الخبراء للتنبؤ بالحركة التالية. نجح هذا النهج البسيط حيث فشل الآخرون؛ بحلول نهاية الصيف، هزمت شبكاته ثور غرابل، باحث في DeepMind ولاعب غو جيد.n?nتعقيد الغو، مع 10^171 موضعًا ممكنًا—يتجاوز بكثير 10^80 ذرة في الكون المرصود—جعله تحديًا هائلًا. تقدم ألفا غو بلعب ملايين الألعاب ضد نفسه، مكتشفًا استراتيجيات تتجاوز اللعب البشري، كما شرح بوشميت كولي في Google DeepMind: «من خلال التعلم عبر هذه الألعاب، يمكنه اكتشاف معرفة جديدة وتجاوز لاعبي المستوى البشري».n?nغادر ماديسون الفريق قبل المباريات لمتابعة الدكتوراه لكنه استشار عن بعد. في سيئول، كانت الأجواء مشحونة؛ تجمعت الحشود على الأرصفة تشاهد المباريات على شاشات كبيرة، مع مئات الملايين في الصين يشاهدون. تذكّر وصف آجا هوانغ لي سيدول بأنه «حجر واحد من الله»، مُبرزًا الفجوة التي عَبَروها.n?nيستمر إرث ألفا غو. قال نوام براون في OpenAI: «أظهر ألفا غو بشكل قاطع أن الشبكات العصبية يمكنها التعرف على الأنماط أفضل من البشر. يمكنها أساسًا أن تمتلك حدسًا يتجاوز البشر». طريقته—التدريب المسبق على بيانات هائلة مثل ألعاب الغو أو نصوص الإنترنت، متبوعًا بالتعلم التعزيزي للتوافق مع الأهداف—يعكس نماذج اللغة الكبيرة. الخلفاء يشملون AlphaFold، التي حازت جائزة نوبل في الكيمياء للتنبؤ بالبروتينات، وAlphaProof، الذي حقق أداءً بميدالية ذهبية في الأولمبياد الدولي للرياضيات.n?nومع ذلك، تبقى التحديات: الشبكات العصبية صناديق سوداء، كما في الحركة 37 غير المفسرة لألفا غو، التي حيّرت المتفرجين في البداية. يعتمد التقدم على بيانات وفيرة وإشارات مكافأة واضحة، خاصة في مجالات مثل الرياضيات والبرمجة. عبر ماديسون عن تعاطفه مع لي سيدول، الذي اعتذر للبشرية بعد الخسارة ولم يتمكن من مراجعة المباراة تقليديًا مع الذكاء الاصطناعي. ومع ذلك، يرى أن الذكاء الاصطناعي يعزز تقدير البشر للألعاب مثل الغو والشطرنج، محافظًا على غرضها الثقافي خارج مجرّد النصر.