围棋,最早据说是秦始皇为指导他儿子发明的。它的规则简单有限:棋分黑白,执黑子棋手先下,使用棋子在19*19的网格棋盘来圈地盘,最后谁在棋盘上占的地盘多,谁就获胜。
但在看似简单的规则背后,围棋实际上是一项非常讲究策略的博弈游戏。在至今2千多年的发展历史中,纵然偶有佼佼者出现,但都未达到“围棋之神”的境界。
直到年,一个名为AlphaGo的计算机程序横空出世,大杀四方。
在短短25个月的时间里(年10月,AlphaGo正式公开与人类对弈),AlphaGo斩落了中日韩的顶尖围棋高手,不断地挑战了人类对围棋的认知,让人大开眼界,叹为观止。人类棋手更是经历了难以置信、震惊、震撼,再到最后转为拜它为师,奉之为“围棋之神”的过程。
如今,AlphaGo教学工具上线,更多的人可以通过它来学习下围棋。从挑战人类,到无人能及,再到回馈人类,AlphaGo的使命已经完成。那么它是如何走到这一步,对人类围棋历史又做出了什么样的贡献?
从备受轻视到惊艳世人
年年末,欧洲围棋冠军、职业围棋二段樊麾在接到DeepMind的邀请,希望他能到伦敦与计算机程序下棋时,他想得非常简单,也很有自信。樊麾那时的自信不是没有道理。即便年,IBM用暴力算法赢下国际象棋第一人卡斯帕罗夫后,人类仍坚信围棋这项古老的游戏,对于计算机而言还有很长的路要走。
因为在19*19的棋盘上,可走的粗略的数目估计为10^。它大概是我们可见宇宙中所有原子总和(大概在10^80的数量级)的倍那么多。在围棋数百回合中,任一回合大约有种下法,也被称为分支因子。因为选择其中任一种下法又将会出现种可能的下法,以此往复直到游戏结束。这意味着围棋是无法采取数学意义上的暴力算法。
另外,每位围棋选手都知道,围棋局部小的战术可能在后面的对弈中会产生巨大的战略影响。围棋还有足够多的定式,围棋选手会说到一些特征,例如梯子、墙和假眼,这些都是从规则中有机演化出来的,而不是规则规定的。同时,围棋也很讲究选手在下棋时的气势,这些对于冰冷的机器而言,很难掌握。
要解决上面这些难题,至少在AlphaGo出现前,人们认为至少需要10年的研究。只是这一次,人类真的低估AlphaGo了。
在5盘的对弈中,樊麾很快败下阵来,而且输得让他不忍看赛后媒体对他的评价。不过,很快地,作为第一个真正感受到AlphaGo实力的人,樊麾加入了DeepMind团队,一起为提升它的技能努力。
年1月份,《自然》杂志发表了DeepMind关于AlphaGo的第一篇论文,重点阐述了如何通过神经网络和蒙特卡洛树搜索让计算机程序掌握下围棋的方法。这篇文章引起的波澜不小,但更多人愿意讨论的是,当时DeepMind宣布,将在3月份,挑战围棋职业九段、韩国棋手李世石。
北京时间年3月9日下午3点31分,韩国首尔,谷歌旗下人工智能公司DeepMInd开发的智能系统AlphaGo(阿尔法围棋)和韩国职业围棋选手李世石九段的第一场比赛正式结束。本文图片均为视觉中国资料图
“围棋是这个世界上历史最悠久的桌游,最简单,也最抽象。人工智能长久以来面临的一项挑战,就是击败专业围棋选手。我们在人工智能中尝试过的所有方法,都无法解决围棋问题。棋盘上可能的排列组合,比宇宙中的原子数还多。但AlphaGo学会了下围棋。到目前为止,AlphaGo完成了所有我们设计的挑战。但在它对阵当时最强的棋手,比如李世石之前,我们还无从了解它的真正实力。”这是《AlphaGo》纪录片在回顾这场对决前的描述。
确实,关于这场比赛,包括中国围棋界在内,很多人对李世石抱有更多的信心。即便在李世石输掉前2局比赛后,当今世界围棋第一人柯洁仍对人类信心十足,他在自己的微博上写到:“就算阿尔法狗战胜了李世石,但它赢不了我”。最终的比分定格在4:1,如果不是第四盘,李世石下出“神来一手”,抓住AlphaGo的漏洞,比分可能会更悬殊。
挑落职业棋手,AlphaGo引来了全球的