围棋master（如何看待在弈城围棋网出现的两大神秘高手Master(P)和刑天(P)）

本文目录

如何看待在弈城围棋网出现的两大神秘高手Master(P)和刑天(P)
有了Master这些强力的围棋AI，围棋运动长远来看是否会遇到象棋一样的问题
这几天出现在网络上的围棋高手Master究竟是谁是不是人类
为什么顶级围棋选手还可以和人工智能平分秋色而象棋选手却不能

如何看待在弈城围棋网出现的两大神秘高手Master(P)和刑天(P)

以后网上围棋肯定会出现更多的Master和刑天，见多了也就不神秘了。人类在围棋Al的磨练下，围棋理论和水平将进入一个新的境界，在AI不使用穷举法下棋的情况下，理论水平提升后的人类战胜AI也非不可能。我们更该关心的是：当身边而不是棋盘上出现Master和刑天时，我们将如何应对。

有了Master这些强力的围棋AI，围棋运动长远来看是否会遇到象棋一样的问题

高水平计算机象棋程序的普及，给象棋带来的影响有利有弊，总体来说是利大于弊，但也有不少麻烦。这些麻烦主要在于：

1. 因为大幅度拉近了大家的水平，所以开局逐渐变得单调无趣，和棋的概率也大大增加；

2. 网络对局和比赛中，无法禁止使用程序作“枪手”的现象，导致网络比赛失去意义；

3. 在手机上也可以运行的高水平程序普及后，会给现实比赛带来作弊可能。

围棋也会受到类似困扰，但在这几个问题上可能和象棋稍有不同：

1. 围棋没有和棋（或者说基本没有），AI的普及可能让大家水平更接近，但在无法和棋的情况下，只会让胜负的争夺更激烈。围棋的正解的“可能性空间”远比象棋大，不太可能出现象棋开局的严重单调化现象，某个阶段虽然会有单调化的倾向，但只要水平持续进步，总是会变得多样化的。

2. 网络对局和比赛会受到和象棋类似的冲击，实际上因为Leela等程序的提高，今年以后我们正处在这个尴尬的节点上。非比赛性质的网络对局倒是无所谓，毕竟爱好者下棋重要的是体验，当机械臂总是无聊的。

3. 职业比赛以前也是不允许看手机的，虽然当时没有超过人类的AI存在，但是也要避免外场高手指导内场啊。所以，现在只不过需要更加严厉的执行禁止电子器械进入赛场的规定。

其实，高水平AI的普及总体来说还是好处更多的，带给我们的困扰也就是少数几项，而且从长远来看并不会阻挡棋类的普及发展。

这几天出现在网络上的围棋高手Master究竟是谁是不是人类

这头条是找不到话题了吗？还来提元旦期间谷歌Alphago化名Master在腾讯围棋等网站枪挑顶尖棋手60盘全胜的事。

不过现在阿法狗金盆洗手了，现在最强的人工智能是腾讯公司的绝艺（骊龙），天天不知疲倦的指导人类顶尖棋手呢。虽胜率（90%）比阿法狗略低，但下的都是对人类有利得多的慢棋，master的60盘全是快棋

为什么顶级围棋选手还可以和人工智能平分秋色而象棋选手却不能

科普一下。现在人工智能的发展已经到了在各种棋类游戏中没有人能战胜的阶段。人类围棋的顶尖棋手和AlphaGoMaster的网络对战成绩是0:60。而Master还不是AlphaGo的最高级版本。而1997年IBM的深蓝战胜了等级分排名世界第一的棋手加里·卡斯帕罗夫。战绩 3.5:2.5 （2胜1负3平）。19年后Google的AlphaGo Master也战胜了等级分排名世界第一的棋手柯洁。

那么现在人类顶尖棋手和AI到底有多大差距呢？唯一战胜过AlphaGoLee的韩国著名顶尖棋手李世石的隐退棋是和韩国的AI韩豆下的。AI让两子，黑棋贴3又3/4子。在这种条件下开局AI的胜率已经无限接近于1%。但是结果还是AI2:1胜出了。

为什么AI会这么强大？它是怎么超越人类的呢？其实AI的成长过程一直是仿生的过程。所有的棋类比赛较量的都是规则下进行计算的能力。1997年版本的深蓝运算速度为每秒2亿步棋。1997年的深蓝可搜寻及估计随后的12步棋，而一名人类象棋好手大约可估计随后的10步棋。正如中国古代军事家孙子所说：“夫未战而庙算胜者，得算多也。未战而庙算不胜者，得算少也。多算胜，少算不胜，而况于无算乎！“ 。

那么为什么计算机要19年后才能在围棋上战胜人类呢？还是计算的问题。围棋对AI的挑战难点在棋盘空间。国际象棋的空间状态是1043。而围棋是10170个状态空间。这样的游戏具有高分支因子。围棋中的可能场景的数量要大于宇宙中的原子数。光照顾了棋局的宽度（变化）就照顾不了棋局的深度（考虑的步数）。所以围棋职业棋手2016年之前一致认为计算机不可能下过人类顶尖棋手。

从当时的情况看计算机确实是有点“机关算尽”了。于是科学家们开始研究新的思路。在资源有限的情况下人是怎么办的？最典型的例子是种花、果时要打尖、疏果。因为植物的营养是有限的。不打尖、疏果就不能得到好的结果。围棋棋盘上的空间状态虽然多但是每个空间状态的价值是不同的。所以对变化的计算要剪枝。问题转化为应该剪除谁？

解决这个问题的就是蒙特卡洛算法和神经元网络的深度学习。

什么是蒙特卡洛算法？举个例子：有一个箱子里边有无数个苹果。想找出最大的。但是人从外边看不到苹果的大小。每次可以随机取出一个。然后和上一次的比较。大的留下。这样重复100次、1000次之后是什么结果呢？留下的不一定是最大的苹果，但一定是在目前最接近最大苹果的苹果。

和蒙特卡洛算法对应的是拉斯维加斯算法。也举个例子：还是，一个箱子里边有无数把钥匙。想找出能打开一把锁的钥匙。还是每次可以随机取出一把来试。打不开扔掉。这样重复100次、1000次之后是什么结果呢？有可能碰上了，但是不保证一定能碰上。

人下棋时是通过过往的经验来做选择。AI也是通过过往的经验找出最接近正确答案的值给每一个选择点赋值。而人们看到的是每着的胜率。

AI是怎么给每一个选择点赋值的呢？这就离不开神经网络和深度学习。人能思考的物质基础是人的神经网络。AI的神经网络系统就是仿生的结果。有了这个物质基础就有了机器学习。深度学习是机器学习的一部分。深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力。深度学习是一个复杂的机器学习算法，又分为有监督学习和无监督学习。

老师留作业，学生做习题集。其实就是一种有监督学习。通过做题掌握了解题规律。于是考试时只要是做过的题型基本上都会。

现实生活中还常常会有这样的问题：缺乏足够的先验知识，因此难以人工标注类别或进行人工类别标注的成本太高。很自然地，我们希望计算机能代我们完成这些工作，或至少提供一些帮助。比如在没有计算机的情况下人通过对大量的数据长期观察思考，找到了克山病的原因。但是这个研究发现其规律的过程长达几十年。AI的无监督学习就是模拟人的这个学习过程。可以加快人们对未知事物的理解。

深蓝和阿尔法狗最初都是用人类的棋谱喂养的。比如战胜李世石的AlphaGo Lee就大约喂了16万人类棋谱和数万个人类人类总结的模式（定式）。但是最后开源的AlphaGo Zero则是从零开始通过“左右互搏”自己通过超过1亿对局自己悟出的围棋真谛。自学成才的AlphaGo Zero水平不但远超AlphaGo Lee，就连横扫千军的AlphaGo Master也不是AlphaGo Zero的对手。这就是职业棋手说的AlphaGo Lee的棋还能看出高明的地方（因为有人类的影子），AlphaGo Zero的棋则净是看不懂的地方。许多过去的共识被纠正。数以万计的定式被废弃。

2005年左右《围棋天地》曾经有一个栏目是访问一线棋手：如果有围棋上帝的话你和他有多大差距。记得当时一致的看法是让两子。而现在顶尖棋手和AI的差距已经差了两个子。那么AI是不是围棋上帝呢？肯定不是。它只是接近最优解，而不是最优解。也就是说AI只是相对真理，是绝对真理的一部分。它并没有穷尽真理。最好的例子就是“芈氏飞刀”。这个定式是在流行AI定式的大形势下人类发明的定式。最开始AI 也不认识，吃了亏后变成AI在一个时期里的常用定式。

AI 的发展还远没有达到尽头。从AlphaGo Lee到AlphaGo Zero都有一个习惯就是见好就收。前边优势很大但是当它算到怎么下都能赢的时候就会退让。最后只赢一两目。作为人类棋手的陪练这是不称职的。所以人类要给它增加个性。中国的AI星阵就加入了“不退让”的个性。

曾经有人预言AI会使围棋衰落。我不这么认为。古代无论东西方绘画都有追求像的趋势。但是当照相机出现后，画得再像也赶不上照相机。但是绘画仍然向前发展并没有衰落。只不过现在追求的是意境和感受了。围棋在商业因素的影响下从两日制演变到包干制的快棋。人的能力在哪摆着，棋的质量不可能不受影响。当信奉“天下武功唯快不破”的时代遇到任谁也快不过的AI。这种“快”还有意义吗？

娱体网

Nice to meet you, too!

围棋master