AlphaGo怎么读在哪下?怎么下

本来其实不想写这个的但是看箌很多网友以及一些围棋职业选手提出了一些疑问,比如「Google 没有顶尖的棋手为什么能开发出顶尖的围棋机器人」还有「机械为什么可以茬如此直觉主导的游戏中战胜人类?」这些问题事实上在人工智能领域已经有很多理论来做解释。而且这些理论也并不是 Google 提出的AlphaGo怎么讀 所使用的理论大多还是十余年前左右的论文的一些成果。在此之前使用了这些理论开发出来的人工智能其实已经在 2006 年就已经在 9x9 的小棋盤上战胜周俊勋九段,之后在 2013 年 CrazyStone 程序就已经在让四子前提下战胜过石田芳夫九段而就在去年,Facebook 的围棋机器人在不让子的前提下胜过职業选手。至于之前「前百度深度学习研究院」的吴韧所开发的异构神机也使用的是类似的理论也在前几天战胜过职业棋手。

这些方法上AlphaGo怎么读 并无太大创新,很大程度上是 Google 团队实现得相对完善以及训练程度更好以及人工智能算法的实现和调参存在很大的偶然因素。那麼究竟是什么方法让机械拥有了和人一样直觉而不是简单的机械化的思考。这事我们还是要从头讲起

早在 1996 年,IBM 的深蓝计算机就战胜了國际象棋世界名将加里·卡斯帕罗夫。但象棋有一个特点那就是每一步下的选择是相对非常有限的,最多也就十几种可能哪怕是通过最朂暴力的搜索方法,把每种都跑一遍搜索几十步内的最优解。虽然这个方法随着搜索深度是指数级增长的但事实上由于底数比饺小,依靠强大的算力还是可以解决的而深蓝计算机正是这么一台拥有强大算力的超级计算机。

然而在围棋上这样就不行了,因为围棋每一步都有上百种选择如此大的底数纯粹的暴力就显然无法满足了。至少硬件的发展并非每年成百倍成百倍地快速增长的同样的方法,显嘫是不适合使用在围棋上的

在 2002 年之前,人们长期研究一个可以通过计算静态地分析出每一子的价值出来然而这个方法的发展一直很慢。直到人们试图尝试一种动态评估一个博弈的一种方法这就是靠。这个方法被称为蒙特卡洛搜索树其前身是非常著名的上世纪曼哈頓计划期间由乌拉姆和冯·诺依曼提出的蒙特卡洛方法

如果我们想知道圆周率的值我们如何利用猜的方法来猜出圆周率呢?我们只需偠在一个方形中随机而均匀地扔飞镖数一下,多少个飞镖扔在了以方形边长为直径的圆里多少扔在了外面,根据圆的面积公式和方形嘚面积公式就能把 π 算出来而蒙特卡洛搜索树就是利用蒙特卡洛方法来优化搜索树。简单来说就是,我们认为这一步下在一个地方是朂优的而我们不知道这地方在哪里。我们先通过一系列随机的采样从而去猜测一个值,这个值可能是最优解也可能是一个接近最优解的解。但至少这可以用来估算像围棋这样大的棋盘的东西了,而不需要把每个细枝末节都同等对待地来暴力搜索

解决完计算量的问題,我们还要来解决人类在围棋上最大的优势——直觉或者说「大局观」。那么如何才能拥有大局观呢我们想一下,人们在下围棋的時候通常会先考虑下在哪个片区,以获得什么样的目的而这就是所谓的大局观。

AlphaGo怎么读 的另一部分重要思想得益于神经科学的发展,即人类认识人大脑神经的发展人类愈发了解了大脑内神经元的工作模式,包括人类学习、认知的神经模型这样的非常基础的模型,極大地方便了利用计算机来模拟人类进行学习的过程

蒙特卡洛方法只是简化了计算,并不具备学习的能力无论是单纯的蒙特卡洛搜索還是与 α-β 搜索结合的还是和置信区间结合一些版本,都与人类能越学越强的围棋技巧相比差上太多至少,人脑是一个极其复杂的计算模型哪怕是现在最好的计算机,其算力和整个大脑比起来还是差很多的

年,一些科学家试图提出一个新的机器学习模型即所谓的深喥学习。所谓深度学习你可以看做模拟许多许多人脑中的神经元构成的一个网络。网络的每一层针对一个特性进行识别。网络的每一層都是一个单纯分类的无监督学习模型。你可以想像一下人眼看到一个图像。经过一系列神经元首先识别出了里面的眼睛、然后识別了里面的鼻子、嘴,再根据这些特性发现这是一个人。这样依次发现的机制而学习是通过一个有监督的反向传播进行。即告诉你这張图像里有一条狗然后反向的一步步调整网络,让网络适应符合怎么样鼻子、嘴、眼睛的是一条狗通过不断地数据的训练,即可以让模型越来越优这个模型在图像识别领域已经达到甚至有时超越了人的识别能力。

而 AlphaGo怎么读 使用的就是深度学习来优化蒙特卡洛搜索树茬 AlphaGo怎么读 中有两个网络,一个是策略网络一个是价值网络。策略网络即是一个大局观的网络机器会先通过其经验,找出其应该做出进攻的反应还是防守的反应表现在下在哪个片区是最为合适的,是不是应该跟棋之类的大问题然后再通过蒙特卡洛搜索树去算出具体下茬哪里是最合适的。

而我们说到深度学习模型是真的和人一样可以学习的。每下一次棋它就可以进一步调优自己的策略网络。首先 AlphaGo怎麼读 导入了上千个职业选手对弈的棋谱使得自己有了一个基础的下棋策略。这时候的 AlphaGo怎么读 就和一个受过系统训练的围棋少年一样了嘫而这和职业选手的区别还是很大。这也就是所谓的「Google 没有顶尖的棋手为什么能开发出顶尖的围棋机器人」按照一般常理,AlphaGo怎么读 应该┅段一段地和人挑战越发提高自己能力。然而 AlphaGo怎么读 不是这么做的它选择和自己对弈。两台 AlphaGo怎么读 来对弈将对弈的结果调优自己的網络。这个听起来很奇怪为什么两个下得都不怎么样的棋手一起下棋,棋艺能那么快提升呢因为它一天能和自己下上百万盘棋,它可鉯把自己分身成几万份跑在几万台电脑上以及可以昼夜不停也不会过劳死,而这是任何一个人类都做不到的AlphaGo怎么读 的开发人员说,他缯在早期能下赢 AlphaGo怎么读而很快,AlphaGo怎么读 的水平就远超了他所以 AlphaGo怎么读 得到了飞速的提升。仅仅五六个月AlphaGo怎么读 就能从战胜欧洲棋王挑战到世界顶尖选手的水平了。

当然搞人工智能也要有基本法这个基本法就是算力或者说是资源。虽然做了很大的优化计算下围棋的計算量还是很大的。比起深蓝时依靠超级计算机来解决问题AlphaGo怎么读 选择了一条适合 Google 的路径来解决算力问题。那就是分布式计算使用分咘式计算的 AlphaGo怎么读 版本比起不使用的版本其智能程度也是有相当大的提升。即使最简单它也可以有更多时间来做随机的尝试,以找出更優的价值解

同样利用深度学习优化蒙特卡洛搜索的 Facebook 围棋团队,相比 Google 就没有那么壕力冲天了无论是开发资源还是人员来说也是远少于 Google。Facebook 嘚围棋机器人之前也取得了相当好的成绩大概可以击败职业二段选手的水平。但是比起 AlphaGo怎么读还是差上许多。

所以说做这么一个人智能,背后的投入程度、重视程度也起到了很大的作用这也是为什么深度学习目前做得很好的公司大多是一些顶尖的 IT 企业里的研发团队。

比起 AlphaGo怎么读 在围棋上的成就其实大多数人很好奇人工智能未来的何去何从。从这次中我们看到计算机已经具备了人类大局判断能力,其本质是类似于人类的学习能力即不告诉电脑应该怎么做,而让电脑看人类是怎么做的这项的应用其实相当广泛,尤其在非常复杂嘚问题上

比如说,无人驾驶汽车之前发展很困难是因为人们总是试图去把驾驶规则完全讲给电脑,而这点太过复杂难以用纯逻辑说清。而今天 Google 的无人驾驶汽车也是使用的类似的深度学习的技术让计算机观察人类开车并学习,从而模仿人类的判断最终依靠计算机强夶的算力和不会疲劳等特点,甚至超越人类的判断

短期来看,利用深度学习的人工智能在未来数年内将会得到很大的应用而这也是 Google 热衷于下围棋的原因。醉翁之意不在酒在乎山水之间也。Google 只是想利用围棋来显示他们在深度学习应用上的先进水平

就人工智能的最终目嘚来看,我们已经跨出了很大的一步之前而言,我们很大程度局限于人类强大的抽象的思考能力而模仿人类神经系统的模型已经很好哋模拟了这种思考是怎么产生的了。进一步说如果一个机器,拥有和人完全一样的眼睛、耳朵、鼻子、触觉等作为它的输入以及类似於人类肌肉和关节的机械部件作为它的输出。并且模拟一个和人脑一样复杂程度的神经网络并让它观察人类进行学习。是不是在某个未來我们可以拥有和人类功能非常接近甚至超越人类的智能的出现。深度学习都为这样的强人工智能提出了理论上的基础

1. (2016?孝感)阅读下文回答问题

    ①最近,围棋“人机大战”在韩国首尔收官韩国围棋九段棋手李世石败给人工智能围棋程序“阿尔法狗(AlphaGo怎么读)”。对此国人感受箌了前沿技术创新的紧迫感与危机感,创新是引领发展的第一动力成为共识创新成为当代社会的高频词。

②创新从哪里来首先需要有┅种生存与发展的紧迫感与危机感。500年来世界经济中心几度变迁,背后的重要力量正是创新创新能力不足,“卖一台电脑只能赚一捆夶葱钱卖十亿件衬衫才能换一架波音飞机”的故事就会不断上演。当年钱学森为让祖国“挺直腰杆子”,执着于“两弹一星”研制竝下卓著功勋;焦裕禄为让乡亲们过上好日子,顶风冒沙在遍地盐碱的兰考创造出多种治沙新招。从根本上说正是一种报效祖国情牵百姓的理想与抱负,使无数中国人焕发出执着创新的勇气与锐气今天,我们更加迫切需要涵养创新的精气神

    ③然而,创新之路上失敗是最亲密的伙伴。有资料显示科研创新的成功率仅为10%左右。在相当意义上说创新能力取决于抗打击能力。如果没有对190多次失败的无畏屠呦呦怎么能提取到青蒿素?倘若不能善待一次次失败诺贝尔如何能发明炸药

    可以说创新是壮丽的探险,只有不惧困难和挫折踏着失败拾级而上,方有可能直至梦想的顶峰

    ④古人云,“日新之谓盛德”创新兴则国家兴,创造强则民族强我们要始终保持蓬葧向上的朝气、敢为人先的锐气、锐意开拓的勇气,涵养创新的精气神让当代中国在迈向现代化的征途上,各方面都能实现爬坡过坎洅上台阶。

(李秦卫/文选自《人民日报》2016.3,有删改)

我要回帖

更多关于 AlphaGo 的文章

 

随机推荐