为什么神经网络算法现在这么火

34被浏览1515分享邀请回答17 条评论分享收藏感谢收起0添加评论分享收藏感谢收起2016年围棋为什么“突然”火了起来?
丹朱棋艺回龙观店&Lv.1& &
13263浏览 & &
  最近,网上谈论围棋的人突然多了起来,准确地说,是这几年围棋火起来了,特别是去年到现在,成为坊间热议的话题。我说围棋很火,可不是空穴来风,看完这五件事情,也许你就明白了。  第一件,2015年11月,常昊陪同李克强总理出访韩国。而据《体坛周报》报道,两年前常昊还受邀参加了习近平主席与韩国总统朴槿惠的晚宴。  第二件,从2015年11月至今,央视体育频道和中国围棋协会共同举办了一个民间争霸赛——《谁是棋王》。  第三件,谷歌公司研发的计算机围棋软件“阿尔法围棋”(以下简称“阿尔法”)挑战韩国李世石九段的五番棋比赛,昨天在韩国首尔打响。  第四件,一位号称“真疯叔叔”的人@棋圣聂卫平,说他可以让一个围棋零基础的人在六天的时间内升到业余1段水准,聂老师对此作出回应,“口出狂言说六天能到业余1段,我表示怀疑。”这件事情迅速发酵,在中外围棋界引起了不小的波澜。  第五件,央视体育频道播放的大型围棋纪录片——《围棋》,受到各界人士的热烈欢迎。五集纪录片《围棋》于3月7日—3月11日CCTV5,22:10,连续播出,每集50分钟。五集的名字分别是:问师、机变、启迪、手谈、气。  围棋与其他项目不同,围棋联系着哲学、数学、军事、教育、艺术、天文、等多种学科,是一门具有科学和艺术价值的体育项目。数千年来,不仅在中国得到绵延传承,传至国外之后,更是受到日本、韩国及至欧美等国家的喜爱。但在国内,围棋仍然是一个非常小众的项目,关注的人不多,学围棋的人更是有限。围棋“一夜之间”火起来的原因是什么呢?  围棋是文化交流的纽带  在中韩两国间,除了民间各项围棋交流频繁,两国间的“围棋外交”近些年也火热开展。  从2013年开始,两国高层就举行了中韩政界围棋交流赛,由中国政协委员与韩国国会议员进行围棋对抗赛。当时韩国《中央日报》就称:“韩国和中国可以用地球上最具智慧的游戏——围棋来增加友谊。”  据《博客天下》报道,大学毕业后,习近平曾担任军委秘书长耿飚的秘书。当时,围棋就是两人共同的爱好,而耿飚也让身边的工作人员学下围棋,训练他们的大局观。  据《人民网》2012年5月报道,在莫斯科大学的演讲中,李克强就谈道:“大家知道,中国人喜欢的围棋和俄罗斯人喜欢的象棋,都讲究谋势布局。我们现在谋的是中俄合作的大局,顺应的是世界和平、发展、合作的大势。”  学围棋对孩子是一种自我提升  (一) 可以提高注意力  少儿都有注意力不易集中的特点。小小棋盘能演出有声有色的“战局”,孩子们觉得很好玩,自己俨然成了指挥作战的“将军”,故而不分胜负是不肯罢休的。时间就在对局中一分一秒地过去,半小时不觉长,三刻钟也挺得住。这种承受能力的延长,大大有利于注意力的集中,由于注意力的集中,观察力、记忆力、想象力与思维力也随之增强。  (二) 可以提高洞察力  少儿时期对事物的观察往往是直觉的,往往需要教师家长进行有意的提醒与训练。围棋的黑白两子变化无穷,落子以后必须静观其变,洞察对手设下的陷阱与圈套,以便将计就计或乘虚而入。孩子们在这种无形阵中目不转睛地探索,便大大锻炼了对事物的洞察力,使他们多长几个“心眼”,这对他们学会认识复杂的世界是很有好处的。  (三) 可以提高记忆力  少儿记忆力比成人强,但记忆力也是训练出来的。围棋的术语词汇丰富,如:打、劫、气、势、长、立等,仅单词名称就有40多个;还有金角、银边、草肚皮等口诀和格言,
要全部记住背熟实属不易。由于围棋术语多使用象形与象声词,形象性使他们并不感到枯燥 。日积月累,词汇不断增加,记忆力便在一次又一次的训练中得到增强。  (四) 可以提高想象力  想象力即创造力,
自幼对孩子给以想象力的训练,是一件功德无量的事。围棋只有黑白两子,看起来十分简单,可世间事往往愈简单者愈复杂。试想黑白两子下出的围棋对局,自古至今不知有多少盘,却“千古无同局”。
一子下去,往往弈者胸中已有全局,中间或暗藏杀机,或声东击西,或暗渡陈仓,或困兽犹斗,或云开雾散,或妙手回春等等,真所谓变幻莫测,妙趣横生。  (五) 可以提高思维力  思维就是在表象、概念的基础上进行分析、综合、判断、推理等整个认识过程。思维有形象思维与逻辑思维之分,形象思维与逻辑思维虽是右脑与左脑分工产生的,但又关系密切,相辅相成。人的思维发展是由形象思维渐入逻辑思维的。倘若在儿童时期有意给以逻辑思维的训练,不仅增强其思考问题的条理性和发展思路的连惯性,而且对形象思维亦有促进作用。  围棋对局,实际上是对少儿进行的一种现实数学课,靠的就是逻辑思维。下棋离不开计算,“气”和“目”的计算贯穿始终;还有得失利弊的计算、转换大小的计算、全局和局部的计算、劫和官子的计算以及更为复杂的几块棋扭在一起的死活计算等到等。一盘棋,几乎每下一步都需冷静思考,慎思选择,郑重应对。围棋中经常遇到的有关劫材和转换的计算(双方子数总和的三分之二)就是寻找劫材的依据。  当然,不能要求少儿一下子掌握那么繁杂的计算,但由浅入深的学棋进程,无疑大大训练了他们的计算能力,对逻辑思维的开发是大有好处的。一个幼儿能从1数到100,只能说明他对数的概念的掌握;但学棋儿童提前领会数的大小顺序和组合,这才是真正理解了数的概念。同时,围棋的计算是无声的独白与回答,它比口头和书面的计算难度更大。让他们在不间断的对局中反复演算,便会逐渐掌握计算的技巧。随着棋艺的长进,逻辑思维能力也随之得到了开发。  (六)围棋对孩子将来的影响  在智力方面:学棋的少儿一般学习成绩都较好,不仅数学成绩好,而且语文读写成绩也好。“只因一着错,满盘皆是输”的教训,使他们解题思路宽,计算步骤也清楚、有序,计算的准确性自然大大提高。由于逻辑思路帮了他们的忙,在语言阅读中便分段敏捷,段意'文章内容概括和中心思想的提炼也比较顺手。写起作文来,一般
思路顺畅、层次清楚、结构完整、中心明确。  在非智力方面:一个人的成长,除了智力因素,还需要具备非智力因素——道德修养、高尚情操'坚强性格等等。由于围棋包含着深奥的人生哲理和科学辩证的棋理,对学生的非智力因素的培育也是有好处的。以棋如其人,好强自负者喜欢猛攻急杀;沉稳内向者则示实稳健;性情懦弱者往往坐失良机;品格高尚者则胜不骄败不馁等等。通过下棋,不仅可使学童获得良好的心理素质,而且可以锻炼他们的意志、磨练他们
的性格。  谷歌为什么研发阿尔法围棋  围棋一直被看作是人类最后的智力竞技高地。据估算,围棋的可能下法数量达到10的171次方,超过了可观测宇宙范围内的原子总数(10的80次方)。  单靠穷举所有的可能性来选取最佳方案,计算机目前的运算能力还达不到这个量级。不过,“阿尔法围棋”是人工智能,它模仿人类的思维方式。  让我们从名字开始来了解它。“阿尔法围棋”的英文名AlphaGo由两部分组成,Alpha对应希腊语的首字母,也就是常说的“阿尔法”,Go是日语中对围棋的称呼。因此,许多人称之为“阿尔法围棋”,还有人根据发音亲昵地叫它“阿尔法狗”或“阿狗”。  它出生在英国。2010年,德米什·哈萨比斯等人在伦敦创建了“深度思维”公司,2014年开发出了“阿尔法围棋”软件。2014年,美国谷歌公司收购了“深度思维”,因此它现在也许算是美国籍。  此前与法国“疯石”、日本“zen”等当今最优秀围棋程序进行的500盘博弈,“阿尔法围棋”只输了一盘。  它的成名是在今年1月。哈萨比斯等人在英国《自然》杂志上发文说,在英国围棋协会见证下,“阿尔法围棋”以5∶0战胜欧洲围棋冠军、前中国职业棋手樊麾,成为第一个击败人类职业棋手的电脑程序。  它的学习方式主要是:  第一步,快速判断。用于快速地观察围棋的盘面,类似于人观察盘面获得的第一反应。  第二步,深度模仿。它模仿学习近万盘人类历史高手的棋局,用得到的经验进行判断。这个深度模仿能够根据盘面产生类似人类棋手的走法。  第三步,自我对弈。不断与“自己”对战,一天就能玩100万局,总结出经验作为棋局中的评估依据。在战胜樊麾之前,“阿尔法围棋”已进行了超过3000万局的自我训练,不断提升自身棋力。  第四步,全局分析。利用第三步学习结果对整个盘面的赢面进行判断,实现从全局分析整个棋局。在观察棋子的整体布局的基础上选择最佳下法,这种方式十分接近于带着直觉和第六感作出判断的人类大脑功能,颇有人类棋手“我感觉这样会赢”的味道。  从技术层面上讲,“阿尔法围棋”的核心是两种不同的深度神经网络——“策略网络”和“值网络”。  “值网络”负责减少搜索的深度,一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑。“策略网络”负责减少搜索的宽度,面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。它们“双剑合璧”挑选出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。
参与更多话题互动,请下载神州佳教APP
后参与评论
他的其他文章
400-706-7131
周一至周五9:00--18:00
总裁邮箱:CEO@
Copyright(C)2016&&神州佳教(北京)信息服务股份有限公司&&&&&&&&&&京公网安备89号 |代理·加盟
> 智能家居魅力何在 为啥突然这么火?
智能家居魅力何在 为啥突然这么火?
文章来源 : 数智网
最近,智能家居突然火了:在亚马逊发布了带有触摸屏的Echo Show智能音箱、微软联合哈曼推出基于Cortana的智能音箱之后,今年的谷歌I/O大会上,谷歌的智能音箱Google Home也迎来了大升级:支持通话功能。
亚马逊、谷歌、微软……这些顶尖科技公司入局智能家居领域,不禁让人好奇:智能家居究竟有何魅力,可以让这么多科技巨头趋之若鹜?
抢占智能家居入口的位置
智能音箱的概念诞生于2014年,彼时的亚马逊发布了首款智能音箱亚马逊Echo,采用了语音交互方式的Echo不仅可以实现语音播放音乐操作,还能控制接入的智能硬件,甚至能够语音购物。虽然没有进行大规模的宣传,不过到了2015年,这款产品竟然在整个音箱市场上占据了25%的份额。
去年的谷歌I/O大会上,谷歌也推出了自家的智能音箱——Google Home,这款基于google Assistant的产品能够实现的功能与亚马逊Echo类似:包括音乐播放和硬件控制。
智能音箱之所以会成为众多巨头发力的重点,很大一部分原因是其“智能家居入口”的地位。入口往往会决定整个生态系统中智能硬件的选择:选择Amazon Echo的用户也必然会选择与之配套的智能硬件,通过这样的方式。
率先入局智能音箱市场最大的好处就是可以拥有更高的占有率。在产品功能/体验差距不大的情况下,实际上影响用户选择的往往是一款智能音箱的生态系统。对于智能硬件提供商来说,更为普及的生态显然是更好的选择。
意指人工智能
无论是采用Assistant的Google Home、采用的Alexa的Amazon Echo、使用Cortana的微软Invoke,还是传闻当中的苹果Siri音箱。语音助手都是这些智能音箱的核心。
微软小冰的负责人李迪曾表示:人工智能和智能家居融合将会分为三个过程:控制-反馈-融合。现阶段来看,智能音箱所能实现的功能大多数还是一些控制类的功能:比如控制音乐的播放、智能硬件的开关等等。与我们所想的人工智能还有这不小的距离。
对于科技巨头来说,入局智能家居领域的另一个好处就是能够获得更多的用户数据模型。就像微软用小娜和小冰“培养”人工智能一样,智能音箱所获得的用户数据同样能够帮助它们加深人工智能的研究。
谷歌今年的Google I/O开发者大会就曾多次提到重点:从“Mobile First 到 AI First”的转变。实际上,不止谷歌,不久前结束的微软Bulid开发者大会也将重点放在了”人工智能和云上。智能音箱在这其中所扮演的角色,不只是一个试水者,更是学习者。
为何国内罕有科技公司入局智能家居
值得注意的是,在VR、AR、无人机等技术普及时,国内科技公司的跟进速度都堪称一流。但在智能音箱,或者说智能家居入口争夺上,时至今日仍少有入局者。这是为什么呢?
体验:从技术难度上讲,智能音箱的入局门槛并不算高。不过,国内企业之所以罕有入局者,很大的因素是考虑到产品的体验问题。目前已经如炬或者准备入局智能音箱行业的几个玩家,都拥有自主的语音助手软件,在语音交互上也走的更远,这一点是多数国内科技公司所无法比拟的。
生态号召力:除此之外,生态作为智能音箱最大的价值所在,也是绝大多数科技公司不愿入局的原因。
当然,国内智能家居也是有玩家的。不久前,小米发布了全新的小米电视4,这款产品上比较有意思的一个概念就是人工智能语音,并且提出了智能家居建设的水滴计划。小米电视4可以通过遥控器控制联入的米家设备:如空调、扫地机器人等等,虽然与Google Home、Echo上的语音唤醒仍有差距,但已经迈出了第一步。
智能家居产品 推荐阅读
基金的发展在这些年来使有着很大的成效的,这与基金公司的运营规划和筹措是分不开的,同时还有基金年度报告...
基金的发展在这些年来使有着很大的成效的,这与基金公司的运营规划和筹措是分不开的,同时还有基金年度报告...
基金的发展在这些年来使有着很大的成效的,这与基金公司的运营规划和筹措是分不开的,同时还有基金年度报告...
基金的发展在这些年来使有着很大的成效的,这与基金公司的运营规划和筹措是分不开的,同时还有基金年度报告...
基金的发展在这些年来使有着很大的成效的,这与基金公司的运营规划和筹措是分不开的,同时还有基金年度报告...
基金的发展在这些年来使有着很大的成效的,这与基金公司的运营规划和筹措是分不开的,同时还有基金年度报告...
基金的发展在这些年来使有着很大的成效的,这与基金公司的运营规划和筹措是分不开的,同时还有基金年度报告...
Copyright(C)
,All Rights Reserved Two & Eight Smart人工智能这么火,可它的终极目标真的能实现吗?_创事记_新浪科技_新浪网
人工智能这么火,可它的终极目标真的能实现吗?
  欢迎关注“创事记”的微信订阅号:sinachuangshiji文/水哥不知从何时起,人类发觉自己所生活的现实世界与科幻小说、影视作品中的世界架构愈趋相似,这仅仅是直觉上的误区?还是真实的历史进程?从《攻壳》说起谈起人工智能,我们不由提及一部曾经闻名世界的Cyberpunk风格科幻作品《攻壳机动队》(Ghost in the Shell)。被誉为电影《黑客帝国》之母的《攻壳》一作中,未来世界庞大的信息网络在超越空间与物理介质之后早已浑然一体、无处不在,人类的组织器官实现了义体(人造)化,大脑意识可经由义体接口进入虚拟网络甚至进行各种意义上的信息同步。当然,这些仅仅是作品世界观架构铺垫的需要,《攻壳》的真正内涵在于关乎“人类与智能”的问题。Ghost in the Shell中的Shell一词有着丰富的解释,普通人可以认为其指外壳,程序员可以认为是人机界面,总之,它是没有灵魂的东西。在这样的躯壳中注入智能,是否就意味着其整体就拥有了灵魂(意识)?而人类本身假如从逻辑上拆分为身体与记忆两部分,是否也意味着如同Ghost in the Shell一般的存在?这是作品留给世人最大的思考。十分凑巧的是,由派拉蒙影业公司出品、斯嘉丽o约翰逊主演的真人版《攻壳机动队》电影将于4月7日登陆国内各大影院。如今正值第三轮人工智能全球热潮掀起之际,人工神经网络、机器学习方面的新突破在全球互联与移动互联大背景的助推下令人工智能被赋予了前所未有的巨大势能,市场、消费者、业界各方几乎一致坚信该领域将涌现出再次改变世界的技术革新。由作品反思现实,我们可知人工智能的起源,在于人类对机器智能改造的探索。现代意义上的AI始于古典哲学家用机械符号来处理观点以解释人类思考过程的尝试。20世纪40年代基于抽象数学推理的第一部电子计算机的问世使一批科学家开始严肃探讨构造一个电子大脑的可能性。人工智能低潮1956年夏季达特茅斯学院的一次科研会议开启了人工智能在计算机科学领域的发展起点。此后经历数代人的努力,大量科学家前仆后继投入到人工智能的项目研究之中,然而在不断的高潮与低谷交替过后,具备人脑同等智力水平的AI仍未出世。研究人员大大低估了这一工程的实现难度,历史上也曾出现过多次人工智能低潮。70年代初,AI开始遭遇了来自学术派系、科研进展、伦理以及实用主义方面的批评,这导致英国与美国政府先后停止向没有明确研究方向的人工智能科研项目拨款。当时的AI瓶颈主要来自几个方面:其一是70年代计算机有限的处理速度与内存不足以解决AI关键性的实质问题。在DEC小型机如沐春风的年代,搭载了System/360的IBM大型机几乎承担了所有大型科研项目,然而在计算复杂性和呈指数爆炸的AI推理与机器学习问题面前,大型机仍然力有未逮。其二是机器智能与人脑的差异陷入悖论。一些科学家发现尽管人脑的逻辑推理能力在计算机上实现只需要少量运算资源,但机器却无法胜任诸如“右脑思维”的直觉、潜意识等功能。比方说让电脑像成年人一样下棋相对简单,但要具备儿童那种避开障碍的协调能力则相当困难。第三则是来自加大伯克利教授约翰o希尔勒的著名反驳——“中文房间”。该实验思想的提出是对当时人工智能科研进展的一次重大批评式打击,迫使AI研究者此后不得不作出思维与认识上的改变。80年代以后,AI的研究重点转向“知识”与“认知”,目标是造出能够实现人机对话、语言翻译、图像识别并且能像人脑一样思考推理的机器智能。这与我们今天所熟知的人工智能十分相似。从1997年IBM“深蓝”在国际象棋领域的卓越表现到2016年AlphaGo的横空出世,人工智能由早期的编程语言构建逻辑推算全面过渡至基于人工神经网络的机器学习和认知模拟阶段。尽管这一过程AI借助现代计算机硬件处理能力以及成熟的编程语言和算法优势有所突破,然而科学家们的初衷并未实现——具备人类同等智力的机器智能。每当人工智能向前迈了一小步,世人更多讨论的是诸如AI会不会让自己饭碗不保这类与现实依旧遥远的问题。但事实是如果根据Gartner的Hype Cycle曲线,在2016年机器学习正处于第一个高峰上,那么它很快就会走进一个下行通道。一步之遥人工智能进化路线的终点——与人脑同等智力的机器智能,研究者们总因一步之遥而望洋兴叹。科学家攻克了机器模拟人脑逻辑推算的全部功能,这方面AI做得甚至优于人类本身,但面对重构人类与生俱来的右脑思维,这项工程犹如不可能完工的巴别塔。几个例子来一窥其艰巨,尽管这不是问题的全部。首先是博弈论与理想化模型。博弈论是应用数学的一个分支,它的参与者是“理性经济人”,是恪守严格优势策略的绝对理性人格,那么同样“绝对理性”的机器算法似乎是最合适的博弈参与者。但是问题在于博弈环境的构建并非循规蹈矩,用于实践的理想化模型永远与现实存在差异。如果说机器是完全恪守逻辑的,那么其只能在堆叠理性的基础上不断建模,试图接近人类特征。但这样的结论是AI所拥有的知识永远只是人类知识的一个子集,让AI下棋容易,要想剖析人性的复杂和社会的迁演则难于登天。事实上这也是博弈论的弱点,但并非错误。另一个例子是信息熵。上世纪中叶香农将热力学的熵引入到信息论是件伟大的事,这至少让后来的AI研究者有了度量工程复杂的手段。简而言之,在信息论里,熵是对不确定性的测量度量;换句话说,熵值越高,能传输的信息量越多,反之则越少。比方说,英语文本数据流的熵比较低,这意味着即使不通读全句,也能够预测这句话的意思。英语文本每字母需要8bit编码,但是它的熵只有4.7bit,而中文熵则高达9.65bit,因为同等单位中文所包含的信息量要高得多。由此可以解释一些事情,一些文字使用者(比如学术研究、翻译小组)总是抱怨机翻的水平低得吓人。事实上,这些年机翻的表现已经有了很大提升,至少能让一个完全不懂第二语言的人彻底明白机翻的意思。但是要尽善尽美,恐怕还有相当距离。另外,许多研究者早已察觉,人工智能最大的瓶颈在于人类对本身大脑认知的缺失。迄今为止,科学家仍无法解释诸如人脑意识是如何产生、潜意识是如何运作等问题。但有一点可以肯定的是,关于右脑思维、直觉、感知、协调性、想象力等等,这些毫无疑问与记忆有关,准确说是与经验有关。所以当经历了“中文房间”的嘲讽之后,研究者开始改变思路,人工智能的方向从“推理”转向以“知识”和“学习”为重点。今天我们看到人工神经网络已初显成效,决策树、蒙特卡罗模拟这些方法被广泛运用,人类对AI的热情被再度点燃。尽管我们仍无法得知沿着这条线路能否抵达人工智能的进化终点——与人脑同等智力的机器智能,但AI进化过程所衍生的新技术在大众消费以及专有领域已为世人享之不尽。或许,我们真正所追求的并非最初想要的结果。最后跟随阿姆斯特朗出舱第二个踏上月球的宇航员奥尔德林在接受记者关于火星登陆难题的采访时曾说:“如果我们只是去了就回、下一次再去,国会也许就会说:‘我们已经到过火星了,可以把钱用在其他地方了。’你懂的,这就是政治,美国政客们总是希望花钱搞些新的东西。“ 技术革新总是在人类的现实博弈面前且行且缓,用尚未到来的“历史进程”一词来解释,恐怕最恰当不过了。文/水哥 高级工程师,科技专栏作者,中国计算机学会会员。微信公众号:qq133991
(声明:本文仅代表作者观点,不代表新浪网立场。)
文章关键词:
IT评论,业界分析,不一而足。微信公众号 &qq133991&
随着票房数字持续刷新,一部新的现象级动漫电影蔚然成风。新海诚…
谷歌为什么要在这个时候向高端机市场的苹果手机发起挑战?它又比…
三星、黑莓各自事件之后,智能手机操作系统阵营力量对比如何变化…生成对抗网络(GANs )为什么这么火?盘点它诞生以来的主要技术_谯城区教育局
当前位置: >
生成对抗网络(GANs )为什么这么火?盘点它诞生以来的主要技术
时间: 11:54&来源:未知&作者:信息发布中心
  起源:雷锋网
  编辑:Gemini
  两年前,蒙特利尔大学 Ian Goodfellow 等学者提出“生成对抗网络”(Generative Adversarial Networks,GANs)的概念,并逐渐引起 AI 业内人士的注意。其实,直到 2015 年,生成对抗网络还称不上是炙手可热。但自今年(2016)以来,学界、业界对 GANs 的兴趣涌现“井喷”:
多篇重磅论文陆续发表;
Facebook、Open AI 等 AI 业界巨头也加入对 GANs 的研究;
它成为今年 12 月 NIPS 大会当之无愧的明星??在会议提纲中被提到逾 170 次;
GANs之父” Ian Goodfellow 被公推为人工智能的顶级专家;
业内另一位大牛 Yan Lecun 也对它交口夸奖,称其为“20 年来机器学习范畴最酷的想法”。
  现在,雷锋网取得消息,就连苹果也跳上了 GANs 的彩车:苹果有史以来第一篇公然发表的 AI 论文,讲的是如何更好地利用 GANs,来训练 AI 图像辨认才能。这是继苹果本月初在 NIPS 大会上宣布“将对外颁布 AI 研究结果”之后,为兑现诺言做出的行动。
  那么,GANs 是如何从一个原本“不温不火”的技术,成为今天人工智能的主要课题之一?
  雷锋网对此进行了梳理,演绎了 GANs 从诞生到现在如何一步步走向技术成熟。以下是它发展路线中的大事件(主要研究进展):
  1. GANs 出生
Ian Goodfellow
  2014 年 6 月,Ian Goodfellow 等学者发表了论文《Generative Adversarial Nets》,标题即“生成对抗网络”,这标记着 GANs 的诞生。文中,Ian Goodfellow 等作者详细介绍了 GANs 的原理,它的优点,以及在图像生成方面的应用。
  那么,什么是 GANs?
  用 Ian Goodfellow 本人的话来说:
  “生成对抗网络是一种生成模型(Generative Model),其背地基本思维是从训练库里获取许多训练样本,从而学习这些训练案例生成的概率分布。
  而实现的办法,是让两个网络相互竞争,‘玩一个游戏’。其中一个叫做生成器网络( Generator Network),它不断捉拿训练库里真实图片的概率分布,将输入的随机噪声(Random Noise)转变成新的样本(也就是假数据)。另一个叫做判别器网络(Discriminator Network),它可以同时视察真实和捏造的数据,断定这个数据到底是不是真的。”
  对不熟习 GANs 的读者,这番解释也许有些艰涩。因此,雷锋网特意找来 AI 博主 Adit Deshpande 的说明,更加清晰直白:
  “GANs 的根本原理是它有两个模型:一个生成器,一个判别器。判断器的任务是判定给定图像是否看起来‘自然’,换句话说,是否像是人为(机器)生成的。而生成器的任务是,顾名思义,生成看起来‘自然’的图像,要求与原始数据散布尽可能一致。
  GANs 的运作方式可被看作是两名玩家之间的零和游戏。原论文的类比是,生成器就像一支造假币的团伙,试图用假币蒙混过关。而判别器就像是警察,目标是检讨出假币。生成器想要骗过判别器,判别器想要不受骗。当两组模型不断训练,生成器不断生成新的成果进行尝试,它们的能力相互进步,直到生成器生成的人造样本看起来与原始样本没有差别。”
  更多“什么是 GANs ?”的详细讲解,请参考雷锋网(大众号:雷锋网)整理的 Ian Goodfellow NIPS 大会 ppt 演讲,Yan Lecun 演讲,以及香港理工大学博士生李嫣然的 “GANs 最新进展”特约稿。
  早期的 GANs 模型有许多问题。Yan Lecun 指出,其中一项主要缺点是:GANs 不稳定,有时候它永远不会开端学习,或者生成我们认为及格的输出。这需要之后的研究一步步解决。
  2. 拉普拉斯金字塔(Laplacian Pyrami)的应用
  GANs 最重要的应用之一,是生成看起来‘自然’的图像,这要求对生成器的充足训练。以下是 Ian Goodfellow 等人的 2014 年论文中,生成器输出的样本:
  能够看出,生成器在生成数字和人脸图像方面做得不错。但是,应用 CIFAR-10 数据库生成的景致、动物图片非常含混。这是 GANs 早期的主要局限之一。
  2015 年 6 月 Emily Denton 等人发表的研究《Deep Generative Image Models using Lapalacian Pyramid of Adversarial Networks》(“深度图像生成模型:在对抗网络应用拉普拉斯金字塔”)转变了这一点。研究人员提出,用一系列的卷积神经网络(CNN)连续生成清晰度不断提高的图像,能终极得到高分辨率图像。该模型被称为 LAPGANs 。
  其中的拉普拉斯金字塔,是指统一幅图像在不同分辨率下的一系列过滤图片。与此前 GAN 架构的区别是:传统的 GAN 只有一个 生成器 CNN,负责生成整幅图像;而在拉普拉斯金字塔结构中,金字塔的每一层(某特定分辨率),都有一个关系的 CNN。每一个 CNN 都会生成比上一层 CNN 更加清楚的图像输出,然后把该输出作为下一层的输入。这样持续对图片进行升采样,每一步图像的清晰度都有晋升。
拉普拉斯金字塔构造图像生成示意
  这发生了一个新概念:有条件生成对抗网络(conditional GAN,CGAN),指的是它有多个输入:低分辨率图片和噪音矢量。该研究生成的高质量图片,在 40% 的情形下被真人裁判当做真实图像。
  对该研究的意义,李嫣然评论道:它将 GAN 的学习过程变成了“序列式” 的??不要让 GAN 一次学完全体的数据,而是让 GAN 一步步完成这个学习过程。
  3. 利用 GANs 把文字转化为图像
  把文字转化为图像,比起把图像转为文字(让 AI 用文字概括、描述图像)要难得多。一方面是近乎无限的像素排列方式;另一方面,目前没人知道如何把它分解,好比像(图像转为文字任务中)预测下一个词那样。
  2016 年 6 月,论文《Generative Adversarial Text to Image Synthesis》(“GANs 文字到图像的合成”)问世。它介绍了如何通过 GANs 进行从文字到图像的转化。比喻说,若神经网络的输入是“粉色花瓣的花”,输出就会是一个包含了这些要素的图像。该任务包括两个部分:1. 利用自然语言处置来懂得输入中的描述。2. 生成网络输出一个准确、自然的图像,对文字进行抒发。
  为实现这些目标,生成器和判别器都使用了文字编码技巧:通过循环文字编码器(recurrent text encoder)生成的文字属性,来作为前提对 GAN 进行训练(详情参考论文)。这使得 GAN 可以在输入的文字描述和输出图像之间树立相关性接洽。
  该任务中,GAN 实在完成了两件任务:1.生成天然、说得从前的图像;2.图像必需与文字描写有相关性。
利用 GAN, GAN-CLS, GAN-INT,GAN-INT-CLS 生成的结果示意。GT 是真实图像,从左到右三组图像的任务分离是:1.全黑色的鸟,粗圆的鸟嘴;2.黄胸、棕冠、黑眉的小鸟;3. 蓝冠、蓝羽、黑颊的超小鸟,嘴小、踝骨小、爪小。
  4. GANs 应用于超分辨率(Super Resolution)
  这是推特 Cortex 研究团队进行的一项研究,在今年 9 月发表。它的主要奉献是开发出全新的损失函数(loss function),使得 GANs 能对大幅降采样后的图像,恢复它的活泼纹理和小颗粒细节。
  对于不熟悉超分辨率的雷锋网读者,它是一个能把低分辨率图像重建为高清图像的技术。在机器学习中,实现超分辨率需要用成对样本对系统进行训练:一个是原始高清图像,一个是降采样后的低分辨率图像。本研究中,低分图像被作为输入喂给生成器,它重建出高分辨率图像。然后,重建图片和原始图片被一起交给判别器,来判断哪一幅是原始图像。
  该研究中的损失函数可分为两个部分:反抗损失(adversarial loss )和内容损失(content loss)。在较高层面上,对抗损失使图像看起来更自然;内容损失则保障重建图像与低分辨率原始图像有相似的特色。其中,对抗损失和传统的 GANs 应用相似,创新的是内容损失。该研究中的内容损失,可被看作为重建的高分辨率图像和原始高分图像之间特点图(feature map)的欧式距离(Euclidean distance)损失。而 GAN 的损失函数是抗衡损失和内容损失的加权和。对原文感兴趣的读者,请看这里https://arxiv.org/pdf/v1.pdf。
左栏是原始图像,右三栏是 GANs 重建的高分图像。
  以上是 GANs
发展期间的主要里程碑。但读者们注意,2016 年以来,GANs 的研究应用层出不穷。以上只是最具代表性的几个,不代表其余 GANs 研究就没有价值。
  值得一说的是,今年 6 月一篇关于深度卷积 GANs (Deep Convolutional Generative Adversarial Networks, DCGAN)的论文在业内引发强烈反响:《Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks》(“使用深度卷积 GANs 进行无监督表征学习”)。研究职员们发现,用大规模数据库训练出的 GANs 能学习一整套层级的特征 (a hierarchy of features),并拥有比其他无监督学习模型更好的效果。而此前使用 CNN 训练 GANs 的尝试大多以失败告终。当研究人员修改架构创造出 DCGAN,他们可能看到神经网络在每一层级学习到的过滤器 。Yan Lecun 评论道,这翻开了 GANs 的“黑箱”。
  最后,我们来看看在大神 Yan Lecun 眼里,GANs 为什么这么重要:
  “它为创立无监视学习模型供给了强有力的算法框架,有望赞助我们为 AI 参加常识(common sense)。我们以为,沿着这条路走下去,有不小的胜利机遇能开发出更智慧的 AI 。”
  往期经典文章回想:
第一个被认为“科学家”的人:泰勒斯
数学思维比数学运算更重要
二十世纪的十大科学圈套
瞎扯现代数学的基本
x当面的轶闻趣事
盘算机是如何启动的?
程序观点下的线性代数
爆笑数学冷笑话
如何优雅地丈量一只猫的体积,而不使其感到惊骇或受到损害?
数学与国家实力
距离,原来还有这么多类
复数的物理意义
表白后女生发给我一串五层加密的密码
主宰这个世界的10大算法
.另一个角度看矩阵剖析
  欢送大家把奇特见解分享出来,投稿邮箱:
上一篇: 下一篇:

我要回帖

更多关于 神经网络 的文章

 

随机推荐