高数有哪些内容中的邻域是哪章节的内容?我想在mooc上学习这方面内容,不知应该搜索什么

非常感谢各位大爷,stan的点赞和关注,开心的我晚上多吃了两锅饭!!&/p&&p&
为了表达谢意,容我再隆重的皮一下,各位大爷,请拿好您的手机,注意一下您的电脑,我将沿着网线,WIFI,4G,3G,2G送给你们一个宇宙超级么么哒!!&/p&&p&
没网的朋友我可以送货上门,爱你比心&/p&&p&一一一一一一一一一一一一一一一一一一手动分割&/p&&p&&br&&/p&&p&Stan们顶起来啊!!&/p&&hr&&p&
第53届格莱美现场,Love The Way You Lie & I Need A Doctor ,每次开车听这首歌,我都只想给88分,因为剩下的12分要留给交警。&/p&&p&
为什么这场表演跟我一样这么出色??&/p&&p&1、蕾哈娜主歌、姆爷rap、天灰副歌、德瑞结尾rap,重点是!!!!!那个闲的没事在别人婚礼蹭吃蹭喝的骚当,在蕾哈娜身后默默弹钢瓶。。。。。。&/p&&p&2、德瑞:一会儿我上场,把你的王八步收一收&/p&&p&
em:好嘞!&/p&&p&
我姆就是这么尊师重道!!!&/p&&p&3、天灰姐这身装备酷的一批,好美!!现场又稳,但是全程没露脸,心疼一波,都给老子
哭!!!!&/p&&p&
超清视频都给你们拉上来了,各位大爷 ,点个赞行嘛!!!!!! &/p&&p&
那些不点赞的大爷,我会沿着网线、wifi、4G冲过来把你暴揍一顿***********&/p&&a class=&video-box& href=&//link.zhihu.com/?target=https%3A//www.zhihu.com/video/4528384& target=&_blank& data-video-id=&& data-video-playable=&& data-name=&点赞都是大爷& data-poster=&https://pic4.zhimg.com/80/v2-5c4808a28b94aa13ba63_b.jpg& data-lens-id=&4528384&&
&img class=&thumbnail& src=&https://pic4.zhimg.com/80/v2-5c4808a28b94aa13ba63_b.jpg&&&span class=&content&&
&span class=&title&&点赞都是大爷&span class=&z-ico-extern-gray&&&/span&&span class=&z-ico-extern-blue&&&/span&&/span&
&span class=&url&&&span class=&z-ico-video&&&/span&https://www.zhihu.com/video/4528384&/span&
非常感谢各位大爷,stan的点赞和关注,开心的我晚上多吃了两锅饭!! 为了表达谢意,容我再隆重的皮一下,各位大爷,请拿好您的手机,注意一下您的电脑,我将沿着网线,WIFI,4G,3G,2G送给你们一个宇宙超级么么哒!! 没网的朋友我可以送货上门,爱你比心…
&p&有个外国网友制作了一个梅西的视频集锦,和其他梅西的视频集锦不同,这个集锦里没有梅西的精彩进球,没有精妙的传球,没有精彩的过人,里面的内容都是梅西在比赛时被对手暴力犯规的片段。看完这个视频你也许就能更加理解梅西的伟大了。&/p&&a class=&video-box& href=&//link.zhihu.com/?target=https%3A//www.zhihu.com/video/718784& target=&_blank& data-video-id=&& data-video-playable=&true& data-name=&& data-poster=&https://pic1.zhimg.com/80/v2-d052c7af79d418db454094_b.jpg& data-lens-id=&718784&&
&img class=&thumbnail& src=&https://pic1.zhimg.com/80/v2-d052c7af79d418db454094_b.jpg&&&span class=&content&&
&span class=&title&&&span class=&z-ico-extern-gray&&&/span&&span class=&z-ico-extern-blue&&&/span&&/span&
&span class=&url&&&span class=&z-ico-video&&&/span&https://www.zhihu.com/video/718784&/span&
&/a&&p&&/p&
有个外国网友制作了一个梅西的视频集锦,和其他梅西的视频集锦不同,这个集锦里没有梅西的精彩进球,没有精妙的传球,没有精彩的过人,里面的内容都是梅西在比赛时被对手暴力犯规的片段。看完这个视频你也许就能更加理解梅西的伟大了。
&figure&&img src=&https://pic3.zhimg.com/v2-f8b0f4ef61fe8b9e26c9f2788d75beb2_b.jpg& data-rawwidth=&900& data-rawheight=&500& class=&origin_image zh-lightbox-thumb& width=&900& data-original=&https://pic3.zhimg.com/v2-f8b0f4ef61fe8b9e26c9f2788d75beb2_r.jpg&&&/figure&&p&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-f2d3b06f1ad3b64a9534ae_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&100& data-rawheight=&82& class=&content_image& width=&100&&&/figure&&p&哈哈~没错,时隔半年我又回归啦!其实中间收到很多私信向我提问,问我要各种资源的,为了不辜负大家对我哪怕一丝丝的信任,我又来继续更新啦!&/p&&p&&br&&/p&&p&「机器学习」现在真的太受欢迎了,但很多人想学又不知道在哪找资源,所以这次为大家整理了关于「机器学习」的各种用得到的工具、资源,希望可以帮到大家( o ?ωo? )?&/p&&p&&br&&/p&&p&&b&一、机器学习学习路线&/b&&/p&&p&就算是整理资源我也回先弄清楚写作的先后顺序,学习也是一样啊,入门机器学习要先学会微积分、线性代数,懂一些编程基础,才能进行下一步的学习。先来看看具体的学习内容:&/p&&figure&&img src=&https://pic4.zhimg.com/v2-8fea44576fe_b.jpg& data-size=&normal& data-rawwidth=&675& data-rawheight=&502& class=&origin_image zh-lightbox-thumb& width=&675& data-original=&https://pic4.zhimg.com/v2-8fea44576fe_r.jpg&&&figcaption&《全栈数据之门》&/figcaption&&/figure&&p&是不是眼花缭乱?看起来有点复杂,如果直接从算法工程师的角度出发的话,可以这样划分:&/p&&figure&&img src=&https://pic2.zhimg.com/v2-d8fb4e3a9cef27889be05_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&750& data-rawheight=&769& class=&origin_image zh-lightbox-thumb& width=&750& data-original=&https://pic2.zhimg.com/v2-d8fb4e3a9cef27889be05_r.jpg&&&/figure&&p&这样就比较清楚了。了解完机器学习具体要学哪些内容以后找资源也有了具体的方向。那就还是继续按照我的方式来总结一篇机器学习的学习资源吧,会从以下几个方面整理:&/p&&ul&&li&1)&b&书籍&/b&:机器学习还是涉及很多数学基础和理论知识的,啃书是必不可少的啦;&/li&&li&2)&b&视频&/b&:看书有些地方看不到,那就听听大牛们的课吧;&/li&&li&3)&b&在线学习网站&/b&:机器学习还是比较复杂,有些网站提供比较系统的学习路径;&/li&&li&4)&b&博客及社区&/b&:一些大牛们的经验总结真的可以利用起来,还有中文社区可以交流讨论,感兴趣的可以看看;&/li&&li&5)&b&其他&/b&:其他与机器学习相关的一些整理。&/li&&/ul&&p&如果还是未入门阶段的小伙伴,还可以看看这些文章:&/p&&blockquote&&a href=&https://link.zhihu.com/?target=https%3A//www.csdn.net/article//2825647& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&机器学习温和指南&/a&&br&&a href=&https://link.zhihu.com/?target=http%3A//blog.jobbole.com/67616/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&有趣的机器学习:最简明入门指南&/a&&br&&a href=&https://link.zhihu.com/?target=https%3A//www.cnblogs.com/subconscious/p/4107357.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&一个故事说明什么是机器学习&/a& &/blockquote&&p&&b&二、学习资源&/b&&/p&&p&&b&1、书籍&/b&&/p&&ul&&li&《数学之美》:入门读起来很不错。&/li&&li&李航的《统计学习方法》:详细介绍支持向量机、Boosting、最大熵、条件随机场等十个统计学习方法。&/li&&li&《Pattern Recognition and Machine Learning》:必读书籍之一,很有用但是相当难啃。&/li&&li&周志华的《机器学习》:认真读每一章都会有收获。&/li&&li&陈希孺《概率论与数理统计》。大师的良心之作,应该是至今为止评价最好的一本概率论教材了。&/li&&li&Adrian Banner的《普林斯顿微积分读本》。深入浅出,非常注重基础知识的积累,讲解也很生动,读起来不会觉得乏味。&/li&&/ul&&p&&b&2、视频&/b&&/p&&ul&&li&&a href=&https://link.zhihu.com/?target=http%3A//open.163.com/special/opencourse/machinelearning.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&吴恩达公开课&/a& :经典中的经典!&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//list.youku.com/albumlist/show%3Fid%3Dascending%3D1%26page%3D1& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&计算机中的数学&/a& :《计算机中的数学》系列视频,8位老师10讲内容,介绍微积分和线性代数基本概念在计算机学科中的各种有趣应用。&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.coursera.org/learn/machine-learning& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Machine Learning&/a& :斯坦福的机器学习课程。从&a href=&https://link.zhihu.com/?target=http%3A//cs229.stanford.edu/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Stanford CS229 course&/a&下载讲义和笔记。主要讲解了线性代数的知识。&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//open.163.com/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&网易公开课 &/a&:很多关于机器学习的课程,国内做得很不错的公开课,翻译了一些国外出名的公开课教程,与国外公开课平台coursera有合作。&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.youtube.com/playlist%3Flist%3DPLD0F06AA0D2E8FFBA& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&YouTube&/a&上的,内容很全面,偏概率统计模型,每一小集只有几分钟。 &/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.bilibili.com/video/av/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&李宏毅机器学习(2017)&/a& ,也是必看啊。&/li&&/ul&&blockquote&Ps.&a href=&https://link.zhihu.com/?target=https%3A//blog.csdn.net/soulmeetliang/article/details/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&李宏毅机器学习课程&/a& ,完整的学习顺序&/blockquote&&ul&&li&&a href=&https://link.zhihu.com/?target=http%3A//work.caltech.edu/lectures.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Learning from Data&/a&,内容更适合进阶。&/li&&/ul&&p&&b&3、在线学习网站&/b&&/p&&p&&b&国内&/b&&/p&&ul&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.jikexueyuan.com/zhiye/ml& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&极客学院&/a& :以视频的形式讲解,每节课的时长一般十五到二十分钟。一些源码可以下载,后面还可以跟着老师做一些项目。&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//study.163.com/course/introduction/.htm& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&网易云课堂&/a& :里面有很多教学视频,机器学习的课比较全,老师讲解得也很详细。听说很多人都是怀着对网易云音乐的情怀去的ヽ(?oωo`)?&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.shiyanlou.com/paths/ml& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&实验楼&/a& :给你提供技术文档和虚拟的实验环境,你要跟着步骤一步步来学,步骤很详细。还有系统的学习路径,所以很适合机器学习的新手。像这种动手学的一般更容易学进去。&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.imooc.com/learn/717& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&慕课网&/a& :每节课讲的时间不长,可以自己选课程,有基础有项目,内容很丰富。&/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.chinahadoop.cn/search%3Fq%3D%25E6%259C%25BA%25E5%%25E5%25AD%25A6%25E4%25B9%25A0& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&小象学院&/a& :里面有许多公开课,直播为主。每个老师讲的内容不一样,适合有一点机器学习基础的小伙伴。&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//cn.udacity.com/mlnd& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&优达学城&/a& :分了机器学习入门课和进阶课,有老师来自硅谷,课程比较专业。&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//cloud.baidu.com/product/bml.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&百度机器学习 BML&/a&&/li&&/ul&&p&&b&国外&/b&&/p&&ul&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.coursera.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Coursera&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.codecademy.com/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&codecademy&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.edx.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&edX&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.openlearning.com/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&openlearning&/a& &/li&&/ul&&p&&b&4、博客及社区&/b&&/p&&p&&b&博客&/b&&/p&&ul&&li&&a href=&https://link.zhihu.com/?target=http%3A//ir.hit.edu.cn/%7Ewanghaifeng/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&王海峰 &/a&:信息检索,自然语言处理,机器翻译方面的专家,ACL的副主席,百度高级科学家。&/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//cs.nju.edu.cn/zhouzh/index.htm& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&周志华&/a&:机器学习和数据挖掘方面国内的领军人物,更可贵的是他的很多文章都有源码公布。&/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.flickering.cn/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&火光摇曳Flickering&/a&: 一群腾讯工程师分享的博客,内容涉及概率统计、数据挖掘、机器学习、自然语言处理、并行计算等等,文章质量很高。&/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//techblog.netflix.com/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Netflix&/a&:Netflix技术博客,很多干货。&/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//freemind.pluskid.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Free Mind&/a& :由 pluskid 所维护的 blog,主要记录一些机器学习、程序设计以及各种技术和非技术的相关内容,写得很不错。&/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//datasciencemasters.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&The Open Source Data Science Masters&/a&:里面包含学ML/DM所需要的一些知识链接,且有些给出了视频教程,网页资料,电子书,开源code等。&/li&&/ul&&p&&b&社区&/b&&/p&&ul&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.cnblogs.com/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&博客园 - 开发者的网上家园&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.ilovematlab.cn/forum.php& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&matlab中文论坛&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//bbs.csdn.net/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&CSDN论坛-IT技术交流平台&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.v2ex.com/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&V2EX&/a&&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.guokr.com/group/262/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&果壳 - 机器学习小组&/a&&/li&&/ul&&p&&b&6、其它&/b&&/p&&p&&b&相关网站&/b&&/p&&ul&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.52nlp.cn/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&我爱自然语言处理&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//blog.jobbole.com/tag/machinelearning/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&机器学习 - 伯乐在线&/a&&a href=&https://link.zhihu.com/?target=http%3A//www.52nlp.cn/& data-draft-node=&block& data-draft-type=&link-card& data-image=&https://pic1.zhimg.com/v2-50a1d046cbbd267f1c84ddb7b2cd1da0_180x120.jpg& data-image-width=&867& data-image-height=&503& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&I Love Natural Language Processing&/a&&a href=&https://link.zhihu.com/?target=http%3A//blog.jobbole.com/tag/machinelearning/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&机器学习 - 伯乐在线&/a&&/li&&/ul&&p&&b&学习笔记&/b&&/p&&ul&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.cnblogs.com/tornadomeet/tag/%25E6%259C%25BA%25E5%%25E5%25AD%25A6%25E4%25B9%25A0/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&tornadomeet 机器学习 笔记&/a& (2013)&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//blog.csdn.net/zouxy09/article/details/8775360& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Deep Learning(深度学习)学习笔记整理系列之(一)&/a&&/li&&/ul&&p&&b&数学概念&/b&&/p&&ul&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.cnblogs.com/LeftNotEasy/archive//mathmatic_in_machine_learning_1_regression_and_gradient_descent.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.cnblogs.com/LeftNotEasy/archive//mathmatic_in_machine_learning_2_regression_and_bias_variance_trade_off.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&机器学习中的数学(2)-线性回归,偏差、方差权衡&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.cnblogs.com/xiefeifeihu/archive//1599198.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&和3D相关的一些数学概念和公式&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.cnblogs.com/pinard/p/5970503.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&梯度下降(Gradient Descent)小结&/a&&/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.cnblogs.com/LeftNotEasy/archive//random-forest-and-gbdt.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&机器学习中的算法(1)-决策树模型组合之随机森林与GBDT&/a&&/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//ocw.nctu.edu.tw/course_detail.php%3Fbgid%3D1%26gid%3D1%26nid%3D271%23.WKm5gxBCtsA& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&线性代数(一) Linear Algebra I&/a&(视频):台湾国立交通大学莊重特聘教授主讲的线性代数课程,从泛函的角度来讲解线性代数(同时兼顾了矩阵角度),会帮你建立一种更加高屋建瓴的线性代数观念。&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//mooc.guokr.com/course/461/%25E6%25A9%259F%25E7%258E%2587/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&叶丙成的概率课&/a&(视频):这是一个几率的入门课程,着重的是教授几率基本概念。&/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//www.icourse163.org/university/NUDT%23/c& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&国防科技大学的高等数学课&/a&(视频):如果你想复习或者重新学高等数学,或者有的地方书上讲得看不懂,可以看看这个。&/li&&/ul&&p&&b&编程语言学习&/b&&/p&&ul&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.shiyanlou.com/courses/57& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&C 语言入门教程&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.shiyanlou.com/courses/490& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Scala 开发教程&/a&&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.opengl.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&OpenGL&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.shiyanlou.com/courses/596& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Python3 简明教程&/a& &/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.shiyanlou.com/courses/855& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&R 语言基础入门&/a& &/li&&/ul&&p&&b&编程库资源&/b&&/p&&ul&&li&&a href=&https://link.zhihu.com/?target=http%3A//mloss.org/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&机器学习开源软件网&/a&:收录了各种机器学习的各种编程语言学术与商业的开源软件。&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.csie.ntu.edu.tw/%7Ecjlin/libsvm/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&libsvm&/a&:台湾大学的林教授的杰作。&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//orange.biolab.si/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Orange&/a&:基于c++和python接口的机器学习软件,界面漂亮,调用方便,可以同时学习C++和python,还有可视化的功能。&/li&&li&&a href=&https://link.zhihu.com/?target=https%3A//www.cs.waikato.ac.nz/ml/weka/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&WEKA&/a& :基于java的机器学习算法最全面最易用的开源软件。&/li&&li&&a href=&https://link.zhihu.com/?target=http%3A//mallet.cs.umass.edu/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Mallet&/a&:基于JAVA实现的机器学习库,主要用于自然语言处理方面,特色是马尔可夫模型和随机域做得好,可和WEKA互补。&/li&&/ul&&p&&br&&/p&&p&嗯,这次整理就到这里了,如果大家还有什么更好的私藏好货也可以告诉我哦,我可以更新上来,嘻嘻~&/p&&p&就酱,溜啦溜啦……&/p&
哈哈~没错,时隔半年我又回归啦!其实中间收到很多私信向我提问,问我要各种资源的,为了不辜负大家对我哪怕一丝丝的信任,我又来继续更新啦! 「机器学习」现在真的太受欢迎了,但很多人想学又不知道在哪找资源,所以这次为大家整理了关于「机器学习」的各…
&p&开口跪!这个Beat Boxer真的太厉害,各种声音模仿的都超级像!路人都看呆了
&/p&&a class=&video-box& href=&//link.zhihu.com/?target=https%3A//www.zhihu.com/video/623360& target=&_blank& data-video-id=&& data-video-playable=&& data-name=&& data-poster=&https://pic4.zhimg.com/v2-30fe70aebc399dbbe9047a.jpg& data-lens-id=&623360&&
&img class=&thumbnail& src=&https://pic4.zhimg.com/v2-30fe70aebc399dbbe9047a.jpg&&&span class=&content&&
&span class=&title&&&span class=&z-ico-extern-gray&&&/span&&span class=&z-ico-extern-blue&&&/span&&/span&
&span class=&url&&&span class=&z-ico-video&&&/span&https://www.zhihu.com/video/623360&/span&
开口跪!这个Beat Boxer真的太厉害,各种声音模仿的都超级像!路人都看呆了
&figure&&img src=&https://pic4.zhimg.com/v2-6a6e0b8ac3dac5da5694d_b.jpg& data-rawwidth=&720& data-rawheight=&535& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&https://pic4.zhimg.com/v2-6a6e0b8ac3dac5da5694d_r.jpg&&&/figure&&p&作者:&a href=&https://link.zhihu.com/?target=https%3A//towardsdatascience.com/the-5-clustering-algorithms-data-scientists-need-to-know-a36d136ef68& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&George Seif&/a&&/p&&p&编译:&a href=&https://link.zhihu.com/?target=https%3A//mp.weixin.qq.com/s%3F__biz%3DMzI3ODkxODU3Mg%3D%3D%26mid%3D%26idx%3D1%26sn%3D2d027330cdfb%26chksm%3Deb4eeee5dc911b9cac4ccab3b16ef3a96e5fd138eac4cbb18456a%23rd& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Bot&/a&&/p&&p&编者按:聚类是一种涉及数据点分组的机器学习技术。给定一组数据点,我们可以使用聚类算法将每个数据点到分类到图像中的特定组中。理论上,同一组中的数据点应具有相似的属性和特征,而不同组中的数据点的属性和特征则应高度不同。聚类是无监督学习的一种方法,是用于多领域统计数据分析的常用技术。&/p&&p&在数据科学中,我们可以通过聚类分析观察使用聚类算法后这些数据点分别落入了哪个组,并从中获得一些有价值的信息。那么今天,我们就跟着机器学习工程师&a href=&https://link.zhihu.com/?target=https%3A//towardsdatascience.com/the-5-clustering-algorithms-data-scientists-need-to-know-a36d136ef68& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&George Seif&/a&来看看数据科学家需要掌握的5种实用聚类算法以及它们的优缺点。&/p&&h2&K-Means聚类&/h2&&p&K-Means(k-平均或k-均值)可以称的上是知名度最高的一种聚类算法,它常出现在许多有关数据科学和机器学习的课程中。在代码中非常容易理解和实现!让我们来看下面这幅动图。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-a371a894a905e4cfcb10f647e00472df_b.jpg& data-size=&normal& data-rawwidth=&480& data-rawheight=&480& data-thumbnail=&https://pic1.zhimg.com/v2-a371a894a905e4cfcb10f647e00472df_b.jpg& class=&origin_image zh-lightbox-thumb& width=&480& data-original=&https://pic1.zhimg.com/v2-a371a894a905e4cfcb10f647e00472df_r.jpg&&&figcaption&K-Means聚类&/figcaption&&/figure&&ol&&li&首先,我们确定要几个的聚类(cluster,也称簇),并为它们随机初始化一个各自的聚类质心点(cluster centroids),它在上图中被表示为“X”。要确定聚类的数量,我们可以先快速看一看已有的数据点,并从中分辨出一些独特的数据。&/li&&li&其次,我们计算每个数据点到质心的距离来进行分类,它跟哪个聚类的质心更近,它就被分类到该聚类。&/li&&li&需要注意的是,初始质心并不是真正的质心,质心应满足聚类里每个点到它的欧式距离平方和最小这个条件。因此根据这些被初步分类完毕的数据点,我们再重新计算每一聚类中所有向量的平均值,并确定出新的质心。&/li&&li&最后,重复上述步骤,进行一定次数的迭代,直到质心的位置不再发生太大变化。当然你也可以在第一步时多初始化几次,然后选取一个看起来更合理的点节约时间。&/li&&/ol&&p&K-Means的优点是速度非常快,因为我们所做的只是计算数据点和质心点之间的距离,涉及到的计算量非常少!因此它的算法时间复杂度只有O(n)。&/p&&p&另一方面,K-Means有两个缺点。一是你必须一开始就决定数据集中包含多少个聚类。这个缺点并不总是微不足道的,理想情况下,我们的目标其实是用一种算法来分类这些数据,并从结果中观察出一些规律,而不是限制几个条件强行聚类。二是一开始质心点的选取是随机的,算法可能会初始化出差异巨大的点。这个缺点导致的结果是质心点的位置不可重复且缺乏一致性。&/p&&p&K-Medians是与K-Means相关的另一种聚类算法,不同之处在于它使用簇的中值向量来重新计算质心点。该方法对异常值不敏感(因为使用中值),但在较大数据集上运行时速度会慢很多,因为每次计算中值向量,我们都要重新排序。&/p&&h2&Mean-Shift聚类&/h2&&p&Mean shift算法,又称均值漂移算法,这是一种基于核密度估计的爬山算法,可用于聚类、图像分割、跟踪等。它的工作原理基于质心,这意味着它的目标是定位每个簇/类的质心,即先算出当前点的偏移均值,将该点移动到此偏移均值,然后以此为新的起始点,继续移动,直到满足最终的条件(找出最密集的区域)。如果没理解,请看下图。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-f628aefabb3c574de7dc42_b.jpg& data-size=&normal& data-rawwidth=&324& data-rawheight=&324& data-thumbnail=&https://pic1.zhimg.com/v2-f628aefabb3c574de7dc42_b.jpg& class=&content_image& width=&324&&&figcaption&Mean-Shift聚类&/figcaption&&/figure&&ol&&li&为了理解均值漂移,我们可以像上图一样想象二维空间中的一组数据点,然后先随机选择一个点C,以它为圆心画一个半径为r的圆开始移动。之前提到了,这是个爬山算法,它的核函数会随着迭代次数增加逐渐向高密度区域靠近。&/li&&li&在每轮迭代中,算法会不断计算圆心到质心的偏移均值,然后整体向质心靠近。漂移圆圈内的密度与数据点数成正比。到达质心后,算法会更新质心位置,并继续让圆圈向更高密度的区域靠近。&/li&&li&当圆圈到达目标质心后,它发现自己无论朝哪个方向漂移都找不到更多的数据点,这时我们就认为它已经处于最密集的区域。&/li&&li&这时,算法满足了最终的条件,即退出。&/li&&/ol&&p&这里我们主要介绍了一个漂移圆圈的思路,如下图所示,其实Mean shift算法事实上存在多个圆形区域,图中黑点代表质心,而灰点则是数据点。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-dd6b9677bdc9c0b9e60706_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&432& data-rawheight=&432& data-thumbnail=&https://pic4.zhimg.com/v2-dd6b9677bdc9c0b9e60706_b.jpg& class=&origin_image zh-lightbox-thumb& width=&432& data-original=&https://pic4.zhimg.com/v2-dd6b9677bdc9c0b9e60706_r.jpg&&&/figure&&p&和K-Means算法相比,Mean-Shift不需要实现定义聚类数量,因为这些都可以在计算偏移均值时得出。这是一个巨大的优势。同时,算法推动聚类中心在向密度最大区域靠近的效果也非常令人满意,这一过程符合数据驱动型任务的需要,而且十分自然直观。如果要说Mean-Shift有什么缺点,那就是对高维球区域的半径r的定义,不同选择可能会产生高度不同的影响。&/p&&h2&具有噪声的基于密度的聚类方法(DBSCAN)&/h2&&p&DBSCAN是一种基于密度的聚类算法,它与mean-shift类似,但又有一些显著优势。我们先来看看下面这幅花哨的图。&/p&&figure&&img src=&https://pic1.zhimg.com/v2-ddd96dd65b724b7ca26b43dcfbfc42d3_b.jpg& data-size=&normal& data-rawwidth=&675& data-rawheight=&424& data-thumbnail=&https://pic1.zhimg.com/v2-ddd96dd65b724b7ca26b43dcfbfc42d3_b.jpg& class=&origin_image zh-lightbox-thumb& width=&675& data-original=&https://pic1.zhimg.com/v2-ddd96dd65b724b7ca26b43dcfbfc42d3_r.jpg&&&figcaption&DBSCAN笑脸聚类&/figcaption&&/figure&&ol&&li&首先,DBSCAN算法会以任何尚未访问过的任意起始数据点为核心点,并对该核心点进行扩充。这时我们给定一个半径/距离ε,任何和核心点的距离小于ε的点都是它的相邻点。&/li&&li&如果核心点附近有足够数量的点,则开始聚类,且选中的核心点会成为该聚类的第一个点。如果附近的点不够,那算法会把它标记为噪声(之后这个噪声可能会成为簇中的一部分)。在这两种情形下,选中的点都会被标记为“已访问”。&/li&&li&一旦聚类开始,核心点的相邻点,或者说以该点出发的所有密度相连的数据点(注意是密度相连)会被划分进同一聚类。然后我们再把这些新点作为核心点,向周围拓展ε,并把符合条件的点继续纳入这个聚类中。&/li&&li&重复步骤2和3,直到附近没有可以扩充的数据点为止,即簇的ε邻域内所有点都已被标记为“已访问”。&/li&&li&一旦我们完成了这个集群,算法又会开始检索未访问过的点,并发现更多的聚类和噪声。一旦数据检索完毕,每个点都被标记为属于一个聚类或是噪声。&/li&&/ol&&p&与其他聚类算法相比,DBSCAN有一些很大的优势。首先,它不需要输入要划分的聚类个数。其次,不像mean-shift,即使数据点非常不同,它也会将它们纳入聚类中,DBSCAN能将异常值识别为噪声,这就意味着它可以在需要时输入过滤噪声的参数。第三,它对聚类的形状没有偏倚,可以找到任意大小和形状的簇。&/p&&p&DBSCAN的主要缺点是,当聚类的密度不同时,DBSCAN的性能会不如其他算法。这是因为当密度变化时,用于识别邻近点的距离阈值ε和核心点的设置会随着聚类发生变化。而这在高维数据中会特别明显,因为届时我们会很难估计ε。&/p&&h2&EM聚类&/h2&&blockquote&均值→质心,方差→椭圆聚类,权重→聚类大小。&/blockquote&&p&K-Means算法的主要缺点之一是它直接用了距离质心的平均值。我们可以从下图中看出这样做为什么不好——图的左侧是两个半径不同的同心圆,K-Means没法处理这个问题,因为这些聚类的平均值非常接近;图的右侧是一个中心对称的非圆形分布,K-Means同样解决不了它,因为如果单纯依靠均值判断,算法无法捕捉更多特征。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-3f6c54ec04f9e2eb18effd_b.jpg& data-size=&normal& data-rawwidth=&357& data-rawheight=&180& class=&content_image& width=&357&&&figcaption&K-Means的两个失败案例&/figcaption&&/figure&&p&高斯混合模型(GMM)比K-Means算法具有更好的灵活性。它是多个高斯分布函数的线性组合,理论上可以拟合出任意类型的分布,通常用于解决同一集合下的数据包含多个不同的分布的情况。对于GMM,我们假设数据点满足不同参数下的高斯分布——比起均值,这是一个限制较少的假设。我们用两个参数来描述聚类的形状:均值和标准差!以二维分布为例,标准差的存在允许聚类的形状可以是任何种类的椭圆形。因此这个算法的思想是:如果数据点符合某个高斯分布,那它就会被归类为那个聚类。&/p&&p&为了找到每个聚类的高斯参数,我们要用到一种名为期望最大化(EM)的优化算法。下图是高斯混合模型的聚类过程,那么,你知道怎么在其中运用EM算法吗?&/p&&figure&&img src=&https://pic4.zhimg.com/v2-b52ac707e5cd3c9a6fe08b6f6d729a44_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&360& data-rawheight=&309& data-thumbnail=&https://pic4.zhimg.com/v2-b52ac707e5cd3c9a6fe08b6f6d729a44_b.jpg& class=&content_image& width=&360&&&/figure&&ol&&li&首先,我们确定聚类的数量(如K-Means),并随机初始化每个聚类的高斯分布参数。你也可以尝试通过快速查看数据来为初始参数提供更好的猜测,但从上图可以看出,这其实不是很必要,因为算法会很快进行优化。&/li&&li&其次,根据每个聚类的高斯分布,计算数据点属于特定聚类的概率。如果数据点越接近高斯质心,那它属于该聚类的概率就越高。这很直观,因为对于高斯分布,我们一般假设大部分数据更靠近聚类质心。&/li&&li&在这些概率的基础上,我们为高斯分布计算一组新的参数,使聚类内数据点的概率最大化。我们用数据点位置的加权和来计算这些新参数,其中权重就是数据点属于聚类的概率。为了可视化这个过程,我们可以看看上面的图片,特别是黄色的聚类。第一次迭代中,它是随机的,大多数黄点都集中在该聚类的右侧。当我们按概率计算加权和后,虽然聚类的中部出现一些点,但右侧的比重依然很高。随着迭代次数增加,黄点在聚类中的位置也完成了“右下→左下”的移动。因此,标准差的变化调整着聚类的形状,以使它能更适合数据点的分布。&/li&&li&迭代步骤2和步骤3,直至收敛。&/li&&/ol&&blockquote&论智注:对于上述第3步,请结合混合高斯模型定义公式理解。如果我们设K为模型的个数,πk为第k个高斯的权重,即第k个高斯的概率密度函数,其均值为μk,方差为σk。我们对此概率密度的估计就是要求πk、μk和σk各个变量。当求出的表达式后,求和式的各项的结果就分别代表样本x属于各个类的概率。在做参数估计的时候,常采用的方法是最大似然。——引自 姜文晖《聚类(1)——混合高斯模型》&/blockquote&&p&GMM有两个关键优势。首先它比K-Means更灵活,由于标准差的引入,最后聚类的形状不再局限于圆形,它还可以是大小形状不一的椭圆形——K均值实际上是GMM的一个特例,其中每个聚类的协方差在所有维上都接近0。其次,权重的引入为同一点属于多个聚类找到了解决方案。如果一个数据点位于两个聚类的重叠区域,那我们就可以简单为它定义一个聚类,或者计算它属于X聚类的百分比是多少,属于Y聚类的百分比是多少。简而言之,GMM支持混合“成员”。&/p&&p&谈及缺点,和K-Means相比,GMM每一步迭代的计算量比较大。另外,它的求解办法基于EM算法,因此有可能陷入局部极值,需要经过多次迭代。&/p&&h2&层次聚类&/h2&&p&层次聚类实际上可以被分为两类:自上而下和自下而上。其中自下而上算法(Bottom-up algorithms)首先会将每个数据点视为单个聚类,然后连续合并(或聚合)成对的聚类,直到所有聚类合并成包含所有数据点的单个聚类。它也因此会被称为hier&a href=&https://link.zhihu.com/?target=https%3A//www.jqr.com/service/company%3Fbusiness%3D17& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&ar&/a&chical agglomerative clustering 或HAC。该算法的聚类可以被表示为一幅树状图,树根是最后收纳所有数据点的单个聚类,而树叶则是只包含一个样本的聚类。在讲解具体步骤前,我们先看看整个过程的图解。&/p&&figure&&img src=&https://pic4.zhimg.com/v2-6ec3a1e96ecd850fd4f13e3_b.jpg& data-size=&normal& data-rawwidth=&720& data-rawheight=&324& data-thumbnail=&https://pic4.zhimg.com/v2-6ec3a1e96ecd850fd4f13e3_b.jpg& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&https://pic4.zhimg.com/v2-6ec3a1e96ecd850fd4f13e3_r.jpg&&&figcaption&层次聚类&/figcaption&&/figure&&ol&&li&首先,我们把每个数据点看作是一个聚类,即如果数据集中有X个数据点,它就有X个聚类。然后我们设置一个阈值作为衡量两个聚类间距离的指标:如果距离小于阈值,则合并;如果距离大于阈值,迭代终止。&/li&&li&在每轮迭代中,我们会把两个聚类合并成一个聚类。这里我们可以用到average linkage,它的思路是计算所有分属于两个目标聚类的数据点之间距离,然后求一个平均值。每次我们会根据设定的阈值选取平均距离最小的两个聚类,然后把它们合并起来,因为按照我们的标准,它们是最相似的。&/li&&li&重复步骤2,直到我们到达树根,即最后只有一个包含所有数据点的聚类。通过这种方式,我们可以选择要几个聚类,以及什么时候停止聚类。&/li&&/ol&&p&层次聚类不要求我们指定聚类的数量,由于这是一个构建树的过程,我们甚至可以选择那种聚类看起来更合适。另外,该算法对距离阈值的选择不敏感,无论怎么定,算法始终会倾向于给出更好地聚类结果,而不像其他算法很依赖参数。根据层次聚类的特点,我们可以看出它非常适合具有层次结构的数据,尤其是当你的目标是为数据恢复层次时。这一点是其他算法无法做到的。与K-Means和GMM的线性复杂性不同,层次聚类的优势是以较低的效率为代价,因为它具有O(n3)的时间复杂度。&/p&&h2&结论&/h2&&p&以上就是数据科学家需要知道的5个聚类方法。在文章的最后,就让我们以一幅聚类图做结,直观展示这些算法和其他算法的表现!&/p&&figure&&img src=&https://pic1.zhimg.com/v2-d8e6cfdda752_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&800& data-rawheight=&476& class=&origin_image zh-lightbox-thumb& width=&800& data-original=&https://pic1.zhimg.com/v2-d8e6cfdda752_r.jpg&&&/figure&&p&&/p&
作者:编译:编者按:聚类是一种涉及数据点分组的机器学习技术。给定一组数据点,我们可以使用聚类算法将每个数据点到分类到图像中的特定组中。理论上,同一组中的数据点应具有相似的属性和特征,而不同组中的数据点的属性和特征则应高度不同…
在老OMG s5赛季成绩最差的时候,小智感觉自己的240w战队有机可乘,于是约了来打一场娱乐赛,当时被称为旋转木马的大哥和智障打野的灵药虽然比赛打的不怎么好,修理一个主播队还是绰绰有余的,小智被打的屎都出来了,小莫第二把没打完就强退了,然后再也没见这货挑战职业队&br&&br&分割线…………………………………………………………………&br&&br&&br&第一场视频&br&&a href=&//link.zhihu.com/?target=http%3A//www.bilibili.com/video/avFshare_medium%3Dandroid%26share_source%3Dcopy_link%26bbid%3DADC50-4F93-9E08-6A3664infoc%26ts%3D1& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&bilibili.com/video/av16&/span&&span class=&invisible&&379955?share_medium=android&share_source=copy_link&bbid=ADC50-4F93-9E08-6A3664infoc&ts=1&/span&&span class=&ellipsis&&&/span&&/a&&br&第二场视频&br&&a href=&//link.zhihu.com/?target=http%3A//www.bilibili.com/video/avFshare_medium%3Dandroid%26share_source%3Dcopy_link%26bbid%3DADC50-4F93-9E08-6A3664infoc%26ts%3D6& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&bilibili.com/video/av16&/span&&span class=&invisible&&380241?share_medium=android&share_source=copy_link&bbid=ADC50-4F93-9E08-6A3664infoc&ts=6&/span&&span class=&ellipsis&&&/span&&/a&
在老OMG s5赛季成绩最差的时候,小智感觉自己的240w战队有机可乘,于是约了来打一场娱乐赛,当时被称为旋转木马的大哥和智障打野的灵药虽然比赛打的不怎么好,修理一个主播队还是绰绰有余的,小智被打的屎都出来了,小莫第二把没打完就强退了,然后再也没见…
&p&还是多图长文预警。&/p&&p&谢谢大家谬赞,我一个朋友看了这个答案之后告诉我其实我一些理解有误,然后我们讨论了之后,才发现我一直以来收藏的资源,其实是有删节的剪辑版本,而不是真正的原版。现在手机不方便,晚些时候我会修改的。原答案对大家有些误导之处,还望包涵&/p&&p&…………(分割线)……………………………………&/p&&p&特别喜欢海上钢琴师,完整的电影和斗琴的片段不知道看了多少遍,所以作为一个音乐外行也来说说自己的见解。&/p&&p&1900一直在船上长大,没有受过完整的教育,连“妈妈”都以为是一种赛马。所以恐怕他首次听说“duel”这个词的时候,不仅没有理解比赛意味着什么,甚至对于这个单词本身都不清楚是什么意思。如图&/p&&p&&br&&/p&&figure&&img data-rawheight=&528& src=&https://pic1.zhimg.com/50/v2-afde88b0cba26c306168_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic1.zhimg.com/50/v2-afde88b0cba26c306168_r.jpg&&&/figure&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-1575fcf3fe4de0dfa0f8d2_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-1575fcf3fe4de0dfa0f8d2_r.jpg&&&/figure&&p&Jelly上船之后,对于1900的不礼貌片段略过不表,直接开始斗琴部分。&/p&&p&&br&&/p&&p&&b&Round 1&/b&&/p&&p&Jelly演奏的第一首曲子动听而欢快,“Jelly Roll Morton 不是在演奏,而是在爱抚这些音符,听起来就像丝绸滑过了女人的肌肤”这句台词,以及周围人的反应毫无疑问都体现出Jelly超高的水准。&/p&&p&1900欣赏的笑容&/p&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-06c1f81b19272cba35ea661f6cf00c86_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-06c1f81b19272cba35ea661f6cf00c86_r.jpg&&&/figure&&p&陶醉的小提琴手Bill&/p&&figure&&img data-rawheight=&528& src=&https://pic1.zhimg.com/50/v2-c529c2fc9bae3e50adbb04_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic1.zhimg.com/50/v2-c529c2fc9bae3e50adbb04_r.jpg&&&/figure&&p&不过弹着弹着,1900发现Jelly弹起来没完了,放在钢琴上的烟马上就要烧到1900无比珍惜的钢琴上,1900眉头一皱,发现事情并不简单.jpg&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-ccf3bffa68a28aecc45a6d_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-ccf3bffa68a28aecc45a6d_r.jpg&&&/figure&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-1d30f9d67f068054bfb45d_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-1d30f9d67f068054bfb45d_r.jpg&&&/figure&&p&好吧,演奏结束,掌声雷动,一片喝彩,1900也在鼓掌&/p&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-73e6efad1fa_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-73e6efad1fa_r.jpg&&&/figure&&p&&br&&/p&&p&1900开始第一段演奏,然而他弹的是《平安夜》,也就是完全不接招,摆明就是没有把这个比赛当回事,只是来缓和一下气氛,于是傲娇的Jelly就不开心了。&/p&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-8cf884ce39f087db2a77a7e0dc38b7ae_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-8cf884ce39f087db2a77a7e0dc38b7ae_r.jpg&&&/figure&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-90fc784bfa32ab3b1f5a086_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-90fc784bfa32ab3b1f5a086_r.jpg&&&/figure&&p&1900演奏完之后还在讨观众的喝彩。贱就一个字,Jelly怒气值50%&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-31cca32e3aa623ecdab7c18d8a61f285_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-31cca32e3aa623ecdab7c18d8a61f285_r.jpg&&&/figure&&p&&br&&/p&&p&&b&Round 2&/b&&/p&&p&这一场是我认为最有意思的,Jelly演奏的是《the crave》,也是我认为最好听的一首。故事中,Jelly自己对于这首曲子一定是有着感情的,注意他神态的变化。&/p&&p&先严肃&/p&&figure&&img data-rawheight=&528& src=&https://pic1.zhimg.com/50/v2-ebf98b79f14ba_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic1.zhimg.com/50/v2-ebf98b79f14ba_r.jpg&&&/figure&&p&再到洋洋自得的暗爽&/p&&figure&&img data-rawheight=&528& src=&https://pic2.zhimg.com/50/v2-bc75b9e97f6aa2fbf40838dfad85078d_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/50/v2-bc75b9e97f6aa2fbf40838dfad85078d_r.jpg&&&/figure&&p&情绪达到高潮,Jelly不禁笑了出来。&/p&&figure&&img data-rawheight=&528& src=&https://pic2.zhimg.com/50/v2-efdca75f2f64e5c8c01aae_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/50/v2-efdca75f2f64e5c8c01aae_r.jpg&&&/figure&&p&最后完全陶醉在曲子里不能自拔&/p&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-b4f82da1bfd3c9ecb2554d29_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-b4f82da1bfd3c9ecb2554d29_r.jpg&&&/figure&&p&&br&&/p&&p&再看周围人的反应&/p&&p&沉醉×1&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-c4c8c70ccd773b4618bce6e658be5299_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-c4c8c70ccd773b4618bce6e658be5299_r.jpg&&&/figure&&p&沉醉×2&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-456cccffd817ad345fdff9_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-456cccffd817ad345fdff9_r.jpg&&&/figure&&p&然而Jelly自己是个苦出身,他对这首曲子也倾注了很深的感情,1900听出了弦外之音和里面的情感,所以被感动的哭了,连Max都以为他有毛病。&/p&&figure&&img data-rawheight=&528& src=&https://pic1.zhimg.com/50/v2-ee031b10eb2b6abcaed9ac_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic1.zhimg.com/50/v2-ee031b10eb2b6abcaed9ac_r.jpg&&&/figure&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-0fd38cbdcfeb_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-0fd38cbdcfeb_r.jpg&&&/figure&&p&说句题外话,其实Jelly是在现实中是确有其人的。&/p&&p&杰利·罗尔·莫顿(Jelly Roll Morton,日-日),美国&a href=&//link.zhihu.com/?target=https%3A//baike.baidu.com/item/%25E7%%25E5%25A3%25AB%25E4%25B9%2590& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&爵士乐&/a&作曲家、钢琴家。原名费迪南德·约瑟夫·莱蒙特(Ferdinand Joseph Lemott)。出生于&a href=&//link.zhihu.com/?target=https%3A//baike.baidu.com/item/%25E6%%25E5%25A5%25A5%25E5%25B0%%2589%25AF& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&新奥尔良&/a&,是爵士乐历史上最早的巨人之一。12岁时就在新奥尔良 Storyville 的妓院演奏钢琴。年间,在美国南方流浪,巡回钢琴表演,时而以赌博、台球、拉皮条等业作辅助收入,还当过游泳池清洁工、小歌舞剧&a href=&//link.zhihu.com/?target=https%3A//baike.baidu.com/item/%25E4%25B8%%25A7%2592& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&丑角&/a&。&/p&&p&这样一个人创作出欢快动听的曲子,也是他的成名曲,那么在演奏的时候肯定免不了想起自己的往事,包含一种悲伤的情感。现场人很多,但只有Jelly自己和1900能够感受到。&/p&&p&&i&原著小说中是这样描述的:一首“能让德国机械师都落泪的蓝调音乐,仿佛全世界黑人的辛酸经历都在那里,而他用那些音符娓娓道来,扣人心扉”&/i&&/p&&p&另外,还有一个值得注意的细节是,第二场对决时1900一直在认真听,所以能够复制Jelly的演奏。直到Max上去骂他有毛病才分了神,此时两人发生了一段对话。&/p&&p&这段对话中,Jelly还在演奏,但是1900和Max说话,所以没办法认真听。我们听一下就能发现,这一小段对话时Jelly演奏的旋律,在1900复刻他的表演时并没有出现,1900是天才,听一遍就能复制,但1900并非上帝,没认真听的部分是不可能完全复制出来的。&/p&&figure&&img data-rawheight=&528& src=&https://pic1.zhimg.com/50/v2-ad03cdacfed695db14a0d0_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic1.zhimg.com/50/v2-ad03cdacfed695db14a0d0_r.jpg&&&/figure&&figure&&img data-rawheight=&528& src=&https://pic2.zhimg.com/50/v2-d922ee365bdc4cdeefcb5_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/50/v2-d922ee365bdc4cdeefcb5_r.jpg&&&/figure&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-ab54cf4f5ed8ca57a26016abb05fb202_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-ab54cf4f5ed8ca57a26016abb05fb202_r.jpg&&&/figure&&p&最后Jelly一脸严肃的结束了第二段表演,周围又是欢声雷动。&/p&&figure&&img data-rawheight=&528& src=&https://pic2.zhimg.com/50/v2-f1dff7dc21a_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/50/v2-f1dff7dc21a_r.jpg&&&/figure&&figure&&img data-rawheight=&528& src=&https://pic1.zhimg.com/50/v2-e154a9af00f1_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic1.zhimg.com/50/v2-e154a9af00f1_r.jpg&&&/figure&&p&1900自己拉凳子坐下,开始复制Jelly的演奏,周围人大失所望,虽然是同一首曲子,但是没人有兴致再听一遍。但此时,作为高手的Jelly发现事情不对,他之所以上船,是因为1900从不下船,既然他从没有下过船,说明1900从未听过Jelly的曲子,毕竟1900第一次见留声机也是后面的情节了。Jelly意识到了这一点,眼前这个人只听一遍就能将自己的曲子一个调不差的复刻出来,甚至更加完美流畅。举个例子,我手中的资源一共是2小时5分钟29秒,Jelly在第1小时03分49秒开始弹的一小段音符,1900是在第1小时05分52秒开始演奏到同一段,但仔细听就能听出来,1900在这一段处理的更为流畅,甚至可以说比Jelly还要纯熟,可是这首The Crave是Jelly自己创作的,电影中和现实中都是,1900的处理和改编,Jelly不可能听不出来,瞧Jelly一脸哔了狗的表情。&/p&&figure&&img data-rawheight=&528& src=&https://pic1.zhimg.com/50/v2-10df1ebd392_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic1.zhimg.com/50/v2-10df1ebd392_r.jpg&&&/figure&&p&如果非要打个比方的话,我觉得就是《倚天屠龙记》中六大门派围攻光明顶,少林方丈空闻大师对张无忌用了龙抓手,反过来就被张无忌用乾坤大挪移复制的龙抓手打了一套的感觉。作为各自领域的高手,遇到这种情况,大概就是:&/p&&figure&&img data-rawheight=&301& src=&https://pic4.zhimg.com/50/v2-c103d5aa1bdc_b.jpg& data-size=&normal& data-rawwidth=&300& class=&content_image& width=&300&&&/figure&&p&&br&&/p&&p&这里还有一个小细节,1900弹同一段曲子,周围的人都很不耐烦,甚至包括Max也在内,而船上的小提琴手Bill却还是在欣赏音乐,陶醉其中。所以,在这场比赛里,这个长的很有特点的小提琴手虽然也是个凡人,但却是一个真正听音乐的人,比起周围基本上只会“看热闹”的围观群众,高到不知哪里去了。至于他有没有听出两段曲子实际上有细小的差别,我还是觉得没有,他只是在欣赏音乐而已。&/p&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-ba29b931d8886a11fcc6_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-ba29b931d8886a11fcc6_r.jpg&&&/figure&&p&&br&&/p&&p&看下面这张图,不耐烦的围观群众在谈话,而非欣赏音乐,但是画面中央模糊的Jelly一直在认真听&/p&&figure&&img data-rawheight=&528& src=&https://pic2.zhimg.com/50/v2-dbfd11bb69ff252aa16ecd_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/50/v2-dbfd11bb69ff252aa16ecd_r.jpg&&&/figure&&p&此时Jelly怒气值Max,但是已经开始方了。&/p&&figure&&img data-rawheight=&528& src=&https://pic2.zhimg.com/50/v2-edf3f2bc8fb391e45f63f_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/50/v2-edf3f2bc8fb391e45f63f_r.jpg&&&/figure&&p&&b&Round 3&/b&&/p&&p&最后Jelly决定用一首纯粹炫技的曲子,让1900无法模仿,但是此时潜意识中他知道这次比赛凶多吉少,已经乱了阵脚。&/p&&figure&&img data-rawheight=&528& src=&https://pic1.zhimg.com/50/v2-80c76ed409ba_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic1.zhimg.com/50/v2-80c76ed409ba_r.jpg&&&/figure&&p&此时1900不再抱着切磋的想法,他感受到了Jelly的敌意,听到Jelly的炫技表演,满脸的失望和蛋疼。小说中提到:1900脸上的表情“是全世界最失望的”,他说:“那人完全是个傻子。“&/p&&figure&&img data-rawheight=&528& src=&https://pic2.zhimg.com/50/v2-896edccea6abca_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/50/v2-896edccea6abca_r.jpg&&&/figure&&p&&br&&/p&&p&Jelly演奏水准依旧高超,小说里说的是“不是演奏,是魔术,是杂技。他让八十八个琴键都发挥到了极致,以一种骇人的速度,一个错误音符都没有”。&/p&&p&演奏完毕,滑音,环视,鞠躬素质三连。&/p&&figure&&img data-rawheight=&297& src=&https://pic3.zhimg.com/50/v2-a3da198feac_b.jpg& data-size=&normal& data-rawwidth=&720& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&https://pic3.zhimg.com/50/v2-a3da198feac_r.jpg&&&/figure&&figure&&img data-rawheight=&297& src=&https://pic2.zhimg.com/50/v2-e4a7f5dda5c6fb88e750bd_b.jpg& data-size=&normal& data-rawwidth=&720& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&https://pic2.zhimg.com/50/v2-e4a7f5dda5c6fb88e750bd_r.jpg&&&/figure&&figure&&img data-rawheight=&297& src=&https://pic3.zhimg.com/50/v2-0741320ede5000767bdfc4c8af03e316_b.jpg& data-size=&normal& data-rawwidth=&720& class=&origin_image zh-lightbox-thumb& width=&720& data-original=&https://pic3.zhimg.com/50/v2-0741320ede5000767bdfc4c8af03e316_r.jpg&&&/figure&&p&最后主角1900开始认真了,骂出脏话&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-afe41ad9efe4168aaefa461d95571ae9_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-afe41ad9efe4168aaefa461d95571ae9_r.jpg&&&/figure&&p&演奏的过程手都重影了&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-b3b1c762f8e_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-b3b1c762f8e_r.jpg&&&/figure&&figure&&img data-rawheight=&528& src=&https://pic1.zhimg.com/50/v2-b5ebc3e1da70bc032947dbe8c2daa752_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic1.zhimg.com/50/v2-b5ebc3e1da70bc032947dbe8c2daa752_r.jpg&&&/figure&&p&&br&&/p&&p&Jelly一开始就发现事情不对&/p&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-cc0b8fe1baf_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-cc0b8fe1baf_r.jpg&&&/figure&&p&Max发现钱回来了&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-a81e96b8ea_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-a81e96b8ea_r.jpg&&&/figure&&p&这位绅士点燃的雪茄从嘴里滑落掉到了不可描述的位置&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-d3b5baba8acaa6ec9cb4dcfa80077ca2_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-d3b5baba8acaa6ec9cb4dcfa80077ca2_r.jpg&&&/figure&&p&Jelly一脸卧槽的表情&/p&&figure&&img data-rawheight=&528& src=&https://pic1.zhimg.com/50/v2-693e9a452d78a2e6c9bef_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic1.zhimg.com/50/v2-693e9a452d78a2e6c9bef_r.jpg&&&/figure&&p&Bill一脸卧槽的表情&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-c039ddd650ce924a85b9d867f0bb77cb_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-c039ddd650ce924a85b9d867f0bb77cb_r.jpg&&&/figure&&p&吓得Jelly杯子都掉了&/p&&figure&&img data-rawheight=&528& src=&https://pic2.zhimg.com/50/v2-3ed92b8ee44c28db1e9d4d4_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic2.zhimg.com/50/v2-3ed92b8ee44c28db1e9d4d4_r.jpg&&&/figure&&p&服务生刮掉了老太太的假发,老太太都没感觉到&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-e41f5a1b29179caacd0704d0_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-e41f5a1b29179caacd0704d0_r.jpg&&&/figure&&p&Jelly看破红尘的表情&/p&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-e648aa5d491b54ac5c82_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-e648aa5d491b54ac5c82_r.jpg&&&/figure&&p&弹完了,一身是汗&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-edefd67a2ca2d23cb8771e04_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-edefd67a2ca2d23cb8771e04_r.jpg&&&/figure&&p&给Jelly点烟&/p&&figure&&img data-rawheight=&528& src=&https://pic3.zhimg.com/50/v2-718f2f2c0c97f406a91fc447c91603f3_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic3.zhimg.com/50/v2-718f2f2c0c97f406a91fc447c91603f3_r.jpg&&&/figure&&figure&&img data-rawheight=&528& src=&https://pic4.zhimg.com/50/v2-1f5e64d23a_b.jpg& data-size=&normal& data-rawwidth=&1280& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic4.zhimg.com/50/v2-1f5e64d23a_r.jpg&&&/figure&&p&后面的事情就不说了,Jelly在这场炫技中完败,而1900除了出风头之外,内心深处我想还是有些失望的,因为他想和Jelly切磋交流音乐,但Jelly却想和他比赛。所以不光是技巧,就连境界也落了下乘。&/p&&p&&br&&/p&&p&斗琴这一段,大概就是如此。海上钢琴师这样的经典之作,我写不出更好的评价,只能引用一句网友的话来总结:&/p&&p&每个镜头都回味无穷。&/p&
还是多图长文预警。谢谢大家谬赞,我一个朋友看了这个答案之后告诉我其实我一些理解有误,然后我们讨论了之后,才发现我一直以来收藏的资源,其实是有删节的剪辑版本,而不是真正的原版。现在手机不方便,晚些时候我会修改的。原答案对大家有些误导之处,还…
&figure&&img src=&https://pic1.zhimg.com/v2-a84b2f4ca1d591ae0f379a_b.jpg& data-rawwidth=&1280& data-rawheight=&640& class=&origin_image zh-lightbox-thumb& width=&1280& data-original=&https://pic1.zhimg.com/v2-a84b2f4ca1d591ae0f379a_r.jpg&&&/figure&&p&文章选自TowardsDataScienceR,作者:Dima Shulga,机器之心编译。&/p&&blockquote&机器学习本质上是对条件概率或概率分布的估计,而这样的估计到底有多少是置信度?这里就涉及到统计学里面的置信区间与置信度,本文简要介绍了置信区间这一核心概念,它有助于我们从直观上理解评价估计优劣的度量方法。&/blockquote&&p&本文讨论了统计学中的一个基本术语 :置信区间。我们仅以一种非常友好的方式讨论一般概念,没有太多花哨的统计术语,同时还会使用 Python 完成简单的实现!尽管这个术语是非常基础的,但我们有时很难完全理解置信区间到底是什么,为什么我们需要它。&/p&&p&假设你想知道美国有多少人热爱足球。为了得到 100% 正确的答案,你可以做的唯一一件事是向美国的每一位公民询问他们是否热爱足球。根据维基百科,美国有超过 3.25 亿的人口。与 3.25 亿人谈话并不现实,因此我们必须通过问更少的人来得到答案。&/p&&p&我们可以通过在美国随机抽取一些人(与更少人交谈)并获得热爱足球的人的百分比来做到这一点,但是我们不能 100% 确信这个数字是正确的,或者这个数字离真正的答案有多远。所以,我们试图实现的是获得一个区间,例如,对这个问题的一个可能的答案是:「我 95% 相信在美国足球爱好者的比例是 58% 至 62%」。这就是置信区间名字的来源,我们有一个区间,并且我们对它此一定的信心。&/p&&p&非常重要的是我们的样本是随机的,我们不能只从我们居住的城市中选择 1000 人,因为这样就不能很好地代表整个美国。另一个不好的例子是,我们不能给这 1000 个随机用户发 Facebook 消息,这样我们就会得到美国 Facebook 用户的喜爱趋势,因为并不是所有的美国公民都使用 Facebook。&/p&&p&因此,假设我们随机抽取了 1000 个美国人的样本,我们发现,在 1000 人中有 63% 的人喜欢足球,我们能假设(推断)出整个美国人口的情况吗?&/p&&p&为了回答这个问题,我希望我们以一个不同的方式来看待它。假设我们知道(理论上)美国人的确切比例,假设它是 65%,那么随机挑选 1000 人只有 63% 的人喜欢足球的机会是多少?让我们用 Python 来探索这个问题!&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&love_soccer_prop = 0.65
# Real percentage of people who love soccer
total_population = 325*10**6
# Total population in the U.S. (325M)
num_people_love_soccer = int(total_population * love_soccer_prop)
num_people_dont_love_soccer = int(total_population * (1 - love_soccer_prop))
people_love_soccer = np.ones(num_of_people_who_love_soccer)
people_dont_love_soccer = np.zeros(num_
people_dont_love_soccer)
all_people = np.hstack([people_love_soccer, people_dont_love_soccer])
print np.mean(all_people)
# Output = 0.00002
&/code&&/pre&&/div&&p&在这段代码中,我创建了一个表示 3.25 亿人的 NumPy 数组,对于每个人,如果他/她喜欢足球,那么我会存储 1,否则就是零。我们可以通过计算它的平均值来得到数组中的百分比,实际上它是 65%。&/p&&p&现在,让我们取几组容量为 1000 个样本的试验,看看得到的百分比是多少:&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&for i in range(10):
sample = np.random.choice(all_people, size=1000)
print 'Sample', i, ':', np.mean(sample)
Sample 0 : 0.641
Sample 1 : 0.647
Sample 2 : 0.661
Sample 3 : 0.642
Sample 4 : 0.652
Sample 5 : 0.647
Sample 6 : 0.671
Sample 7 : 0.629
Sample 8 : 0.648
Sample 9 : 0.627
&/code&&/pre&&/div&&p&对于每组样本,我们获得了不同的值,但直觉(和统计理论)表示,大量样本的平均值应该非常接近真实百分比。让我们这样试试!我们取很多样本,然后看看会发生什么:&/p&&div class=&highlight&&&pre&&code class=&language-text&&&span&&/span&values = []
for i in range(10000):
sample = np.random.choice(all_people, size=1000)
mean = np.mean(sample)
values.append(mean)
print np.mean(values)
# Output = 0.99992
&/code&&/pre&&/div&&p&我们创建了 10K 个样本,检查了每个样本中热爱足球的人的百分比,然后取平均值,我们得到了 64.98%,这非常接近于实际值 65%。让我们画出我们得到的所有值:&/p&&figure&&img src=&https://pic2.zhimg.com/v2-0e2e51a4ddf21_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&851& data-rawheight=&584& class=&origin_image zh-lightbox-thumb& width=&851& data-original=&https://pic2.zhimg.com/v2-0e2e51a4ddf21_r.jpg&&&/figure&&p&这里你看到的是我们得到的所有样本值的直方图,这个直方图的一个很好的性质是它和正态分布非常相似。正如我所说的,我不想在这里使用太多的统计术语,但假设如果我们这样做了很多次(无限次),我们将得到一个非常接近正态分布的直方图,我们可以知道该分布的参数。用更简单的话来说,我们会知道这个直方图的形状,所以我们可以精确地知道在任意数值范围内有多少个样本。&/p&&p&下面是一个例子,我们会多次运行这个模拟(试图达到无穷大):&/p&&figure&&img src=&https://pic3.zhimg.com/v2-65fa05dcdb72_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&870& data-rawheight=&589& class=&origin_image zh-lightbox-thumb& width=&870& data-original=&https://pic3.zhimg.com/v2-65fa05dcdb72_r.jpg&&&/figure&&p&首先,我们可以看到直方图的中心(平均值)接近 65%,正如我们所预期的,但我们可以通过查看直方图来得到更多信息,例如,我们可以说,一半样本都大于 65%,或者我们可以说大约 25% 的样本大于 67%,甚至可以说(大致)只有 2.5% 的样本大于 68%。&/p&&p&在这一点上,很多人可能会问两个重要的问题:「我怎样才能取得无数的样本?」和「它对我有什么帮助?」。&/p&&p&让我们回到我们的例子,我们抽取了 1000 人的样本,得到了 63%,我们想知道,随机抽样的 1000 人中有 63% 的足球爱好者的概率是多少。使用这个直方图,我们可以说有(大概)25%的概率,我们会得到一个小于或等于 63% 的值。该理论告诉我们,我们实际上并不需要得到无限的样本,如果我们随机选择 1000 人,只有 63% 的人喜欢足球是可能发生的。&/p&&p&实际上,为了找到不同数值范围或区间的概率,我们需要知道或至少估计总体分布的标准差。因为我们想把事情变得简单一点,因此现在先不讨论它。&/p&&p&让我们回到现实和真正的问题,我不知道美国足球爱好者的实际比例,我只抽取了一个样本,得到了 63%,这对我有什么帮助?&/p&&p&所以,我们不知道在美国热爱足球的人的实际比例。我们所知道的是,如果我们从总体分布取无数个样本,它将如下所示:&/p&&figure&&img src=&https://pic1.zhimg.com/v2-76dea806e9f35ac0cd0f654c5ed87b94_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&815& data-rawheight=&501& class=&origin_image zh-lightbox-thumb& width=&815& data-original=&https://pic1.zhimg.com/v2-76dea806e9f35ac0cd0f654c5ed87b94_r.jpg&&&/figure&&p&这里 μ 是总体分布的平均值(我们例子中足球爱好者的实际百分比),σ 是总体分布的标准差。&/p&&p&如果我们知道这一点(并且我们知道标准差),我们可以说约 64% 的样本会落在红色区域,或者 95% 以上的样品会落在图中的绿色区域之外:&/p&&figure&&img src=&https://pic3.zhimg.com/v2-a9a4e7e688e13bd735a2030f50ecfc4e_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&866& data-rawheight=&342& class=&origin_image zh-lightbox-thumb& width=&866& data-original=&https://pic3.zhimg.com/v2-a9a4e7e688e13bd735a2030f50ecfc4e_r.jpg&&&/figure&&p&如果我们在之前假设的实际百分比 65% 上使用该图,那么 95% 以上的样本将在 62% 和 68% 之间(+ - 3)。&/p&&figure&&img src=&https://pic2.zhimg.com/v2-09ad1aac1f5_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&1080& data-rawheight=&724& class=&origin_image zh-lightbox-thumb& width=&1080& data-original=&https://pic2.zhimg.com/v2-09ad1aac1f5_r.jpg&&&/figure&&p&当然,距离是对称的,所以如果样本有 95% 落在在实际百分比 -3 和 +3 之间,那么真实百分比落在样本百分比 -3 和 +3 之间的概率为 95%。&/p&&p&如果我们抽取一个样本,得到了 63%,那么我们可以说我们 95% 确信实际比例在 60%(63-3)和 66%(63 + 3)之间。&/p&&p&这就是置信区间,区间为 63 + -3,置信度为 95%。&/p&&p&我希望大家现在对置信区间有更好的理解,但这个介绍忽略了一些重要的技术性的部分。有很多文章包含了这些部分,因此读者可继续阅读相关的材料加强理解。&/p&&p&原文链接:&a href=&http://link.zhihu.com/?target=https%3A//towardsdatascience.com/a-very-friendly-introduction-to-confidence-intervals-9add126e714& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&towardsdatascience.com/&/span&&span class=&invisible&&a-very-friendly-introduction-to-confidence-intervals-9add126e714&/span&&span class=&ellipsis&&&/span&&/a&&/p&
文章选自TowardsDataScienceR,作者:Dima Shulga,机器之心编译。机器学习本质上是对条件概率或概率分布的估计,而这样的估计到底有多少是置信度?这里就涉及到统计学里面的置信区间与置信度,本文简要介绍了置信区间这一核心概念,它有助于我们从直观上理…
&figure&&img src=&https://pic3.zhimg.com/50/v2-77a5a0e27acfff2b5d183d_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&703& data-rawheight=&258& class=&origin_image zh-lightbox-thumb& width=&703& data-original=&https://pic3.zhimg.com/50/v2-77a5a0e27acfff2b5d183d_r.jpg&&&/figure&&p&现在的 Python 科学栈非常成熟,里面有各种用途的数据库,包括&b&机器学习&/b&和&b&数据分析&/b&。数据可视化是探究数据和交流结果的一个重要部分。古语有云:“没图你说个oo”,相信在很多知乎回答下方大家都见过这张图:↓↓&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/50/v2-ebd00afffe5bf79fd38be77e725ada83_b.jpg& data-size=&normal& data-rawwidth=&254& data-rawheight=&199& class=&content_image& width=&254&&&figcaption&数据可视化重要性可见一斑&/figcaption&&/figure&&p&&br&&/p&&p&过去几年,出现了许多新的用于可视化数据的 Python 库。在这些库里面,用的最广泛的是 matplotlib,但也有一些库,如 vispy,bokeh,seaborn,pygal,folium 和 networkx,它们大都建立在 matplotlib 上,有些还具有 matplotlib 所不支持的功能。&/p&&p&&br&&/p&&p&其它答主也提到了有哪些可用于数据可视化的 Python 库以及它们的地址,我们今天就来看看&b&这些库有哪些优缺点,什么时候最适合用哪个库&/b&。&/p&&p&&br&&/p&&p&我们会借助真实数据集,并用上文提到的这些 Python 库将数据可视化。这样一来,我们会&b&发现每个库最适合的领域,以及如何最有效地利用 Python 数据可视化的种种工具。&/b&&/p&&p&&br&&/p&&h2&&b&探究数据集&/b&&/h2&&p&&br&&/p&&p&在我们开始可视化数据之前,我们快速浏览一下即将使用的数据集。我们下面会使用 openflights 的数据(&a href=&//link.zhihu.com/?target=https%3A//openflights.org/data.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&openflights.org/data.ht&/span&&span class=&invisible&&ml&/span&&span class=&ellipsis&&&/span&&/a&),其中包括路线,机场和航空公司的数据。路线数据中的每一行对应于两个机场之间的航线。机场数据中的每一行对应于世界上的一个机场,并附有相关信息。航空公司数据中的每一行代表一家航空公司。&/p&&p&首先我们读取数据:&/p&&div class=&highlight&&&pre&&code class=&language-python&&&span class=&c&&# Import the pandas library.&/span&
&span class=&kn&&import&/span& &span class=&nn&&pandas&/span&
&span class=&c&&# Read in the airports data.&/span&
&span class=&n&&airports&/span& &span class=&o&&=&/span& &span class=&n&&pandas&/span&&span class=&o&&.&/span&&span class=&n&&read_csv&/span&&span class=&p&&(&/span&&span class=&s&&&airports.csv&&/span&&span class=&p&&,&/span& &span class=&n&&header&/span&&span class=&o&&=&/span&&span class=&bp&&None&/span&&span class=&p&&,&/span& &span class=&n&&dtype&/span&&span class=&o&&=&/span&&span class=&nb&&str&/span&&span class=&p&&)&/span&
&span class=&n&&airports&/span&&span class=&o&&.&/span&&span class=&n&&columns&/span& &span class=&o&&=&/span& &span class=&p&&[&/span&&span class=&s&&&id&&/span&&span class=&p&&,&/span& &span class=&s&&&name&&/span&&span class=&p&&,&/span& &span class=&s&&&city&&/span&&span class=&p&&,&/span& &span class=&s&&&country&&/span&&span class=&p&&,&/span& &span class=&s&&&code&&/span&&span class=&p&&,&/span& &span class=&s&&&icao&&/span&&span class=&p&&,&/span& &span class=&s&&&latitude&&/span&&span class=&p&&,&/span& &span class=&s&&&longitude&&/span&&span class=&p&&,&/span& &span class=&s&&&altitude&&/span&&span class=&p&&,&/span& &span class=&s&&&offset&&/span&&span class=&p&&,&/span& &span class=&s&&&dst&&/span&&span class=&p&&,&/span& &span class=&s&&&timezone&&/span&&span class=&p&&]&/span&
&span class=&c&&# Read in the airlines data.&/span&
&span class=&n&&airlines&/sp

我要回帖

更多关于 高数邻域 的文章

 

随机推荐