如何看待 Python 超越 R 成为最受欢迎的机器学习语言

您还没有登录,快捷通道只有在登录后才能使用。 还没有帐号? 赶紧
Python赶超R语言,成数据科学、机器学习平台中最热语言?
在线时间72小时
&&发表于: 10-07
09月14日报道:近日,kdnuggets做了一个关于数据科学、机器学习语言使用情况的问卷调查,他们分析了954个回答,得出结论——Python已经打败R语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。有关此次问卷更具体的情况如何?雷锋网 AI科技评论将kdnuggets上发表的总结文编译整理如下:之前我们在kdnuggets上做了这样一个问卷调查,两年,在分析、数据科学和机器学习的工作中,你用R语言,还是Python,或两者都用,或选择其他的语言?通过分析954个回答,我们得出了这样的结论:虽然Python并没有完全取代R语言,但在2017年,Python已经成功打败R语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。在2016年Python还是第二位(主要用Python的人占34%,主要用R语言的人占42%),在2017年Python就以5%的优势领先于R语言(主要用Python的人占41%,主要用R语言的人占36%)。同时用Python和R两种语言的人也从2016年的8.5%增长到12%了,而用其他语言的人则从16%降到11%。'995')this.width='995';">这张图看起来很复杂,不过从中可以很容易地看出Python在忠诚度和转换率两个关键层面都领先于其他语言。忠诚度:使用Python的用户对它的忠诚度要高于使用其他语言的用户。2016年使用Python的用户中,有91%的人2017年还在继续使用它,而R语言的用户留存率为74%,其他语言的用户留存率则为60%。转换率:从2016年到2017年,只有5%的Python用户转向R语言,而R语言用户转向Python的则是10%,这是前者的两倍。另外,2016年同时使用两种语言的人中,只有49%的人还在继续使用这两种语言,38%的人转向Python,11%的人转向R语言。接下来我们看一下年这几种语言的使用趋势。因为我们2015年【R vs Python】的问卷调查中没有提供【同时使用两种语言】这个选项,因此下面这四年的对比趋势图中,年的Python、R语言使用趋势我们是这样计算的:Python*= (Python的比例) + 50% * (同时使用Python和R语言的比例)R* = (R的比例) + 50% * (同时使用Python和R语言的比例)可以看到,R语言的使用率在逐年缓慢下降(从2015年的50%降到2017年的36%),而Python的使用率则从2014年的23%增长到2017年的47%。另外,其他语言的使用率也在逐年下降。最后,我们也按地区分析了几种语言的使用趋势,地区分布情况如下:美国/加拿大,40%欧洲,35%亚洲,12.5%拉美,6.2%非洲/中东,3.6%澳洲/新西兰,3.1%'995')this.width='995';">我们注意到不同区域的语言变化情况:Python的使用率增长了8-10%R语言的使用率降低了大约2-4%其他语言的使用率降低了5-7%上面的数据表明了Python的使用前景很好,我们也预测R语言和其他语言的使用率还是会有相当的占比,因为它们已经有很深的用户基础。
访问内容超出本站范围,不能确定是否安全
限100 字节
如果您提交过一次失败了,可以用”恢复数据”来恢复帖子内容
您目前还是游客,请
验证问题: ECS是阿里云提供的什么服务? 正确答案:云服务器
&回复后跳转到最后一页Python、R、Java、 C++,谁是最受欢迎的机器学习语言&&
Python、R、Java、 C++,谁是最受欢迎的机器学习语言?
对于开发者来说,掌握什么编程语言能更容易找到机器学习或者数据科学的工作?
这是个许多人关心的问题,非常实际,也在许多论坛被翻来覆去地讨论过。非常显着的是 &Python 是大趋势&这一论调,似乎它即将在机器学习领域一统天下。那么这种说法到底有几分事实?&
首先要指出的是,大多数对编程语言的讨论都比较主观。比如说,有的开发者(尤其是初学者)会因为一门语言的某个特性很契合自己的使用习惯、用着最顺手,就狂赞这门语言,而对其他语言的优点选择性失明。而这篇编译自 IBM 开发者论坛的文章,则尽量避免了主观判断,用数据来展示各门开发语言在工业界的实际使用情况,可以说是十分难得。毕竟,统计学习的核心就是用数据说话。AI 开发者应该更明白可靠数据相比主观臆测的价值。&
闲话少说,我们来看看 2016 年开发语言使用情况统计,到底哪门语言的使用人数上升最快?居前几位的都是哪些?
图1:机器学习与数据科学领域各语言的雇主招聘指数对比&
如图所示,这是利用美国职位搜索引擎
得出的机器学习、数据科学招聘趋势:对这些领域内开发职位所列出的编程语言要求进行了统计。它展示出了企业都在寻找哪些语言技能。但注意:&
这并不能精确体现各公司开发人员正在使用哪些语言。&
这是美国的机器学习业界趋势,与中国、学界关系不是那么紧密。&
没有包涵在搜索结果内的语言,不代表它们的招聘职位比上述语言要少。&
我们可以清楚看出,美国雇主最需要的前四大语言**是 Python,Java,R,C++。其中,Python 在 2015 年中超过 Java 跃升至第一。&
然后,把搜索结果限制在机器学习领域(去掉数据科学),数据其实差不多:
图2:机器学习领域各语言的雇主招聘指数对比&
这张折线图中包含了 Lua,但由于它的招聘职位实在太少,代表 Lua 的线与坐标轴重合。&
我们能从这两组数据中推断出什么?&
1.Python 是市场的领先者,作为最受欢迎的机器学习语言当之无愧。 另外,Python 与 Java 之间的差距正在被拉开。但是 Java 与 R 之间的差距正在被缩小。IoT科技评论获知,有业内人士对居第二位的语言是 Java 而不是 R 感到惊讶。通常,大家的主观感受是除了 Python,使用 R 语言开发机器学习应用最普遍。&
2.Python 并没有成为霸主。各主流语言的招聘需求都很多。对小众语言如 Lua 和 Julia ,目前业界的需求确实小些,但其他语言都占有了相当的比例。&
3.进入 2016 年后,市场对所有语言的需求都大幅上涨。Python 并没有与其他语言拉开明显差距。这表现出,最近一年里业界对机器学习和数据科学整体的兴趣和重视。&
4.Scala 在 2014 年之后的增长十分惊人。2014 年之前,对它几乎没有招聘需求。但那年之后一直在稳定增长。2016 年,它赶上了 Javacript,达到主流语言阵营的水平。&
5.作为一门口碑不错的新兴语言,Julia 的普及程度还很低。但在 2016 下半年有了巨幅增长。现在还看不出来它是否会成为主流语言。&
关于 Scala 和 Julia 的增长趋势,在它们的增长率折线图中,我们可以很明显的看出来:
图3:Scala,Julia,Lua 在机器学习、数据科学领域的雇主招聘指数增长率&
然后,当我们省略掉 Scala、Julia 和 Lua,统计主流语言的增长率,可以明白无误看出 Python 和 R 的增长速度远超其他主流语言:
图4:机器学习与数据科学领域,主流语言的雇主招聘增长率&
R 的增长率始终高于 Python,位居第一,更是远超 Java。以此来看,在可预测的将来,R 不但不会消失,还会成为更受欢迎的主流机器学习语言。因此,说&Python 是未来大趋势&肯定是不对的。&
但是,当我们聚焦于细分领域&深度学习&,数据就变得很不一样:
图5:深度学习领域各语言的雇主招聘指数对比&
在深度学习市场,对 Python 的招聘需求仍然最高。但前五大语言的排序变成了Python,C++,Java,C,R。这里有很明显的对高性能计算语言的侧重。 而且,Java 的增长速度惊人,它可能很快成为深度学习领域的第二位。在可预期的将来,R 还不会成为最受欢迎的深度学习语言。令人惊讶的是 Lua 的存在感之低。要知道,开源框架巨头之一的 Torch 便是基于 Lua,许多开发者因此会认为它在深度学习市场占有特殊地位。&
对于文章开头提出的问题&&雇主需要掌握什么语言的开发者,答案已经很明确了:
在机器学习和数据科学市场,Python, Java, 和 R 的招聘需求最大;&
在深度学习领域, Python, Java, C++ 以及 C 更被公司欢迎。&
但大家需要注意的是,这只是私营公司的招聘需求。学界研究人员的偏好会有很大出入。另外,自学 AI 的业余爱好者、暂时没打算在这行谋生的,也不需要对这些数据太过在意。&
至于文章原作者的个人观点,他本人较倾向 Python。原因有二:1. 基于 Python 的顶级机器学习框架选择较多。2. 作者来自计算机专业背景,Python 的逻辑更适合。相比之下,R 语言就更适合统计学、数学背景的开发者。在 Python 之外,作者更倾向于使用 C++,这是因为他用 C++ 写代码写了半辈子,已经习惯了。其他人、新人可能更适合学习其他语言。比如说,写代码功底不深的统计学背景开发者通常用 R 语言更顺手。经验丰富的 Java 开发者可以接着用 Java,尤其有那么多开源 Java API 。&
归纳起来,还是程序猿的个人学习、开发经历,以及知识背景影响了他的语言偏好。很少有人能够涉猎所有主流语言,即便只掌握几门语言,也未必在每一门上的开发经验都够深。因此,lao司机对新入门开发者的语言推荐都带有强烈主观色彩。即使拿这篇以陈述数据为主的文章来说,也有它的主观局限:Matlab/Octave 和 Lisp,这两门重头语言并没有包括在内。这大约是由于作者并没有充分接触这三门语言。而 AI 大牛吴恩达对新手的建议就是选择 Octave 或者 Matlab 起步。&
对于新入门、正犹豫选择哪门语言的技术宅,关键还是在投入大量时间之前多听、多看、多了解;比较不同人的观点,选择最适合自己的。
我爱物联网是一个专注于物联网行业,为广大物联网相关人员提供物联网资讯,物联网技网络安全术,物联网应用,物联网方案,物联网研究的一个整合性服务平台/
被转藏 : 0次
被转藏 : 0次非常抱歉,您请求的页面当前无法访问
这可能是因为:
1. 网站内容涉嫌违反国家相关规定
2. 输入的地址不正确,或页面已被删除
根据国家相关规定,不允许为违规或未备案网站提供服务。
如果您认为网站已备案、内容正常或有其他疑问,请联系我们的客服。利用Python,四步掌握机器学习 - Python - 伯乐在线
& 利用Python,四步掌握机器学习
为了理解和应用机器学习技术,你需要学习 Python 或者 R。这两者都是与 C、Java、PHP 相类似的编程语言。但是,因为 Python 与 R 都比较年轻,而且更加“远离”CPU,所以它们显得简单一些。相对于R 只用于处理数据,使用例如机器学习、统计算法和漂亮的绘图分析数据, Pthon 的优势在于它适用于许多其他的问题。因为 Python 拥有更广阔的分布(使用 Jango 托管网站,自然语言处理 NLP,访问 Twitter、Linkedin 等网站的 API),同时类似于更多的传统语言,比如 C python 就比较流行。
在Python中学习机器学习的四个步骤
1、首先你要使用书籍、课程、视频来学习 Python 的基础知识
2、然后你必需掌握不同的模块,比如 Pandas、Numpy、Matplotlib、NLP (自然语言处理),来处理、清理、绘图和理解数据。
3、接着你必需能够从网页抓取数据,无论是通过网站API,还是网页抓取模块Beautiful Soap。通过网页抓取可以收集数据,应用于机器学习算法。
4、最后一步,你必需学习机器学习工具,比如 Scikit-Learn,或者在抓取的数据中执行机器学习算法(ML-algorithm)。
1.Python入门指南:
有一个简单而快速学习Python的方法,是在
注册,然后开始编程,并学习 Python 基础知识。另一个学习Python的经典方法是通过
,一个为广大 Python 编程者所推荐的网站。然后还有一个优秀的 PDF,
。python社团还为初学者准备了一个Python资源列表。同时,还有来自 O’Reilley 的书籍 《Think Python》,也可以从这里免费 。最后一个资源是 Python 用于计量经济学、统计学和数据分析的介绍:《 》,其中也包含了 Python 的基础知识。
2.机器学习的重要模块
关于机器学习最重要的模块是:, ,
。有一本书涵盖了其中一些模块:《》 。然后来自于1.的免费书籍《》,同时也包括 Numpy,Pandas,Matplotlib 和 IPython这几个模块。还有一个资源是 ,也包含了一些很重要的模块。以下是其他免费模块的相关链接: Numpy (, , ),
Pandas (,,)
3.从网站通过API挖掘和抓取数据
一旦理解了Python的基础知识和最重要的模块,你必需要学习如何从不同的源收集数据。这个技术也被称作网页抓取。传统的源是网站文本,通过API进入twitter或linkedin一类网站得到的文本数据。网页抓取方面的优秀书籍包括:《 》 (免费书籍),《》 和《 》。
最后这个文本数据必须要转换为数值数据,通过自然语言处理(NLP)技术完成,
上面有相应的资料。其它的数据包括图片和视频,可以使用计算机图像技术分析: ,
,这些是图片分析方面的典型资源。
以下例子中包括可以用基本的Python命令行实现,有教育意义,而且有趣的例子,以及网页抓取技术。
(微型教程:使用Python保存推文到数据库)
(网页抓取关键数据科学工作技巧)
(案例学习:电影评论中的情感分析)
(第一网页抓取)
(邮件的情感分析)
(简单文本分类)
(Python基础情感分析)
(使用Python和NLTK 做Twitter情感分析)
(第二个尝试:Python情感分析)
(电影评论相关Kaggle Competition中的NLP自然语言处理)
4. Python 中的机器学习
机器学习可以分为四组:分类,聚类,回归和降维。
“分类”也可以称作监督学习,有助于分类图片,用来识别图片中的特征或脸型,或者通过用户外形来分类用户,并给他赋不同的分数值。“聚类”发生在无监督学习的情况,允许用户在数据中识别组/集群。“回归”允许通过参数集估算一个值,可以应用于预测住宅、公寓或汽车的最优价格。
罗列了 Python、C、Scala、Java、Julia、MATLAB、Go、R 和 Ruby等语言中所有学习机器学习的重要模块、包和技巧。有关Python机器学习的书籍,我特别推荐《》。尽管有点短,但它很可能是机器学习中的经典,因为它提到了“集体智慧编程时代”:。这两本书帮助你通过抓取数据建立机器学习。最近关于机器学习的出版物大多都是基于模块 scikit-learn 。由于所有的算法在模块中都已实现,使得机器学习非常简单。你唯一要做的事就是告诉 Python ,应该使用哪一个机器学习技巧 (ML-technique) 来分析数据。
可以在 scikit-learn 官方网站上找到。其他的帖子可以通过以下链接获取:
(机器学习中 Python 和 Scikit-Learn 的介绍)
(Python 中的数据科学)
(用机器学习来预测坏账)
(通过机器学习来分类文本的通用架构)
(利用 Python 和 AI 人工智能来预测酒的品种)
(应用机器学习的建议)
(使用 scikit-learn 预测用户流失)
(映射你的音乐收藏)
(Python 中的数据科学)
(案例学习:电影评论中的情感分析)
(Python中的文档聚类)
(5 个最流行的Python相似度测量的实现)
(案例学习:电影评论中的情感分析)
(将会是 Python 么?)
(机器学习中的文本处理)
(使用色彩灯光秀和实时机器学习黑入史诗级 NHL(北美冰球联赛)进球庆祝)
(温哥华房间价格)
(探索和预测大学教师工资)
(预测航班延误)
关于机器学习和 Python 中模块 scikit-learn 的书籍:
新闻网站上的书籍)
(用 Python 建立机器学习系统)
(用 Python 建立机器学习系统,第二版)
(学习 scikit-learn:Python 中的机器学习)
(透视机器学习算法)
(抓取的数据科学——关于 Python 的首要原则)
(Python 中的机器学习)
接下来数月将要发行的书籍包括:
《》 (Python 机器学习的介绍)
《》 (思考 Python 机器学习:接近测试驱动)
机器学习相关的课程和博客
你想要得到一个学位,加入在线课程,或者参加线下讲习班、大本营或大学课程么?这里有一些关于逻辑分析、大数据、数据挖掘和数据科学的在线教育站点链接: 。另外推荐一些在线课程–来自Udacity的Coursera 课程:
和 。还有一些关于机器学习的博客列表:。
最后是来自 Jake Vanderplas 和 Olivier Grisel,关于探索机器学习的优秀 。
机器学习理论
想要学习机器学习的理论?那么,《》和《 》 是常常被引用的经典。然后还有另外两本书籍:《 》和《 》。这些链接包括免费的PDF,你不需要付费!如果不想阅读这些书籍,请观看视频:!
关于作者:
可能感兴趣的话题
o 256 回复
关于 Python 频道
Python频道分享 Python 开发技术、相关的行业动态。
新浪微博:
推荐微信号
(加好友请注明来意)
– 好的话题、有启发的回复、值得信赖的圈子
– 分享和发现有价值的内容与观点
– 为IT单身男女服务的征婚传播平台
– 优秀的工具资源导航
– 翻译传播优秀的外文文章
– 国内外的精选文章
– UI,网页,交互和用户体验
– 专注iOS技术分享
– 专注Android技术分享
– JavaScript, HTML5, CSS
– 专注Java技术分享
– 专注Python技术分享
& 2017 伯乐在线

我要回帖

 

随机推荐