大数据 书籍书籍哪家最好

您的 IP 地址/地理位置:58.214.219.72江苏&&无锡&&联通
当前位置: &
荐书!推荐5本关于互联网+创业的书籍 20:38:13&|&编辑:tarnford&|&查看:&|&评论:
来,我们看看真正的创业机会是什么。
《掘金:互联网+时代创业黄金指南》
未来扑面而来,预见方能预见!机遇从来不会主动降临,未来也从不是自动发生。来,我们聊聊真正的创业机会是什么。企鹅智酷经过长达半年深入调研,近距离观察行业变化,这本书覆盖社交、O2O、媒体、教育、娱乐等5大领域,11个细分行业,分析了几十个典型案例&&我们希望可以通过这些努力,找到移动时代真正的创业机会,以及更加重要的,隐藏于机会窗口下面的危险与挑战。如果想要更深入、更详细地了解这些领域的创业机会,请从第一章开始阅读吧。
《工业4.0:正在发生的未来》
全球视角、本土实践;案例丰富,逻辑清晰。深入浅出,让你轻松掌握工业4.0的核心与本质。德国工业4.0是把工厂、机器、和人通过高度联结,形成自组织的生产,其内涵已经远远超越机器的自动化。工业4.0不仅为中国的工业生产提供了一种全新思路,而且与中国国策&两化融合&(工业化与信息化深度融合)战略不谋而合。新一届中国政府鼎力推荐工业4.0,工信部快马加鞭制定&中国制造2025&,都是为了使工业4.0能顺利落地中国,并开花结果,升级&中国智造&,调整就业的结构性失衡。中国版&工业4.0&&&&中国制造2025&是我们未来十年的国之大略。
《互联网+:从IT到DT》
马云:&人类正从IT走向DT,只有让别人成功,你才会成功!&阿里研究院权威发布,&互联网+&国民必读手册。深度解析了&互联网+&的内涵及其与云计算、、新分工网络的关系。世界正从IT走向DT(数据技术)。IT以自我控制、自我管理为主,DT以服务大众、激发生产力为主,未来属于DT时代。书中以无可辩驳的实证研究,详述了互联网使商业、金融、物流发生的巨大变化,以及将在传统制造业、农业领域引发的生产方式的革命。&互联网+&不只是一场物理反应,而是一场极其深刻的化学过程。只有通过这场化学过程,才能真正实现和社会经济转型。
《互联网+:跨界与融合》
&互联网+&时代来临!每个企业都要找到自己的&互联网+&。这是一本真正意义上讲解从&互联网+&的理论与框架到产业、企业实践的专著。&互联网+&是什么?&互联网+&的核心是什么?&互联网+&的理论与框架是什么?互联网&+&什么?&互联网+&如何+?传统企业如何做好&互联网+&?&互联网+&的原动力是什么?在本书中都做了深刻阐述。
《褚橙你也学不会》
褚橙热卖,是褚时健的名声作用大,还是褚橙的质量真好?曾经的烟草大王褚时健,75岁出狱后开始种橙子,10年后再次傲视同行。2014年,在万科和找同行网的协助下,黄铁鹰来到了云南省新平县褚橙的果园,对褚橙这一经典案例进行调查。曾经在四个行业获得成功的褚时健才是真正的创业大咖,他的创业经历对创业者来说尤其值得学习!
From:小窗科技
相关阅读:
搜索"raincent"或扫描下面的二维码后使用快捷导航没有帐号?
查看: 3077|回复: 7
大数据方面书籍推荐
高级会员, 积分 971, 距离下一级还需 29 积分
论坛徽章:13
本帖最后由 许熙平 于
11:41 编辑
大数据现在正在被称为一个时代的标志,了解和学习大数据,要从理念上彻底转变,彻底理解大数据思维,并渗透到血液和骨髓中,换句话说,你的世界观要彻底转变!而要实现这个转变,必须经过初级、中级和高级三个阶段的学习。以下是这三个阶段大数据方面的书籍推荐。初级阶段:《大数据时代》作者:[英]维克托·迈尔-舍恩伯格,[英]肯尼思·库克耶,翻译:盛杨燕,周涛不用说了,肯定是这本书。读完这本书,要求你形成大数据的概念,即知道这么几点:1、绝不是有很多数据就叫大数据;2、大数据是一种数据分析方式,与传统数据分析方式有着本质上的不同;3、大数据的特点是“关注相关性,不关注因果”,这是大数据最核心的东西,一定要真正理解,并牢牢记住,不然你就很容易被别人忽悠;4、大数据采用的是统计的方法;5、大数据主要是结合进行机器的自动数据挖掘;6、大数据主要是用来作预测的。而不是象一般的数据分析,只是分析出历史情况和现状,未来还是要靠人去预测,大数据则是直接告诉你未来的结果。中级阶段:《失控》作者:凯文·凯利(KEVIN KELLY),很多人都亲切地叫他KK,翻译:东西文库为什么是这本书呢?学完初级阶段要记住的几件事还没忘吧?对,用统计的方法,而不是因果的方法,预测未来。在对预测机制进行剖析的时候,法默最喜欢用这个例子来进行说明:「来,接着!」他说着就朝你扔过来一个棒球。你抓住了球。「你知道你是怎么接住这个球的吗?」,他问道。「通过预测。」用f=ma(公式)来预测,或者说线性预测,就是通过因果推理来进行预测,即根据球的质量、加速度等等因素,找出这个球为什么会从那个地方飞到这个地方的原因;而“归纳”即是“统计”的意思,或者说是较粗略的统计,归纳是不问原因的,接住这个球就完了,管它是什么原因。你想成为大数据高手,你想用统计的方法来对某些东西进行预测? 好了,现在你来告诉我,还有什么理由不去好好读这本书?高级阶段:《复杂性》作者:[美]尼古拉斯·雷舍尔(NICHOLAS RESCHER),翻译:吴彤学完中级阶段,你接触到了一件事,“复杂性”,知道了事情复杂到一定程度,就不可能用寻找因果的方法去进行预测。那么到底什么是复杂性,它的本质和原理是什么?想成为大数据高手,你不能对此一无所知,因为你将一辈子与复杂甚至是极其复杂的事情打交道。推荐这本书还有个原因。大家都知道大数据是研究数据的相关性,即找出数据之间的关系。当我经历了15年统计学人工智能数据相关性的探索和研究,感觉已经研究得差不多了,但又觉得要解决所有的问题还有不小的距离,这时就感到很迷茫,不知下一步的研究该往何方去,有种路越走越窄的感觉,又有一种达到顶峰的幻觉,直到看到这本书中的一句话:“可以考虑它们的关系,再考虑这些关系中的关系,如此下去。”大家千万不要小看这句话中的“如此下去”几个字,他指明了一个无穷叠代,即 “关系的关系的……关系”,而智能将在这里涌现,解决复杂性问题预测的关键很可能就在这里,这句话打开了一个非常广阔的前景,将象宇宙一样没有穷尽。高级阶段(2):《量子物理史话》作者:曹天元,辽宁教育出版社你一定有疑问,“这本书就能让我改变世界观?”那么我们就来看看书中说些什么吧:量子世界的本质是“随机性”。传统观念中的严格因果关系在量子世界是不存在的,必须以一种统计性的解释来取而代之,波函数ψ就是一种统计,它的平方代表了粒子在某处出现的概率。当我们说“电子出现在x处”时,我们并不知道这个事件的“原因”是什么,它是一个完全随机的过程,没有因果关系。因果性必须死,因为物理学需要生!停止争论吧,上帝真的掷骰子!随机性是世界的基石,当电子出现在这里时,它是一个随机的过程,并不需要有谁给它加上难以忍受的条条框框。……而统计规律则把微观上的无法无天抹平成为宏观上的井井有条。——摘自《量子物理史话》“统计规律则把微观上的无法无天抹平成为宏观上的井井有条”,这句话实际上就是表明,统计方法可以使极其复杂的随机事件成为可预测。我认为,社会、市场、股票等等与量子世界有着很多相似之处。由于量子理论实际上是从最本质上去研究我们存在于其中的这个世界,因此正如书中的一句话:“这个世界的本质:它本就是统计性的!作者:玻尔兹曼大脑的放逐,大家可以关注他的微博:原文地址:
金牌会员, 积分 2288, 距离下一级还需 712 积分
论坛徽章:7
谢谢分享 ~~
论坛徽章:48
谢谢分享。
中级会员, 积分 489, 距离下一级还需 11 积分
论坛徽章:0
只看过第一本
金牌会员, 积分 1040, 距离下一级还需 1960 积分
论坛徽章:19
论坛徽章:23
多谢分享。
高级会员, 积分 530, 距离下一级还需 470 积分
论坛徽章:4
CopyRight 2011- All Right Reserved.
扫一扫加入本版微信群求助,入门学习大数据,想学习 Hadoop 语言,童鞋们 有什么好书推荐的,最好是京东能买到的~
17:09:57 +08:00 · 2886 次点击
23 回复 &| &直到
22:55:45 +08:00
& & 17:26:12 +08:00
先想清楚学了之后想干啥,再考虑要学啥
& & 17:28:08 +08:00
@ 现在想学习大数据方面的知识,先从数据储存技术学习,之后再学习数据处理相关的知识,不晓得这样考虑对不对,还望大师们指教~谢谢~
& & 17:36:22 +08:00
Hadoop 不是语言啊兄弟,先学好 java
& & 17:52:06 +08:00
@ 那怎么才能进入到大数据的学习中去呢?还请赐教!
& & 17:56:54 +08:00
学习大数据,搭环境是入门的步骤里最困难的,所以建议你可以先研究一下 docker
& & 18:04:38 +08:00 via Android
先学 Python 然后学 spark 我校 lab 出的 比 Hadoop 好写 3 倍
& & 18:20:06 +08:00
@ 《数据挖掘概念与技术》
& & 18:25:45 +08:00
@ 感谢,学习了~
& & 18:39:02 +08:00
hadoop 语言是啥
& & 19:55:25 +08:00
JAVA 或者 Python
在看 Spark 吧
& & 21:35:11 +08:00 via iPhone
以前学的时候,找教材最头疼的是版本的问题。当时 2.x 版本出来时,市面上流行的教材还留在 1.x 版本。不同版本还是挺有区别的。感觉看看书了解一下开发思路,程序结构以后,如果没有较新版本配套的书,可以去看文档的。另外,搭环境真的挺困难的,就是直接学 spark ,也有基于 hadoop 的 yarn 的...总是要试试的。(不要盲目相信搜到的博客内容ˊ_&ˋ...)另外的另外,虽然 spark 说是性能高,那也要考虑实际环境。之前去实习的时候(去年)感觉用 hadoop 的还蛮多的以上个人看法,有一年没碰过了,不太清楚现在情况变了没
& & 22:12:35 +08:00
Hadoop 语言...
可以试试 Python + Spark, 先看 Spark Standalone 的, 然后看看 YARN/Mesos 等不同部署的方式.
MapR 的免费课程作为入门不错:
UCBX 的 Spark 入门也可:
& & 22:19:46 +08:00
这东西如果没马上能用上的地方, 学起来收获其实不大
最后也就学会了怎么搭一个 hadoop 集群和用 java 调用它的 api
自己构造的那几 G 的数据(这估计算很有耐性的了), 真心感觉不出这东西有什么优势, 反而麻烦的要死
然后没几天就全忘记干净了
这样的经历, 对找工作估计也没什么作用
& & 22:32:36 +08:00 via Android
不想花时间搭环境的话,下一个 cloudera quick start vm ,虚拟机里面把什么都装好了
& & 00:14:33 +08:00
0 基础就不要想着直接学大数据了,先把数学和 Java 学好
& & 06:59:50 +08:00
Hadoop the Definitive Guide, 3rd or 4th Edition.
太经典 绕不过. 稍微看一看也许能让题主要不要做这个.
另外, Hadoop 是一种以 MapReduce 模式进行批数据的处理框架, 不是语言, 常常看到的是以 Java 来完成的几个关键组件部分-mapper, reducer, combiner, partitioner...
如果是特别不习惯用 Java 则也能借助 Hadoop-Streaming 用其它的语言来部分替代, 但多少不方便.
Spark 是 DataBricks 公司(当时还是在实验室)的几个人提出的新的 BigData 模式, 使用 Scala(和 Java 非常亲昵), 由于性能和扩展的优势, Spark-Sql,
Spark-MLlib, 慢慢被更多人认识.
个人觉得主要 Spark 的学习门槛要比 Hadoop 低一些, --- 有的时候你只要懂一些简单的 RDD 的操作 API, 能看懂一些简单的 Pyspark 或者是 Scala 的过程代码, 都能理解数据是怎样操作和变换的.
不过如果以大数据工程师作为目标, 二者都是要看的.
我自己是从事数据科学方向, 所以 Hadoop 的一些性能方面会考虑一些, 平时侧重是 Spark-Mllib 中的监督式机器学习的部分.
毕竟自己不会造轮子.
& & 08:54:22 +08:00 via iPhone
hadoop 语言……,你还是别学习了。先学习 java 基础吧
& & 12:44:37 +08:00
[ 澄观见韦小宝什么拳法都不会,也不生气,说道:“咱们少林派武功循序渐进,入门之后先学少林长拳,熟习之后,再学罗汉拳,然后学伏虎拳,内功外功有相当根柢了,可以学韦陀掌。如果不学韦陀掌,那么学大慈大悲千手式也可以……” ......
韦小宝道:“你开始学武,到练成一指禅,花了多少时候?”
澄观微笑道:“师侄从十一岁上起始上少林长拳,总算运气极好,拜晦智禅师座下,学得比同门师兄弟们快得多,到五十三岁,于这指法已略窥门径。”
咱们 hadoop 语言循序渐进,入门之后先学 java ,熟习之后,在学 hdfs ,然后学 yarn.....
& & 14:18:49 +08:00
@感谢各位,原来这么多东西需要学习的,看来自己知道太少了,很多名词也只是自己偶尔看过, java 只是上学的时候接触过,早已忘记了~,一切看来都得重头开始了,看来这些不是短期内能有效果的。
& & 16:01:10 +08:00
@ 膜拜 Berkely~~
& & 17:15:29 +08:00
@ Berkeley... :)
& & 17:37:10 +08:00
@ 噗。。。
& & 22:55:45 +08:00
哎~ 我怎么记得人家推荐用 scala?
手动滑稽笑
& · & 1642 人在线 & 最高记录 3541 & · &
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.0 · 60ms · UTC 15:37 · PVG 23:37 · LAX 07:37 · JFK 10:37? Do have faith in what you're doing.各高校“学霸”最爱读什么书,大数据告诉你各高校“学霸”最爱读什么书,大数据告诉你大地历史百家号大学生上完课都爱看哪些书?不同学校的学生更爱什么类型的书?学霸们都在图书馆看啥?统计数据告诉你。中南大学中南大学对2016年中南大学图书馆的数据情况展开了大数据调查。从科幻到历史,中南学子广泛涉猎。读遍古今中外,我们永不停歇。复旦大学古今馆藏,源远流长。学研珍宝,在馆一方。2016年,复旦大学图书总借阅量42.1万册。哪些图书受到追捧?武汉大学2016年,最受武大同学欢迎的书有哪些?小说?散文?还是微积分?哪些书最难借到?这些书在武大可吃香呢。武大学子预约最多的十本书▼四川大学2016年,四川大学最受欢迎的十本书涉及文史哲理医,横跨古今中外,《马克思恩格斯选集》《平凡的世界》连续三年上榜。江南大学2016年,江南大学图书馆被借阅图书累计177085册,垒起来有3398.9米,相当于峨眉山最高峰万佛顶的高度,厉害了!华南理工大学2016年,华南理工大学图书馆借阅量前十位的书籍中,文学书籍独占鳌头,《平凡的世界》再度上榜。看来有思想有文化的书籍,也深受理工科同学欢迎。天津大学2016年,天津大学图书馆进馆读者数340万,全年借阅总数349498册。看了各高校的图书馆大数据,你的阅读大数据如何呢?读书好,读好书,好读书,让阅读充实我们的精神世界吧。素材来源于微言教育、各高校官微编辑整理:知翼、刘亮、汤佳本文仅代表作者观点,不代表百度立场。系作者授权百家号发表,未经许可不得转载。大地历史百家号最近更新:简介:真实历史带您了解历史背后的真相!作者最新文章相关文章33,032被浏览1,564,631分享邀请回答ocw.mit.edu/courses/mathematics/18-02sc-multivariable-calculus-fall-2010/index.htm线性代数(Linear Algebra):这本书对应课程绝对良心:3. 概率论与统计(Probability And Statistics):Introduction to Probability, Statistics, and Random Processes(还没看)一本手把手教你概率论的书,相应学习网站上书和视频都有。OpenIntro Statistics(看完了)至今见到最好的一本统计学入门书,同样相应学习网站上书和视频都有。Statistical Inference(看完了)不少美国大学统计系研究生第一年的教材,推荐给想系统学习数理统计的同学。Applied Linear Statistical Models(看了一半)我觉得是把线性模型讲得很好的一本书An Introduction to Generalized Linear Models(看完了)广义线性模型入门简介All of Statistics: A Concise Course in Statistical Inference(正在看)注意,我觉得这本书是给的统计底子很好的人复习用的,不适合自学。Computer Age Statistical Inference: Algorithms, Evidence, and Data Science (正在看)Efron和Hastie两位大师通过这本书给了大数据时代的统计学一个非常现代和全面的介绍。Statistics in a Nutshell: A Desktop Quick Reference(翻查用)案头的统计学速查手册贝叶斯统计(Bayesian Statistics)Bayes' Rule: A Tutorial Introduction to Bayesian Analysis(还没看)贝叶斯统计101Think Bayes: Bayesian Statistics in Python(还没看)简介怎么用Python做贝叶斯统计这里可以免费下载:Bayesian Methods for Hackers(还没看)更加深入地介绍怎么用Python做贝叶斯统计。在线版本:Practical Statistics for Data Scientists: 50 Essential Concepts(读完了)我在实习期间抽空看完的一本书,这本书应该算是填平课堂的统计学和工业界数据科学的一本很好的参考指南。写得比较简洁但是直击要点,而且给出了很多reference。这本书的github:这本书的Amazon 链接:4. 机器学习(Machine Learning)我觉得机器学习不能沉溺于理论,要尽快开始动手把玩一些实际数据集来加深对算法的理解。所以我打算推荐一些Hands-on(手把手)的书。An Introduction to Statistical Learning: with Applications in R(看完了)通过R讲解算法的统计学习入门书,估计被推荐烂了(笑)。可以在这本书的网站上找到这本书的pdf和数据集。相关课程Applied Predictive Modeling(看完了)黄皮书,没啥好多说的。准备面试和工作的时候必读。Python Machine Learning(基本上看完了)手把手教你用sklearn做机器学习,同样是工作必备。Fundamentals of Machine Learning for Predictive Data Analytics: Algorithms, Worked Examples, and Case Studies(看了一半)我觉得这本书特别适合我这种脑子不太好的人,因为他会把机器学习算法拆开,结合案例,一步一步地给你讲。Real-World Machine Learning(看完了)告诉你工业界的人怎么用Machine Learning解决实际问题的书。建议所有Data Scientist在实习前和全职工作开始前都读一下。Learning From Data(看完了)这本书讲清楚了很多机器学习书中不怎么提到的机器学习理论,比如VC Dimension这种东西。Caltech有公开课,吐血推荐:The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition(看了一半)大名鼎鼎的ESL,读起来比较累(我太渣),我觉得适合翻查和摘抄。Pattern Recognition and Machine Learning(正在看)同样大名鼎鼎的PRML,我个人觉得比ESL好读不少。5. 数据挖掘(Data Mining)数据挖掘中不少东西其实和机器学习是重合的,至于这两个东西有什么区别,可以看看这个回答:Principles of Data Mining(还没看)非常基本的数据挖掘入门书,讲了不少Association Rule的东西Introduction to Data Mining(正在看)更加深入讲数据挖掘的书,干货很多Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management(还没看)通过实例讲怎么通过数据挖掘赚顾客钱做生意。6. SQL:SQL怎么入门,网上到处都是教程。书的话我只是觉得这一本Cookbook最好。因为他把很多SQL query里的陷阱都提到了,而且每道题给出了市面上所有流行数据库(MySQL,DB2,Oracle,SQL Server,Postgresql)的Query代码SQL Cookbook: Query Solutions and Techniques for Database Developers (翻查用)7. R:R in Action(正在看)有名的R语言实践下面是R教主Hadley Wickham的三本书,没啥好太多说的,读就是了:R for Data Science(正在看)在线版本:R Packages(还没看)Advanced R(还没看)在线版本:8. Python:因为不是软件工程师,我Python水平也不高。推荐两本我用来入门和准备继续进一步提高看的书吧。Think Python(看完了)这本书我拿来入门的Fluent Python(还没看)打算用来Python进阶的Python for Probability, Statistics, and Machine Learning(还没看)我打算用来复习概率论和统计学的书(with Python)Python Data Science Handbook(翻查用)一本非常全面的通过Python解决数据科学问题的工作手册。作者给出了这本书全部的Jupyter Notebook:9. 数据科学家面试 (Data Scientist Interview)Data Science Interviews Exposed(看完了)几个在美国的中国人数据科学家写的面试准备书。基本给出了所有数据科学面试涵盖的知识点概述,数据科学家面试流程和注意事项,干货满满。仔细读完这本书,数据科学家面试是怎么个一回事儿,基本上你就心中有数了。Cracking the PM Interview: How to Land a Product Manager Job in Technology(读完了)在美国,不少数据科学家在公司做的很多工作和产品相关,甚至不少数据科学家被当成半个产品经理用,所以这本产品经理的面试准备书对于数据科学家的面试也很有借鉴意义的。10. 算法(Algorithm)数据科学家逃不掉算法,虽然要求不像软件工程师那么高。因为我是Python死忠,所以这里推荐的所有算法书中的算法实现都有用到Python。Grokking Algorithms: An illustrated guide for programmers and other curious people(看了一半)非常直观的一本算法入门书中的入门书,这本书作者不仅仅是软件工程师,他还是一个绘本画师,里面所有的插图都是他自己亲手画的,非常的萌。Problem Solving with Algorithms and Data Structures Using Python(正在看)一本用Python讲数据结构和算法的好书,有在线的电子版。Algorithms in a Nutshell: A Practical Guide(翻查用)算法速查手册,给出了Python的实现。11. 工作手册(Handbook) The Data Science Handbook(正在看)我正在读的,涵盖最全面的一本数据科学工作手册,推荐给想成为“Unicorn"-全栈数据科学家的同学12. 网络爬虫与数据折腾(Web Scraping and Data Wrangling)(还没看)Web Scraping with Python: Collecting Data from the Modern Web用Python3手把手教你做爬虫Data Wrangling with Python: Tips and Tools to Make Your Life Easier(正在看)这本书教你怎么把又脏乱差的原始数据清理,整理,折腾成你想要的样子。Regular Expressions Cookbook(翻查用)我知道很多人不喜欢正则表达式,但是又不得不面对他,经常翻查这本书应该能搞定很多问题。13. 数据可视化与讲故事(Data Visualization and Storytelling)怎么画出又漂亮又高大上的图表,然后讲一个好故事把你的老板和客户忽悠得一愣一愣的,是一个好的数据科学家的终极大招之一。Communicating Data with Tableau: Designing, Developing, and Delivering Data Visualizations(还没看)我知道有些喜欢编程的人瞧不上各种按钮点点点的软件,但是我表示Tableau真的很好用。Interactive Data Visualization for the Web: An Introduction to Designing with D3(还没看)讲怎么用数据可视化工具D3.js。会一些前端技能和Javascript对数据科学家绝对是锦上添花。Data Visualization with Python and JavaScript: Scrape, Clean, Explore & Transform Your Data(还没看)一本讲怎么把把Python和Javascript串起来做数据可视化的书,一颗赛艇。Storytelling with Data: A Data Visualization Guide for Business Professionals(还没看)教你怎么忽悠人2333314. A/B 测试(A/B Testing)(看完了)A / B Testing: The Most Powerful Way to Turn Clicks Into CustomersDesigning with Data: Improving the User Experience with A/B Testing(正在看)Spotify 的 VP of Design and User Experience 写的怎么做AB测试的书。-----------------------分割线-------------------------第二部分:其他技能(Some Other Skills)这一部分推荐的书,是为那些想成为数据科学家中的超级赛亚人的同学所准备的2333315.
神经网络与深度学习(Neural Network and Deep Learning)Make Your Own Neural Network(正在看)深度学习炒得火热,但是在认真学习Deep Learning之前,各位巨巨们真的不先尝试下推推公式,然后Python从头自己造一个玩具神经网络玩一玩吗,真的很好玩的!Deep Learning(正在看)这个还有介绍的必要吗(望天)Hands-On Machine Learning with Scikit-Learn and TensorFlow(还没看)我觉得对于DS老司机们来说,这本书的Sklearn部分可以无视,重点放在后半部分怎么用TensorFlow玩深度学习。16. 信息论(Information Theory)关于信息论在数据科学上的重要性,可以看看这篇文章:Information Theory: A Tutorial Introduction(还没看)Information, Entropy, Life and the Universe: What We Know and What We Do Not Know(还没看)17. 因果推断(Causal Inference)关于因果分析的重要性可以看看这个slides:Causal Inference in Statistics: A Primer(还没看)Field Experiments: Design, Analysis, and Interpretation (还没看)18. 抽样(Sampling)Sampling(还没看)19. 凸优化(Convex)Convex Optimization(还没看)斯坦福的凸优化,课程在这里:另外这本书的网站给出了免费电子书:20.
增长分析(Growth Analytics)Lean Analytics: Use Data to Build a Better Startup Faster (Lean Series)(还没看)Web Analytics 2.0: The Art of Online Accountability and Science of Customer Centricity(还没看)21. 文本挖掘与自然语言处理(Text Mining And Natural Language Processing)Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit(还没看)Python NLTK的官方指南,有在线版:Text Analytics with Python: A Practical Real-World Approach to Gaining Actionable Insights from your Data(还没看)Introduction to Information Retrieval(还没看)斯坦福的信息萃取,有在线电子版数学之美(正在看)吴军老师的数学之美。22. 异常检测(Anomaly Detection)Fraud Analytics Using Descriptive, Predictive, and Social Network Techniques: A Guide to Data Science for Fraud Detection(正在看)这本书我正在读,不难读,作为Fraud Detection的概述讲得还是挺细的。Outlier Analysis(正在看)23. 推荐系统 (Recommender Systems)Statistical Methods for Recommender Systems(还没看)Recommender Systems: The Textbook(还没看)24. 社交网络分析 (Social network analysis)Network Science(正在看)大牛Barabási 今年的力作,关于网络科学的简介。有在线版本,里面的图漂亮得我是跪下了。Social and Economic Networks(还没看)斯坦福教授Matthew O. Jackson的书,在coursera上有这本书的公开课。Social Network Analysis for Startups: Finding connections on the social web(还没看)一本用Python做社交网络分析的书。25. 时间序列预报(Time Series Analysis and Forecasting)现在很多时间序列的书,重点放在描述时间序列上,所以会大量介绍ARMA和ARIMA。但是我这里想着重强调的是预报(Forecasting)。这里面有一套方法,个人感觉很少被传统统计系的时间序列课程介绍。Practical Time Series Forecasting with R: A Hands-On Guide(看完了)Forecasting: principles and practice(还没看)这本书也是有在线版本的,和上面那本书互补。26. 强化学习与人工智能Reinforcement Learning: An Introduction(还没看)强化学习入门书,有在线版Artificial Intelligence: A Modern Approach(还没看)Google的大佬,研究总监Peter Norvig的书-----------------------分割线-------------------------第三部分:休闲读物(Casual Reading)这部分介绍的书,躺在床上看看很不错。Soft Skills: The software developer's life manual(还没看)同软件工程师一样,数据科学家只会写代码和建模是远远不够的。软实力非常非常重要。The Healthy Programmer: Get Fit, Feel Better, and Keep Coding(还没看)身体是革命的本钱,身体搞垮了怎么继续用数据科学改变世界呢?另外数据科学家其实和人打交道的机会通常来说要远远多于软件工程师,在这个看脸看身材的时代,你懂的。Exposing the Magic of Design(还没看)有一个Design Mindset对数据科学家是很加分的哦 :)Thinking, Fast and Slow(还没看)这本书被大V邹昕推荐过。Naked Statistics: Stripping the Dread from the Data(还没看)可能是你读过最好玩的统计学读物。Uncertainty: The Soul of Modeling, Probability & Statistics(正在看)一本在哲学层面上思考数据科学的书。---------------------------------大概先到这里吧,豆瓣link什么的之后再慢慢补。最后祝大家世界读书日快乐,比心~~~------------------答主睡前本想拍个图庆祝世界读书日,结果发现玩脱了
,正在为以后的搬家问题发愁ing1K79 条评论分享收藏感谢收起7.9K29 条评论分享收藏感谢收起

我要回帖

更多关于 关于大数据的书籍 的文章

 

随机推荐