机器学习,数据挖掘和机器学习的关系的书有哪些

扫一扫下载手机客户端
扫描我,关注团购信息,享更多优惠
||网络安全
| | | | | | | | | | | | | | | |
||电子电工
汽车交通| | | | | | | | | |
||投资理财
| | | | | | | | | | | | | | | | |
| | | | | | |
| | | | | | | | | | | | | | | | | | | | | | | | | | | | | |
||外语考试
| | | | | | | | |
| 视频教程|
热销图书排行榜 (美)Brian W.Kernighan,Dennis M.Ritchie¥24 (美)Mark Allen Weiss¥24.5 (美)Erich Gamma, Richard Helm, Ralph Johnson, John Vlissides¥24.5 (美)Ron Patton¥24 (美)Bruce Eckel¥86.4 程杰¥36 《编程之美》小组¥30
机器学习经典书籍及书单资料推荐:带你认识人工智能
上一篇: 下一篇:
订单处理配送
北京奥维博世图书发行有限公司 china-pub,All Rights Reserved有了这些书,再也不愁下了班没妹纸该咋办了。慢慢来,认真学,揭开机器学习和数据挖掘这一神秘的面纱吧!
《机器学习实战》:本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。
全书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用Python代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。
之前看过一部分这本书,但是实习工作涉及到用Java代码处理数据,所以暂时先搁一下,目前正在李航的那本书。
《数据挖掘-实用机器学习技术》:本书介绍数据挖掘的基本理论与实践方法。主要内容包括:各种模型(决策树,关联规则、线性模型、聚类、贝叶斯网以及神经网络)以及在实践中的运用,所存任缺陷的分析。安全地清理数据集、建立以及评估模型的预测质量的方法,并且提供了一个公开的数据挖掘工作平台Weka。Weka系统拥有进行数据挖掘仟务的图形用户界面,有助于理解模型,是一个实用并且深受欢迎的工具。
《数据挖掘:概念与技术》:本书全面地讲述数据挖掘领域的重要知识和技术创新。在第1版内容相当全面的基础上,第2版展示了该领域的最新研究成果,例如挖掘流、时序和序列数据以及挖掘时间空间、多媒体、文本和Web数据。本书可作为数据挖掘和知识发现领域的教师、研究人员和开发人员的一本必读书。
《统计学习基础 数据挖掘、推理与预测》:尽管应用的是统计学方法,但强调的是概念,而不是数学。许多例子附以彩图。《统计学习基础:数据挖掘、推理与预测》内容广泛,从有指导的学习(预测)到无指导的学习,应有尽有。包括神经网络、支持向量机、分类树和提升等主题,是同类书籍中介绍得最全面的。计算和信息技术的飞速发展带来了医学、生物学、财经和营销等诸多领域的海量数据。理解这些数据是一种挑战,这导致了统计学领域新工具的发展,并延伸到诸如数据挖掘、机器学习和生物信息学等新领域。
《机器学习》(Mitchell):展示了机器学习中核心的算法和理论,并阐明了算法的运行过程。《机器学习》综合了许多的研究成果,例如统计学、人工智能、哲学、信息论、生物学、认知科学、计算复杂性和控制论等,并以此来理解问题的背景、算法和其中的隐含假定。《机器学习》可作为计算机专业 本科生、研究生教材,也可作为相关领域研究人员、教师的参考书。
《统计学习方法》:本书全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外,每章介绍一种方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。
《机器学习导论》:对机器学习的定义和应用实例进行了介绍,涵盖了监督学习。贝叶斯决策理论。参数方法、多元方法、维度归约、聚类、非参数方法、决策树。线性判别式、多层感知器,局部模型、隐马尔可夫模型。分类算法评估和比较,组合多学习器以及增强学习等。
《机器学习及其应用》:全书共分14章,内容分别涉及因果推断、流形学习与降维、迁移学习、类别不平衡学习、演化聚类、多标记学习、排序学习、半监督学习等技术和协同过滤、社区推荐、机器翻译等应用,以及互联网应用对机器学习技术需求的探讨。
《模式分类》第二版:除了保留了第1版的关于统计模式识别和结构模式识别的主要内容以外,读者将会发现新增了许多近25年来的新理论和新方法,其中包括神经网络、机器学习、数据挖掘、进化计算、不变量理论、隐马尔可夫模型、统计学习理论和支持向量机等。
《推荐系统实践》:过大量代码和图表全面系统地阐述了和推荐系统有关的理论基础,介绍了评价推荐系统优劣的各种标准(比如覆盖率、满意度)和方法(比如AB测试),总结了当今互联网领域中各种和推荐有关的产品和服务。
《深入搜索引擎--海量信息的压缩、索引和查询》:理论和实践并重,深入浅出地给出了海量信息数据处理的整套解决方案,包括压缩、索引和查询的方方面面。其最大的特色在于不仅仅满足信息检索理论学习的需要,更重要的是给出了实践中可能面对的各种问题及其解决方法。
《概率论与数理统计》:这本书不用过多介绍了吧,普遍大学里大一时期的教科书,只恨当年没听课啊,现在正在慢慢啃。。。
《大数据:互联网大规模数据挖掘与分布式处理》:主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统。
《Web数据挖掘》:信息检索领域的书籍,该书深入讲解了从大量非结构化Web数据中提取和产生知识的技术。书中首先论述了Web的基础(包括Web信息采集机制、Web标引机制以及基于关键字或基于相似性搜索机制),然后系统地描述了Web挖掘的基础知识,着重介绍基于超文本的机器学习和数据挖掘方法,如聚类、协同过滤、监督学习、半监督学习,最后讲述了这些基本原理在Web挖掘中的应用。《Web数据挖掘》为读者提供了坚实的技术背景和最新的知识。
《数据之巅》:对大数据追根溯源,提出当前信息技术的发展,已经让中国获得了后发优势,中国要在大数据时代的全球竞争中胜出,必须把大数据从科技符号提升成为文化符号,在全社会倡导数据文化。
《深入浅出统计学》:本书涵盖的知识点包括:信息可视化、概率计算、几何分布、二项分布及泊松分布、正态分布、统计抽样、置信区间的构建、假设检验、卡方分布、相关与回归等等,完整涵盖AP考试范围。
《矩阵分析》:本书从数学分析的角度论述矩阵分析的经典方法和现代方法,取材新,有一定的深度,并给出在多元微积分、复分析、微分方程、量优化、逼近理论中的许多重要应用。主要内容包括:特征值、特征向量和相似性,酉等价和正规矩阵,标准形,Hermite矩阵和对称矩阵,向量范数和矩阵范数,特征值和估计和扰动,正定矩阵,非负矩阵。
本文已收录于以下专栏:
相关文章推荐
机器学习和数据挖掘推荐书单
有了这些书,再也不愁下了班没妹纸该咋办了。慢慢来,认真学,揭开机器学习和数据挖掘这一神秘的面纱吧!
《机器学习实战》 :本书第一部分主要介绍机器学习基础,以及如...
机器学习和数据挖掘推荐书单
有了这些书,再也不愁下了班没妹纸该咋办了。慢慢来,认真学,揭开机器学习和数据挖掘这一神秘的面纱吧!
《机器学习实战》:本书第一部分主要介绍机器学习基础...
入门读物:深入浅出数据分析 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了 R 是大加分。难易程度:非常易。
啤酒与尿布 通过案例来说事情,而且是最经典的例子。难易程度:非常易。
推荐几个机器学习和数据挖掘领域相关的中国大牛:
李航:/en-us/people/hangli/,是MSRA Web Search ...
1. 适合入门的读物:
《深入浅出数据分析》这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。
《啤酒与尿布》通过案例来说事情,而且是最经典的例子。难易程度...
数学计算是Shell中比较常用的一种操作,
但是因为shell中所有的变量都默认为字符串, 这就使得在shell中进行数学计算比较复杂, 以下直觉上貌似正确的方法是不对的:
#第一种错误方法
人工智能、机器学习、模式识别、计算机视觉、数据挖掘、信息检索、自然语言处理等作为计算机科学重要的研究分支,不论是学术界还是工业界,有关这方面的研究都在如火如荼地进行着,学习这些方面的内容有一些经典书籍...
数据挖掘,机器学习,深度学习,推荐算法的联系与区别
人工智能、机器学习、模式识别、计算机视觉、数据挖掘、信息检索、自然语言处理等作为计算机科学重要的研究分支,不论是学术界还是工业界,有关这方面的研究都在如火如荼地进行着,学习这些方面的内容有一些经典书籍...
本文接《基于机器学习的SNS隐私保护策略推荐向导的设计与实现》,详细解析基于机器学习的SNS隐私策略推荐向导分类器的C++及WEKA实现与评估结果,本文完整C++程序及JAVA工程下载链接见点击打开链...
他的最新文章
讲师:董岩
您举报文章:
举报原因:
原文地址:
原因补充:
(最多只允许输入30个字)您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
发私信给恒亮
导语:也有中文版呦~
同步到新浪微博
欢迎交流,微信:whl123465
当月热门文章
为了您的账户安全,请
您的邮箱还未验证,完成可获20积分哟!
您的账号已经绑定,现在您可以以方便用邮箱登录
请填写申请人资料机器学习、数据挖掘、计算机视觉等领域经典书籍推荐
我的图书馆
机器学习、数据挖掘、计算机视觉等领域经典书籍推荐
请选中您要保存的内容,粘贴到此文本框人工智能:《Artificial Intelligence: A Modern Approach》,第三版,Russell著,权威、经典的人工智能教材,阐述了人工智能的核心内容,反映了人工智能最近10年来的新进展。《ProgrammingCollective Intelligence》,Toby Segaran著,本书将带你进入机器学习和统计学的世界,对算法的描述简明清晰,很对代码都可以直接拿去实际应用。数据挖掘:《DataMining, Concepts and Techniques》,第三版,Han著,数据挖掘领域最具里程碑意义的经典著作。《DataMining: Practical Machine Learning Tools and Techniques》,第二版,Witten著,介绍了机器学习的基本理论和实践方法,并提供了一个公开的数据挖掘工作平台Weka,算法部分介绍得很详细。信息检索:《An Introductionto Information Retrieval》,Manning著,这是一本介绍信息检索的入门书籍,书中对信息检索的基本概念和基本算法做了介绍,适合初学者。《Search Engines Information Retrieval in Practice》,Croft著,这本书讲述了搜索引擎的构造方法,通过实际代码展示了搜索引擎的工作原理,对于学生和从事相关领域的工程师,本书都值得一看。《Managing Gigabytes》,《Mining the Web -Discovering Knowledge from Hypertext Data》《Information Theory:Inference and Learning Algorithms》。模式识别和机器学习:《Pattern Classification 》,第二版,Duda著,模式识别的奠基之作,但对SVM、Boosting几乎没提,有挂一漏万之嫌。《Pattern Recognition and Machine Learning》,Bishop著,侧重概率模型,详细介绍了Bayesian方法、有向图、无向图理论等,体系完备。《Kernel Methods for Pattern Analysis》,John Shawe-Taylor著,SVM等统计学的诸多工具里都用到了核方法,可以将将低维非线性空间映射到高维的线性空间中,但同时会引入高维数据的难题。计算机视觉:《Computer Vision: A Modern Approach》,第二版,Forsyth著,一本不错的计算机视觉教材,全书理论联系实际,并加入了计算机视觉领域的最新研究成果。《Computer Vision: Algorithms and Applications》,Richard Szeliski的大作,《数字图像处理》课程老师推荐的一本书籍,这本书我还没有看完,书中对计算机视觉领域最新的一些算法进行了汇编,包括图像分割,特征检测和匹配,运动检测,图像缝合,3D重建,对象识别等图像处理的诸多方面,借助本书我们可以对最新主流图像处理算法有个全局把握。线性代数:《Linear Algebra and Its Applications》Fourth Edition, Gilbert Strang的著作,本书详细介绍了向量空间、线性变换、本征值和本征向量等线性代数的重要基本概念,把抽象的线性空间形象地表达出来,适合初学者。《Introduction to Probability Models》第10版,Ross著,一本书能够发行到第十版,你说是不是很经典呢?离散数学:《Discrete Mathematics and Its Applications》,第六版,Rosen著,本书囊括了离散数学推导、组合分析、算法及其应用、计算理论等多方面的内容,适合初学者。矩阵数学:《Matrix Analysis》,Horn著,本书无疑是矩阵论领域的经典著作了,风行几十年了。概率论与数理统计:《All Of Statistics》,Wasserman著,一本数理统计的简介读本。《Introductionto Mathematical Statistics》,第六版,Hogg著,本书介绍了概率统计的基本概念以及各种分布,以及ML,Bayesian方法等内容。《Statistical Learning Theory》Vapnik的大作,统计学界的权威,本书将理论上升到了哲学层面,他的另一本书《The Nature ofStatistical Learning Theory》也是统计学习研究不可多得的好书,但是这两本书都比较深入,适合有一定基础的读者。《统计学习方法》,李航著,国内很多大学都在用这本书,本书从具体问题入手,由浅入深,简明地介绍了统计学习的主要方法,适合初学者而又想对统计学习理论有一个全局理解的学生。《The Elements of Statistical Learning-Data Mining, Inference, and Prediction》,第二版,Trevor Hastie著,机器学习方面非常优秀的一本书,较PC和PRML,此书更加深入,对工程人员的价值也许更大一点。《AnIntroduction to Probabilistic Graphical Models》,Jordan著,本书介绍了条件独立、分解、混合、条件混合等图模型中的基本概念,对隐变量(潜在变量)也做了详细介绍,相信大家在隐马尔科夫链和用Gaussian混合模型来实现EM算法时遇到过这个概念。《Probabilistic Graphical Models-Principles and Techniques》,Koller著,一本很厚很全面的书,理论性很强,可以作为参考书使用。最优化方法:《Convex Optimization》,Boyd的经典书籍,被引用次数超过14000次,面向实际应用,并且有配套代码,是一本不可多得的好书,网址http://www.stanford.edu/~boyd/cvxbook/。《Numerical Optimization》,第二版,Nocedal著,非常适合非数值专业的学生和工程师参考,算法流程清晰详细,原理清楚。另外推荐几个博客和网站:https://www.coursera.org/,这是一个由世界顶级大学联合创办的网上在线视频公开课网站,里面有stanford, MIT,CMU等计算机科学一流大学提供的免费教学视频,内容全面,计算机科学方面的资源较网易视频公开课网站(/)内容要新、要全。http://blog.csdn.net/pongba/article/details/2915005,本文的部分内容就是借鉴刘未鹏大神的博客而来的,也正是看过他的那个书单后,我才决定写一个总结归纳性的文章,这样可以方便大家学习,更可以勉励自己多看些有益的经典书籍。http://blog.pluskid.org/,这是浙大学生张驰原的博客网站,现在他去了MIT,博客里面的很多资源都值得一看,博文的很大一部分都是关于机器学习的,加入了作者自己的理解,深入浅出。http://blog.csdn.net/ffeng271/article/details/7164498,林达华推荐的几本数学书,转自MIT大牛博客。
馆藏&99439
TA的最新馆藏
喜欢该文的人也喜欢812被浏览62379分享邀请回答11 条评论分享收藏感谢收起

我要回帖

更多关于 数据挖掘和机器学习区别 的文章

 

随机推荐