【现货正版】Python数据挖掘入门与实践 (澳)罗伯特·莱顿(Robert Layton) 著;杜春晓 译 数据库 人民邮电出版社 9787115427106 pdf pdb 阿里云 极速 mobi caj kindle 下载

【现货正版】Python数据挖掘入门与实践 (澳)罗伯特·莱顿(Robert Layton) 著;杜春晓 译 数据库 人民邮电出版社 9787115427106电子书下载地址
- 文件名
- [epub 下载] 【现货正版】Python数据挖掘入门与实践 (澳)罗伯特·莱顿(Robert Layton) 著;杜春晓 译 数据库 人民邮电出版社 9787115427106 epub格式电子书
- [azw3 下载] 【现货正版】Python数据挖掘入门与实践 (澳)罗伯特·莱顿(Robert Layton) 著;杜春晓 译 数据库 人民邮电出版社 9787115427106 azw3格式电子书
- [pdf 下载] 【现货正版】Python数据挖掘入门与实践 (澳)罗伯特·莱顿(Robert Layton) 著;杜春晓 译 数据库 人民邮电出版社 9787115427106 pdf格式电子书
- [txt 下载] 【现货正版】Python数据挖掘入门与实践 (澳)罗伯特·莱顿(Robert Layton) 著;杜春晓 译 数据库 人民邮电出版社 9787115427106 txt格式电子书
- [mobi 下载] 【现货正版】Python数据挖掘入门与实践 (澳)罗伯特·莱顿(Robert Layton) 著;杜春晓 译 数据库 人民邮电出版社 9787115427106 mobi格式电子书
- [word 下载] 【现货正版】Python数据挖掘入门与实践 (澳)罗伯特·莱顿(Robert Layton) 著;杜春晓 译 数据库 人民邮电出版社 9787115427106 word格式电子书
- [kindle 下载] 【现货正版】Python数据挖掘入门与实践 (澳)罗伯特·莱顿(Robert Layton) 著;杜春晓 译 数据库 人民邮电出版社 9787115427106 kindle格式电子书
内容简介:
本书作为数据挖掘入门读物,介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带你轻松踏上数据挖掘之旅。本书采用理论与实践相结合的方式,呈现了如何使用决策树和随机森林算法预测美国职业篮球联赛比赛结果,如何使用亲和性分析方法推荐电影,如何使用朴素贝叶斯算法进行社会媒体挖掘,等等。本书也涉及神经网络、深度学习、大数据处理等内容。
书籍目录:
第1章 开始数据挖掘之旅 1
1.1 数据挖掘简介 1
1.2 使用Python和IPython Notebook 2
1.2.1 安装Python 2
1.2.2 安装IPython 4
1.2.3 安装scikit-learn库 5
1.3 亲和性分析示例 5
1.3.1 什么是亲和性分析 5
1.3.2 商品推荐 6
1.3.3 在NumPy中加载数据集 6
1.3.4 实现简单的排序规则 8
1.3.5 排序找出最佳规则 10
1.4 分类问题的简单示例 12
1.5 什么是分类 12
1.5.1 准备数据集 13
1.5.2 实现OneR算法 14
1.5.3 测试算法 16
1.6 小结 18
第2章 用scikit-learn估计器分类 19
2.1 scikit-learn估计器 19
2.1.1 近邻算法 20
2.1.2 距离度量 20
2.1.3 加载数据集 22
2.1.4 努力实现流程标准化 24
2.1.5 运行算法 24
2.1.6 设置参数 25
2.2 流水线在预处理中的应用 27
2.2.1 预处理示例 28
2.2.2 标准预处理 28
2.2.3 组装起来 29
2.3 流水线 29
2.4 小结 30
第3章 用决策树预测获胜球队 31
3.1 加载数据集 31
3.1.1 采集数据 31
3.1.2 用pandas加载数据集 32
3.1.3 数据集清洗 33
3.1.4 提取新特征 34
3.2 决策树 35
3.2.1 决策树中的参数 36
3.2.2 使用决策树 37
3.3 NBA比赛结果预测 37
3.4 随机森林 41
3.4.1 决策树的集成效果如何 42
3.4.2 随机森林算法的参数 42
3.4.3 使用随机森林算法 43
3.4.4 创建新特征 44
3.5 小结 45
第4章 用亲和性分析方法推荐电影 46
4.1 亲和性分析 46
4.1.1 亲和性分析算法 47
4.1.2 选择参数 47
4.2 电影推荐问题 48
4.2.1 获取数据集 48
4.2.2 用pandas加载数据 49
4.2.3 稀疏数据格式 49
4.3 Apriori算法的实现 50
4.3.1 Apriori算法 51
4.3.2 实现 52
4.4 抽取关联规则 54
4.5 小结 60
第5章 用转换器抽取特征 62
5.1 特征抽取 62
5.1.1 在模型中表示事实 62
5.1.2 通用的特征创建模式 64
5.1.3 创建好的特征 66
5.2 特征选择 67
5.3 创建特征 71
5.4 创建自己的转换器 75
5.4.1 转换器API 76
5.4.2 实现细节 76
5.4.3 单元测试 77
5.4.4 组装起来 79
5.5 小结 79
第6章 使用朴素贝叶斯进行社会媒体挖掘 80
6.1 消歧 80
6.1.1 从社交网站下载数据 81
6.1.2 加载数据集并对其分类 83
6.1.3 Twitter数据集重建 87
6.2 文本转换器 90
6.2.1 词袋 91
6.2.2 N元语法 92
6.2.3 其他特征 93
6.3 朴素贝叶斯 93
6.3.1 贝叶斯定理 93
6.3.2 朴素贝叶斯算法 94
6.3.3 算法应用示例 95
6.4 应用 96
6.4.1 抽取特征 97
6.4.2 将字典转换为矩阵 98
6.4.3 训练朴素贝叶斯分类器 98
6.4.4 组装起来 98
6.4.5 用F1值评估 99
6.4.6 从模型中获取更多有用的特征 100
6.5 小结 102
第7章 用图挖掘找到感兴趣的人 104
7.1 加载数据集 104
7.1.1 用现有模型进行分类 106
7.1.2 获取Twitter好友信息 107
7.1.3 构建网络 110
7.1.4 创建图 112
7.1.5 创建用户相似度图 114
7.2 寻找子图 117
7.2.1 连通分支 117
7.2.2 优化参数选取准则 119
7.3 小结 123
第8章 用神经网络破解验证码 124
8.1 人工神经网络 124
8.2 创建数据集 127
8.2.1 绘制验证码 127
8.2.2 将图像切分为单个的字母 129
8.2.3 创建训练集 130
8.2.4 根据抽取方法调整训练数据集 131
8.3 训练和分类 132
8.3.1 反向传播算法 134
8.3.2 预测单词 135
8.4 用词典提升正确率 138
8.4.1 寻找最相似的单词 138
8.4.2 组装起来 139
8.5 小结 140
第9章 作者归属问题 142
9.1 为作品找作者 142
9.1.1 相关应用和使用场景 143
9.1.2 作者归属 143
9.1.3 获取数据 144
9.2 功能词 147
9.2.1 统计功能词 148
9.2.2 用功能词进行分类 149
9.3 支持向量机 150
9.3.1 用SVM分类 151
9.3.2 内核 151
9.4 字符N元语法 152
9.5 使用安然公司数据集 153
9.5.1 获取安然数据集 153
9.5.2 创建数据集加载工具 154
9.5.3 组装起来 158
9.5.4 评估 158
9.6 小结 160
第10章 新闻语料分类 161
10.1 获取新闻文章 161
10.1.1 使用Web API获取数据 162
10.1.2 数据资源宝库reddit 164
10.1.3 获取数据 165
10.2 从任意网站抽取文本 167
10.2.1 寻找任意网站网页中的主要内容 167
10.2.2 组装起来 168
10.3 新闻语料聚类 170
10.3.1 k-means算法 171
10.3.2 评估结果 173
10.3.3 从簇中抽取主题信息 175
10.3.4 用聚类算法做转换器 175
10.4 聚类融合 176
10.4.1 证据累积 176
10.4.2 工作原理 179
10.4.3 实现 180
10.5 线上学习 181
10.5.1 线上学习简介 181
10.5.2 实现 182
10.6 小结 184
第11章 用深度学习方法为图像中的物体进行分类 185
11.1 物体分类 185
11.2 应用场景和目标 185
11.3 深度神经网络 189
11.3.1 直观感受 189
11.3.2 实现 189
11.3.3 Theano简介 190
11.3.4 Lasagne简介 191
11.3.5 用nolearn实现神经网络 194
11.4 GPU优化 197
11.4.1 什么时候使用GPU进行
计算 198
11.4.2 用GPU运行代码 198
11.5 环境搭建 199
11.6 应用 201
11.6.1 获取数据 201
11.6.2 创建神经网络 202
11.6.3 组装起来 204
11.7 小结 205
第12章 大数据处理 206
12.1 大数据 206
12.2 大数据应用场景和目标 207
12.3 MapReduce 208
12.3.1 直观理解 209
12.3.2 单词统计示例 210
12.3.3 Hadoop MapReduce 212
12.4 应用 212
12.4.1 获取数据 213
12.4.2 朴素贝叶斯预测 215
12.5 小结 226
附录 接下来的方向 227
作者介绍:
作者简介:
Robert Layton
计算机科学博士,网络犯罪问题和文本分析方面的专家。多年来一直热衷于Python编程,参与过scikit-learn库等很多开源库的开发,曾担任2014年度“谷歌编程之夏”项目导师。他曾与全球几大数据挖掘公司密切合作,挖掘真实数据并研发相关应用。他的公司dataPipeline为多个行业提供数据挖掘和数据分析解决方案。
译者简介:
杜春晓
英语语言文学学士,软件工程硕士。其他译著有《电子达人——我的第一本Raspberry Pi入门手册》《Python数据分析》。新浪微博:@宜_生。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
书籍介绍
本书作为数据挖掘入门读物,介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带你轻松踏上数据挖掘之旅。本书采用理论与实践相结合的方式,呈现了如何使用决策树和随机森林算法预测美国职业篮球联赛比赛结果,如何使用亲和性分析方法推荐电影,如何使用朴素贝叶斯算法进行社会媒体挖掘,等等。本书也涉及神经网络、深度学习、大数据处理等内容。
网站评分
书籍多样性:5分
书籍信息完全性:6分
网站更新速度:6分
使用便利性:8分
书籍清晰度:9分
书籍格式兼容性:7分
是否包含广告:9分
加载速度:9分
安全性:8分
稳定性:6分
搜索功能:8分
下载便捷性:3分
下载点评
- 差评少(261+)
- 四星好评(597+)
- 下载快(221+)
- 好评多(501+)
- 赞(600+)
- 字体合适(492+)
下载评价
- 网友 石***烟:
还可以吧,毕竟也是要成本的,付费应该的,更何况下载速度还挺快的
- 网友 国***芳:
五星好评
- 网友 孙***夏:
中评,比上不足比下有余
- 网友 利***巧:
差评。这个是收费的
- 网友 步***青:
。。。。。好
- 网友 孔***旋:
很好。顶一个希望越来越好,一直支持。
- 网友 仰***兰:
喜欢!很棒!!超级推荐!
- 网友 菱***兰:
特好。有好多书
- 网友 温***欣:
可以可以可以
- 网友 国***舒:
中评,付点钱这里能找到就找到了,找不到别的地方也不一定能找到
- 网友 焦***山:
不错。。。。。
- 网友 訾***晴:
挺好的,书籍丰富
- 网友 田***珊:
可以就是有些书搜不到
喜欢"【现货正版】Python数据挖掘入门与实践 (澳)罗伯特·莱顿(Robert Layton) 著;杜春晓 译 数据库 人民邮电出版社 9787115427106"的人也看了
莎乐美 pdf pdb 阿里云 极速 mobi caj kindle 下载
心理咨询与治疗系列丛书-团体辅导-理论设计与实例【正版】 pdf pdb 阿里云 极速 mobi caj kindle 下载
After Effects印象 影视后期特效插件高级技法精解 pdf pdb 阿里云 极速 mobi caj kindle 下载
【时光学】我的汉字课堂中国人写好中国字同步字帖一年级上册控笔训练字帖人教版小学生专用练习笔画笔顺练字帖每日一练写字训练儿童行楷 一年级上册【人教版课本同步】 pdf pdb 阿里云 极速 mobi caj kindle 下载
心理画外音(跨越10年的心理咨询个案) pdf pdb 阿里云 极速 mobi caj kindle 下载
皮肤性病学(第2版)——高级医师进阶 pdf pdb 阿里云 极速 mobi caj kindle 下载
中华经典素读本(第3册) pdf pdb 阿里云 极速 mobi caj kindle 下载
图解人像摄影布光全攻略 章宗 光影基础知识技巧实例布光图3D示意图场景布光秘籍拍摄案例布光展示实拍操作理论讲解摄影图书籍正版自营同款 pdf pdb 阿里云 极速 mobi caj kindle 下载
高耸结构设计标准 GB 50135-2019 中国计划出版社 pdf pdb 阿里云 极速 mobi caj kindle 下载
這樣學超好玩!第一本親子互動數學遊戲:88款從日常學會概念、愛上數學的生活遊戲 港台原版 亲子读物 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 中国农村养老保障制度的升级路径问题研究:基于区域经济差异视角 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 第三学期寒假衔接九年级英语外研版 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 【预订】King Henry V 9780521594288 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 2014年贵州省公务员考试专用教材申论冲刺预测试卷 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 百家讲坛.陆游DVD pdf pdb 阿里云 极速 mobi caj kindle 下载
- 浮生六记(汉法对照版) pdf pdb 阿里云 极速 mobi caj kindle 下载
- 上海社区工作者考试中公2019上海社区工作者招聘考试辅导书真题精解及全真模拟试卷 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 小学生小古文120课(上下2册) 赠朗诵音频 依据《完善中华优秀传统文化教育指导纲要》编写 开心教育 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 近代中国社会的新陈代谢精装 陈旭麓著 新增浮想录摘编 中国近代史导论性著作 近代社会结构演变中国通史历史书 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 趣味钢琴曲选 献给老年朋友(一 修订版) pdf pdb 阿里云 极速 mobi caj kindle 下载
书籍真实打分
故事情节:8分
人物塑造:8分
主题深度:4分
文字风格:5分
语言运用:7分
文笔流畅:8分
思想传递:8分
知识深度:9分
知识广度:6分
实用性:5分
章节划分:6分
结构布局:7分
新颖与独特:3分
情感共鸣:4分
引人入胜:7分
现实相关:3分
沉浸感:7分
事实准确性:6分
文化贡献:6分