Python机器学习基础教程 pdf pdb 阿里云 极速 mobi caj kindle 下载

Python机器学习基础教程电子书下载地址
内容简介:
本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。
书籍目录:
目录
前言 ix
第 1 章 引言 1
1.1 为何选择机器学习 1
1.1.1 机器学习能够解决的问题 2
1.1.2 熟悉任务和数据 4
1.2 为何选择Python 4
1.3 scikit-learn 4
1.4 必要的库和工具 5
1.4.1 Jupyter Notebook 6
1.4.2 NumPy 6
1.4.3 SciPy 6
1.4.4 matplotlib 7
1.4.5 pandas 8
1.4.6 mglearn 9
1.5 Python 2 与Python 3 的对比 9
1.6 本书用到的版本 10
1.7 第 一个应用:鸢尾花分类 11
1.7.1 初识数据 12
1.7.2 衡量模型是否成功:训练数据与测试数据 14
1.7.3 要事第 一:观察数据 15
1.7.4 构建第 一个模型:k 近邻算法 16
1.7.5 做出预测 17
1.7.6 评估模型 18
1.8 小结与展望 19
第 2 章 监督学习 21
2.1 分类与回归 21
2.2 泛化、过拟合与欠拟合 22
2.3 监督学习算法 24
2.3.1 一些样本数据集 25
2.3.2 k 近邻 28
2.3.3 线性模型 35
2.3.4 朴素贝叶斯分类器 53
2.3.5 决策树 54
2.3.6 决策树集成 64
2.3.7 核支持向量机 71
2.3.8 神经网络(深度学习) 80
2.4 分类器的不确定度估计 91
2.4.1 决策函数 91
2.4.2 预测概率 94
2.4.3 多分类问题的不确定度 96
2.5 小结与展望 98
第3 章 无监督学习与预处理 100
3.1 无监督学习的类型 100
3.2 无监督学习的挑战 101
3.3 预处理与缩放 101
3.3.1 不同类型的预处理 102
3.3.2 应用数据变换 102
3.3.3 对训练数据和测试数据进行相同的缩放 104
3.3.4 预处理对监督学习的作用 106
3.4 降维、特征提取与流形学习 107
3.4.1 主成分分析 107
3.4.2 非负矩阵分解 120
3.4.3 用t-SNE 进行流形学习 126
3.5 聚类 130
3.5.1 k 均值聚类 130
3.5.2 凝聚聚类 140
3.5.3 DBSCAN 143
3.5.4 聚类算法的对比与评估 147
3.5.5 聚类方法小结 159
3.6 小结与展望 159
第4 章 数据表示与特征工程 161
4.1 分类变量 161
4.1.1 One-Hot 编码(虚拟变量) 162
4.1.2 数字可以编码分类变量 166
4.2 分箱、离散化、线性模型与树 168
4.3 交互特征与多项式特征 171
4.4 单变量非线性变换 178
4.5 自动化特征选择 181
4.5.1 单变量统计 181
4.5.2 基于模型的特征选择 183
4.5.3 迭代特征选择 184
4.6 利用专家知识 185
4.7 小结与展望 192
第5 章 模型评估与改进 193
5.1 交叉验证 194
5.1.1 scikit-learn 中的交叉验证 194
5.1.2 交叉验证的优点 195
5.1.3 分层k 折交叉验证和其他策略 196
5.2 网格搜索 200
5.2.1 简单网格搜索 201
5.2.2 参数过拟合的风险与验证集 202
5.2.3 带交叉验证的网格搜索 203
5.3 评估指标与评分 213
5.3.1 牢记目标 213
5.3.2 二分类指标 214
5.3.3 多分类指标 230
5.3.4 回归指标 232
5.3.5 在模型选择中使用评估指标 232
5.4 小结与展望 234
第6 章 算法链与管道 236
6.1 用预处理进行参数选择 237
6.2 构建管道 238
6.3 在网格搜索中使用管道 239
6.4 通用的管道接口 242
6.4.1 用make_pipeline 方便地创建管道 243
6.4.2 访问步骤属性 244
6.4.3 访问网格搜索管道中的属性 244
6.5 网格搜索预处理步骤与模型参数 246
6.6 网格搜索选择使用哪个模型 248
6.7 小结与展望 249
第7 章 处理文本数据 250
7.1 用字符串表示的数据类型 250
7.2 示例应用:电影评论的情感分析 252
7.3 将文本数据表示为词袋 254
7.3.1 将词袋应用于玩具数据集 255
7.3.2 将词袋应用于电影评论 256
7.4 停用词 259
7.5 用tf-idf 缩放数据 260
7.6 研究模型系数 263
7.7 多个单词的词袋(n 元分词) 263
7.8 分词、词干提取与词形还原 267
7.9 主题建模与文档聚类 270
7.10 小结与展望 277
第8 章 全书总结 278
8.1 处理机器学习问题 278
8.2 从原型到生产 279
8.3 测试生产系统 280
8.4 构建你自己的估计器 280
8.5 下一步怎么走 281
8.5.1 理论 281
8.5.2 其他机器学习框架和包 281
8.5.3 排序、推荐系统与其他学习类型 282
8.5.4 概率建模、推断与概率编程 282
8.5.5 神经网络 283
8.5.6 推广到更大的数据集 283
8.5.7 磨练你的技术 284
8.6 总结 284
关于作者 285
关于封面 285
作者介绍:
Andreas C. Müller
scikit-learn库维护者和核心贡献者。现任哥伦比亚大学数据科学研究院讲师,曾任纽约大学数据科学中心助理研究员、亚马逊公司计算机视觉应用的机器学习研究员。在波恩大学获得机器学习博士学位。
Sarah Guido
Mashable公司数据科学家,曾担任Bitly公司首席数据科学家。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
The most successful kinds of machine learning algorithms are those that automate decison-making processes by generalizing from know examples.
does not show the interaction of all of features at once, so some interesting aspects of the data may not be revealed when visualizing this way.
其它内容:
书籍介绍
本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。
网站评分
书籍多样性:5分
书籍信息完全性:7分
网站更新速度:8分
使用便利性:9分
书籍清晰度:5分
书籍格式兼容性:4分
是否包含广告:5分
加载速度:9分
安全性:4分
稳定性:3分
搜索功能:9分
下载便捷性:9分
下载点评
- 目录完整(616+)
- 内容完整(381+)
- 排版满分(116+)
- 体验差(318+)
- 引人入胜(114+)
- 章节完整(649+)
- 赞(490+)
- 体验好(395+)
- azw3(484+)
- 内容齐全(129+)
- txt(199+)
- 无漏页(347+)
下载评价
- 网友 宫***玉:
我说完了。
- 网友 马***偲:
好 很好 非常好 无比的好 史上最好的
- 网友 仰***兰:
喜欢!很棒!!超级推荐!
- 网友 晏***媛:
够人性化!
- 网友 郗***兰:
网站体验不错
- 网友 师***怡:
说的好不如用的好,真心很好。越来越完美
- 网友 步***青:
。。。。。好
- 网友 宫***凡:
一般般,只能说收费的比免费的强不少。
- 网友 薛***玉:
就是我想要的!!!
- 网友 通***蕊:
五颗星、五颗星,大赞还觉得不错!~~
- 网友 曾***玉:
直接选择epub/azw3/mobi就可以了,然后导入微信读书,体验百分百!!!
- 网友 师***怀:
好是好,要是能免费下就好了
喜欢"Python机器学习基础教程"的人也看了
纳税实务(含配套实训教程) 北京理工大学出版社 pdf pdb 阿里云 极速 mobi caj kindle 下载
声呐电子系统设计导论 pdf pdb 阿里云 极速 mobi caj kindle 下载
广深珠泛珠三角周边自驾游 pdf pdb 阿里云 极速 mobi caj kindle 下载
倔犟的姑娘 葡萄园看守 耶恩森短篇小说集-诺贝尔文学奖文集 pdf pdb 阿里云 极速 mobi caj kindle 下载
中国经济化(英文版)/中国道路丛书经济科学出版社9787521834963蔚蓝书店 pdf pdb 阿里云 极速 mobi caj kindle 下载
无线电定位理论与技术 pdf pdb 阿里云 极速 mobi caj kindle 下载
绣像全本 红楼梦 pdf pdb 阿里云 极速 mobi caj kindle 下载
胸外科疾病并发症鉴别诊断与治疗 pdf pdb 阿里云 极速 mobi caj kindle 下载
金域行 pdf pdb 阿里云 极速 mobi caj kindle 下载
桥艺测试(第2辑共4册) pdf pdb 阿里云 极速 mobi caj kindle 下载
- 营养圣经 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 人物摄影一点通 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 9787111458036 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 商务礼仪实务 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 基础化学实验III pdf pdb 阿里云 极速 mobi caj kindle 下载
- 双排键电子琴教程 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 9787554804599 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 西方百年版画艺术 从丢勒到勃鲁盖尔的蚀刻之美 华中科技大学出版社 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 突破英语专业八级13000词——征服英语专业四、八级 pdf pdb 阿里云 极速 mobi caj kindle 下载
- 中人2016年国家职业资格考试秘书三级历年真题汇编及押题密卷 pdf pdb 阿里云 极速 mobi caj kindle 下载
书籍真实打分
故事情节:4分
人物塑造:3分
主题深度:8分
文字风格:9分
语言运用:3分
文笔流畅:5分
思想传递:8分
知识深度:7分
知识广度:9分
实用性:6分
章节划分:7分
结构布局:8分
新颖与独特:5分
情感共鸣:3分
引人入胜:4分
现实相关:9分
沉浸感:5分
事实准确性:8分
文化贡献:3分