𝔖 Scriptorium
✦   LIBER   ✦

📁

Python机器学习基础教程

✍ Scribed by 安德里亚斯·穆勒; 莎拉·吉多


Publisher
人民邮电出版社
Year
2018
Tongue
Chinese
Leaves
306
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。

✦ Table of Contents


封面
数字版权声明
译者介绍
扉页
版权页
版权声明
O’Reilly Media, Inc.介绍
目录
前言
第1章 引言
1.1 为何选择机器学习
1.1.1 机器学习能够解决的问题
1.1.2 熟悉任务和数据
1.2 为何选择Python
1.3 scikit-learn
安装scikit-learn
1.4 必要的库和工具
1.4.1 Jupyter Notebook
1.4.2 NumPy
1.4.3 SciPy
1.4.4 matplotlib
1.4.5 pandas
1.4.6 mglearn
1.5 Python 2与Python 3的对比
1.6 本书用到的版本
1.7 第一个应用:鸢尾花分类
1.7.1 初识数据
1.7.2 衡量模型是否成功:训练数据与测试数据
1.7.3 要事第一:观察数据
1.7.4 构建第一个模型:k近邻算法
1.7.5 做出预测
1.7.6 评估模型
1.8 小结与展望
第2章 监督学习
2.1 分类与回归
2.2 泛化、过拟合与欠拟合
模型复杂度与数据集大小的关系
2.3 监督学习算法
2.3.1 一些样本数据集
2.3.2 k近邻
2.3.3 线性模型
2.3.4 朴素贝叶斯分类器
2.3.5 决策树
2.3.6 决策树集成
2.3.7 核支持向量机
2.3.8 神经网络(深度学习)
2.4 分类器的不确定度估计
2.4.1 决策函数
2.4.2 预测概率
2.4.3 多分类问题的不确定度
2.5 小结与展望
第3章 无监督学习与预处理
3.1 无监督学习的类型
3.2 无监督学习的挑战
3.3 预处理与缩放
3.3.1 不同类型的预处理
3.3.2 应用数据变换
3.3.3 对训练数据和测试数据进行相同的缩放
3.3.4 预处理对监督学习的作用
3.4 降维、特征提取与流形学习
3.4.1 主成分分析
3.4.2 非负矩阵分解
3.4.3 用t-SNE进行流形学习
3.5 聚类
3.5.1 k均值聚类
3.5.2 凝聚聚类
3.5.3 DBSCAN
3.5.4 聚类算法的对比与评估
3.5.5 聚类方法小结
3.6 小结与展望
第4章 数据表示与特征工程
4.1 分类变量
4.1.1 One-Hot编码(虚拟变量)
4.1.2 数字可以编码分类变量
4.2 分箱、离散化、线性模型与树
4.3 交互特征与多项式特征
4.4 单变量非线性变换
4.5 自动化特征选择
4.5.1 单变量统计
4.5.2 基于模型的特征选择
4.5.3 迭代特征选择
4.6 利用专家知识
4.7 小结与展望
第5章 模型评估与改进
5.1 交叉验证
5.1.1 scikit-learn中的交叉验证
5.1.2 交叉验证的优点
5.1.3 分层k折交叉验证和其他策略
5.2 网格搜索
5.2.1 简单网格搜索
5.2.2 参数过拟合的风险与验证集
5.2.3 带交叉验证的网格搜索
5.3 评估指标与评分
5.3.1 牢记最终目标
5.3.2 二分类指标
5.3.3 多分类指标
5.3.4 回归指标
5.3.5 在模型选择中使用评估指标
5.4 小结与展望
第6章 算法链与管道
6.1 用预处理进行参数选择
6.2 构建管道
6.3 在网格搜索中使用管道
6.4 通用的管道接口
6.4.1 用make_pipeline方便地创建管道
6.4.2 访问步骤属性
6.4.3 访问网格搜索管道中的属性
6.5 网格搜索预处理步骤与模型参数
6.6 网格搜索选择使用哪个模型
6.7 小结与展望
第7章 处理文本数据
7.1 用字符串表示的数据类型
7.2 示例应用:电影评论的情感分析
7.3 将文本数据表示为词袋
7.3.1 将词袋应用于玩具数据集
7.3.2 将词袋应用于电影评论
7.4 停用词
7.5 用tf-idf缩放数据
7.6 研究模型系数
7.7 多个单词的词袋(n元分词)
7.8 高级分词、词干提取与词形还原
7.9 主题建模与文档聚类
隐含狄利克雷分布
7.10 小结与展望
第8章 全书总结
8.1 处理机器学习问题
参与决策过程的人
8.2 从原型到生产
8.3 测试生产系统
8.4 构建你自己的估计器
8.5 下一步怎么走
8.5.1 理论
8.5.2 其他机器学习框架和包
8.5.3 排序、推荐系统与其他学习类型
8.5.4 概率建模、推断与概率编程
8.5.5 神经网络
8.5.6 推广到更大的数据集
8.5.7 磨练你的技术
8.6 总结
关于作者
关于封面
连接图灵
看完了


📜 SIMILAR VOLUMES


Python 机器学习基础教程
✍ 安德里亚斯·穆勒; 莎拉·吉多 📂 Library 📅 2018 🏛 人民邮电出版社 🌐 Chinese

<p>本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。</p>

机器学习基础
✍ 吕云翔; 马连韬; 刘卓然; 张凡; 张程博 📂 Library 📅 2018 🏛 清华大学出版社 🌐 Chinese

<p>本书全面系统地介绍了机器学习的基本概念、预备知识、主要思想、研究进展、基础技术、应用技巧,并围绕当前机器学习领域的热点问题展开讨论。全书共11章,主要内容包括决策树、神经网络、支持向量机、遗传算法、回归、聚类分析等。</p> <p>本书可作为高等院校计算机、软件工程、智能科学与技术等专业研究生和高年级本科生的教材,同时对于从事人工智能、数据挖掘、模式识别等相关技术人员也具有较高的参考价值。</p>

Python基础教程
✍ 周胜,鄢军霞 📂 Library 📅 2019 🏛 电子工业出版社 🌐 Chinese

本教材以 Windows 操作系统为平台,系统讲解 Python3 的基础知识。全书共 11 章,主要介绍了 Python 基本语法、字符串、列表、元组、字典、文件的读写、函数与模块等基础知识。首先介绍了 Python 的特点、 发展及推荐学习方法,然后讲授了 Python 基础语法、流程控制语句、数据类型、函数、模块、面向对象、文 件处理、异常处理、数据库操作,最后增加了全国计算机等级考试二级 Python 语言程序设计考试中所要求的 第三方库相关知识等。教材根据“自主式一体化教学”模式,对教材的构成要素进行调整,按照 Python 的有 关知识由浅入深、从易到难进行编写,并在每章

Python基础教程
✍ 相甍甍 孙鸿飞 📂 Library 📅 2019 🏛 清华大学出版社 🌐 Chinese

《Python基础教程》专门针对Python新手量身定做,涵盖Python 3实际开发中经常用到的重要知识点,内容主要包括Python语言的类型和对象、运算符和表达式、编程结构和控制流、函数、序列、多线程编程、正则表达式、面向对象编程、文件和目录操作、网络编程和邮件收发、数据库编程、Django框架和项目范例。在介绍知识点的过程中,实现了理论和实践相结合。书中还安排了不少实践示例,以帮助读者巩固所学、学以致用。 《Python基础教程》内容丰富、结构合理、思路清晰、语言简练流畅、示例翔实。《Python基础教程》主要面向Python初学者,适合作为高等院校Python程序设计课程的教材,还可作