𝔖 Scriptorium
✦   LIBER   ✦

📁

机器学习基础教程: A First Course in Machine Learning

✍ Scribed by (英)Simon Rogers,; Mark Girolami


Publisher
机械工业出版社
Year
2014
Tongue
Chinese
Leaves
202
Series
计算机科学丛书
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


书签已装载,
书签制作方法请找 [email protected]
完全免费

本书是一本机器学习入门教程,包含了数学和统计学的核心技术,用于帮助理解一些常用的机器学习算法。书中展示的算法涵盖了机器学习的各个重要领域:分类、聚类和投影。本书对一小部分算法进行了详细描述和推导,而不是简单地将大量算法罗列出来。
本书通过大量的MATLAB/Octave脚本将算法和概念由抽象的等式转化为解决实际问题的工具,利用它们读者可以重新绘制书中的插图,并研究如何改变模型说明和参数取值。
本书特色
介绍机器学习技术及应用的主要算法和思想。
为读者进一步探索机器学习领域中的特定方向提供起点。
不需要太多的数学知识,穿插在文中的注解框提供相应的数学解释。
每章末均包含练习。

✦ Table of Contents


封面
书名
版权
前言
目录
第1章 线性建模:最小二乘法
1.1线性建模
1.1.1定义模型
1.1.2模型假设
1.1.3定义什么是好的模型
1.1.4最小二乘解:一个有效的例子
1.1.5有效的例子
1.1.6奥运会数据的最小二乘拟合
1.1.7小结
1.2预测
1.2.1第二个奥运会数据集
1.2.2小结
1.3向量/矩阵符号
1.3.1例子
1.3.2数值的例子
1.3.3预测
1.3.4小结
1.4线性模型的非线性响应
1.5泛化与过拟合
1.5.1验证数据
1.5.2交叉验证
1.5.3 K折交叉验证的计算缩放
1.6正则化最小二乘法
1.7练习
其他阅读材料
第2章 线性建模:最大似然方法
2.1误差作为噪声
2.2随机变量和概率
2.2.1随机变量
2.2.2概率和概率分布
2.2.3概率的加法
2.2.4条件概率
2.2.5联合概率
2.2.6边缘化
2.2.7贝叶斯规则介绍
2.2.8期望值
2.3常见的离散分布
2.3.1伯努利分布
2.3.2二项分布
2.3.3多项分布
2.4连续型随机变量——概率密度函数
2.5常见的连续概率密度函数
2.5.1均匀密度函数
2.5.2β密度函数
2.5.3高斯密度函数
2.5.4多元高斯
2.5.5小结
2.6产生式的考虑(续)
2.7似然估计
2.7.1数据集的似然值
2.7.2最大似然
2.7.3最大似然解的特点
2.7.4最大似然法适用于复杂模型
2.8偏差-方差平衡问题
2.9噪声对参数估计的影响
2.9.1参数估计的不确定性
2.9.2与实验数据比较
2.9.3模型参数的变异性——奥运会数据
2.10预测值的变异性
2.10.1预测值的变异性——一个例子
2.10.2估计值的期望值
2.10.3小结
2.11练习
其他阅读材料
第3章 机器学习的贝叶斯方法
3.1硬币游戏
3.1.1计算正面朝上的次数
3.1.2贝叶斯方法
3.2精确的后验
3.3三个场景
3.3.1没有先验知识
3.3.2公平的投币
3.3.3有偏的投币
3.3.4三个场景——总结
3.3.5增加更多的数据
3.4边缘似然估计
3.5超参数
3.6图模型
3.7奥运会100米数据的贝叶斯处理实例
3.7.1模型
3.7.2似然估计
3.7.3先验概率
3.7.4后验概率
3.7.5 1阶多项式
3.7.6预测
3.8边缘似然估计用于多项式模型阶的选择
3.9小结
3.10练习
其他阅读材料
第4章 贝叶斯推理
4.1非共轭模型
4.2二值响应
4.3点估计:最大后验估计方案
4.4拉普拉斯近似
4.4.1拉普拉斯近似实例:近似γ密度
4.4.2二值响应模型的拉普拉斯近似
4.5抽样技术
4.5.1玩飞镖游戏
4.5.2 Metropolis-Hastings算法
4.5.3抽样的艺术
4.6小结
4.7练习
其他阅读材料
第5章 分类
5.1一般问题
5.2概率分类器
5.2.1贝叶斯分类器
5.2.2逻辑回归
5.3非概率分类器
5.3.1 K近邻算法
5.3.2支持向量机和其他核方法
5.3.3小结
5.4评价分类器的性能
5.4.1准确率——0/1损失
5.4.2敏感性和特异性
5.4.3 ROC曲线下的区域
5.4.4 混淆矩阵
5.5判别式和产生式分类器
5.6小结
5.7练习
其他阅读材料
第6章 聚类分析
6.1一般问题
6.2 K均值聚类
6.2.1聚类数目的选择
6.2.2 K均值的不足之处
6.2.3核化K均值
6.2.4小结
6.3混合模型
6.3.1生成过程
6.3.2混合模型似然函数
6.3.3 EM算法
6.3.4例子
6.3.5 EM寻找局部最优
6.3.6组分数目的选择
6.3.7混合组分的其他形式
6.3.8用EM估计MAP
6.3.9贝叶斯混合模型
6.4小结
6.5练习
其他阅读材料
第7章 主成分分析与隐变量模型
7.1一般问题
7.2主成分分析
7.2.1选择D
7.2.2 PCA的局限性
7.3隐变量模型
7.3.1隐变量模型中的混合模型
7.3.2小结
7.4变分贝叶斯
7.4.1选择Q(θ)
7.4.2优化边界
7.5 PCA的概率模型
7.5.1 Qτ(τ)
7.5.2Qx(xn)
7.5.3Qω(wm)
7.5.4期望值要求
7.5.5算法
7.5.6例子
7.6缺失值
7.6.1缺失值作为隐变量
7.6.2预测缺失值
7.7非实值数据
7.7.1概率PPCA
7.7.2议会数据可视化
7.8小结
7.9练习
其他阅读材料
词汇表
索引


📜 SIMILAR VOLUMES


Python 机器学习基础教程
✍ 安德里亚斯·穆勒; 莎拉·吉多 📂 Library 📅 2018 🏛 人民邮电出版社 🌐 Chinese

<p>本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。</p>

Python机器学习基础教程
✍ 安德里亚斯·穆勒; 莎拉·吉多 📂 Library 📅 2018 🏛 人民邮电出版社 🌐 Chinese

<p>本书是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。</p>

机器学习基础
✍ 吕云翔; 马连韬; 刘卓然; 张凡; 张程博 📂 Library 📅 2018 🏛 清华大学出版社 🌐 Chinese

<p>本书全面系统地介绍了机器学习的基本概念、预备知识、主要思想、研究进展、基础技术、应用技巧,并围绕当前机器学习领域的热点问题展开讨论。全书共11章,主要内容包括决策树、神经网络、支持向量机、遗传算法、回归、聚类分析等。</p> <p>本书可作为高等院校计算机、软件工程、智能科学与技术等专业研究生和高年级本科生的教材,同时对于从事人工智能、数据挖掘、模式识别等相关技术人员也具有较高的参考价值。</p>

易学基础教程
✍ 朱伯崑 📂 Library 📅 2011 🏛 九州出版社 🌐 Chinese

本书以通俗易懂的语言,深入浅出、全方位地介绍了《易经》、《易传》、易图学、《易》卦爻辞,易学、易学中的思维方式,易学与传统文化等各方面的概况,是一本易学爱好者必备的入门之书。