𝔖 Scriptorium
✦   LIBER   ✦

📁

数据挖掘与R语言: 数据挖掘与R语言

✍ Scribed by (葡)Luis Torgo


Publisher
机械工业出版社
Year
2013
Tongue
Chinese
Leaves
216
Series
计算机科学丛书
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


书签已装载,
书签制作方法请找 [email protected]
完全免费

“如果你想学习如何用一款统计专家和数据挖掘专家所开发的免费软件包,那就选这本书吧。本书包括大量实际案例,它们充分体现了R软件的广度和深度。”
—— Bernhard Pfahringer, 新西兰怀卡托大学
本书利用大量给出必要步骤、代码和数据的具体案例,详细描述了数据挖掘的主要过程和技术,广泛涵盖数据大小、数据类型、分析目标、分析工具等方面的各种具有挑战性的问题。
本书的支持网站(http://www.liaad.up.pt/~ltorgo/DataMiningWithR/)给出了案例研究的所有代码、数据集以及R函数包。
本书特色
通过仔细选择的案例涵盖了主要的数据挖掘技术。
给出的代码和方法可以方便地复制或者改编后应用于自己的问题。
不要求读者具有R、数据挖掘或统计技术的基础知识。
包含R和MySQL基础知识的简介。
提供了对数据挖掘技术的特性、缺点和分析目标的基本理解。

✦ Table of Contents


封面
书名
版权
前言
目录
第1章 简介
1.1如何阅读本书
1.2 R简介
1.2.1 R起步
1.2.2 R对象
1.2.3向量
1.2.4向量化
1.2.5因子
1.2.6生成序列
1.2.7数据子集
1.2.8矩阵和数组
1.2.9列表
1.2.10数据框
1.2.11构建新函数
1.2.12对象、类和方法
1.2.13管理R会话
1.3 MySQL简介
第2章 预测海藻数量
2.1问题描述与目标
2.2数据说明
2.3数据加载到R
2.4数据可视化和摘要
2.5数据缺失
2.5.1将缺失部分剔除
2.5.2用最高频率值来填补缺失值
2.5.3通过变量的相关关系来填补缺失值
2.5.4通过探索案例之间的相似性来填补缺失值
2.6获取预测模型
2.6.1多元线性回归
2.6.2回归树
2.7模型的评价和选择
2.8预测7类海藻的频率
2.9小结
第3章 预测股票市场收益
3.1问题描述与目标
3.2可用的数据
3.2.1在R中处理与时间有关的数据
3.2.2从CSV文件读取数据
3.2.3从网站上获取数据
3.2.4从MySQL数据库读取数据
3.3定义预测任务
3.3.1预测什么
3.3.2预测变量是什么
3.3.3预测任务
3.3.4模型评价准则
3.4预测模型
3.4.1如何应用训练集数据来建模
3.4.2建模工具
3.5从预测到实践
3.5.1如何应用预测模型
3.5.2与交易相关的评价准则
3.5.3模型集成:仿真交易
3.6模型评价和选择
3.6.1蒙特卡罗估计
3.6.2实验比较
3.6.3结果分析
3.7交易系统
3.7.1评估最终测试数据
3.7.2在线交易系统
3.8小结
第4章 侦测欺诈交易
4.1问题描述与目标
4.2可用的数据
4.2.1加载数据至R
4.2.2探索数据集
4.2.3数据问题
4.3定义数据挖掘任务
4.3.1问题的不同解决方法
4.3.2评价准则
4.3.3实验方法
4.4计算离群值的排序
4.4.1无监督方法
4.4.2有监督方法
4.4.3半监督方法
4.5小结
第5章 微阵列样本分类
5.1问题描述与目标
5.1.1微阵列实验背景简介
5.1.2数据集ALL
5.2可用的数据
5.3基因(特征)选择
5.3.1基于分布特征的简单过滤方法
5.3.2 ANOVA过滤
5.3.3用随机森林进行过滤
5.3.4用特征聚类的组合进行过滤
5.4遗传学异常的预测
5.4.1定义预测任务
5.4.2模型评价标准
5.4.3实验过程
5.4.4建模技术
5.4.5模型比较
5.5小结
参考文献
主题索引
数据挖掘术语索引
R函数索引


📜 SIMILAR VOLUMES


数据挖掘算法与R语言实现
✍ 肖海军,胡鹏编著 📂 Library 📅 2018 🏛 电子工业出版社 🌐 Chinese

数据挖掘算法是根据数据创建数据挖掘模型的一组试探法和计算。算法根据数据创建的挖掘模型可以采用多种形式,这包括:说明数据集中的事例如何相关的一组分类。预测结果并描述不同条件是如何影响该结果的决策树。预测销量的数学模型。说明在事务中如何将产品分组到一起的一组规则,以及一起购买产品的概率等。本书主要介绍数据挖掘的十大经典算法的基本原理及其R语言的实现。 理论部分通俗易懂,实验部分使用编写语言的顺序讲解每个数据挖掘算法的实现过程,让学员所见即所得。

数据分析与数据挖掘
✍ 喻梅 于健 主编;王建荣 王庆节 副主编 📂 Library 📅 2018 🏛 清华大学出版社 🌐 Chinese

《数据分析与数据挖掘》主要介绍数据挖掘和数据分析的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据立方体和OLAP技术、频繁模式挖掘、回归分析、分类、聚类、离群点分析。书中涉及到的模型和算法均给予了相应的实例。

数据仓库与数据挖掘
✍ 陈志泊 📂 Library 📅 2009 🏛 清华大学出版社 🌐 Chinese

<p>《数据仓库与数据挖掘》主要介绍数据仓库和数据挖掘技术的基本原理和应用方法,全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。《数据仓库与数据挖掘》既重视理论知识的讲解,又强调应用技能的培养。每章首先介绍算法的主要思想和理论基础,之后利用算法去解决实例中给出的任务,而且对于数据仓库的组建方法和多数章节中的数据挖掘算法,《数据仓库与数据挖掘》都使用Microsoft SQL Server 2005进行了操作实现。《数据仓库与数据挖掘》通过

大数据分析与数据挖掘
✍ 简祯富; 许嘉裕 📂 Library 📅 2016 🏛 清华大学出版社 🌐 Chinese

<p>《大数据分析与数据挖掘》综合大数据分析与数据挖掘的理论、技术和实际案例,以丰富的产学合作实务案例,深入浅出地剖析从大数据中掏金的秘诀。全书内容涵盖大数据分析与数据挖掘的基本概念、数据准备、大数据分析的方法与实证及相关的进阶运用,并佐以R语言及例题实作,提升读者的数据挖掘实战能力,开拓对大数据分析的洞察视野。</p> <p>随着移动通信和行动装置普及、物联网和网络发展,以及云端技术的不断进步,现今数据产生、搜集和储存方式比以往更为方便。数据挖掘与大数据分析可以从海量数据中,找到值得参考的样型或规则,转换成有价值的信息、洞察或知识,创造更多新价值。</p> <p>本书主要介绍数据挖掘与大

金融数据挖掘与分析
✍ 郑志明; 缪绍日; 荆丽丽; 等 📂 Library 📅 2015 🏛 机械工业出版社 🌐 Chinese

<p>本套丛书由国家银行业信息科技管理高层指导委员会组织编写,银监会尚福林主席担任丛书编委会主编并亲笔作序。编委会成员囊括了银监会、国内各大银行的领导,各书的编著者都是各大银行总行的信息技术技术专家。本套丛书系统性强,内容先进实用,既立足我国银行业实际,又注重总结本土银行业的实践经验和成功案例,既着眼于国际先进银行的信息技术发展态势,又对如何将这些先进技术和理念本土化结合进行了探索和思考。</p> <p>本书针对金融行业数据量大、更新快的特点,着重介绍了数据挖掘与分析技术在金融行业尤其是银行业中的应用。本书的主要内容包括:数据挖掘概述、金融数据挖掘概述、基于大数据的金融数据挖掘概述、数据仓库