使用Python进行数据分析是十分便利且高效的,因此它被认为是最优秀的数据分析工具之一。本书从理论和实战两个角度对Python数据分析工具进行了介绍,并采用理论分析和Python实践相结合的形式,按照数据分析的基本步骤对数据分析的理论知识以及相应的Python库进行了详细的介绍,让读者在了解数据分析的基本理论知识的同时能够快速上手实现数据分析程序。 本书适用于对数据分析有浓厚兴趣但不知从何下手的初学者,在阅读数据分析的基础理论知识的同时可以通过Python实现简单的数据分析程序,从而快速对数据分析的理论和实现两个层次形成一定的认知。
数据分析:R语言实战
✍ Scribed by 李诗羽; 张飞; 王正林
- Publisher
- 电子工业出版社
- Year
- 2014
- Tongue
- Chinese
- Leaves
- 335
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
大数据时代,数据成为决策最为重要的参考之一,数据分析行业迈入了一个全新的阶段。R是一款非常优秀的统计分析软件,《数据分析:R语言实战》侧重于使用R进行数据的处理、整理和分析,重点讲述了R的数据分析流程、算法包的使用以及相关工具的应用,同时结合大量精选的数据分析问题对R软件进行科学、准确和全面的介绍,以便使读者能深刻理解R的精髓和灵活、高效的使用技巧。
通过《数据分析:R语言实战》,读者不仅能掌握使用R及相关的算法包来快速解决实际问题,而且能学会从实际问题分析入手,到利用R进行求解,以及对结果进行分析。
《数据分析:R语言实战》可作为计算机、互联网、机器学习、信息、数学、经济金融、管理、运筹、统计以及有关理工科专业的本科生、研究生的学习用书,也能帮助市场营销、金融、财务、人力资源管理人员及产品经理解决实际问题,还能帮助从事咨询、研究、分析行业的人士及各级管理人员提高专业水平。
✦ Table of Contents
内容简介
前言
目录
第0章 致敬,R!
致敬,肩膀!
致敬,时代!
致敬,人才!
致敬,R瑟!
上篇 数据分析的前期准备
第1章 数据分析导引
1.1 数据分析概述
1.1.1 数据分析的原则
1.1.2 数据分析的步骤
1.1.3 数据分析的过程
1.1.4 数据分析的对象
1.2 大数据分析
1.2.1 大数据分析的流程
1.2.2 大数据分析的基本方面
1.2.3 大数据分析的应用
1.3 数据分析常用工具
1.4 R在数据分析中的优势
第2章 数据的读取与保存
2.1 数据读取
2.1.1 读取内置数据集
2.1.2 读取文本文件
2.1.3 读取固定宽度格式的文件
2.1.4 读取Excel数据
2.1.5 读取数据库文件
2.1.6 读取网页数据
2.1.7 读入R格式的文件
2.1.8 从其他统计软件读入数据
2.2 数据保存
2.2.1 使用函数cat()
2.2.2 保存为文本文件
2.2.3 保存R格式文件
2.2.4 保存为其他类型文件
第3章 数据预处理
3.1 基本函数
3.2 数据修改
3.2.1 修改数据标签
3.2.2 行列删除
3.3 缺失值处理
3.3.1 判断缺失数据
3.3.2 判断缺失模式
3.3.3 处理缺失数据
3.4 数据整理
3.4.1 数据合并
3.4.2 选取数据的子集
3.4.3 数据排序
3.5 长宽格式的转换
3.5.1 揉数据函数
3.5.2 揉数据的最佳伴侣
中篇 基本分析及应用
第4章 数据的图形描述
4.1 R绘图概述
4.2 绘图区域分割
4.2.1 函数par()
4.2.2 函数layout()
4.2.3 函数split.screen()
4.3 二维图形
4.3.1 高级绘图函数
4.3.2 多元数据绘图
4.3.3 低级绘图函数
4.3.4 图形美化
4.3.5 交互式绘图命令
4.4 三维图形
4.5 lattice程序包
4.6 ggplot2程序包
4.6.1 快速绘图
4.6.2 分图层绘图
4.7 图形保存
4.8 实战实例:数据地图
第5章 数据的描述性分析
5.1 R内置的分布
5.2 集中趋势的分析
5.2.1 集中趋势的测度
5.2.2 R语言实现
5.3 离散趋势的分析
5.3.1 离散趋势的测度
5.3.2 R语言实现
5.4 数据的分布分析
5.4.1 分布情况的测度
5.4.2 R语言实现
5.5 图形分析及R实现
5.5.1 直方图和密度函数图
5.5.2 QQ图
5.5.3 茎叶图
5.5.4 箱线图
5.5.5 经验分布图
5.6 多组数据分析及R实现
5.6.1 多组数据的统计分析
5.6.2 多组数据的图形分析
第6章 参数估计及R实现
6.1 点估计及R实现
6.1.1 矩估计
6.1.2 极大似然估计
6.2 单正态总体的区间估计
6.2.1 均值 的区间估计
6.2.2 方差 的区间估计
6.3 两正态总体的区间估计
6.3.1 均值差 的区间估计
6.3.2 两方差比 的区间估计
6.4 关于比率的区间估计
第7章 假设检验及R实现
7.1 假设检验概述
7.1.1 理论依据
7.1.2 检验步骤
7.1.3 两类错误
7.2 单正态总体的检验
7.2.1 均值 的检验
7.2.2 方差 的检验
7.3 两正态总体的检验
7.3.1 均值差 的检验
7.3.2 成对数据的t检验
7.3.3 两总体方差的检验
7.4 比率的检验
7.4.1 比率的二项分布检验
7.4.2 比率的近似检验
7.5 非参数的检验
7.5.1 总体分布的 检验
7.5.2 Kolmogrov-Smirnov检验
第8章 方差分析及R实现
8.1 单因素方差分析及R实现
8.1.1 基本假设的检验
8.1.2 单因素方差分析
8.1.3 多重t检验
8.1.4 Kruskal-Wallis秩和检验
8.2 双因素方差分析及R实现
8.2.1 无交互作用的分析
8.2.2 有交互作用的分析
8.3 协方差分析及R实现
第9章 回归分析及R实现
9.1 一元线性回归
9.1.1 模型理论
9.1.2 显著性检验
9.1.3 R语言实现
9.2 多元线性回归
9.2.1 模型理论
9.2.2 显著性检验
9.2.3 R语言实现
9.2.4 逐步回归
9.3 回归诊断及R实现
9.3.1 残差诊断
9.3.2 影响分析
9.3.3 多重共线性诊断
9.4 岭回归及R实现
9.5 广义线性模型
9.5.1 模型理论
9.5.2 R语言实现
第10章 主成分分析与因子分析
10.1 主成分分析
10.1.1 理论基础
10.1.2 R语言实现
10.2 因子分析
10.2.1 理论模型
10.2.2 因子载荷矩阵的估计方法
10.2.3 R语言实现
第11章 典型相关分析和对应分析
11.1 典型相关分析
11.1.1 理论基础
11.1.2 典型相关分析的应用
11.1.3 R语言实现
11.2 对应分析
11.2.1 理论基础
11.2.2 对应分析的步骤
11.2.3 R语言实现
第12章 判别分析和聚类分析
12.1 判别分析及R实现
12.1.1 距离判别法
12.1.2 距离判别法的R实现
12.1.3 Fisher判别法
12.1.4 Fisher判别法的R实现
12.1.5 贝叶斯判别法
12.1.6 贝叶斯判别法的R实现
12.2 聚类分析及R实现
12.2.1 理论概述
12.2.2 R实现举例
第13章 时间序列分析及R实现
13.1 时间序列的基本分析
13.1.1 平稳性与非平稳性
13.1.2 R实现的基本步骤
13.2 时间序列的分解
13.2.1 分解非季节性数据
13.2.2 分解季节性数据
13.3 指数平滑法预测分析
13.3.1 简单指数平滑法
13.3.2 残差的白噪声检验
13.3.3 Holt指数平滑法
13.3.4 Winters指数平滑法
13.4 ARIMA模型分析
13.4.1 基本思想
13.4.2 平稳化处理
13.4.3 建模
13.4.4 模型的参数估计
13.4.5 模型预测及检验
下篇 综合实例
第14章 R在金融数据分析中的应用
14.1 投资组合最优化实例
14.1.1 概述
14.1.2 均值-方差模型
14.1.3 模拟退火算法
14.2 构造投资组合的有效前沿
14.2.1 R中的算法包
14.2.2 计算分析
14.3 股票聚类分析
14.3.1 概述
14.3.2 K-means聚类分析
14.3.3 层次聚类分析
第15章 R在数据预测中的应用
15.1 回归分析预测
15.1.1 概述
15.1.2 实战案例
15.2 时间序列预测
15.2.1 概述
15.2.2 实战案例
📜 SIMILAR VOLUMES
本书介绍了来自统计分析,机器学习,人工智能等领域的多种数据分析算法,在讲解与之相关的R代码时,还讨论了这些算法的原理,优缺点与适用背景.
<p>《深入浅出R语言数据分析》首先介绍数据分析的方法论,然后介绍数据分析的相关模型方法,并进一步通过数据分析案例,讲解数据分析的思维、方法及模型实现过程。该书重点介绍R语言在数据分析方面的应用,让读者能够快速地使用R语言进行数据分析、构建模型。</p> <p>全书分为17章,内容包括:使用R语言获取数据、数据分析中的数据处理与数据探索、生存分析、主成分分析、多维缩放、线性回归模型、逻辑回归模型、聚类模型、关联规则、随机森林、支持向量机、神经网络、文本挖掘、社交网络分析,以及关于R语言数据分析的两个延伸内容:H2O机器学习和R语言爬虫。</p> <p>《深入浅出R语言数据分析》内容通俗易懂
《游戏数据分析实战》主要针对游戏策划、游戏运营、游戏数据分析、产品数据分析挖掘、数据平台开发维护人员及对数据分析感兴趣的读者,介绍怎样利用数据分析游戏生命周期中各阶段遇到的问题。 《游戏数据分析实战》主要分为三部分:第一部分主要介绍游戏数据分析相关指标体系,通过这套体系,可以初步监控游戏整体运营情况;第二部分主要介绍游戏正式发行前期的市场调研、渠道用户质量分析、竞品分析及投资收益预测,对游戏品质进行定位,评估正式上线后的效果;第三部分主要对游戏正式发行后的用户流失、活跃用户分类、付费习惯、版本迭代效果、区服合并等主要问题进行深入探讨,实现游戏的精益化运营。 《游戏数据分析实战》的特色是以详
本书详细阐述了与Hadoop 3大数据分析相关的基本解决方案,主要包括Hadoop简介、大数据分析概述、基于MapReduce的大数据处理、Python-Hadoop科学计算和大数据分析、R-Hadoop统计数据计算、Apache Spark批处理分析、Apache Spark实时数据分析、Apache Flink批处理分析、Apache Flink流式处 理、大数据可视化技术、云计算简介、使用亚马逊Web服务等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。
书签已装载, 书签制作方法请找 [email protected] 完全免费 “如果你想学习如何用一款统计专家和数据挖掘专家所开发的免费软件包,那就选这本书吧。本书包括大量实际案例,它们充分体现了R软件的广度和深度。” —— Bernhard Pfahringer, 新西兰怀卡托大学 本书利用大量给出必要步骤、代码和数据的具体案例,详细描述了数据挖掘的主要过程和技术,广泛涵盖数据大小、数据类型、分析目标、分析工具等方面的各种具有挑战性的问题。 本书的支持网站(http://www.liaad.up.pt/~ltorgo/DataMiningWithR/)给出了案例研究的所有