<p>《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文以后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。</p> <p>本书构思跌宕起伏,行文妙趣横生,无论是职场老手,还是业界新人,无论是字斟句酌,还是信手翻阅,相信都能跟着文字在职场中走上几回,去体味数据分析领域的乐趣与挑战。</p>
深入浅出R语言数据分析
✍ Scribed by 米霖
- Publisher
- 清华大学出版社
- Year
- 2020
- Tongue
- Chinese
- Leaves
- 271
- Series
- 新时代·技术新未来
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
《深入浅出R语言数据分析》首先介绍数据分析的方法论,然后介绍数据分析的相关模型方法,并进一步通过数据分析案例,讲解数据分析的思维、方法及模型实现过程。该书重点介绍R语言在数据分析方面的应用,让读者能够快速地使用R语言进行数据分析、构建模型。
全书分为17章,内容包括:使用R语言获取数据、数据分析中的数据处理与数据探索、生存分析、主成分分析、多维缩放、线性回归模型、逻辑回归模型、聚类模型、关联规则、随机森林、支持向量机、神经网络、文本挖掘、社交网络分析,以及关于R语言数据分析的两个延伸内容:H2O机器学习和R语言爬虫。
《深入浅出R语言数据分析》内容通俗易懂,案例丰富,实用性强,特别适合R语言的入门读者和进阶读者阅读,也适合数据分析人员、数据挖掘人员等其他数据科学从业者。另外,该书也适用于统计学、计算机、机器学习、数学等相关专业的本科生、研究生使用。
✦ Table of Contents
封面
扉页
内容简介
版权页
前言
目录
第1章 数据分析项目的流程
1.1 数据分析项目中的角色
1.2 数据分析项目的阶段
1.3 总结
第2章 数据的读取
2.1 RData数据
2.2 readr高效读取数据
2.3 读取Excel数据
2.4 读取SPSS、SAS、STATA数据
2.5 R语言操作数据库
2.6 总结
第3章 数据探索
3.1 缺失值的识别与处理
3.2 异常值
3.3 dlookr数据处理包
3.4 数据相关性
3.5 自动化创建数据探索报告
3.6 总结
第4章 生存分析
4.1 生存分析的基本内容
4.2 使用R语言进行生存分析
4.3 非参数模型
4.4 半参数模型生存分析方法
4.5 参数模型
4.6 随机生存森林模型
4.7 总结
第5章 主成分分析
5.1 概述
5.2 主成分分析详解
5.3 使用R语言进行主成分分析
5.4 总结
第6章 多维缩放
6.1 MDS的工作原理
6.2 在R语言中实现MDS
6.3 MDS的优点
6.4 总结
第7章 线性回归模型
7.1 线性回归模型概述
7.2 在R语言中实现回归模型
7.3 总结
第8章 逻辑回归模型
8.1 逻辑回归的原理
8.2 在R语言中实现逻辑回归模型
8.3 总结
第9章 聚类模型
9.1 概述
9.2 在R语言中实现聚类模型
9.3 总结
第10章 关联规则
10.1 关联规则概述
10.2 关联规则的基本概念
10.3 在R语言中实现关联规划
10.4 总结
第11章 随机森林
11.1 随机森林的基本概念
11.2 在R语言中实现随机森林
11.3 总结
第12章 支持向量机
12.1 概述
12.2 在R语言中实现支持向量机
12.3 总结
第13章 神经网络
13.1 概述
13.2 在R语言中实现神经网络
13.3 总结
第14章 文本挖掘
14.1 概述
14.2 text2vec背景及其基本原理
14.3 DTM与TFIDF的原理和实现
14.4 情感分析
14.5 LDA主题模型及其实现
14.6 构建自动问答系统
14.7 总结
第15章 社交网络分析
15.1 社交网络概述
15.2 igraph简介
15.3 社交网络的常见结构
15.4 社交网络分析算法
15.5 微博社交群体分析
15.6 总结
第16章 H2O机器学习
16.1 H2O机器学习平台
16.2 在R语言中使用H2O
16.3 H2O Flow
16.4 总结
第17章 R语言爬虫
17.1 快速爬取网页数据
17.2 rvest简介
17.3 爬取BOSS直聘数据
17.4 模拟登录
17.5 总结
正文结束
📜 SIMILAR VOLUMES
本书坚持以大数据基础和应用为主导的编写原则,理论联系实际,并通过大量实例循序渐进地为读者介绍了进行大数据实践所涉及的各类知识。为了更好地帮助读者在短时间内掌握大数据基础理论知识和实践能力,全书的基础知识介绍清晰,理论联系实际,具有很强的操作性,并提供了大量通过测试可运行的完整实例,这些实例都给出了设计步骤、代码详解及程序运行结果,对于容易出现问题的地方,则以“注”的方式介绍常用的技巧和注意事项。另外本书的配套资料可从清华大学出版社网站(www.tup.com.cn)上下载。本书可作为计算机专业的本科生和研究生的大数据基础教材,也可作为大数据技术培训、Hadoop应用开发和运行维护人员的必备参考
<p>大数据时代,数据成为决策最为重要的参考之一,数据分析行业迈入了一个全新的阶段。R是一款非常优秀的统计分析软件,《数据分析:R语言实战》侧重于使用R进行数据的处理、整理和分析,重点讲述了R的数据分析流程、算法包的使用以及相关工具的应用,同时结合大量精选的数据分析问题对R软件进行科学、准确和全面的介绍,以便使读者能深刻理解R的精髓和灵活、高效的使用技巧。</p> <p>通过《数据分析:R语言实战》,读者不仅能掌握使用R及相关的算法包来快速解决实际问题,而且能学会从实际问题分析入手,到利用R进行求解,以及对结果进行分析。</p> <p>《数据分析:R语言实战》可作为计算机、互联网、机器学习
<p>你将从《深入浅出JavaScript(中文版)》学到什么?这么说你准备从写html和css的静态网页跃进到编写动态网络应用程序脚本了?这里就是起点。《深入浅出java script》带你游历令人兴奋的交互式网页创建过程。为了启发你的思考,《深入浅出JavaScript(中文版)》覆盖了所有的java script基本知识,从基本网络编程技巧,如变量、函数和循环语句,到高级一些的专题,如表单验证、dom操作、客户端对象、脚本程序调试——甚至是aiax!赶快做好准备……快速响应的网站离你只有几页纸那么远。</p> <p>为何《深入浅出JavaScript(中文版)》看上去如此不同?</p>
内容简介 · · · · · · 本书详细描述了Rust语言的基本语法,穿插讲解一部分高级使用技巧,并以更容易理解的方式解释其背后的设计思想。全书总共分五个部分。 第一部分介绍Rust基本语法,因为对任何程序设计语言来说,语法都是基础,学习这部分是理解其他部分的前提。 第二部分介绍属于Rust独一无二的内存管理方式。它设计了一组全新的机制,既保证了安全性,又保持了强大的内存布局控制力,而且没有额外性能损失。这部分是本书的重点和核心所在,也是Rust语言的思想内核精髓之处。 第三部分介绍Rust的抽象表达能力。它支持多种编程范式,以及较为强大的抽象表达能力。 第