本书对大数据挖掘与应用的基本算法进行了系统的介绍,每种算法不仅包括对算法基本原理的介绍,而且配有大量的例题以及基于阿里云数加平台的演示,这种理论与实践相结合的方式极大地方便了读者对抽象的数据挖掘算法的理解和掌握。本书共17章,内容覆盖了数据预处理、关联规则挖掘算法、分类算法和聚类算法及常见的数据挖掘应用,具体章节包括大数据简介、数据预处理技术、关联规则挖掘、逻辑回归方法、KNN算法、朴素贝叶斯分类算法、随机森林分类算法、支持向量机、人工神经网络算法、决策树分类算法、Kmeans聚类算法、K中心点聚类算法、自组织神经网络聚类算法、DBSCAN聚类算法以及社交网络分析方法及应用、文本分析方法及
大数据挖掘及应用
✍ Scribed by 王国胤、刘群、于洪、曾宪华
- Publisher
- 清华大学出版社
- Year
- 2017
- Tongue
- Chinese
- Leaves
- 417
- Series
- 大数据系列丛书
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
《大数据系列丛书:大数据挖掘及应用》围绕大数据背景下的数据挖掘及应用问题,从大数据挖掘的基本概念入手,由浅入深、循序渐进地介绍了大数据挖掘分析过程中的数据准备和预处理方法、数据可视化技术、数据挖掘理论和经典算法、常用大数据分析计算平台的编程模型、并行化程序设计技术、统计分析R语言基础等内容。其中数据挖掘理论和经典算法不仅覆盖了传统的关联分析、分类和聚类,还包括深度学习理论等数据挖掘研究和发展的潮流主题。每一章内容都尽量从不同角度进行深入浅出的剖析,还配以丰富的习题和参考文献,对于读者掌握大数据挖掘及应用领域的基本知识和进一步研究都具有参考价值。 《大数据系列丛书:大数据挖掘及应用》可以作为高校本科相关专业数据分析类课程教材和面向各专业的数据科学通识教材,也可供广大IT从业人员参考。
✦ Table of Contents
封面
扉页
内容简介
版权页
序言
前言
目录
第1章 大数据挖掘及应用概论
1.1 大数据智能分析处理的普及和应用
1.2 大数据的发展及挑战
1.3 数据挖掘概述
1.4 大数据挖掘的计算框架
1.5 大数据时代“互联网+”的未来:智能互联
1.6 本书架构
1.7 小结
1.8 习题
1.9 参考文献
第2章 数据认知与预处理
2.1 数据分析的定义和流程
2.2 数据类型
2.3 数据的统计描述方法
2.4 数据对象关系的计算方法
2.5 数据准备
2.6 数据统计分析常用工具介绍
2.7 SPSS案例分析
2.8 小结
2.9 习题
2.10 参考文献
第3章 数据可视化
3.1 可视化简介
3.2 高维数据可视化
3.3 网络数据可视化
3.4 可视化案例分析
3.5 小结
3.6 习题
3.7 参考文献
第4章 数据关联分析
4.1 数据关联分析简介
4.2 基本概念
4.3 Apriori算法
4.4 FP-Growth算法
4.5 面向大数据的有效数据结构
4.6 关联规则有效性的评估方法
4.7 多维关联规则挖掘
4.8 多层关联规则挖掘
4.9 基于Python平台的案例分析
4.10 小结
4.11 习题
4.12 参考文献
第5章 数据分类分析
5.1 基本概念和术语
5.2 决策树算法
5.3 贝叶斯分类算法
5.4 支持向量机算法
5.5 粗糙集分类算法
5.6 分类器评估方法
5.7 组合分类器技术
5.8 惰性学习法(k最近邻分类)
5.9 基于Python平台的案例分析
5.10 小结
5.11 习题
5.12 参考文献
第6章 数据聚类分析
6.1 基本概念和术语
6.2 基于划分的方法
6.3 基于层次的方法
6.4 基于密度的方法
6.5 基于概率模型的聚类方法
6.6 聚类评估
6.7 基于Python平台的案例分析
6.8 小结
6.9 习题
6.10 参考文献
第7章 深度学习
7.1 引言
7.2 深信网
7.3 深玻尔兹曼机
7.4 栈式自动编码器
7.5 卷积神经网络
7.6 深度学习开源框架
7.7 深度学习应用技巧
7.8 小结
7.9 习题
7.10 参考文献
第8章 R语言
8.1 下载和安装R语言
8.2 使用R语言
8.3 R语言的数据结构
8.4 R语言的编程结构
8.5 R语言的数据挖掘和图形绘制包
8.6 实际案例
8.7 小结
8.8 习题
8.9 参考文献
第9章 Hadoop大数据分布式处理生态系统
9.1 Hadoop集群基础
9.2 HDFS基础操作
9.3 MapReduce并行计算框架
9.4 基于Storm的分布式实时计算
9.5 基于Spark Streaming的分布式实时计算
9.6 小结
9.7 参考文献
第10章 大数据分析算法的并行化
10.1 并行算法设计基础
10.2 典型数据挖掘算法并行化案例
10.3 大数据分析应用案例
10.4 小结
10.5 习题
10.6 参考文献
第11章 大数据挖掘及应用展望
11.1 大数据时代的发展回顾与展望
11.2 大数据中的新数据类型
11.3 大数据挖掘的新方法
11.4 未来发展趋势
11.5 小结
11.6 参考文献
正文结束
📜 SIMILAR VOLUMES
本书重点介绍Python语言在数据处理与数据挖掘方面的应用技巧,主要包括数据分析基础知识(数据收集与分析软件、数据挖掘的分析基础、简单数据的统计分析),数据分析高级方法(多元数据的综合分析、时序数据的模型分析),大数据基本处理方法(大数据分析基础应用、文献计量与科研评价、社会网络分析方法、数据分析编程平台)等内容。附录中还提供了Python数据分析相关方法和函数等,方便读者随时查看。本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向数据分析的读者,能有效帮助读者提高数据处理与分析的水平,提升工作效率。书中的例子数据、习题数据及相关代码都可在作者的学习博客http://blog.leanot
<p>《数据仓库与数据挖掘原理及应用》从专业角度全面介绍了数据仓库和数据挖掘的理论、方法、技术及其应用,系统地阐述了数据仓库和数据挖掘的产生、发展和应用及其主要概念、原理和算法,并结合当前数据仓库和数据挖掘中一些新的应用实例进一步加以说明,力求学以致用。</p> <p>全书分为三篇。第一篇介绍数据仓库的起源和演变过程,阐述数据仓库的定义、体系结构、组成、元数据、数据粒度和数据模型以及ETL过程,论述数据仓库设计和实现的方法。结合具体应用详细阐述了如何构建数据仓库及其主要应用,包括OLAP和OLAM等。第二篇介绍数据挖掘的起源和发展趋势,以及数据挖掘与web挖掘的技术和方法,包括聚类、分类、预
本书详细介绍了大数据挖掘技术,全书分为3篇,共12章。第1篇为大数据分析基础,包括第1~4章,分别为大数据概述、大数据相关技术、数据预处理、R语言工具的使用。第2篇为大数据挖掘技术,包括第5~11章,分别为线性分类方法、分类方法、聚类分析、关联规则、预测方法与离群点诊断、时间序列分析、大数据挖掘可视化。第3篇为大数据挖掘案例,包括第12章,介绍了大数据挖掘应用案例。 本书既可作为高等学校计算机科学与技术、数据科学与大数据技术、统计学、数据分析等专业的高等教育教材,也可作为科研人员、从事大数据相关工作的技术人员的参考书。
本书主要根据作者近几年在清华大学面向研究生和本科生开设的“数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系,系统的介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。
<p> 吕云翔、钟巧灵、衣志昊编著的《大数据基础及应用(大数据技术与应用专业规划教材)》从大数据的基本概念开始,由浅人深地领会大数据的精髓。本书除了讲述必要的大数据理论之外,还通过大数据实践来讲述大数据技术的应用,包括如何运用阿里云大数据计算平台分析和解决实际问题,很好地体现了大数据理论与实践的有机结合。</p> <p>本书分为三大部分,分别是大数据概述及基础、</p> <p>大数据处理和大数据分析与应用。其中,大数据概述及基础部分重点介绍数据组织、重要数据结构、大数据协同技术以及大数据存储技术等内容;大数据处理部分重点介绍大数据处理框架,包括大数据批处理和流处理框架等内容;大数据分析与应