𝔖 Scriptorium
✦   LIBER   ✦

📁

Python数据挖掘方法及应用

✍ Scribed by 王斌会; 王术编著


Publisher
电子工业出版社
Year
2019
Tongue
Chinese
Leaves
216
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


本书重点介绍Python语言在数据处理与数据挖掘方面的应用技巧,主要包括数据分析基础知识(数据收集与分析软件、数据挖掘的分析基础、简单数据的统计分析),数据分析高级方法(多元数据的综合分析、时序数据的模型分析),大数据基本处理方法(大数据分析基础应用、文献计量与科研评价、社会网络分析方法、数据分析编程平台)等内容。附录中还提供了Python数据分析相关方法和函数等,方便读者随时查看。本书内容丰富,图文并茂,可操作性强且便于查阅,主要面向数据分析的读者,能有效帮助读者提高数据处理与分析的水平,提升工作效率。书中的例子数据、习题数据及相关代码都可在作者的学习博客http://blog.leanote.com/DaPy下载使用,也可登录华信教育资源网http://www.hxedu.com.cn免费下载。

✦ Table of Contents


扉页
版权页
前 言
目 录
第一部分 数据分析基础知识
第1章 数据收集与分析软件
1.1 数据收集过程
1.1.1 数据的类型
1.1.2 数据的收集
1.1.3 数据的管理
1.2 数据分析软件
1.2.1 数据分析软件简介
1.2.2 Python语言介绍
1.2.3 Python在线平台
1.3 Python编程基础
1.3.1 Python编程入门
1.3.2 Python数据类型
1.3.3 数值分析包numpy
1.3.4 数据分析包pandas
1.3.5 Python编程运算
数据及练习1
第2章 数据挖掘的分析基础
2.1 数据的描述分析
2.1.1 基本统计量
2.1.2 基本绘图函数
2.2 数据的透视分析
2.2.1 一维频数分析
2.2.2 二维集聚分析
2.2.3 多维透视分析
数据及练习2
第3章 简单数据的统计分析
3.1 随机变量及其分布
3.1.1 均匀分布
3.1.2 正态分布
3.2 随机模拟及其应用
3.2.1 随机模拟方法
3.2.2 模拟大数定律
3.2.3 模拟方法求积分
3.3 单变量统计分析模型
3.3.1 单变量线性相关模型
3.3.2 单变量线性回归模型
数据及练习3
第二部分 数据分析高级方法
第4章 多元数据的综合分析
4.1 多元线性相关与回归
4.1.1 多元线性相关
4.1.2 多元线性回归模型
4.2 综合评价方法
4.2.1 综合评价指标体系
4.2.2 综合评价分析方法
4.3 数据压缩方法
4.3.1 主成分分析的基本思想
4.3.2 主成分的基本分析
4.4 聚类分析方法
4.4.1 聚类分析的概念
4.4.2 系统聚类方法
数据与练习4
第5章 时序数据的模型分析
5.1 时间序列简介
5.1.1 时间序列的概念
5.1.2 时间序列的模拟
5.1.3 时间序列的读取
5.2 时间序列分析模型
5.2.1 AR模型
5.2.2 MR模型
5.2.3 ARMA模型
5.2.4 ARIMA模型
5.3 ARMA模型的构建
5.3.1 序列的相关性检验
5.3.2 ARMA模型的建立与检验
5.3.3 序列的平稳性检验
5.4 股票指数预测模型的构建
5.4.1 模型的预处理
5.4.2 参数的估计与检验
5.4.3 模型的预测
数据与练习5
第三部分 大数据基本处理方法
第6章 大数据分析基础应用
6.1 大数据的概念
6.1.1 大数据的含义
6.1.2 大数据应用举例
6.1.3 大数据分析方法
6.2 Python文本预处理
6.2.1 字符串的基本操作
6.2.2 字符串查询与替换
6.3 网络爬虫及应用
6.3.1 网页的基础知识
6.3.2 Python爬虫步骤
6.3.3 爬虫方法的应用
6.4 数据库技术及应用
6.4.1 Python中数据库的使用
6.4.2 数据库的建立与使用
数据及练习6
第7章 文献计量与科研评价
7.1 文献计量研究的框架
7.2 文献数据的获取与分析
7.2.1 文献数据的获取
7.2.2 文献数据的分析
7.3 科研数据的管理与评价
7.3.1 科研单位与项目分析
7.3.2 科研期刊与作者分析
数据及练习7
第8章 社会网络分析方法
8.1 社会网络的初步印象
8.1.1 社会网络分析概念
8.1.2 社会网络分析包
8.2 社会网络图的构建
8.2.1 社会网络数据形式
8.2.2 社会网络统计量
8.2.3 网络图之知识图谱
数据及练习8
第9章 数据分析编程平台
9.1 Anaconda科学计算发行包
9.1.1 Anaconda下载与安装
9.1.2 Anaconda启动与运行
9.2 Jupyter编辑平台
9.2.1 Jupyter Notebook
9.2.2 Jupyter Lab
9.2.3 在Jupyter中使用R语言
9.3 Spyder分析平台
9.3.1 Spyder平台简介
9.3.2 Spyder平台使用
附录A 本书的学习网站
附录B 书中的例子数据
附录C 书中自定义函数
参考文献


📜 SIMILAR VOLUMES


数据挖掘:方法与应用
✍ 徐华 📂 Library 📅 2014 🏛 清华大学出版社 🌐 Chinese

本书主要根据作者近几年在清华大学面向研究生和本科生开设的“数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系,系统的介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。

大数据挖掘及应用
✍ 王国胤、刘群、于洪、曾宪华 📂 Library 📅 2017 🏛 清华大学出版社 🌐 Chinese

《大数据系列丛书:大数据挖掘及应用》围绕大数据背景下的数据挖掘及应用问题,从大数据挖掘的基本概念入手,由浅入深、循序渐进地介绍了大数据挖掘分析过程中的数据准备和预处理方法、数据可视化技术、数据挖掘理论和经典算法、常用大数据分析计算平台的编程模型、并行化程序设计技术、统计分析R语言基础等内容。其中数据挖掘理论和经典算法不仅覆盖了传统的关联分析、分类和聚类,还包括深度学习理论等数据挖掘研究和发展的潮流主题。每一章内容都尽量从不同角度进行深入浅出的剖析,还配以丰富的习题和参考文献,对于读者掌握大数据挖掘及应用领域的基本知识和进一步研究都具有参考价值。 《大数据系列丛书:大数据挖掘及应用》可以作为高校

数据仓库与数据挖掘原理及应用
✍ 郑岩 📂 Library 📅 2011 🏛 清华大学出版社 🌐 Chinese

<p>《数据仓库与数据挖掘原理及应用》从专业角度全面介绍了数据仓库和数据挖掘的理论、方法、技术及其应用,系统地阐述了数据仓库和数据挖掘的产生、发展和应用及其主要概念、原理和算法,并结合当前数据仓库和数据挖掘中一些新的应用实例进一步加以说明,力求学以致用。</p> <p>全书分为三篇。第一篇介绍数据仓库的起源和演变过程,阐述数据仓库的定义、体系结构、组成、元数据、数据粒度和数据模型以及ETL过程,论述数据仓库设计和实现的方法。结合具体应用详细阐述了如何构建数据仓库及其主要应用,包括OLAP和OLAM等。第二篇介绍数据挖掘的起源和发展趋势,以及数据挖掘与web挖掘的技术和方法,包括聚类、分类、预

大数据挖掘与应用
✍ 王振武 📂 Library 📅 2017 🏛 清华大学出版社 🌐 Chinese

本书对大数据挖掘与应用的基本算法进行了系统的介绍,每种算法不仅包括对算法基本原理的介绍,而且配有大量的例题以及基于阿里云数加平台的演示,这种理论与实践相结合的方式极大地方便了读者对抽象的数据挖掘算法的理解和掌握。本书共17章,内容覆盖了数据预处理、关联规则挖掘算法、分类算法和聚类算法及常见的数据挖掘应用,具体章节包括大数据简介、数据预处理技术、关联规则挖掘、逻辑回归方法、KNN算法、朴素贝叶斯分类算法、随机森林分类算法、支持向量机、人工神经网络算法、决策树分类算法、Kmeans聚类算法、K中心点聚类算法、自组织神经网络聚类算法、DBSCAN聚类算法以及社交网络分析方法及应用、文本分析方法及

数据挖掘原理
✍ David Hand; Heikki Mannila; Padhraic Smyth 📂 Library 📅 2003 🏛 机械工业出版社 🌐 Chinese

书签已装载, 书签制作方法请找 [email protected] 完全免费 很多学科都面临着一个普遍问题:如何存储、访问异常庞大的数据集,并用模型来描述和理解它们?这些问题使得人们对数据挖掘技术的兴趣不断增强。长期以来,很多相互独立的不同学科分别致力于数据挖掘的各个方面。本书把信息科学、计算科学和统计学在数据挖掘方面的应用融合在一起,是第一本真正和跨学科教材。 本书由三部分构成。第一部分是基础,介绍了数据挖掘算法及其应用所依赖的基本原理。讲座方法直观易懂,深入浅出。第二部分是数据挖掘算法,系统讲座了如何构建求解特定问题的不同算法。讲座的内容包括用于分类和回归的树及规则、关