《数据分析与数据挖掘》主要介绍数据挖掘和数据分析的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据立方体和OLAP技术、频繁模式挖掘、回归分析、分类、聚类、离群点分析。书中涉及到的模型和算法均给予了相应的实例。
数据挖掘实用案例分析
✍ Scribed by 赵卫东 董亮
- Publisher
- 清华大学出版社
- Year
- 2018
- Tongue
- Chinese
- Leaves
- 264
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
数据挖掘已经广泛应用于各行各业,并催生了数据分析师的兴起。本书结合项目实践,首先对数据挖掘的核心问题进行了总结,并以保险推荐为例说明数据挖掘过程中每个步骤需要关注之处; 然后,结合香水销售分析,讨论可视化图形的基本应用。为增强本书的实用性,提高读者的动手能力,后续章节详细地分析了数据挖掘在银行信用卡、餐饮、商务酒店、制造业、公安等领域的应用。此外,本书还介绍了卷积神经网络在音频数据处理方面的实际应用。 本书内容深入浅出,案例生动形象,可以作为高校相关专业“数据挖掘”“机器学习”“商务数据分析”等课程的实验教材,也可以供学习数据分析的社会人士参考。
✦ Table of Contents
封面
扉页
内容简介
版权页
前言
目录
第1章 数据分析过程的主要问题
1.1 业务理解
1.2 数据理解
1.3 数据质量问题与预处理
1.4 数据分析常见陷阱
1.5 数据分析方法的选择
1.6 数据分析结果的评价
1.7 数据分析团队的组建
1.8 数据分析人才培养的难题
第2章 数据挖掘算法的选择———保险产品推荐
2.1 业务理解
2.2 数据分析目标
2.3 数据探索
2.4 模型选择过程
2.5 总结
第3章 常用可视化的多维分析
3.1 箱图
3.2 雷达图
3.3 标签云
3.4 气泡图
3.5 树图
3.6 地图
3.7 高低图
3.8 双轴图
3.9 关系图
3.10 热图
第4章 SPSS Modeler建模组件介绍
4.1 数据预处理组件
4.2 数据挖掘建模组件
4.3 知识表示
第5章 香水销售分析
5.1 香水销售数据预处理
5.2 香水销售数据统计分析
5.3 影响香水销量的因素分析
5.4 香水适用场所关联分析
5.5 香水聚类分析
5.6 香水营销建议
第6章 银行信用卡欺诈与拖欠行为分析
6.1 客户信用等级影响因素
6.2 信用卡客户信用等级影响因素
6.3 基于消费的信用等级影响因素
6.4 信用卡欺诈判断模型
6.5 欺诈人口属性分析
第7章 海底捞火锅运营分析
7.1 火锅相关数据抓取
7.2 数据预处理
7.3 数据分析
7.4 菜品关联分析
7.5 用户评论与评分的关联分析
7.6 顾客情感分析
第8章 商务宾馆竞争分析
8.1 目前经济型酒店行业竞争态势
8.2 用户相关数据准备
8.3 通过Python编程抓取评论
8.4 数据预处理
8.5 商务宾馆客户数据分析
8.6 建议
第9章 耐热导线工厂质量管理数据分析
9.1 项目概述
9.2 耐热导线生产质量数据预处理
9.3 耐热铝线质量检测数据分析
第10章 基于逻辑回归模型的高危人员分析
10.1 高危人员分析需求
10.2 高危人群相关数据收集与预处理
10.3 建立模型
第11章 卷积神经网络在音频质量评价领域的应用
11.1 深度学习基础
11.2 音频质量评价
11.3 性能验证
正文结束
参考文献
图书资源支持
📜 SIMILAR VOLUMES
数据仓库与数据挖掘是与计算机、信息类等相关专业的核心课程。本书采用提出问题、分析问题、解决问题的思路,通过工程实例介绍了SQL Server 2005和Weka软件的使用方法以及联机分析处理技术、关联规则方法、决策树方法、贝叶斯方法、人工神经网络方法、聚类分析方法、线性回归方法等数据仓库与数据挖掘技术。本书结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;坚持理论与实际相结合,知识理论与具体实现方法相结合,使技术实现具体化、生动化、可操作化;工程实例的实现过程建立在SQL Server 2005和Weka软件的基础上,以帮助读者在学习后达到学以致用的效果。本书可以和《数据仓库与数据挖
<p>《大数据分析与数据挖掘》综合大数据分析与数据挖掘的理论、技术和实际案例,以丰富的产学合作实务案例,深入浅出地剖析从大数据中掏金的秘诀。全书内容涵盖大数据分析与数据挖掘的基本概念、数据准备、大数据分析的方法与实证及相关的进阶运用,并佐以R语言及例题实作,提升读者的数据挖掘实战能力,开拓对大数据分析的洞察视野。</p> <p>随着移动通信和行动装置普及、物联网和网络发展,以及云端技术的不断进步,现今数据产生、搜集和储存方式比以往更为方便。数据挖掘与大数据分析可以从海量数据中,找到值得参考的样型或规则,转换成有价值的信息、洞察或知识,创造更多新价值。</p> <p>本书主要介绍数据挖掘与大
<p>本套丛书由国家银行业信息科技管理高层指导委员会组织编写,银监会尚福林主席担任丛书编委会主编并亲笔作序。编委会成员囊括了银监会、国内各大银行的领导,各书的编著者都是各大银行总行的信息技术技术专家。本套丛书系统性强,内容先进实用,既立足我国银行业实际,又注重总结本土银行业的实践经验和成功案例,既着眼于国际先进银行的信息技术发展态势,又对如何将这些先进技术和理念本土化结合进行了探索和思考。</p> <p>本书针对金融行业数据量大、更新快的特点,着重介绍了数据挖掘与分析技术在金融行业尤其是银行业中的应用。本书的主要内容包括:数据挖掘概述、金融数据挖掘概述、基于大数据的金融数据挖掘概述、数据仓库
本书主要根据作者近几年在清华大学面向研究生和本科生开设的“数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系,系统的介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。
书签已装载, 书签制作方法请找 [email protected] 完全免费 很多学科都面临着一个普遍问题:如何存储、访问异常庞大的数据集,并用模型来描述和理解它们?这些问题使得人们对数据挖掘技术的兴趣不断增强。长期以来,很多相互独立的不同学科分别致力于数据挖掘的各个方面。本书把信息科学、计算科学和统计学在数据挖掘方面的应用融合在一起,是第一本真正和跨学科教材。 本书由三部分构成。第一部分是基础,介绍了数据挖掘算法及其应用所依赖的基本原理。讲座方法直观易懂,深入浅出。第二部分是数据挖掘算法,系统讲座了如何构建求解特定问题的不同算法。讲座的内容包括用于分类和回归的树及规则、关