<p>本书全面介绍了数据挖掘,涵盖了五个主题:数据、分类、关联分析、聚类和异常检测。除异常检测外,每个主题都有两章。前一章涵盖基本概念、代表性算法和评估技术,而后一章讨论高级概念和算法。这样读者在透彻地理解数据挖掘的基础的同时,还能够了解更多重要的高级主题。</p> <p>本书是明尼苏达大学和密歇根州立大学数据挖掘课程的教材,由于独具特色,正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。</p> <p>本书特色</p> <p> 与许多其他同类图书不同,本书将重点放在如何用数据挖掘知识解决各种实际问题。</p> <p> 只要求具备很少
数据挖掘导论
✍ Scribed by 戴红; 常子冠; 于宁
- Publisher
- 清华大学出版社
- Year
- 2014
- Tongue
- Chinese
- Leaves
- 218
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
本书为数据挖掘入门级教材,共分8章,主要内容分为三个专题:技术、数据和评估。技术专题包括决策树技术、K-means算法、关联分析技术、神经网络技术、回归分析技术、贝叶斯分析、凝聚聚类、概念分层聚类、混合模型聚类技术的EM算法、时间序列分析和基于Web的数据挖掘等常用的机器学习方法和统计技术。数据专题包括数据库中的知识发现处理模型和数据仓库及OLAP技术。评估专题包括利用检验集分类正确率和混淆矩阵,并结合检验集置信区间评估有指导学习模型,使用无指导聚类技术评估有指导模型,利用Lift和假设检验比较两个有指导学习模型,使用MS Excel 2010和经典的假设检验模型评估属性,使用簇质量度量方法和有指导学习技术评估无指导聚类模型。
本书秉承教材风格,强调广度讲解。注重成熟模型和开源工具的使用,以提高学习者的应用能力为目标;注重结合实例和实验,加强基本概念和原理的理解和运用;注重实例的趣味性和生活性,提高学习者学习的积极性。使用章后练习、计算和实验作业巩固和检验所学内容;使用词汇表附录,解释和规范数据挖掘学科专业术语;使用适合教学的简单易用开源的Weka和通用的MS Excel软件工具实施数据挖掘验证和体验数据挖掘的精妙。
本书可作为普通高等院校计算机科学、信息科学、数学和统计学专业的入门教材,也可作为如经济学、管理学、档案学等对数据管理、数据分析与数据挖掘有教学需求的其他相关专业的基础教材。同时,对数据挖掘技术和方法感兴趣,致力于相关方面的研究和应用的其他读者,也可以从本书中获取基本的指导和体验。
本书配有教学幻灯片、大部分章后习题和实验的参考答案以及课程大纲。
✦ Table of Contents
封面
扉页
内容简介
版权页
前言
目录
第1章 认识数据挖掘
1.1 数据挖掘的定义
1.2 机器学习
1.3 数据查询
1.4 专家系统
1.5 数据挖掘的过程
1.6 数据挖掘的作用
1.7 数据挖掘技术
1.8 数据挖掘的应用
1.9 Weka数据挖掘软件
本章小结
习题
第2章 基本数据挖掘技术
2.1 决策树
2.2 关联规则
2.3 聚类分析技术
2.4 数据挖掘技术的选择
本章小结
习题
第3章 数据库中的知识发现
3.1 知识发现的基本过程
3.2 KDD过程模型的应用
3.3 实验:KDD案例
本章小结
习题
第4章 数据仓库
4.1 数据库与数据仓库
4.2 设计数据仓库
4.3 联机分析处理
4.4 使用Excel数据透视表和数据透视图分析数据
本章小结
习题
第5章 评估技术
5.1 数据挖掘评估概述
5.2 评估有指导学习模型
5.3 比较有指导学习模型
5.4 属性评估
5.5 评估无指导聚类模型
本章小结
习题
第6章 神经网络技术
6.1 神经网络概述
6.2 神经网络训练
6.3 神经网络模型的优势和缺点
本章小结
习题
第7章 统计技术
7.1 回归分析
7.2 贝叶斯分析
7.3 聚类技术
7.4 数据挖掘中的统计技术与机器学习技术
本章小结
习题
第8章 时间序列和基于Web的数据挖掘
8.1 时间序列分析
8.2 基于Web的数据挖掘
8.3 多模型分类技术
本章小结
习题
正文结束
附录A 词汇表
附录B 数据挖掘数据集
参考文献
📜 SIMILAR VOLUMES
书签已装载, 书签制作方法请找 [email protected] 完全免费 很多学科都面临着一个普遍问题:如何存储、访问异常庞大的数据集,并用模型来描述和理解它们?这些问题使得人们对数据挖掘技术的兴趣不断增强。长期以来,很多相互独立的不同学科分别致力于数据挖掘的各个方面。本书把信息科学、计算科学和统计学在数据挖掘方面的应用融合在一起,是第一本真正和跨学科教材。 本书由三部分构成。第一部分是基础,介绍了数据挖掘算法及其应用所依赖的基本原理。讲座方法直观易懂,深入浅出。第二部分是数据挖掘算法,系统讲座了如何构建求解特定问题的不同算法。讲座的内容包括用于分类和回归的树及规则、关
本书全面总结了不确定数据环境下频繁模式挖掘领域的主要研究成果,从数据模型、问题定义、常用算法等方面系统介绍不确定频繁项集挖掘、不确定序列模式挖掘、不确定频繁子图模式挖掘、不确定高效用项集挖掘和不确定加权频繁项集挖掘技术。重点针对两类典型的不确定数据,即概率数据和容错数据,进行概率频繁模式挖掘和近似频繁模式挖掘的研究,并应用于传统中医药数据环境下,从主观不确定性和客观不确定性两个方面提出相应的解决方案,实现基于不确定数据的高效频繁模式挖掘,并通过实验验证了它们的有效性和实用性。 本书主要面向对数据挖掘和机器学习感兴趣的科研人员和学生,特别适合从事不确定数据挖掘、频繁模式挖掘和关联规则发现以及相关
《数据分析与数据挖掘》主要介绍数据挖掘和数据分析的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据立方体和OLAP技术、频繁模式挖掘、回归分析、分类、聚类、离群点分析。书中涉及到的模型和算法均给予了相应的实例。