本书主要根据作者近几年在清华大学面向研究生和本科生开设的“数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系,系统的介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。
数据挖掘技术:市场营销、销售与客户关系管理领域应用
✍ Scribed by [美]MichaelJ.A.B 著; 别荣芳 / 尹静 / 邓六爱 译
- Publisher
- 机械工业
- Year
- 2006
- Tongue
- Chinese
- Leaves
- 426
- Series
- 计算机科学丛书
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
书签已装载,
书签制作方法请找 [email protected]
完全免费
(若有印刷不清等问题也请发送相关邮件,会尽快更新的)
本书是数据挖掘领域的经典著作,数年来畅销不衰。全书从技术和应用两个方面,全面、系统地介绍了数据挖掘的商业环境、数据挖掘技术及其在商业环境中的应用。自从1997年本书第1版出版以来,数据挖掘界发生了巨大的变化,其中的大部分核心算法仍然保持不变,但是算法嵌入的软件、应用算法的数据库以及用于解决的商业问题都有所演进。第2版展示如何利用基本的数据挖掘方法和技术,解决常见的商业问题。
本书涵盖核心的数据挖掘技术,包括:决策树、神经网络、协同过滤、关联规则、链接分析、聚类和生存分析等。此外,还提供了数据挖掘最佳实践、数据挖掘的最新进展和一些富有挑战性的研究课题,极具技术深度与广度。配套网站www.data-miners.com/companion提供了每章的练习和用于测试各种数据挖掘技术的数据。全书语句凝炼、清新,对复杂概念的实际应用进行了生动解释,是必不可少的...
(展开全部)
✦ Table of Contents
封面
书名
版权
前言
目录
第1章 数据挖掘的缘起和内容
1.1 分析客户关系管理系统
1.1.1 交易处理系统的作用
1.1.2 数据仓库的作用
1.1.3 数据挖掘的作用
1.1.4 客户关系管理策略的作用
1.2 什么是数据挖掘
1.3 数据挖掘可以完成哪些工作
1.3.1 分类
1.3.2 估计
1.3.3 预测
1.3.5 聚类
1.3.6 建立简档
1.3.4 关联分组或关联规则
1.4 为什么现在研究
1.4.1 数据正在生成
1.4.2 数据正在形成数据仓库
1.4.3 计算能力足以承受
1.4.4 客户关系管理的兴趣增强
1.4.5 商业数据挖掘软件产品已经易于使用
1.5 目前如何使用数据挖掘
1.5.1 超级市场成为信息经纪人
1.5.2 基于推荐的商业
1.5.3 交叉销售
1.5.4 抓住好的客户
1.5.5 淘汰差的客户
1.5.6 变革一个行业
1.6 小结
1.5.7 其他
第2章 数据挖掘的良性循环
2.1 商业数据挖掘案例研究
2.1.1 识别商务挑战
2.1.2 应用数据挖掘
2.1.3 按照结果采取行动
2.1.4 测试效果
2.2 何谓良性循环
2.2.1 识别商业机会
2.2.2 挖掘数据
2.2.3 采取行动
2.2.4 测试结果
2.3 良性循环环境下的数据挖掘
2.4 移动通信公司建立恰当的联系
2.4.1 机会
2.4.2 如何应用数据挖掘
2.4.3 处理行动
2.4.4 完成循环
2.5 神经网络和决策树驱动SUV的销售
2.5.1 最初的挑战
2.5.2 如何应用数据挖掘
2.5.3 最终措施
2.5.4 完成循环
2.6 小结
第3章 数据挖掘方法论和最佳实践
3.1 为什么需要方法论
3.1.1 获取不真实的知识
3.1.2 获取真实但无用的知识
3.2 假设测试
3.3 模型、建立简档和预测
3.3.1 建立简档
3.3.2 预测
3.4 方法论
3.4.1 第一步:将商业问题转换为数据挖掘问题
3.4.2 第二步:选取合适数据
3.4.3 第三步:设法理解数据
3.4.4 第四步:创建模型集
3.4.5 第五步:修复数据问题
3.4.6 第六步:变换数据,获取信息
3.4.8 第八步:评估模型
3.4.7 第七步:建立模型
3.4.9 第九步:部署模型
3.4.10 第十步:评估结果
3.9.11 第十一步:重新开始
3.5 小结
第4章 数据挖掘在市场营销和客户关系管理中的应用
4.1 寻找潜在客户
4.1.1 识别好的潜在客户
4.1.2 选择沟通渠道
4.1.3 遴选适当的信息
4.2 为选择正确的广告场所进行数据挖掘
4.2.1 谁匹配简档
4.2.2 测量读者群组的匹配度
4.3 通过数据挖掘改进定向市场营销活动
4.3.2 优化固定预算的响应率
4.3.1 响应建模
4.3.3 优化营销活动收益
4.3.4 接触那些受相关信息影响最大的人们
4.3.5 差别响应分析
4.4 使用当前客户来了解潜在客户
4.4.1 在他们成为客户前就开始跟踪客户
4.4.2 从新客户那里收集信息
4.4.3 获取时间变量可预测未来结果
4.5 客户关系管理数据挖掘
4.5.1 按客户需求策划营销活动
4.5.2 划分客户群体
4.5.3 减少信用风险
4.5.4 决定客户价值
4.6.1 识别流失
4.5.5 交叉销售、提升销售和销售推荐
4.6 保持和流失
4.6.2 流失为什么重要
4.6.3 不同类型的流失
4.6.4 不同类型的流失模型
4.7 小结
第5章 统计学的魅力:数据挖掘常用的工具
5.1 Occam的剃刀
5.1.1 原假设
5.1.2 p值
5.2 观察数据
5.2.1 观察离散数值
5.2.2 观察连续变量
5.2.3 另一对统计概念
5.3.1 比例标准误差
5.3 测定响应
5.3.2 使用置信界限比较结果
5.3.3 使用比例差值比较结果
5.3.4 样本大小
5.3.5 置信区间的真正含义
5.3.6 实验的测试群组和对照群组大小
5.4 多重比较
5.4.1 多重比较下的置信层次
5.4.2 Bonferroni修正
5.5 卡方检验
5.5.1 期望值
5.5.2 卡方值
5.6 示例:区域和起点的卡方
5.5.3 卡方与比例差值的比较
5.7 数据挖掘和统计学异同
5.7.1 原始数据中没有测量误差
5.7.2 有大量的数据
5.7.3 时间从属性随处出现
5.7.4 试验是艰难的
5.7.5 数据审查和截取
5.8 小结
第6章 决策树
6.1 什么是决策树
6.1.1 分类
6.1.2 评分
6.1.3 估计
6.1.4 树以多种形态生长
6.2.1 发现拆分
6.2 决策树是如何长成的
6.2.2 生成完全树
6.2.3 度量决策树的有效性
6.3 选择最佳拆分的测试
6.3.1 纯度和发散性
6.3.2 基尼或总体发散性
6.3.3 熵归约或信息增益
6.3.4 信息增益比率
6.3.5 卡方检验
6.3.6 方差归约
6.3.7 F测试
6.4 修剪
6.4.1 CART修剪算法
6.4.2 C5修剪算法
6.4.3 基于稳定性的修剪
6.5 从树中提炼规则
6.6 考虑成本
6.7 决策树方法的进一步修正
6.7.1 每次使用多于一个字段
6.7.2 倾斜超平面
6.7.3 神经树
6.7.4 使用树分段回归
6.8 决策树的替代表示法
6.8.1 方格图
6.8.2 树年轮图
6.9 实际应用中的决策树
6.9.1 决策树作为数据探查工具
6.9.2 把决策树方法应用于顺序事件
6.9.3 模拟未来
6.10 小结
第7章 人工神经网络
7.1 历史回眸
7.2 房地产评估
7.3 用于定向数据挖掘的神经网络
7.4 神经网络是什么
7.4.1 神经网络的单元是什么
7.4.2 前馈神经网络
7.4.3 神经网络如何使用反向传播学习
7.4.4 前馈网络和反向传播网络的启发
7.5 选择训练集
7.5.1 覆盖所有特征值
7.5.2 特征数目
7.5.4 输出数目
7.5.3 训练集的大小
7.6 准备数据
7.6.1 具有连续数值的特征
7.6.2 具有有序、离散(整数)数值的特征
7.6.3 具有分类数值的特征
7.6.4 其他类型的特征
7.7 解释结果
7.8 时间序列神经网络
7.9 如何了解在神经网络内部正在运行的事情
7.10 自组织映像
7.10.1 什么是自组织映像
7.10.2 实例:发现簇
7.11 小结
8.1 基于存储的推理
第8章 最近邻方法:基于存储的推理和协同过滤
8.2 MBR面临的挑战
8.2.1 选择一组平衡的历史记录
8.2.2 表示训练数据
8.2.3 确定距离函数、组合函数和邻居的数目
8.3 案例研究:分类新闻报导
8.3.1 什么是代码
8.3.2 应用MBR
8.3.3 结果
8.4 测量距离
8.4.1 什么是距离函数
8.4.2 每次每个字段只建立一个距离函数
8.4.3 其他数据类型的距离函数
8.4.4 当距离度量已经存在时
8.5.1 基本的方法:民主
8.5 组合函数:向邻居求答案
8.5.2 加权投票
8.6 协同过滤:可以做出推荐的最近邻方法
8.6.1 建立简档
8.6.2 比较简档
8.6.3 做出预测
8.7 小结
第9章 购物篮分析和关联规则
9.1 定义购物篮分析
9.1.1 购物篮数据的三个层次
9.1.2 订单特征
9.1.3 项流行性
9.1.4 跟踪市场干预
9.1.5 按用途聚类产品
9.2 关联规则
9.2.1 可操作的规则
9.2.2 平凡的规则
9.2.3 费解的规则
9.3 一个关联规则有多好
9.4 建立关联规则
9.4.1 选择恰当的项集
9.4.2 从所有这些数据中生成规则
9.4.3 克服实际局限
9.4.4 大数据的问题
9.5 扩展思想
9.5.1 使用关联规则比较店铺
9.5.2 无关规则
9.6 使用关联规则的顺序分析
9.7 小结
第10章 链接分析
10.1 图论基础
10.1.1 哥尼斯堡七桥问题
10.1.2 旅行推销员问题
10.1.3 有向图
10.1.4 检测图中的环
10.2 链接分析的一个熟悉的应用
10.2.1 Kleinberg算法
10.2.2 细节:查找网络中心和权威
10.2.3 实践中的网络中心和权威
10.3.1 为什么发现传真机是有用的
10.3.2 用数据画图
10.3 案例研究:谁在家中使用传真机
10.3.3 方法
10.3.4 一些结果
10.4 案例研究:分段移动电话客户
10.4.1 数据
10.4.2 不使用图论的分析
10.4.3 两位客户的对比
10.4.4 链接分析的力量
10.5 小结
第11章 自动聚类探测
11.1 搜索单纯岛状片段
11.1.1 星光与星的亮度
11.1.2 适应多维情况
11.2.1 K平均算法的三个步骤
11.2 K平均聚类
11.2.2 K的意义
11.3 相似性和距离
11.3.1 相似性度量与变量类型
11.3.2 相似性的常规度量
11.4 聚类过程的数据准备
11.4.1 利用比例缩放使变量相对一致
11.4.2 使用权重编码外部信息
11.5 聚类探测的其他途径
11.5.1 高斯混合模型
11.5.2 凝聚聚类
11.5.3 分裂聚类
11.5.4 自组织映像
11.6 评价簇
11.7 案例研究:聚类城镇
11.6.1 在簇内部
11.6.2 在簇之外
11.7.1 创造城镇特征
11.7.2 创建簇
11.7.3 利用主题簇调整区域边界
11.8 小结
第12章 市场营销中的风险函数和生存分析
12.1 客户保持
12.1.1 计算保持
12.1.2 保持曲线揭示的内容
12.1.3 从保持曲线找出平均保有期
12.1.4 把客户保持看做衰变
12.2 风险
12.2.1 基本思想
12.2.2 风险函数示例
12.2.3 审查
12.2.4 其他类型的审查
12.3 从风险到生存
12.3.1 保持
12.3.2 生存
12.4 比例风险
12.4.1 比例风险实例
12.4.2 分层:测量生存的初始结果
12.4.3 Cox比例风险
12.4.4 比例风险的局限性
12.5 生存分析实践
12.5.1 处理不同的流失类型
12.5.2 客户何时会回来
12.5.3 预测
12.5.4 风险随时间变化
12.6 小结
第13章 遗传算法
13.1 遗传算法如何工作
13.1.1 计算机上的遗传学
13.1.2 表示数据
13.2 案例研究:使用遗传算法进行资源优化
13.3 模式:遗传算法为什么起作用
13.4 遗传算法的更多应用
13.4.1 在神经网络方面的应用
13.4.2 案例研究:为响应建模完善一个解决方案
13.5 超越简单算法
13.6 小结
14.1 客户关系层次
第14章 数据挖掘贯穿客户生存周期
14.1.1 深度亲密
14.1.2 大众亲密
14.1.3 中间关系
14.1.4 间接关系
14.2 客户生存周期
14.2.1 客户生存周期:生存阶段
14.2.2 客户生存周期
14.2.3 基于订阅关系和基于事件关系的比较
14.3 围绕客户生存周期组织商业过程
14.3.1 客户获取
14.3.2 客户激活
14.3.3 关系管理
14.3.4 保持
14.3.5 赢回
14.4 小结
第15章 数据仓库、OLAP和数据挖掘
15.1 数据结构
15.1.1 交易数据——基础层
15.1.2 操作汇总数据
15.1.3 决策支持汇总数据
15.1.4 数据库模式
15.1.5 元数据
15.1.6 商业规则
15.2 数据仓库的大致结构
15.2.1 源系统
15.2.2 提取、转化和加载
15.2.3 中央储存库
15.2.4 元数据储存库
15.2.5 数据集市
15.2.6 操作反馈
15.2.7 最终用户和桌面工具
15.3 OLAP适用于何处
15.3.1 立方体中的内容
15.3.2 星形模式
15.3.3 OLAP和数据挖掘
15.4 数据挖掘在哪里切入数据仓库
15.4.1 大量数据
15.4.2 一致的、清洁的数据
15.4.3 假设测试和测量
15.4.4 可升级硬件及RDBMS支持
15.5 小结
16.1 以客户为中心的组织
第16章 构造数据挖掘环境
16.2 理想的数据挖掘环境
16.2.1 确定什么数据可用的能力
16.2.2 将数据转化为可操作信息的技巧
16.2.3 所有必需的工具
16.3 返回现实世界
16.3.1 建立以客户为中心的组织
16.3.2 创建单个客户视图
16.3.3 定义以客户为中心的度量标准
16.3.4 收集正确的数据
16.3.6 挖掘客户数据
16.4 数据挖掘组
16.3.5 从客户交互到学习机会
16.4.1 外包数据挖掘
16.4.2 内部数据挖掘
16.4.3 数据挖掘组成员需要具备的条件
16.5 数据挖掘基础设施
16.5.1 挖掘平台
16.5.2 评分平台
16.5.3 一个产品数据挖掘结构实例
16.6 数据挖掘软件
16.6.1 所应用的技术范围
16.6.2 可扩展性
16.6.3 评分支持
16.6.4 用户界面的多种层次
16.6.8 对新手和高级用户的培训、咨询和支持
16.6.7 文档及简单使用
16.6.6 处理各种数据类型的能力
16.6.5 可理解的输出
16.6.9 卖方可信度
16.7 小结
第17章 为挖掘准备数据
17.1 数据应该像什么
17.1.1 客户特征标识
17.1.2 列
17.1.3 模型在建模中的角色
17.1.4 变量度量
17.1.5 用于数据挖掘的数据
17.2 构建客户特征标识
17.2.2 识别客户
17.2.1 编写数据目录
17.2.3 第一次尝试
17.2.4 取得进展
17.2.5 实际的问题
17.3 探查变量
17.3.1 直方图分布
17.3.2 随时间变化
17.3.3 交叉表
17.4 衍生变量
17.4.1 提取来自单个数值的特征
17.4.2 在记录内合并数值
17.4.3 查找辅助信息
17.4.4 转轴正则时间序列
17.4.5 汇总交易记录
17.5 基于行为变量的例子
17.4.6 汇总跨越模型集的字段
17.5.1 购买频率
17.5.2 衰减使用
17.5.3 旋转者、交易商和便利用户:定义客户行为
17.6 数据的黑暗面
17.6.1 缺失值
17.6.2 脏数据
17.6.3 不一致数值
17.7 计算问题
17.7.1 源系统
17.7.2 提取工具
17.7.3 专用代码
17.7.4 数据挖掘工具
17.8 小结
18.1 开始
第18章 应用数据挖掘
18.1.1 从概念验证方案中能期待什么
18.1.2 识别概念验证方案
18.1.3 实现概念验证方案
18.2 选择数据挖掘技术
18.2.1 将商务目标转换为数据挖掘任务
18.2.2 决定数据的相关特性
18.2.3 考虑混合方法
18.3 公司如何开展数据挖掘
18.3.1 保持的对照实验
18.3.2 数据
18.3.3 一些发现
18.3.4 实践出真知
18.4 小结
封底
📜 SIMILAR VOLUMES
<p>《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》主要介绍数据仓库和数据挖掘技术的基本概念、相关技术和应用案例及方法。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》共分为9章,主要内容包括:数据仓库与数据挖掘的概念和体系结构、数据仓库开发模型、ETL技术、OLAP技术、商务智能系统、数据预处理技术、数据挖掘技术、数据仓库开发实例、报表设计等内容。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》各章节的案例均使用Microsoft SQL Server 2005进行操作实践讲解。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中
<p>《数据仓库与数据挖掘技术》内容简介:数据仓库与数据挖掘是计算机专业和其他一些与计算机技术关系密切专业必修的核心课程。《数据仓库与数据挖掘技术》系统地介绍了数据仓库和数据挖掘的基本概念、相关知识和基本方法,每种数据挖掘方法都有详尽的实例描述和具体实现步骤。《数据仓库与数据挖掘技术》结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;《数据仓库与数据挖掘技术》坚持理论与实际相结合,概念和具体方法相结合,使知识具体化,生动化;实例实现的过程建立在sql 2005数据挖掘软件的基础上,以帮助读者在学习后达到学以致用的目的。</p> <p>《数据仓库与数据挖掘技术》可以作为计算机类、信息
<p>如果你急盼在推销事业上出人头地,你必须要态度坚决,善于经营爱心;如果你想拥有优秀的业绩,你必须拥有一颗良好的心态,正确认识成败;如果你想顾客络绎不绝,你必须要积极主动的去和顾客交流,沟通才会让你把推销之路走得更远......《挖掘你的销售力量》教你怎样成为一个成功的推销大师!
<p>本书内容涵盖数据科学基础知识,介绍了数据科学的工作流程,包括数据采集、数据整理和探索、数据可视化和数据建模预测等技术,并通过文本、图像、语音等前沿应用,引入人工智能技术在数据科学领域应用的最新成果。全书设计收集了多个数据分析案例,采用 Python 及相关科学计算工具包数据分析实现的方法,帮助读者通过实际应用理解数据科学知识,掌握实践技能,运用统计学、人工智能等技术解决实际问题。</p> <p>本书通俗易懂、实例丰富、技术先进,并配备丰富的教学资源,可作为各类高等院校数据科学、大数据技术的入门教材,计算机基础教学较高层次课程的教材,也可以作为数据科学实践的技术参考书。</p>