数据仓库: (原书第4版)
✍ Scribed by 荫蒙
- Publisher
- 机械工业出版社
- Year
- 2006
- Tongue
- Chinese
- Leaves
- 331
- Series
- 计算机科学丛书
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
书签已装载,
书签制作方法请找 [email protected]
完全免费
本书系统讲述数据仓库的基本概念、基本原理以及建立数据仓库的方法和过程。主要内容包括:决策支持系统的发展、数据仓库环境结构、数据仓库设计、数据仓库粒度划分、数据仓库技术、分布式数据仓库、EIS系统和数据仓库的关系、外部和非结构化数据与数据仓库的关系、数据装裁问题、数据仓库与Web、ERP与数据仓库以及数据仓库设计的复查要目。
本书是数据仓库之父撰写的关于数据仓库的最权威著作,既可作为相关专业的研究生教材,也是数据仓库的研究、开发和管理人员的必备指南。
✦ Table of Contents
封面
书名
版权
前言
目录
第1章 决策支持系统的发展
1.1 演化
1.1.1 直接存取存储设备的出现
1.1.2 个人计算机/第四代编程语言技术
1.1.3 进入抽取程序
1.1.4 蜘蛛网
1.2 自然演化式体系结构的问题
1.2.1 数据缺乏可信性
1.2.2 生4产率问题
1.2.3 从数据到信息
1.2.4 方法的变迁
1.2.5 体系结构化环境
1.2.6 体系结构化环境中的数据集成
1.2.7 用户是谁
1.3 开发生命周期
1.4 硬件利用模式
1.5 为重建工程创造条件
1.6 控数据仓库环境
1.7 小结
第2章 数据仓库环境
2.1 数据仓库的结构
2.2 面向主题
2.3 第1天到第n天的现象
2.4 粒度
2.4.1 粒度带来的好处
2.4.2 粒度的一个例子
2.4.3 双重粒度
2.5 探查与数据挖掘
2.6 活样本数据库
2.7 分区设计方法
2.8 数据仓库中的数据组织
2.9 审计与数据仓库
2.10 数据的同构/异构
2.11 数据仓库中的数据清理
2.12 报表与体系结构化环境
2.13 各种环境中的操作型窗口
2.15 小结
2.14 数据仓库中的错误数据
第3章 设计数据仓库
3.1 从操作型数据开始
3.2 数据/过程模型与体系结构化环境
3.3 数据仓库与数据模型
3.3.1 数据仓库的数据模型
3.3.2 中间层数据模型
3.3.3 物理数据模型
3.4 数据模型与迭代式开发
3.5 规范化/反向规范化
3.6 元数据
3.7 数据周期——时间间隔
3.8 转换和集成的复杂性
3.9 数据仓库记录的触发
3.9.1 事件
3.9.2 快照的构成
3.9.3 一些例子
3.10 概要记录
3.11 管理大量数据
3.13 从数据仓库环境到操作型环境
3.12 创建多个概要记录
3.14 数据仓库数据的直接操作型访问
3.15 数据仓库数据的间接访问
3.15.1 航空公司的佣金计算系统
3.15.2 零售个性化系统
3.15.3 信用审核
3.16 数据仓库数据的间接使用
3.17 星形连接
3.18 支持操作型数据存储
3.19 需求和Zachman框架
3.20 小结
第4章 数据仓库中的粒度
4.1 粗略估算
4.2 规划过程的输入
4.3 溢出存储器中的数据
4.4 确定粒度级别
4.5 一些反馈循环技巧
4.6 确定粒度级别的几个例子
4.6.1 银行环境中的粒度级别
4.6.2 制造业环境中的粒度级别
4.6.3 保险业环境中的粒度级别
4.7 填充数据集市
4.8 小结
第5章 数据仓库和技术
5.1 管理大量数据
5.2 管理多种介质
5.3 索引和监控数据
5.6 数据的并行存储和管理
5.5 程序员/设计者对数据存放位置的控制
5.4 多种技术的接口
5.7 语言接口
5.8 数据的有效装载
5.9 有效利用索引
5.10 数据压缩
5.11 复合主键
5.12 变长数据
5.16 其他的技术特征
5.15 快速恢复
5.14 只涉及索引的处理
5.13 加锁管理
5.17 DBMS类型和数据仓库
5.18 改变DBMS技术
5.19 多维DBMS和数据仓库
5.20 在多种存储介质上构建数据仓库
5.21 数据仓库环境中元数据的角色
5.22 上下文和内容
5.22.1 上下文信息的三种类型
5.22.2 捕获和管理上下文信息
5.22.3 回顾上下文信息管理历史
5.23 刷新数据仓库
5.24 测试问题
5.25 小结
第6章 分布式数据仓库
6.1 分布式数据仓库的类型
6.1.1 局部数据仓库和全局数据仓库
6.1.2 技术分布式数据仓库
6.1.3 独立开发的分布式数据仓库
6.2 开发项目的本质特征
6.3 分布式数据仓库的开发
6.3.1 在分布的地理位置间协调开发
6.3.2 企业数据的分布式模型
6.3.3 分布式数据仓库中的元数据
6.4 在多种层次上构建数据仓库
6.5 多个小组建立当前细节级
6.5.1 不同层的不同需求
6.5.2 其他类型的细节数据
6.5.3 元数据
6.7 小结
6.6 公共细节数据采用多种平台
第7章 主管信息系统和数据仓库
7.1 EIS概述
7.2 一个简单例子
7.3 向下钻取分析
7.4 支持向下钻取处理
7.5 作为EIS基础的数据仓库
7.6 到哪里取数据
7.7 事件映射
7.8 细节数据和EIS
7.9 在EIS中只保存汇总数据
7.10 小结
第8章 外部数据与数据仓库
8.1 数据仓库中的外部数据
8.2 元数据和外部数据
8.3 存储外部数据
8.4 外部数据的不同部件
8.5 建模与外部数据
8.6 辅助报告
8.9 小结
8.7 外部数据存档
8.8 内部数据与外部数据的比较
第9章 迁移到体系结构化环境
9.1 一种迁移方案
9.2 反馈循环
9.3 策略方面的考虑
9.4 方法和迁移
9.5 数据驱动的开发方法
9.5.2 系统开发生命周期
9.5.1 概念
9.6 小结
9.5.3 智者观点
第10章 数据仓库和Web
10.1 支持电子商务环境
10.2 将数据从Web移动到数据仓库
10.3 将数据从数据仓库移动到Web
10.4 对Web的支持
10.5 小结
第11章 非结构化数据和数据仓库
11.1.1 文本——公共联接
11.1 两个领域的集成
11.1.2 基本错误匹配
11.1.3 环境间文本匹配
11.1.4 概率匹配
11.1.5 匹配所有信息
11.2 主题匹配
11.2.1 产业特征主题
11.2.2 自然事件主题
11.2.4 通过抽象和元数据关联
11.2.3 通过主题和主题词关联
11.3 两层数据仓库
11.3.1 非结构化数据仓库分类
11.3.2 非结构化数据仓库中的文档
11.3.3 非结构化数据可视化
11.4 自组织图(SOM)
11.4.1 非结构化数据仓库
11.4.2 数据量和非结构化数据仓库
11.5 适用于两个环境
11.6 小结
第12章 大型数据仓库
12.1 快速增长的原因
12.2 庞大数据量的影响
12.2.1 基本数据管理活动
12.2.2 存储费用
12.2.3 实际存储费用
12.2.4 大型数据量中的数据使用模式
12.2.5 一个简单计算
12.2.7 数据分类涉及的问题
12.2.6 两类数据
12.3.1 近线存储
12.3 数据在不同介质的存储
12.3.2 访问速度和磁盘存储
12.3.3 存档存储
12.3.4 透明的意义
12.4 环境间数据转移
12.4.1 CMSM方法
12.4.2 数据仓库使用监控器
12.4.3 不同存储介质下数据仓库的扩展
12.7 最大容量
12.5 数据仓库转换
12.6 总费用
12.8 小结
第13章 关系模型和多维模型数据库设计基础
13.1 关系模型
13.2 多维模型
13.3 雪花结构
13.4 两种模型的区别
13.4.2 重建关系型数据
13.4.1 区别的起源
13.4.3 数据的直接访问和间接访问
13.4.4 支持将来未知的需求
13.4.5 支持适度变化的需求
13.5 独立数据集市
13.6 建立独立数据集市
13.7 小结
14.1.2 关系型的基础
14.1.1 数据仓库和数据模型
14.1 最终用户的需求和数据仓库
第14章 数据仓库高级话题
14.1.3 数据仓库和统计处理
14.2 数据仓库内的资源竞争
14.2.1 探查型数据仓库
14.2.2 数据挖掘型数据仓库
14.2.3 冻结探查型数据仓库
14.2.4 外部数据和探查型数据仓库
14.3 同一个处理器处理数据集市和数据仓库
14.4 数据的生命周期
14.5 测试和数据仓库
14.6 追踪数据仓库中的数据流
14.6.1 数据仓库中的数据速率
14.6.2 “推”和“拉”数据
14.7 数据仓库和基于网络的电子商务环境
14.7.1 两种环境之间的界面
14.7.2 粒度管理器
14.7.4 ODS,概要记录以及性能
14.7.3 概要记录
14.8 财务数据仓库
14.9 记录系统
14.10 结构体系的概要历史——演化为公司信息工厂
14.10.1 CIF的进化
14.10.2 障碍
14.11 CIF的未来
14.11.1 分析
14.11.2 ERP/SAP
14.11.4 数据量
14.11.3 非结构化数据
14.12 小结
第15章 数据仓库的成本论证和投资回报
15.1 应对竞争
15.2 宏观上的成本论证
15.3 微观上的成本论证
15.4 来自遗留环境的信息
15.4.4 建立数据仓库
15.4.3 成本比较
15.4.2 用数据仓库收集信息
15.4.1 新信息的成本
15.4.5 完整的情况图
15.4.6 得到数据的障碍
15.5 数据的时间价值
15.6 集成的信息
15.6.1 历史数据的价值
15.6.2 历史数据和客户关系模型
15.7 小结
16.1 互补的结构
第16章 数据仓库和ODS
16.1.1 ODS中的升级
16.1.2 历史数据与ODS
16.1.3 概要记录
16.2 不同种类的ODS
16.3 数据库设计——一种混合的方式
16.4 按比例画图
16.6 对ODS处理日进行分片
16.7 多个ODS
16.5 ODS中的事务集成
16.8 ODS和网络环境
16.9 ODS的一个例子
16.10 小结
第17章 企业信息依从准则和数据仓库
17.1 两个基本行为
17.2 财务依从准则
17.2.1 “是什么”
17.2.2 “为什么”
17.3 审计公司的交流信息
17.4 小结
18.1 农民
18.2 探险者
18.3 矿工
第18章 最终用户社区
18.4 旅行者
18.5 整个社区
18.6 不同的数据类型
18.7 成本论证和ROI分析
18.8 小结
19.1 何时进行设计复查
第19章 数据仓库设计的复查要目
19.2 谁负责设计复查
19.3 有哪些议事日程
19.4 结果
19.5 复查管理
19.6 典型的数据仓库设计复查
19.7 小结
术语表
参考文献
📜 SIMILAR VOLUMES
书签已装载, 书签制作方法请找 [email protected] 完全免费 数据通信、计算机网络与开放系统,ISBN:9787111122128,作者:(英)Fred Halsall著;吴时霖等译
<p>【编辑推荐】</p> <p>数据库领域的殿堂级作品</p> <p>夯实数据库理论基础,增强数据库技术内功的必备之选</p> <p>对深入理解数据库,深入研究数据库,深入操作数据库都具有极强的指导作用!</p> <p>【内容简介】</p> <p>本书是数据库系统方面的经典教材之一,其内容由浅入深,既包含数据库系统基本概念,又反映数据库技术新进展。它被国际上许多著名大学所采用,包括斯坦福大学、耶鲁大学、得克萨斯大学、康奈尔大学、伊利诺伊大学等。我国也有多所大学采用本书作为本科生和研究生数据库课程的教材和主要教学参考书,收到了良好的效果。</p> <p>第6版保持了前5版的总体风格
书签已装载, 书签制作方法请找 [email protected] 完全免费 【编辑推荐】 数据库领域的殿堂级作品 夯实数据库理论基础,增强数据库技术内功的必备之选 对深入理解数据库,深入研究数据库,深入操作数据库都具有极强的指导作用! 【内容简介】 本书是数据库系统方面的经典教材之一,其内容由浅入深,既包含数据库系统基本概念,又反映数据库技术新进展。它被国际上许多著名大学所采用,包括斯坦福大学、耶鲁大学、得克萨斯大学、康奈尔大学、伊利诺伊大学等。我国也有多所大学采用本书作为本科生和研究生数据库课程的教材和主要教学参考书,收到了良好的效果。 第6版保持了前5版的总体风格,同