𝔖 Scriptorium
✦   LIBER   ✦

📁

Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案

✍ Scribed by Matt Casters, Roland Bouman, Jos van Dongen


Publisher
电子工业出版社
Year
2014
Tongue
Chinese
Leaves
488
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


《Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案》主要介绍如何使用开源ETL工具来完成数据整合工作。

《Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案》介绍的PDI(Kettle)是一种开源的 ETL 解决方案,书中介绍了如何使用PDI来实现数据的剖析、清洗、校验、抽取、转换、加载等各类常见的ETL类工作。

除了ODS/DW类比较大型的应用外,Kettle 实际还可以为中小企业提供灵活的数据抽取和数据处理的功能。Kettle除了支持各种关系型数据库、HBase、MongoDB这样的NoSQL数据源外,它还支持Excel、Access这类小型的数据源。并且通过插件扩展,Kettle 可以支持各类数据源。本书详细介绍了Kettle可以处理的数据源,而且详细介绍了如何使用Kettle抽取增量数据。

Kettle 的数据处理功能也很强大,除了选择、过滤、分组、连接、排序这些常用的功能外,Kettle 里的Java表达式、正则表达式、Java脚本、Java类等功能都非常灵活而强大,都非常适合于各种数据处理功能。本书也使用了一些篇幅介绍Kettle这些灵活的数据处理功能。

《Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案》后面章节介绍了如何在 Kettle 上开发插件,如何使用Kettle处理实时数据流,以及如何在Amazon AWS上运行Kettle 等一些高级主题。

除了介绍PDI(Kettle)工具的使用和功能,本书还结合Kimball博士的数据仓库和ETL子系统的理论,从实践的角度介绍数据仓库的模型设计、数据仓库的构建方法,以及如何使用 PDI实现Kimball博士提出的34种ETL子系统。

✦ Table of Contents


封面
封底
内容简介
用户体会
译者序
关于作者
致谢
介绍
目录
第一部分:开始
第1章 ETL入门
第2章 Kettle基本概念
第3章 安装和配置
第4章 ETL示例解决方案――Sakila
第二部分:ETL
第5章 ETL子系统
第6章 数据抽取
第7章 清洗和校验
第8章 处理维度表
第9章 加载事实表
第10章 处理OLAP数据
第三部分:管理和部署
第11章 ETL开发生命期
第12章 调度和监控
第13章 版本和移植
第14章 血统和审计
第四部分:性能和扩展性
第15章 性能调优
第16章 并行、集群和分区
第17章 云计算中的动态集群
第18章 实时数据整合
第五部分:高级主题
第19章 Data Vault管理
第20章 处理复杂数据格式
第21章 Web Services
第22章 Kettle集成
第23章 扩展Kettle
附录A:Kettle生态群
附录B:Kettle 企业版特性
附录C:内置的变量和属性参考


📜 SIMILAR VOLUMES


企业集成模式: 设计、构建及部署消息传递解决方案
✍ Gregor Hohpe; Bobby Woolf 📂 Library 📅 2006 🏛 中国电力出版社 🌐 Chinese

<p>这是一本有关使用消息传递进行企业集成的书。这本书并不只是介绍某种特别的技术或产品,而是为使用各种消息传递产品和技术的开发人员以及集成人员准备的。本书不会为企业应用集成建立商业案例,而是把重点放在如何实现应用的集成上。读者通过本书可以学会如何集成企业应用。. </p> <p>异步消息传递已证明是成功实现企业集成的最佳方案。但是,为了构建和部署消息传递解决方案,开发人员要面对大量的问题。本书提供了意义非凡的65种模式,并用真实的解决方案演示了消息传递的强大功能,可以帮助你为自己的企业设计出高效的消息传递解决方案。.. </p> <p>本书还是一本有关各种消息传递或中间件技术的指南。在