𝔖 Scriptorium
✦   LIBER   ✦

📁

大数据实时计算与应用

✍ Scribed by 吴斌


Publisher
清华大学出版社
Year
2007
Tongue
Chinese
Leaves
191
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


本书定位于大数据专业核心技术——实时计算,重点讨论大数据应用场景中的数据特点和应用需求的实时流计算技术。本书通过对分布式实时计算系统的分析,将学习部分按功能性质划分成四个模块,分别为Kafka数据流处理模块、Strom实时计算模块、HBase数据存储模块和Zookeeper分布式协调模块。对此四个工作模块进行教学化处理,形成HBase基础操作、Zookeeper集群管理、配置Storm集群等核心课程体系,并配以实例使学习者便于理解,易于上手,掌握实时计算Storm相关的基础知识和实际业务系统的开发能力。本书主要针对具有软件编程基础(特别是数据技术)的学生和专业工程师,特别是数据科学、数据分析专业的高年级本科学生以及从事与数据相关的高级技术人员的读者人群。

✦ Table of Contents


封面
扉页
内容简介
版权页
前言
目录
第1章 分布式实时计算系统
1.1 分布式的概念
1.2 分布式通信
1.3 分布式实时计算系统架构
1.4 系统架构
本章小结
习题
第2章 初识Kafka
2.1 什么是Kafka
2.2 Topics和logs
2.3 分布式———consumers和producers
本章小结
习题
第3章 Kafka环境搭建
3.1 服务器搭建
3.2 开发环境搭建
本章小结
习题
第4章 Kafka消息传送
4.1 消息传输的事务定义
4.2 性能优化
4.3 生产者和消费者
4.4 主从同步
4.5 客户端API
4.6 消息和日志
本章小结
习题
第5章 Zookeeper开发
5.1 Zookeeper的来源
5.2 Zookeeper基础
5.3 Zookeeper的API
5.4 状态变化处理
5.5 故障处理
5.6 Zookeeper集群管理
本章小结
习题
第6章 初识HBase
6.1 什么是HBase
6.2 HBase部署
本章小结
习题
第7章 HBase基础操作
7.1 CRUD操作
7.2 批处理操作
7.3 行锁
7.4 扫描
7.5 其他操作
本章小结
习题
第8章 HBase高阶特性
8.1 过滤器
8.2 计数器
8.3 协处理器
本章小结
习题
第9章 管理HBase
9.1 HBase数据描述
9.2 表管理API
本章小结
习题
第10章 初识Storm
10.1 什么是Storm
10.2 构建topology
10.3 Storm并发机制
10.4 数据流分组的理解
10.5 消息的可靠处理
本章小结
习题
第11章 配置Storm集群
11.1 Storm集群框架介绍
11.2 在Linux上安装Storm
11.3 将topology提交到集群上
本章小结
习题
第12章 Trident和Trident GML
12.1 Tridenttopology
12.2 Trident接口
12.3 Trident状态
12.4 Trident-ML:基于storm的实时在线机器学习库
本章小结
习题
第13章 DRPC模式
13.1 DRPC概述
13.2 DRPC自动化组件
13.3 本地模式DRPC
13.4 远程模式DRPC
13.5 一个更复杂的例子
本章小结
习题
第14章 Storm实战
14.1 网站页面浏览量计算
14.2 网站用户访问量计算
本章小结
习题
正文结束
参考文献


📜 SIMILAR VOLUMES


云计算与大数据技术理论及应用
✍ 林伟伟、彭绍亮 📂 Library 📅 2019 🏛 清华大学出版社 🌐 Chinese

内容新颖先进;内容涉及最新的云计算与雾计算技术,大数据的新技术平台、新应用案例和生物信息计算示例等; 知识系统全面:从传统的经典分布式计算原理开始,系统地、深入剖析新兴的云计算、雾计算和大数据的技术原理; 技术深入易学:通过大量的编程案例和应用开发实践让读者更容易学习和深刻理解相关技术原理、技术开发与应用方法;

Storm:大数据流式计算及应用实践
✍ 丁维龙,赵卓峰,韩燕波 📂 Library 📅 2015 🏛 电子工业出版社 🌐 Chinese

Storm作为实时的、分布式以及具备高容错的流式计算系统,对比适于海量数据批处理的hadoop,不仅简化了数据流上相关处理的并行编程复杂度,也提供了数据处理实时性、可靠性和集群节点动态伸缩的特性。本书通过各自章节的详细阐述和应用,全面介绍了Storm的溯源发展、核心概念和集群配置、可靠性保障关键技术、常用的并行流模型编程范式,关键数据结构和源码解析等。本书的一大特色是,书中所有实例,均来自笔者所在团队的实际应用,是一个在智能交通背景下的城市道路车辆实时监控系统。

实时大数据分析: 基于Storm、Spark技术的实时应用
✍ [美]Sumit Gupta, Shilpi Saxena 著 张广骏 译 📂 Library 📅 2018 🏛 清华大学出版社 🌐 Chinese

<p>本书详细阐述了实时大数据分析的实现过程,主要包括大数据技术前景及分析平台;熟悉Storm平台;用Storm处理数据;Trident介绍和Storm性能优化;熟悉Kinesis;熟悉Spark;RDD编程;Spark的SQL查询引擎;Spark Streaming分析流数据以及Lambda架构等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。</p>

大数据分析与应用
✍ 赵守香; 唐胡鑫; 熊海涛 📂 Library 📅 2015 🏛 BEIJING BOOK CO. INC. 🌐 Chinese

本书共分七章,主要内容包括:大数据与数据分析、大数据存储、大数据分析工具、大数据与信息安全、基于二部图网络的电子商务推荐算法研究、基于位置的社交网络好友推荐算法研究、基于稀有类分类的信用卡欺诈识别研究。

云计算与大数据技术
✍ 吕云翔; 钟巧灵; 张璐; 王佳玮 📂 Library 📅 2018 🏛 清华大学出版社 🌐 Chinese

本书在阐述云计算和大数据关系的基础上,介绍了云计算和大数据的基本概念、技术及应用。全书内容如下: 第1~4章讲述云计算的概念和原理,包括云计算的概论、基础、虚拟化、应用; 第5~8章讲述大数据概述及基础,包括大数据概念和发展背景、大数据系统架构概述、分布式通信与协同、大数据存储; 第9~13章讲述大数据处理,包括分布式处理、Hadoop MapReduce解析、Spark解析、流计算、集群资源管理与调度; 第14章讲述综合实践(在OpenStack平台上搭建Hadoop并进行数据分析)。 本书结合实际应用及实践过程来讲解相关概念、原理和技术,实用性较强。适合作为本科院校计算机、云计算、大数据及

大数据: 技术与应用实践指南
✍ 赵钢 📂 Library 📅 2013 🏛 电子工业出版社 🌐 Chinese

大数据是互联网、移动应用、社交网络和物联网等技术发展的必然趋势,大数据应用成为当前最为热门的信息技术应用领域。本书由浅入深,首先概述性地分析了大数据的发展背景、基本概念,从业务的角度分析了大数据应用的主要业务价值和业务需求,在此基础上介绍大数据的技术架构和关键技术,结合应用实践,详细阐述了传统信息系统与大数据平台的整合策略,大数据应用实践的流程和方法,并介绍了主要的大数据应用产品和解决方案。最后,对大数据面临的挑战和未来的趋势进行了展望。 本书既具有技术深度,又具有很强的可操作性,提供了一个系统性、架构性的大数据应用实践指南,纲要性地指导大数据应用实践,推动大数据技术在各个行业的广泛应用。