<p>本书围绕 Hadoop 生态圈相关系统介绍大数据处理架构。全书共 11章,其中,第 12 章主要带领大家认识 Hadoop以及学会搭建 Hadoop 集群;第 3~5 章讲解分布式文件系统(HDFS)分布式计算框架MapReduce 以及分布式协调服务;第 6 章讲解 Hadoop 2.0 新特性,包含 YARN 和高可用特性;第7~10 章主要讲解 Hadoop 生态圈的相关辅助系统,包括 Hive,Flume,Azkaban 和 Sqop;第 11 章是一个综合项目一网站流量日志数据分析系统,目的是教会大家如何利用 Hadoop 生态圈技术构建大数据系统架构并进行开发,同时加深对 H
大数据技术与应用
✍ Scribed by 娄岩
- Publisher
- 清华大学出版社
- Year
- 2016
- Tongue
- Chinese
- Leaves
- 165
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
本书是将大数据这一计算机前沿科学和基本应用有机结合的典范教材,全面介绍大数据和相关的基础知识,由浅入深地剖析大数据的分析处理方法和技术手段,突出介绍大数据最新的发展趋势和技术成果。本书的一大亮点是每章中都使用图表对大数据与传统数据处理方式进行对比。另外,本书注重启发式的学习策略,便于读者理解和掌握。全书每章均包括实际应用案例与关键词注释,方便读者查阅和自学,同时配备习题和参考答案。本书体系完整、内容丰富、注重应用、前瞻性强、适用性好,并有开放式的课程教学网站(http://www.cmu.edu.cn/computer)提供技术支持。本书既可以作为普通高校大数据技术的基础教材,也可以作为职业培训教育及相关技术人员的参考用书。
✦ Table of Contents
封面
扉页
内容简介
版权页
本书编委会
前言
目录
第1章 大数据概论
1.1 大数据技术简介
1.2 大数据的技术架构
1.3 大数据的整体技术
1.4 大数据分析的4种典型工具简介
1.5 大数据未来发展趋势
本章小结
习题1
第2章 大数据采集及预处理
2.1 数据采集简介
2.2 大数据的预处理
2.3 大数据采集及预处理的主要工具
本章小结
习题2
第3章 大数据分析概论
3.1 大数据分析简介
3.2 大数据分析的主要技术
3.3 大数据分析处理系统简介
3.4 大数据分析的应用
本章小结
习题3
第4章 大数据可视化
4.1 大数据可视化简介
4.2 大数据可视化工具Tableau
本章小结
习题4
第5章 Hadoop概论
5.1 Hadoop简介
5.2 Hadoop的架构与组成
5.3 Hadoop应用分析
本章小结
习题5
第6章 HDFS和Common概论
6.1 HDFS简介
6.2 Common简介
本章小结
习题6
第7章 MapReduce概论
7.1 MapReduce简介
7.2 Map和Reduce任务
7.3 MapReduce架构和工作流程
本章小结
习题7
第8章 NoSQL概论
8.1 NoSQL简介
8.2 NoSQL技术基础
8.3 NoSQL的类型
8.4 典型的NoSQL工具
本章小结
习题8
第9章 Spark概论
9.1 Spark平台
9.2 Spark与Hadoop
9.3 Spark处理框架及其生态系统
9.4 Spark的应用
本章小结
习题9
第10章 云计算与大数据
10.1 云计算简介
10.2 云计算核心技术
10.3 云计算应用案例
本章小结
习题10
第11章 典型大数据解决方案
11.1 Intel大数据
11.2 百度大数据
11.3 腾讯大数据
本章小结
习题11
正文结束
附录A 习题答案
参考文献
图书资源支持
📜 SIMILAR VOLUMES
本书强调了大数据的宝贵价值,介绍了常用的数据分析技术与方法,论述了大数据分析的思维特征,紧扣大数据的特点演示了可视化分析与可视化挖掘的方法,详细讨论了数据清洗与元数据管理,对大数据的风险予以充分揭示,同时提出了大数据风险管理的对策,对大数据治理作了简介。 本书具有很强的实用性、可操作性和指导性,对于企业管理人员、企业数据分析人员、业务分析人员和市场营销人员,政府监管机构如证监会、银监局、保监会的监管人员,审计师、注册会计师,纪检监察和司法机关执纪执法人员有参考价值,同时可供高等院校相关专业的师生参阅。
大数据是互联网、移动应用、社交网络和物联网等技术发展的必然趋势,大数据应用成为当前最为热门的信息技术应用领域。本书由浅入深,首先概述性地分析了大数据的发展背景、基本概念,从业务的角度分析了大数据应用的主要业务价值和业务需求,在此基础上介绍大数据的技术架构和关键技术,结合应用实践,详细阐述了传统信息系统与大数据平台的整合策略,大数据应用实践的流程和方法,并介绍了主要的大数据应用产品和解决方案。最后,对大数据面临的挑战和未来的趋势进行了展望。 本书既具有技术深度,又具有很强的可操作性,提供了一个系统性、架构性的大数据应用实践指南,纲要性地指导大数据应用实践,推动大数据技术在各个行业的广泛应用。
<p>本书内容分为三个部分,第一部分为互联网大数据的概述;第二部分为互联网大数据的获取与存储,包括了静态或动态WEB页面内容获取技术、结构化或非结构化数据的存储、常见的开源系统等;第二部分为处理与分析技术,包括了文本数据预处理、数据内容的语义分析技术、文本内容分类技术、聚类分析、大数据中的隐私保护、大数据可视化等内容;第三部分为综合应用。</p>
本书详细介绍了大数据技术的基础理论和最新主流前沿技术,全书共分为10章,分别介绍我们目前面临的数字化信息社会的大数据时代、大数据技术基本概念、云计算网络、大数据采集与预处理、大数据存储、计算模式与处理系统、查询显示与交互、大数据分析与数据挖掘、隐私与安全、大数据技术发展前景,同时包括行业案例研究(银行、保险、证券、金融行业),典型系统与相关大数据分析实例。本书主要作为高等院校计算机专业、信息管理专业、经济类专业、管理类专业相关本科生和研究生专业基础课的教材,也可以作为干部培训、职业技术教育以及职业培训机构的云计算与大数据分析技术的专业训练教材。对从事云计算与大数据分析工作的财政金融、政府管理、
内容新颖先进;内容涉及最新的云计算与雾计算技术,大数据的新技术平台、新应用案例和生物信息计算示例等; 知识系统全面:从传统的经典分布式计算原理开始,系统地、深入剖析新兴的云计算、雾计算和大数据的技术原理; 技术深入易学:通过大量的编程案例和应用开发实践让读者更容易学习和深刻理解相关技术原理、技术开发与应用方法;