𝔖 Scriptorium
✦   LIBER   ✦

📁

大数据技术入门

✍ Scribed by 杨正洪


Publisher
清华大学出版社
Year
2016
Tongue
Chinese
Leaves
305
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


从2015年开始,国内大数据市场继续保持高速的发展态势,作者在与地方政府、证券金融公司的项目合作中发现,他们对大数据技术很感兴趣,并希望从大数据技术、大数据采集、管理、分析以及可视化等方面得到指导和应用帮助。因此编写了这本大数据技术的快速入门书。 本书共12章,以Hadoop和Spark框架为线索,比较全面地介绍了Hadoop技术、Spark技术、大数据存储、大数据访问、大数据采集、大数据管理、大数据分析等内容。最后还给出两个案例:环保大数据和公安大数据,供读者参考。 本书适合大数据技术初学者,政府、金融机构的大数据应用决策和技术人员,IT经理,CTO,CIO等快速学习大数据技术。本书也可以作为高等院校和培训学校相关专业的培训教材。

✦ Table of Contents


封面
扉页
内容简介
版权页
前言
目录
第1章 大数据时代
1.1 什么是大数据
1.2 大数据的四大特征
1.3 大数据的商用化
1.4 大数据分析
1.5 大数据与云计算的关系
1.6 大数据的国家战略
1.7 企业如何迎接大数据
1.8 大数据产业链分析
1.9 大数据交易
1.10 大数据之我见
第2章 大数据软件框架
2.1 Hadoop框架
2.2 Spark(内存计算框架)
2.3 实时流处理框架
2.4 框架的选择
第3章 安装与配置大数据软件
3.1 Hadoop发行版
3.2 安装 Hadoop前的准备工作
3.3 安装Ambari和HDP
3.4 初识Hadoop
3.5 Hadoop的特性
第4章 大数据存储:文件系统
4.1 HDFS shell命令
4.2 HDFS配置文件
4.3 HDFS API编程
4.4 HDFS API总结
4.5 HDFS文件格式
第5章 大数据存储:数据库
5.1 NoSQL
5.2 HBase管理
5.3 HBase编程
5.4 其他NoSQL数据库
第6章 大数据访问:SQL引擎层
6.1 Phoenix
6.2 Hive
6.3 Pig
6.4 ElasticSearch(全文搜索引擎)
第7章 大数据采集和导入
7.1 Flume
7.2 Kafka
7.3 Sqoop
7.4 Storm
7.5 Splunk
第8章 大数据管理平台
8.1 大数据建设总体架构
8.2 大数据管理平台的必要性
8.3 大数据管理平台的功能
8.4 数据管理平台(DMP)
8.5 EasyDoop案例分析
第9章  Spark技术
9.1 Spark框架
9.2 Spark Shell
9.3 Spark编程
9.4 RDD
9.5 Spark SQL
9.6 Spark Streaming
9.7 GraphX图计算框架
第10章 大数据分析
10.1 数据科学
10.2 预测分析
10.3 机器学习
10.4 Spark MLib
10.5 深入了解算法
10.6 Mahout简介
第11章 案例分析:环保大数据
11.1 环保大数据管理平台
11.2 环保大数据应用平台
11.3 环保大数据分析系统
第12章 案例分析:公安大数据
12.1 总体架构设计
12.2 建设内容
12.3 建设步骤
正文结束
附录1 数据量的单位级别
附录2 Linux Shell常见命令
附录3 Ganglia(分布式监控系统)
附录4 auth-ssh脚本
附录5 作者简介


📜 SIMILAR VOLUMES


大数据技术基础
✍ 中科普开 📂 Library 📅 2016 🏛 清华大学出版社 🌐 Chinese

本书的知识架构是在培训了多届学员的基础上总结整理得来的,已经经过了实践的考验,证实了其科学性;本书当中的案例都为企业实际开发的案例,通过学习这些大量的实际案例,帮助学生在进入企业后可以很快融入大数据工作岗位。本书包括大数据概论、初识Hadoop、认识HDFS、HDFS的运行机制、访问HDFS、Hadoop I/O 详解、认识MapReduce编程模型、MapReduce应用编程开发、MapReduce的工作机制与YARN平台、MapReduce高级开发、MapReduce实例共11章内容。本书既可作为高等院校学习大数据技术的教材,亦可作为广大大数据技术学习者的入门用书。