<p>本书围绕大数据采集,对采集技术的相关基础、技术原理、Python实现技术、大数据挖掘与应用方法进行了系统介绍。书中全面完整地覆盖了各种类型的网络爬虫及相关的信息处理挖掘技术,并提供了27个与爬虫相关技术和应用相关的Python程序。本书可以作为高等院校大数据、计算机、信息以及经管、金融等人文社科相关专业研究生和高年级本科生的教材,也可以作为大数据、计算机、信息以及经管、金融等人文社科领域研究人员和专业技术人员的参考书。</p>
Hadoop+Spark大数据技术(微课版)
✍ Scribed by 刘彬斌主编,李柏章、周磊、李永富编著
- Publisher
- 清华大学出版社
- Year
- 2018
- Tongue
- Chinese
- Leaves
- 359
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
全书内容分为大数据系统基础、Hadoop技术、Spark技术和项目实战4部分。其中,Linux是学习大数据技术的基础,先从Linux入手,打下坚实的基础,之后才能更好地学习Hadoop和Spark。4部分内容分别介绍如下。 大数据系统基础篇通过大数据概述、Linux系统安装、Linux系统基础命令、Shell编程和MySQL数据操作,为以后编程奠定坚实的基础。 Hadoop技术篇以Hadoop生态圈为中心,详细介绍Hadoop高可用集群搭建、HDFS技术、MapReduce技术、Hive技术,为读者学习大数据开发技术提供便利,并以实用的方式简单介绍HBase、Sqoop、Flume工具的使用,使读者在精通一门技术的前提下,能扩展了解相关知识,真正成为一专多能的专业型人才。 Spark技术篇从Spark概述、Scala语言、环境搭建、RDD核心技术、Spark SQL和机器学习等多方面讲解Spark大数据的开发,从基础的Scala语言开始学习,并以Hadoop环境为基础搭建Spark大数据集群,从最基础、最常用、最容易理解的思路出发,帮助读者逐步掌握Spark大数据技术。 项目实战篇从真实项目“电力能源大数据分析”中抽取一部分业务作为实战解读,通过简洁的流程讲解,使读者了解大数据项目开发的整个过程。
✦ Table of Contents
封面
扉页
内容简介
版权页
前言
目录
第1篇 大数据系统基础
第1章 大数据概述
第2章 系统的安装与使用
第3章 任务命令
第4章 数据库操作
第2篇 Hadoop技术
第5章 Hadoop开发环境
第6章 HDFS技术
第7章 Map Reduce技术
第8章 Hive数据仓库
第9章 HBase分布式数据库
第10章 Sqoop工具
第11章 Flume日志收集
第3篇 Spark技术
第12章 Spark概述
第13章 Scala语言
第14章 Spark高可用环境
第15章 RDD技术
第16章 Spark SQL
第17章 Spark Streaming
第18章 Spark机器学习
第4篇 项目实战
第19章 基于电力能源的大数据实战
正文结束
图书资源支持
📜 SIMILAR VOLUMES
“多媒体技术与应用”教材共六章,除第一章基本认识及第六章综合外,主要包括“音频获取与处理”、“图像获取与处理”、“动画设计与制作”、“视频获取与处理”四大模块内容,每个模块通过“基础理论——基础实验——进阶实验——扩展实验”的层层推进,带领学生理解多种媒体信息的数字化过程及原理.
<p>本书围绕 Hadoop 生态圈相关系统介绍大数据处理架构。全书共 11章,其中,第 12 章主要带领大家认识 Hadoop以及学会搭建 Hadoop 集群;第 3~5 章讲解分布式文件系统(HDFS)分布式计算框架MapReduce 以及分布式协调服务;第 6 章讲解 Hadoop 2.0 新特性,包含 YARN 和高可用特性;第7~10 章主要讲解 Hadoop 生态圈的相关辅助系统,包括 Hive,Flume,Azkaban 和 Sqop;第 11 章是一个综合项目一网站流量日志数据分析系统,目的是教会大家如何利用 Hadoop 生态圈技术构建大数据系统架构并进行开发,同时加深对 H
<p>本书在主要介绍数据的逻辑结构、数据的存储结构、数据的运算等基本知识的基础上,从抽象数据类型的角度,讨论各种基本类型的数据结构及相关应用。</p> <p>全书共分 5 篇:第 1篇(第 1章)为绪论篇,着重介绍数据结构的相关概念和算法的基础知识;第 2 篇(第 2~5 章)为线性结构篇,着重讨论线性结构的概念和基本运算的算法实现,介绍了一般的线性结构和特殊的线性结构在不同存储结构之下的基本操作和应用:第 3 篇(第 6 章)为树形结构篇,着重介绍基本的树形结构一一二叉树在不同存储结构之下如何实现基本操作和应用;第 4 篇(第 7章)为图形结构篇,介绍图形结构在不同存储结构之下的基本操作和