𝔖 Scriptorium
✦   LIBER   ✦

📁

大数据库

✍ Scribed by 刘鹏


Publisher
电子工业出版社
Year
2017
Tongue
Chinese
Leaves
293
Series
高级大数据人才培养丛书
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


本书详细介绍大数据环境下的常用的数据库和相关工具,包括HBase、Hive、Impala、Spark、Spark SQL、键值数据库和流式数据库等,给出了详细的工作机理和应用方法,并给出完整的实践案例和代码。

✦ Table of Contents


扉页
版权页
编写组
总序
前言
目录
第1章 大数据库概述
1.1 传统关系型数据库面临的问题
1.2 大数据库技术
1.2.1 列式数据库
1.2.2 内存数据库
1.2.3 键值数据库
1.2.4 流式数据库
1.3 大数据SQL
1.4 当前主流大数据SQL简介
1.4.1 Hive
1.4.2 Impala
1.4.3 Shark
1.4.4 Spark SQL
1.5 本章总结
习题
参考文献
第2章 分布式数据库HBase
2.1 HBase基础
2.1.1 体系架构
2.1.2 数据模型
2.2 HBase操作简介
2.2.1 HBase接口简介
2.2.2 HBase Shell实战
2.2.3 HBase API
2.3 HBase实战
2.3.1 实战HBase之综例
2.3.2 实战HBase之使用MapReduce构建索引
习题
参考文献
第3章 数据仓库工具Hive
3.1 Hive简介
3.1.1 工作原理
3.1.2 体系架构
3.1.3 计算模型
3.1.4 Hive部署模式
3.2 Hive的使用
3.2.1 Hive的数据类型
3.2.2 Hive接口汇总
3.3 实战Hive Shell
3.3.1 DDL操作
3.3.2 DML操作
3.3.3 SQL操作
3.4 实战Hive之复杂语句
3.5 实战Hive之综合示例
3.6 实战Hive API接口
3.6.1 UDF编程示例
3.6.2 UDAF编程示例
习题
参考文献
第4章 大数据查询系统Impala
4.1 Impala简介
4.1.1 Impala的起源
4.1.2 Impala的特点
4.1.3 Impala 前辈及竞争对手
4.2 Impala工作原理
4.2.1 Impala 设计目标
4.2.2 Impala 服务器组件
4.2.3 Impala 编程特点
4.2.4 Impala在Hadoop生态圈中的生存之道
4.3 Impala环境搭建
4.3.1 Impala 安装前的考虑
4.3.2 Impala 安装途径与安装示范
4.4 Impala操作实例
4.4.1 Impala 基本操作
4.4.2 Impala 数据库操作
习题
参考文献
第5章 内存数据库Spark
5.1 Spark简介
5.1.1 Spark的引入
5.1.2 Spark生态系统BDAS
5.1.3 Spark系统架构
5.1.4 Spark工作流程
5.1.5 Spark应用案例
5.2 Spark计算模型
5.2.1 Spark程序模型
5.2.2 弹性分布式数据集(RDD)
5.2.3 Spark算子
5.3 Spark工作机制
5.3.1 Spark运行机制
5.3.2 Spark调度机制
5.3.3 Spark I/O机制
5.3.4 Spark通信机制
5.3.5 Spark容错机制
5.3.6 Spark Shuffle机制
5.4 Scala快速入门
5.4.1 Scala解释器
5.4.2 变量
5.4.3 函数
5.4.4 编写Scala脚本
5.4.5 while 配合if实现循环
5.4.6 foreach和 for 来实现迭代
5.4.7 类型参数化数组
5.4.8 Lists
5.4.9 使用元组(Tuples)
5.4.10 Sets和Maps
5.4.11 函数编程风格
5.4.12 读取文件
5.5 Spark环境部署
5.5.1 安装与配置Spark
5.5.2 Intellij IDEA构建Spark开发环境
5.5.3 SBT构建Spark程序
5.5.4 编译Spark程序
5.5.5 远程调试Spark程序
5.5.6 生成Spark部署包
5.6 Spark 编程案例
5.6.1 WordCount
5.6.2 Top K
5.6.3 倒排索引
习题
参考文献
第6章 Spark SQL
6.1 Spark SQL简介
6.1.1 Spark SQL发展历程
6.1.2 Spark SQL 架构
6.2 Spark SQL编程基础
6.2.1 数据类型及表达式
6.2.2 Spark SQL查询引擎Catalyst
6.2.3 SQL DSL API
6.2.4 Spark SQL ThriftServer和CLI
6.2.5 Spark SQL常用操作
6.3 Spark SQL实战
6.3.1 Spark SQL开发环境搭建
6.3.2 Spark SQL使用入门
习题
参考文献
第7章 键值数据库
7.1 概述
7.1.1 键值存储
7.1.2 键值数据库
7.2 Redis
7.2.1 简介
7.2.2 Redis数据服务及集群技术
7.2.3 Redis安装
7.2.4 Redis数据操作
7.2.5 案例:网站访问历史记录查询
7.3 Memcached
7.3.1 简介
7.3.2 Memcached缓存技术
7.3.3 Memcached安装
7.3.4 Memcached数据操作
7.3.5 Memcached分布式技术
7.3.6 案例:论坛帖子信息缓存
7.4 典型应用及局限
7.4.1 典型应用
7.4.2 键值数据库局限
习题
参考文献
第8章 流式数据库
8.1 流式计算模型
8.1.1 流式计算概念
8.1.2 流式计算数据特点
8.1.3 流式计算典型应用
8.1.4 典型流式计算平台
8.2 流式计算关键技术
8.2.1 计算拓扑
8.2.2 消息传递
8.2.3 高可用性
8.2.4 语义保障
8.2.5 其他关键技术
8.3 Storm平台
8.3.1 Storm简介
8.3.2 Storm原理
8.3.3 Storm部署
8.3.4 案例:Maven环境下的Storm编程
8.4 Spark Streaming平台
8.4.1 Spark Streaming简介
8.4.2 Spark Streaming原理
8.4.3 案例:集群环境下的Spark Streaming编程
习题
参考文献
第9章 大数据应用托管平台Docker
9.1 Docker技术简介
9.1.1 Docker是什么
9.1.2 Docker的架构和流程
9.2 Docker的优势和局限
9.2.1 Docker的优势
9.2.2 Docker的局限性
9.3 基于Docker的大数据系统设计
9.3.1 分布式Docker网络环境的搭建
9.3.2 Docker集群管理系统:Kubernetes
习题
参考文献


📜 SIMILAR VOLUMES


数据库系统: 数据库与数据仓库导论
✍ 内纳德·尤基克 (Nenad Jukic); 苏珊·维布斯基 (Susan Vrbsky); 斯维特洛扎·奈斯特罗夫 (Svetlozar Ncstorov) 📂 Library 📅 2015 🏛 机械工业出版社 🌐 Chinese

书签已装载, 书签制作方法请找 [email protected] 完全免费 《数据库系统:数据库与数据仓库导论》内容全面,理论清晰。详细解析操作型数据库和分析型数据库的基本概念、设计方法和使用技巧,简要介绍数据挖掘、NoSQL数据库等高级主题,结合丰富的习题和案例帮助学生掌握基础知识。 面向实战,重视应用。针对当今快速变化的市场需求,培养学生设计和使用数据库的能力,重点是学会如何将理论知识成功地应用到信息系统、商业数据分析和决策支持等应用环境中,真正实现学以致用。 资源丰富,免费实用。访问dbtextbook.com获取免费资源:专门为本书开发的基于Web的数据建模套件E

数据库原理
✍ 严冬梅 📂 Library 📅 2011 🏛 清华大学出版社 🌐 Chinese

<p>由严冬梅主编的《数据库原理》以关系数据库系统为核心,全面介绍了数据库系统的基本原理。全书共10章,主要内容包括数据库系统基本概念、关系数据模式、关系数据库标准语言sql、关系数据库理论、查询优化、数据库保护、数据库应用系统设计、数据库编程、数据库产品及数据库技术新发展。本书中所涉及的例子均以学生学习过程为主线,每章后均附有习题,习题答案可从网站下载。为了配合教学和学生自学,本书配有制作精美的ppt课件。同时,本书还有配套教材《数据库应用与实践指导》对实验环节进行指导。</p> <p> 《数据库原理》可作为普通高等院校计算机及相关学科的数据库课程教材,也可作为数据库技术的自学教材和

数据仓库与数据挖掘
✍ 陈志泊 📂 Library 📅 2009 🏛 清华大学出版社 🌐 Chinese

<p>《数据仓库与数据挖掘》主要介绍数据仓库和数据挖掘技术的基本原理和应用方法,全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。《数据仓库与数据挖掘》既重视理论知识的讲解,又强调应用技能的培养。每章首先介绍算法的主要思想和理论基础,之后利用算法去解决实例中给出的任务,而且对于数据仓库的组建方法和多数章节中的数据挖掘算法,《数据仓库与数据挖掘》都使用Microsoft SQL Server 2005进行了操作实现。《数据仓库与数据挖掘》通过

漫画数据库
✍ [日]高桥麻奈; 崔建峰(译) 📂 Library 📅 2010 🏛 科学出版社 🌐 Chinese
现代数据库管理
✍ 霍弗 📂 Library 📅 2004 🌐 Chinese

书签已装载, 书签制作方法请找 [email protected] 完全免费 本书是一本数据库管理的教材,内容翔实,示例丰富,由浅入深。   本书从数据库管理环境、数据库分析、数据库设计、实现以及高级数据库五个方面全面介绍了数据库的知识。每章之后安排了大量的习题帮助读者梳理知识,掌握基本的概念、原理。   本书还包含一个贯穿始终的实例,让读者体验数据库开发的全过程。本书的网站(http://www.prenhall.com/hoffer)中还包含大量相关资源,有助于读者复习所学知识,拓展知识面。本书适合作为相关专业的本科生、研究生的教材,也适合作为从事数据库方面工作的人员和