𝔖 Scriptorium
✦   LIBER   ✦

📁

深入浅出大数据

✍ Scribed by 宋智军


Publisher
清华大学出版社
Year
2016
Tongue
Chinese
Leaves
383
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


本书坚持以大数据基础和应用为主导的编写原则,理论联系实际,并通过大量实例循序渐进地为读者介绍了进行大数据实践所涉及的各类知识。为了更好地帮助读者在短时间内掌握大数据基础理论知识和实践能力,全书的基础知识介绍清晰,理论联系实际,具有很强的操作性,并提供了大量通过测试可运行的完整实例,这些实例都给出了设计步骤、代码详解及程序运行结果,对于容易出现问题的地方,则以“注”的方式介绍常用的技巧和注意事项。另外本书的配套资料可从清华大学出版社网站(www.tup.com.cn)上下载。本书可作为计算机专业的本科生和研究生的大数据基础教材,也可作为大数据技术培训、Hadoop应用开发和运行维护人员的必备参考书。

✦ Table of Contents


封面
扉页
内容简介
版权页
丛书序
前言
目录
第1章 大数据概述
1.1 大数据发展历程
1.2 大数据的定义及特征
1.3 大数据与传统数据的区别
1.4 大数据的核心价值
1.5 大数据安全与隐私保护
第2章 大数据关键技术
2.1 大数据采集与预处理技术
2.2 大数据存储与管理技术
2.3 大数据分析与挖掘技术
2.4 大数据应用与展现技术
第3章 基于Hadoop的大数据生态系统
3.1 Hadoop概述
3.2 Hadoop家族成员
3.3 Hadoop生态系统
3.4 Hadoop集群架构
3.5 Hadoop运行环境
3.6 Hadoop集群的安装与配置
第4章 分布式文件系统HDFS
4.1 HDFS概述
4.2 HDFS基本组成
4.3 HDFS体系架构
4.4 HDFS核心功能
4.5 HDFS通信机制
4.6 HDFS安全机制
4.7 HDFS容错机制
4.8 HDFS快照机制
4.9 HDFS读写机制
4.10 HDFS常用操作
第5章 分布式计算框架MapReduce
5.1 MapReduce概述
5.2 MapReduce原理
5.3 MapReduce框架
5.4 MapReduce开发环境
5.5 MapReduce编程过程
5.6 MapReduce开发实例
第6章 资源管理框架YARN
6.1 YARN概述
6.2 YARN体系架构
6.3 YARN工作流程
6.4 YARN通信机制
6.5 YARN安全机制
6.6 YARN容错机制
6.7 YARN资源调度机制
6.8 可在YARN上运行的框架
6.9 YARN编程实例
第7章 分布式列存储数据库HBase
7.1 HBase概述
7.2 HBase特点
7.3 HBase体系架构
7.4 HBase安装配置
7.5 HBase数据模型
7.6 HBase关键技术
7.7 HBase交互接口
7.8 HBase快照机制
第8章 数据仓库Hive
8.1 Hive概述
8.2 Hive特点
8.3 Hive体系架构
8.4 Hive安装配置
8.5 Hive数据模型
8.6 Hive数据类型
8.7 Hive基本操作
8.8 Hive内置运算符
8.9 Hive内置函数
8.10 Hive实例
第9章 数据分析与挖掘Mahout
9.1 Mahout概述
9.2 Mahout安装配置
9.3 Mahout算法集
9.4 分类算法
9.5 聚类算法
9.6 模式挖掘算法
9.7 协同过滤算法
第10章 大数据应用
10.1 大数据应用现状及发展趋势
10.2 互联网大数据应用
10.3 金融行业大数据应用
10.4 电信行业大数据应用
10.5 医疗行业大数据应用
10.6 智慧交通大数据应用
10.7 大数据应用案例
正文结束
附表
参考文献


📜 SIMILAR VOLUMES


深入浅出数据分析
✍ Michael Milton 📂 Library 📅 2009 🏛 电子工业出版社 🌐 Chinese

<p>《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文以后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。</p> <p>本书构思跌宕起伏,行文妙趣横生,无论是职场老手,还是业界新人,无论是字斟句酌,还是信手翻阅,相信都能跟着文字在职场中走上几回,去体味数据分析领域的乐趣与挑战。</p>

深入浅出JavaScript
✍ Michael Morrison 📂 Library 📅 2010 🏛 东南大学出版社 🌐 Chinese

<p>你将从《深入浅出JavaScript(中文版)》学到什么?这么说你准备从写html和css的静态网页跃进到编写动态网络应用程序脚本了?这里就是起点。《深入浅出java script》带你游历令人兴奋的交互式网页创建过程。为了启发你的思考,《深入浅出JavaScript(中文版)》覆盖了所有的java script基本知识,从基本网络编程技巧,如变量、函数和循环语句,到高级一些的专题,如表单验证、dom操作、客户端对象、脚本程序调试——甚至是aiax!赶快做好准备……快速响应的网站离你只有几页纸那么远。</p> <p>为何《深入浅出JavaScript(中文版)》看上去如此不同?</p>

深入浅出 Rust
✍ 范长春 📂 Library 📅 2018 🏛 机械工业出版社 🌐 Chinese

内容简介 · · · · · · 本书详细描述了Rust语言的基本语法,穿插讲解一部分高级使用技巧,并以更容易理解的方式解释其背后的设计思想。全书总共分五个部分。 第一部分介绍Rust基本语法,因为对任何程序设计语言来说,语法都是基础,学习这部分是理解其他部分的前提。 第二部分介绍属于Rust独一无二的内存管理方式。它设计了一组全新的机制,既保证了安全性,又保持了强大的内存布局控制力,而且没有额外性能损失。这部分是本书的重点和核心所在,也是Rust语言的思想内核精髓之处。 第三部分介绍Rust的抽象表达能力。它支持多种编程范式,以及较为强大的抽象表达能力。 第

深入浅出 Rust
✍ 范长春 📂 Library 📅 2018 🏛 机械工业出版社 🌐 Chinese

内容简介 · · · · · · 本书详细描述了Rust语言的基本语法,穿插讲解一部分高级使用技巧,并以更容易理解的方式解释其背后的设计思想。全书总共分五个部分。 第一部分介绍Rust基本语法,因为对任何程序设计语言来说,语法都是基础,学习这部分是理解其他部分的前提。 第二部分介绍属于Rust独一无二的内存管理方式。它设计了一组全新的机制,既保证了安全性,又保持了强大的内存布局控制力,而且没有额外性能损失。这部分是本书的重点和核心所在,也是Rust语言的思想内核精髓之处。 第三部分介绍Rust的抽象表达能力。它支持多种编程范式,以及较为强大的抽象表达能力。 第

深入浅出 Networking
✍ [美] Al Anderson,[美] Ryan Benedetti 著;徐定翔 译 📂 Library 📅 2011 🏛 电子工业出版社 🌐 Chinese

《深入浅出Networking》内容简介:厌倦了让人昏昏欲睡的网络术语?想学网络管理却苦于无法入门?试试《深入浅出Networking》吧。这是本渐进式的学习指南,书中以趣味案例为背景讲解网络知识,规划了从初学者到专家的学习课程,目标是让读者知其然,更知其所以然。想寻找网络电缆的断路点?布线时遇到障碍?该用交换机还是路由器,用DHCP还是NAT,用端口映射还是静态IP地址?如何排查网络故障?《深入浅出Networking》会告诉你答案。