本书是将大数据这一计算机前沿科学和基本应用有机结合的典范教材,全面介绍大数据和相关的基础知识,由浅入深地剖析大数据的分析处理方法和技术手段,突出介绍大数据最新的发展趋势和技术成果。本书的一大亮点是每章中都使用图表对大数据与传统数据处理方式进行对比。另外,本书注重启发式的学习策略,便于读者理解和掌握。全书每章均包括实际应用案例与关键词注释,方便读者查阅和自学,同时配备习题和参考答案。本书体系完整、内容丰富、注重应用、前瞻性强、适用性好,并有开放式的课程教学网站(http://www.cmu.edu.cn/computer)提供技术支持。本书既可以作为普通高校大数据技术的基础教材,也可以作为职业培
大数据: 技术与应用实践指南
✍ Scribed by 赵钢
- Publisher
- 电子工业出版社
- Year
- 2013
- Tongue
- Chinese
- Leaves
- 290
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
大数据是互联网、移动应用、社交网络和物联网等技术发展的必然趋势,大数据应用成为当前最为热门的信息技术应用领域。本书由浅入深,首先概述性地分析了大数据的发展背景、基本概念,从业务的角度分析了大数据应用的主要业务价值和业务需求,在此基础上介绍大数据的技术架构和关键技术,结合应用实践,详细阐述了传统信息系统与大数据平台的整合策略,大数据应用实践的流程和方法,并介绍了主要的大数据应用产品和解决方案。最后,对大数据面临的挑战和未来的趋势进行了展望。
本书既具有技术深度,又具有很强的可操作性,提供了一个系统性、架构性的大数据应用实践指南,纲要性地指导大数据应用实践,推动大数据技术在各个行业的广泛应用。
✦ Table of Contents
封面
内封
内 容 简 介
版权页
序
前 言
第1章大数据的概念和发展背景
1.1 大数据的发展背景
1.2 大数据的概念和特征
1.2.1 大数据的概念
1.2.2 大数据的特征
1.3 大数据的产生
1.3.1 数据产生由企业内部向企业外部扩展
1.3.2 数据产生从Web 1.0向Web 2.0、从互联网向移动互联网扩展
1.3.3 数据产生从计算机/互联网(IT)向物联网(IOT)扩展
1.4 数据的量级
1.4.1 数据大小的量级
1.4.2 大数据的量级
1.5 大量不同的数据类型
1.5.1 按照数据结构分类
1.5.2 按照产生主体分类
1.5.3 按照数据作用方式分类
1.6 大数据的速度
1.7 大数据的潜在价值
1.8 大数据的挑战
1.8.1 业务视角不同带来的挑战
1.8.2 技术架构不同带来的挑战
1.8.3 管理策略不同带来的挑战
第2章大数据应用的业务需求
2.1 大数据应用的业务流程
2.1.1 产生数据
2.1.2 聚集数据
2.1.3 分析数据
2.1.4 利用数据
2.2 大数据应用的业务价值
2.2.1 发现大数据的潜在价值
2.2.2 实现大数据整合创新的价值
2.2.3 新领域再利用的价值
2.3 各行业大数据应用的个性需求
2.3.1 互联网与电子商务行业
2.3.2 零售业
2.3.3 金融业
2.3.4 政府
2.3.5 医疗业
2.3.6 能源业
2.3.7 制造业
2.3.8 电信运营业
2.3.9 交通物流业
2.4 企业级大数据应用的共性需求
2.4.1 客户分析
2.4.2 绩效分析
2.4.3 欺诈和风险评估
2.5 以银行客户分析为例,分析一个大数据的应用场景
第3章大数据应用的总体架构和关键技术
3.1 总体架构
3.1.1 业务目标
3.1.2 架构设计原则
3.1.3 总体架构参考模型
3.1.4 总体架构的特点
3.2 大数据存储和处理技术
3.2.1 Hadoop:分布式存储和计算平台
3.2.2 Hadoop之HDFS:分布式文件系统
3.2.3 Hadoop之MapReduce:分布式计算框架
3.2.4 Hadoop之NoSQL:分布式数据库
3.2.5 Hadoop之外的大数据计算技术
3.3 大数据查询和分析技术:SQL on Hadoop
3.3.1 Hive:基本的Hadoop查询和分析
3.3.2 Hive 2.0:Hive的优化和升级
3.3.3 实时互动的SQL:Im pa la和d rill
3.3.4 基于PostgreSQL的SQL on Hadoop
3.4 大数据高级分析和可视化技术
3.4.1 传统数据仓库与联机分析处理技术
3.4.2 大数据对传统分析的挑战
3.4.3 大数据挖掘与高级分析
3.4.4 大数据挖掘与高级分析库:Mahout
3.4.5 非结构化复杂数据分析
3.4.6 实时预测分析
3.4.7 开源可视化工具:R语言
3.4.8 可视化技术
3.5 以银行客户分析为例的大数据的技术环境部署
3.5.1 银行客户大数据应用体系架构
3.5.2 技术环境安装与配置
第4章大数据与企业级应用的整合策略
4.1 大数据传输、整合和流程管理平台
4.1.1 数据传输
4.1.2 数据整合
4.1.3 流程管理
4.2 大数据与存储架构的整合
4.2.1 传统存储架构比较
4.2.2 大数据平台的存储架构的选择
4.2.3 集群存储的发展
4.2.4 基于HDFS的集群存储
4.2.5 固态硬盘(SSD)对内存计算的支持
4.3 大数据与网络架构的发展
4.4 大数据与虚拟化技术的整合
4.5 在云计算平台上的大数据云
4.6 大数据与信息安全
4.7 以银行客户分析为例,分析一个大数据的平台整合
第5章大数据应用的实践方法与案例
5.1 实践方法论
5.1.1 业务需求定义
5.1.2 数据应用现状分析与标杆比较
5.1.3 大数据应用架构规划和设计
5.1.4 大数据技术切入与实施
5.1.5 大数据试用和评估
5.1.6 大数据应用推广
5.2 应用案例
5.2.1 亚马逊
5.2.2 雅虎
5.2.3 淘宝网
5.2.4 Facebook
5.3 以银行客户分析为例的实施案例分析
5.3.1 银行基于大数据的客户分析的业务需求
5.3.2 银行基于大数据的客户分析的现状与标杆比较
5.3.3 银行基于大数据的客户分析的应用架构规划与设计
5.3.4 银行基于大数据的数据分析的实施、试点和推广
第6章大数据应用的主流解决方案
6.1 产业链
6.1.1 国际上的大数据生态环境
6.1.2 国内产业链主要力量
6.2 主流厂商解决方案
6.2.1 Cloundera
6.2.2 Hortonworks
6.2.3 MapR
6.2.4 IBM
6.2.5 Oracle
6.2.6 EMC
6.2.7 Intel
6.2.8 SAP
6.2.9 Teradata
第7章大数据应用的未来挑战和趋势
7.1 隐私保护
7.1.1 法律保护
7.1.2 技术保护
7.1.3 理念革新
7.2 技术标准
7.2.1 ISO标准化进展
7.2.2 评价基准和基准测试
7.2.3 标准套件
7.3 大数据治理
7.3.1 数据治理框架
7.3.2 数据质量管理
7.3.3 大数据的组织、角色和责任
7.4 适应商业社会的未来趋势
7.4.1 从产品推销向数据营销的转变
7.4.2 从流程驱动到分析驱动的转变
7.4.3 从私有资源到公共服务的转变
📜 SIMILAR VOLUMES
<p>本书围绕 Hadoop 生态圈相关系统介绍大数据处理架构。全书共 11章,其中,第 12 章主要带领大家认识 Hadoop以及学会搭建 Hadoop 集群;第 3~5 章讲解分布式文件系统(HDFS)分布式计算框架MapReduce 以及分布式协调服务;第 6 章讲解 Hadoop 2.0 新特性,包含 YARN 和高可用特性;第7~10 章主要讲解 Hadoop 生态圈的相关辅助系统,包括 Hive,Flume,Azkaban 和 Sqop;第 11 章是一个综合项目一网站流量日志数据分析系统,目的是教会大家如何利用 Hadoop 生态圈技术构建大数据系统架构并进行开发,同时加深对 H
本书强调了大数据的宝贵价值,介绍了常用的数据分析技术与方法,论述了大数据分析的思维特征,紧扣大数据的特点演示了可视化分析与可视化挖掘的方法,详细讨论了数据清洗与元数据管理,对大数据的风险予以充分揭示,同时提出了大数据风险管理的对策,对大数据治理作了简介。 本书具有很强的实用性、可操作性和指导性,对于企业管理人员、企业数据分析人员、业务分析人员和市场营销人员,政府监管机构如证监会、银监局、保监会的监管人员,审计师、注册会计师,纪检监察和司法机关执纪执法人员有参考价值,同时可供高等院校相关专业的师生参阅。
<p>本书内容分为三个部分,第一部分为互联网大数据的概述;第二部分为互联网大数据的获取与存储,包括了静态或动态WEB页面内容获取技术、结构化或非结构化数据的存储、常见的开源系统等;第二部分为处理与分析技术,包括了文本数据预处理、数据内容的语义分析技术、文本内容分类技术、聚类分析、大数据中的隐私保护、大数据可视化等内容;第三部分为综合应用。</p>
本书详细介绍了大数据技术的基础理论和最新主流前沿技术,全书共分为10章,分别介绍我们目前面临的数字化信息社会的大数据时代、大数据技术基本概念、云计算网络、大数据采集与预处理、大数据存储、计算模式与处理系统、查询显示与交互、大数据分析与数据挖掘、隐私与安全、大数据技术发展前景,同时包括行业案例研究(银行、保险、证券、金融行业),典型系统与相关大数据分析实例。本书主要作为高等院校计算机专业、信息管理专业、经济类专业、管理类专业相关本科生和研究生专业基础课的教材,也可以作为干部培训、职业技术教育以及职业培训机构的云计算与大数据分析技术的专业训练教材。对从事云计算与大数据分析工作的财政金融、政府管理、
本书是从大数据和云计算相结合的视角,系统地介绍大数据云架构技术与实践的专业图书,全书分为五篇19章,分别介绍大数据云计算的概论、关键技术、体系架构、云架构实践与编程和安全。本书层次清晰,结构合理,主要内容包括大数据云计算关系、大数据应用价值、分布式计算、NoSQL数据库、机器学习、虚拟化、Docker容器、Web 2.0、绿色数据中心、基础设计即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)、容器即服务(CaaS)、大数据云架构搭建、Spark大数据编程、大数据和云计算面临的安全威胁、保障大数据安全、应用大数据保障安全等。本书可作为高年级本科生和研究生教材,也可作为广大科学技