<p>企业管理人员进行营销资源配置、精准锁定营销目标的必读书,美国商学院MBA营销分析课程指定用书,以真实的商业场景和案例数据展现营销分析在商业实践中的巨大作用。在这本书中,来自美国弗吉尼亚大学达顿商学院的三位专家介绍了当今最有价值的营销分析方法与工具,并为如何成功运用这些工具提供了实务方法。书中的每一部分都包含了提供统计背景与案例研究的技术性说明。所有这些案例研究都附加有被支持者用于制定决策的真实数据。随着你实践性学习的开展,你将会对营销分析的重要性形成更深刻的理解,学会把量化分析法整合到你的管理领悟力中,掌握诸如回归分析与聚类分析等核心的统计工具,并发现如何在实验设计中避免常见的易犯错误。
Spark大数据分析与实战
✍ Scribed by 黑马程序员
- Publisher
- 清华大学出版社
- Year
- 2019
- Tongue
- Chinese
- Leaves
- 241
- Series
- 大数据技术与应用丛书
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
本书从初学者角度详细介绍了Spark应用程序体系架构的核心技术,全书共9章。第1章详细介绍开发Spark框架的Scala编程语言;第2~4、7~8章主要讲解Spark核心基础、SparkRDD弹性分布式数据集、Spark SQL处理结构化数据、Spark Streaming实时计算框架、Spark MLlib机器学习库,并包含了搭建Spark集群、Spark集群的操作方式、利用Spark解决大数据工作中遇到的基本问题。第5~6章主要讲解大数据环境中常见的辅助系统,HBase数据库以及Kafka流处理平台,包含辅助系统的搭建方式、使用方法以及相关底层实现的基本原理;第9章是一个综合项目,利用Spark框架开发流式计算系统。掌握Spark相关技术,能够很好地适应企业开发的技术需要,为离线、实时数据处理平台的开发奠定基础。
本书附有配套源代码、教学PPT、题库、教学视频、教学补充案例、教学设计等资源。为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。
本书可作为高等院校本、专科计算机相关专业,大数据课程的专用教材,是一本适合广大计算机编程爱好者的优秀读物。
✦ Table of Contents
封面
扉页
内容简介
版权页
序言
前言
目录
第1章 Scala语言基础
1.1 初识Scala
1.2 Scala的基础语法
1.3 Scala的数据结构
1.4 Scala面向对象的特性
1.5 Scala的模式匹配与样例类
1.6 本章小结
1.7 课后习题
第2章 Spark基础
2.1 初识Spark
2.2 搭建Spark开发环境
2.3 Spark运行架构与原理
2.4 体验第一个Spark程序
2.5 启动Spark-Shell
2.6 IDEA开发WordCount程序
2.7 本章小结
2.8 课后习题
第3章 Spark RDD弹性分布式数据集
3.1 RDD简介
3.2 RDD的创建方式
3.3 RDD的处理过程
3.4 RDD的分区
3.5 RDD的依赖关系
3.6 RDD机制
3.7 Spark的任务调度
3.8 本章小结
3.9 课后习题
第4章 Spark SQL结构化数据文件处理
4.1 Spark SQL的基础知识
4.2 DataFrame的基础知识
4.3 Dataset的基础知识
4.4 RDD转换为DataFrame
4.5 Spark SQL操作数据源
4.6 本章小结
4.7 课后习题
第5章 HBase分布式数据库
5.1 HBase的基础知识
5.2 HBase的集群部署
5.3 HBase的基本操作
5.4 深入学习HBase原理
5.5 HBase和Hive的整合
5.6 本章小结
5.7 课后习题
第6章 Kafka分布式发布订阅消息系统
6.1 Kafka的基础知识
6.2 Kafka工作原理
6.3 Kafka集群部署与测试
6.4 Kafka生产者和消费者实例
6.5 Kafka Streams
6.6 本章小结
6.7 课后习题
第7章 Spark Streaming实时计算框架
7.1 实时计算的基础知识
7.2 Spark Streaming的基础知识
7.3 Spark的DStream
7.4 Spark Streaming整合Kafka实战
7.5 本章小结
7.6 课后习题
第8章 Spark MLlib机器学习算法库
8.1 初识机器学习
8.2 Spark机器学习库MLlib的概述
8.3 数据类型
8.4 Spark MLlib基本统计
8.5 分类
8.6 案例——构建推荐系统
8.7 本章小结
8.8 课后习题
第9章 综合案例——Spark实时交易数据统计
9.1 系统概述
9.2 Redis数据库
9.3 模块开发——构建工程结构
9.4 模块开发——构建订单系统
9.5 模块开发——分析订单数据
9.6 模块开发——数据展示
9.7 本章小结
正文结束
📜 SIMILAR VOLUMES
本书详细阐述了与Hadoop 3大数据分析相关的基本解决方案,主要包括Hadoop简介、大数据分析概述、基于MapReduce的大数据处理、Python-Hadoop科学计算和大数据分析、R-Hadoop统计数据计算、Apache Spark批处理分析、Apache Spark实时数据分析、Apache Flink批处理分析、Apache Flink流式处 理、大数据可视化技术、云计算简介、使用亚马逊Web服务等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。
<p>大数据分析与机器学习技术已成为各行各业实现数字化变革的关键驱动力。本书以功能强大且较易上手的Python语言为编程环境,全面讲解了大数据分析与机器学习技术的商业应用实战。</p> <p>全书共16章,讲解了线性回归模型、逻辑回归模型、决策树模型、朴素贝叶斯模型、K近邻算法模型、随机森林模型、AdaBoost与GBDT模型、XGBoost与LightGBM模型、PCA(主成分分析)模型、聚类与分群模型(KMeans与DBSCAN算法)、协同过滤算法模型、Apriori关联分析模型、神经网络模型等十余种机器学习模型的原理和代码实现,每种模型都配有一到两个典型案例,涵盖金融、营销、医疗、社会
本书通过近100家平台和企业的近100个实战案例,由浅入深一步步诠释了大数据和营销的奥秘,从两条线帮助读者从入门到精通大数据营销,从新手成为大数据营销高手。 一条是横向案例线,通过大数据营销做得最好的十多个行业:服装、餐饮、房产、汽车、社交、影视、游戏、电商、医疗、通信、体育、旅游、生产等,对大数据营销和运营进行充分讲解。 一条是纵向技巧线,通过近100个成功案例讲解大数据营销技巧:模式、产品设计、用户体验、痛点痒点解决方案、运营、分享等,对大数据营销进行详细分析与说明。本书适合以上十多个热门行业,以及相关行业准备从事大数据营销的人员或者企业;从事大数据营销有一段时间却没有获得预期效果的人员或
<p>《大数据分析与数据挖掘》综合大数据分析与数据挖掘的理论、技术和实际案例,以丰富的产学合作实务案例,深入浅出地剖析从大数据中掏金的秘诀。全书内容涵盖大数据分析与数据挖掘的基本概念、数据准备、大数据分析的方法与实证及相关的进阶运用,并佐以R语言及例题实作,提升读者的数据挖掘实战能力,开拓对大数据分析的洞察视野。</p> <p>随着移动通信和行动装置普及、物联网和网络发展,以及云端技术的不断进步,现今数据产生、搜集和储存方式比以往更为方便。数据挖掘与大数据分析可以从海量数据中,找到值得参考的样型或规则,转换成有价值的信息、洞察或知识,创造更多新价值。</p> <p>本书主要介绍数据挖掘与大
<p>本书从浅显易懂的“大数据和机器学习”原理说明入手,讲述大数据和机器学习的基本概念,如分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用等。书中不仅加入了新近的大数据技术,还丰富了“机器学习”内容。 为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单机Windows系统上通过Virtual Box虚拟机安装多机Linux虚拟机,如何建立Hadoop集群,再建立Spark开发环境。书中介绍搭建的上机实践平台并不限制于单台实体计算机。对于有条件的公司和学校,参照书中介绍的搭