统计推断、探索性数据分析(EDA)及数据科学工作流程 算法 垃圾邮件过滤、朴素贝叶斯和数据清理 逻辑回归 金融建模 推荐引擎和因果关系 数据可视化 社交网络与数据新闻 数据工程、MapReduce、Pregel和Hadoop
124-数据中台实战课
✍ Scribed by it-ebooks
- Publisher
- iBooker it-ebooks
- Tongue
- Chinese
- Series
- it-ebooks-extra
- Category
- Library
No coin nor oath required. For personal study only.
📜 SIMILAR VOLUMES
<p>“数据是重要资产”已成为大家的共识,众多公司都在争相分析、挖掘大数据背后的信息资源。本书在此背景下,对目前大数据及其相关技术的发展进行总结,理论联系实践,既不缺乏理论深度又具有实用价值。</p> <p>本书共12章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例,HDFS云文件系统实例。</p> <p>本书适合大数据技术初学者、大数据从业人员和研究人员,也可以作为高等院校相关专业师生的教学参考书。</p>
<p>《数据新闻实战》紧密围绕数字媒体环境下新闻工作者在数据新闻制作中的实际需求,基于案例全面介绍了数据新闻制作的流程。《数据新闻实战》理论和实践结合,内容包括数据新闻的概念和制作流程,公开数据的获取、申请和搜索方法,数据转换和存储方法,“脏数据”的成因及其表现形式,常见的数据清理和分析工具,基于OpenRefine环境清理“脏数据”的过程和方法,数据清理原则,数据合理性分析,缺失数据的预测和时间序列预测等。《数据新闻实战》同时阐明了数据可视化的概念,详细介绍了Tableau制作数据新闻的方法和技巧,最后介绍了其他常用的数据新闻制作工具。</p> <p>《数据新闻实战》通俗易懂、结构严谨、层
使用Python进行数据分析是十分便利且高效的,因此它被认为是最优秀的数据分析工具之一。本书从理论和实战两个角度对Python数据分析工具进行了介绍,并采用理论分析和Python实践相结合的形式,按照数据分析的基本步骤对数据分析的理论知识以及相应的Python库进行了详细的介绍,让读者在了解数据分析的基本理论知识的同时能够快速上手实现数据分析程序。 本书适用于对数据分析有浓厚兴趣但不知从何下手的初学者,在阅读数据分析的基础理论知识的同时可以通过Python实现简单的数据分析程序,从而快速对数据分析的理论和实现两个层次形成一定的认知。
对于入门和学习大数据技术的读者来说,大数据技术的生态圈和知识体系过于庞大,可能还没有开始学习就已经陷入众多的陌生名词和泛泛的概念中。本书的切入点明确而清晰,从Hadoop 生态系统的明星 Cloudera 入手,逐步引出各类大数据基础和核心应用框架。 本书分为18章,系统介绍Hadoop 生态系统大数据相关的知识,包括大数据概述、Cloudera Hadoop平台的安装部署、HDFS分布式文件系统、MapReduce计算框架、资源管理调度框架YARN 、Hive数据仓库、数据迁移工具Sqoop、分布式数据库HBase、ZooKeeper分布式协调服务、准实时分析系统Impala、日志采集工具F