𝔖 Scriptorium
✦   LIBER   ✦

📁

数据新闻实战

✍ Scribed by 刘英华


Publisher
电子工业出版社
Year
2016
Tongue
Chinese
Leaves
274
Series
CDA数据分析师系列丛书
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


《数据新闻实战》紧密围绕数字媒体环境下新闻工作者在数据新闻制作中的实际需求,基于案例全面介绍了数据新闻制作的流程。《数据新闻实战》理论和实践结合,内容包括数据新闻的概念和制作流程,公开数据的获取、申请和搜索方法,数据转换和存储方法,“脏数据”的成因及其表现形式,常见的数据清理和分析工具,基于OpenRefine环境清理“脏数据”的过程和方法,数据清理原则,数据合理性分析,缺失数据的预测和时间序列预测等。《数据新闻实战》同时阐明了数据可视化的概念,详细介绍了Tableau制作数据新闻的方法和技巧,最后介绍了其他常用的数据新闻制作工具。

《数据新闻实战》通俗易懂、结构严谨、层次清晰、案例丰富,特别适合网络编辑、新媒体记者、大中专院校相关专业师生阅读,有一定工作经验的数据新闻工作者也可以从《数据新闻实战》中学习到大量高级实用的功能和技巧。

✦ Table of Contents


扉页
版权页
前言
目录
第1章 数据新闻概述
1.1 数据新闻的概念
1.2 制作数据新闻
1.2.1 人才需求
1.2.2 技术需要
1.2.3 制作流程
1.3 数据新闻奖(DJA)获奖作品
第2章 获取数据
2.1 政府、国际组织与第三方机构的公开数据
2.2 政府信息公开数据的申请
2.3 众包搜集数据
2.4 搜索引擎的使用
2.4.1 搜索指令
2.4.2 百度搜索工具
2.4.3 百度高级搜索页面
2.5 数据存储
2.5.1 PDF格式转换为Excel格式
2.5.2 在线转换工具Zamzar
2.5.3 浏览器插件
2.5.4 结构化信息表格化
2.5.5 批量下载文件
2.6 综合案例
2.6.1 使用联合国数据库
2.6.2 获取北京市2014年常住人口数量
第3章 清理和分析数据
3.1 “脏数据”(Dirty Data)
3.1.1 “脏数据”的成因
3.1.2 “脏数据”的表现形式
3.2 数据清理/分析工具
3.3 清理“脏数据”
3.3.1 安装OpenRefine环境
3.3.2 创建项目(导入数据)
3.3.3 主界面
3.3.4 归类(Facet)
3.3.5 文本过滤器(Text filter)
3.3.6 编辑单元格(Edit cells)
3.3.7 编辑列(Edit column)
3.3.8 变换(Transpose)
3.3.9 排序(Sort)
3.3.10 视图(View)
3.3.11 导出(Export)
3.3.12 函数
3.3.13 正则表达式
3.4 使用Excel简单分析数据
3.4.1 常用函数
3.4.2 筛选
3.4.3 数据透视表(PivotTable)
3.4.4 在透视表里做筛选
3.5 数据清理原则
3.6 综合案例
3.6.1 查找重复记录
3.6.2 使用OpenRefine清理数据
第4章 数据质量分析
4.1 数据合理性
4.1.1 内部合理性
4.1.2 外部合理性
4.2 游程检验
4.3 抽样分析
4.4 缺失数据的预测
4.5 时间序列预测
4.5.1 移动平均
4.5.2 指数平滑
4.5.3 回归
第5章 数据分析及可视化工具应用
5.1 数据可视化
5.2 数据可视化工具
5.3  Tableau下载和安装
5.4 创建第一个可视化作品
5.4.1 首次数据连接
5.4.2 首次创建多种图表
5.4.3 首次创建仪表板
5.4.4 首次输出
5.5 连接数据
5.5.1 在图表中查看数据
5.5.2 简单数据连接
5.5.3 连接多个数据源
5.5.4 连接一个数据源的多个表
5.5.5 提取数据
5.5.6 数据类型
5.6 数据视图
5.6.1 工作表和工作簿
5.6.2 数据视图界面
5.6.3 文本表、压力图和突出显示表
5.6.4 条形图
5.6.5 线图
5.6.6 地图
5.6.7 饼图
5.6.8 树地图
5.6.9 填充气泡图
5.6.10 甘特图
5.6.11 散点图
5.6.12 双组合图和面积图
5.6.13 盒须图
5.6.14 标靶图
5.7 高级分析
5.7.1 函数
5.7.2 聚合
5.7.3 注释
5.7.4 计算
5.7.5 简单预测
5.7.6 合计
5.7.7 参数
5.7.8 分层
5.7.9 分组
5.7.10 “页面”功能区
5.7.11 数据桶和直方图
5.7.12 背景图像
5.8 仪表板
5.8.1 创建仪表板
5.8.2 布局容器
5.8.3 编辑仪表板
5.8.4 仪表板和工作表
5.8.5 操作
5.9 故事
5.10 作品发布
5.10.1 工作簿和工作表
5.10.2 发布
5.10.3 打印
5.11 Tableau作品
5.11.1 Is Your Country Good at Reducing CO2 Emissions
5.11.2 Cabs in NYC
5.11.3 Analysis of Twitter Hashtags Following the Paris Attacks
第6章 其他数据新闻制作工具
6.1 图表绘制工具库ECharts
6.1.1 获取ECharts
6.1.2 绘制一个简单的图表
6.1.3 编辑图表
6.1.4 图表中的地图
6.2 标签云
6.2.1 标签云制作工具Tagul
6.2.2 标签云制作工具Tagxedo
6.3 关系图制作工具PeoplePlotr
6.4 语义万维网服务Open Calais
6.5 HTML5网站制作模板


📜 SIMILAR VOLUMES


数据科学实战
✍ Rachel Schutt, Cathy O’Neil 📂 Library 📅 2015 🏛 人民邮电出版社 🌐 Chinese

统计推断、探索性数据分析(EDA)及数据科学工作流程 算法 垃圾邮件过滤、朴素贝叶斯和数据清理 逻辑回归 金融建模 推荐引擎和因果关系 数据可视化 社交网络与数据新闻 数据工程、MapReduce、Pregel和Hadoop

实战大数据
✍ 鲍两; 李倩 📂 Library 📅 2014 🏛 清华大学出版社 🌐 Chinese

<p>“数据是重要资产”已成为大家的共识,众多公司都在争相分析、挖掘大数据背后的信息资源。本书在此背景下,对目前大数据及其相关技术的发展进行总结,理论联系实践,既不缺乏理论深度又具有实用价值。</p> <p>本书共12章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例,HDFS云文件系统实例。</p> <p>本书适合大数据技术初学者、大数据从业人员和研究人员,也可以作为高等院校相关专业师生的教学参考书。</p>

Python数据分析实战
✍ 吕云翔; 李伊琳; 王肇一; 张雅素 📂 Library 📅 2019 🏛 清华大学出版社 🌐 Chinese

使用Python进行数据分析是十分便利且高效的,因此它被认为是最优秀的数据分析工具之一。本书从理论和实战两个角度对Python数据分析工具进行了介绍,并采用理论分析和Python实践相结合的形式,按照数据分析的基本步骤对数据分析的理论知识以及相应的Python库进行了详细的介绍,让读者在了解数据分析的基本理论知识的同时能够快速上手实现数据分析程序。 本书适用于对数据分析有浓厚兴趣但不知从何下手的初学者,在阅读数据分析的基础理论知识的同时可以通过Python实现简单的数据分析程序,从而快速对数据分析的理论和实现两个层次形成一定的认知。

游戏数据分析实战
✍ 黎湘艳; 叶洋 📂 Library 📅 2018 🏛 电子工业出版社 🌐 Chinese

《游戏数据分析实战》主要针对游戏策划、游戏运营、游戏数据分析、产品数据分析挖掘、数据平台开发维护人员及对数据分析感兴趣的读者,介绍怎样利用数据分析游戏生命周期中各阶段遇到的问题。 《游戏数据分析实战》主要分为三部分:第一部分主要介绍游戏数据分析相关指标体系,通过这套体系,可以初步监控游戏整体运营情况;第二部分主要介绍游戏正式发行前期的市场调研、渠道用户质量分析、竞品分析及投资收益预测,对游戏品质进行定位,评估正式上线后的效果;第三部分主要对游戏正式发行后的用户流失、活跃用户分类、付费习惯、版本迭代效果、区服合并等主要问题进行深入探讨,实现游戏的精益化运营。 《游戏数据分析实战》的特色是以详

HAWQ数据仓库与数据挖掘实战
✍ 王雪迎 📂 Library 📅 2018 🏛 清华大学出版社 🌐 Chinese

<p>Apache HAWQ是一个SQL-on-Hadoop产品,它非常适合用于Hadoop平台上快速构建数据仓库系统。HAWQ具有大规模并行处理、完善的SQL兼容性、支持存储过程和事务、出色的性能表现等特性,还可与开源数据挖掘库MADlib轻松整合,从而使用SQL就能进行数据挖掘与机器学习。</p> <p>《HAWQ数据仓库与数据挖掘实战》内容分技术解析、实战演练与数据挖掘三个部分共27章。技术解析部分说明HAWQ的基础架构与功能特性,包括安装、连接、对象与资源管理、查询优化、备份恢复、高可用性等。实战演练部分用一个完整的示例,说明如何使用HAWQ取代传统数据仓库,包括ETL处理、自动调度