使用Python进行数据分析是十分便利且高效的,因此它被认为是最优秀的数据分析工具之一。本书从理论和实战两个角度对Python数据分析工具进行了介绍,并采用理论分析和Python实践相结合的形式,按照数据分析的基本步骤对数据分析的理论知识以及相应的Python库进行了详细的介绍,让读者在了解数据分析的基本理论知识的同时能够快速上手实现数据分析程序。 本书适用于对数据分析有浓厚兴趣但不知从何下手的初学者,在阅读数据分析的基础理论知识的同时可以通过Python实现简单的数据分析程序,从而快速对数据分析的理论和实现两个层次形成一定的认知。
Python数据抓取技术与实战
✍ Scribed by 潘庆和; 赵星驰
- Publisher
- 电子工业出版社
- Year
- 2016
- Tongue
- Chinese
- Leaves
- 255
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
如何在大数据时代获得实时的数据信息,分析挖掘、提取出有价值的信息,并以直观清晰的图形表示出关键的数量关系和概念,是一个值得研究的问题。本书通过数据抓取篇(如何获得数据信息)、数据分析篇(分析挖掘,提取出有价值的信息)、数据可视化篇(以直观清晰的图形表示出关键的数量关系和概念)详细描述数据抓取、分析、展示的整个流程,每一篇自成一体,可以单独学习掌握。
✦ Table of Contents
扉页
版权
前言
目录
第1章 Python基础
1.1 Python安装
1.2 安装pip
1.3 如何查看帮助
1.4 第一个实例
1.5 文件操作
1.6 循环
1.7 异常
1.8 元组
1.9 列表
1.10 字典
1.11 集合
1.12 随机数
1.13 enumerate的使用
1.14 第二个实例
第2章 字符串解析
2.1 常用函数
2.2 正则表达式
2.3 BeautifulSoup
2.4 json结构
第3章 单机数据抓取
3.1 单机顺序抓取
3.2 requests
3.3 并发和并行抓取
第4章 分布式数据抓取
4.1 RPC的使用
4.2 Celery系统
第5章 全能的Selenium
5.1 Selenium单机抓取
5.2 Selenium分布式抓取
5.3 Linux无图形界面使用Selenium
第6章 神秘的Tor
6.1 抓取时IP被封锁的问题
6.2 Tor的安装与使用
6.3 Tor的多线程使用
6.4 Tor与Selenium结合
第7章 抓取常见问题
7.1 Flash
7.2 桌面程序
7.3 U盘
7.4 二级三级页面
7.5 图片的处理
7.6 App数据抓取
第8章 监控框架
8.1 框架说明
8.2 监控系统实例
第9章 拥抱大数据
9.1 Hadoop生态圈
9.2 Cloudera环境搭建
反侵权盗版声明
📜 SIMILAR VOLUMES
大数据是互联网、移动应用、社交网络和物联网等技术发展的必然趋势,大数据应用成为当前最为热门的信息技术应用领域。本书由浅入深,首先概述性地分析了大数据的发展背景、基本概念,从业务的角度分析了大数据应用的主要业务价值和业务需求,在此基础上介绍大数据的技术架构和关键技术,结合应用实践,详细阐述了传统信息系统与大数据平台的整合策略,大数据应用实践的流程和方法,并介绍了主要的大数据应用产品和解决方案。最后,对大数据面临的挑战和未来的趋势进行了展望。 本书既具有技术深度,又具有很强的可操作性,提供了一个系统性、架构性的大数据应用实践指南,纲要性地指导大数据应用实践,推动大数据技术在各个行业的广泛应用。
<p>《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》主要介绍数据仓库和数据挖掘技术的基本概念、相关技术和应用案例及方法。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》共分为9章,主要内容包括:数据仓库与数据挖掘的概念和体系结构、数据仓库开发模型、ETL技术、OLAP技术、商务智能系统、数据预处理技术、数据挖掘技术、数据仓库开发实例、报表设计等内容。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》各章节的案例均使用Microsoft SQL Server 2005进行操作实践讲解。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中
<p>《数据仓库与数据挖掘技术》内容简介:数据仓库与数据挖掘是计算机专业和其他一些与计算机技术关系密切专业必修的核心课程。《数据仓库与数据挖掘技术》系统地介绍了数据仓库和数据挖掘的基本概念、相关知识和基本方法,每种数据挖掘方法都有详尽的实例描述和具体实现步骤。《数据仓库与数据挖掘技术》结构严谨,条理清晰,语言浅显易懂,循序渐进地表达了知识内容;《数据仓库与数据挖掘技术》坚持理论与实际相结合,概念和具体方法相结合,使知识具体化,生动化;实例实现的过程建立在sql 2005数据挖掘软件的基础上,以帮助读者在学习后达到学以致用的目的。</p> <p>《数据仓库与数据挖掘技术》可以作为计算机类、信息
本书是将大数据这一计算机前沿科学和基本应用有机结合的典范教材,全面介绍大数据和相关的基础知识,由浅入深地剖析大数据的分析处理方法和技术手段,突出介绍大数据最新的发展趋势和技术成果。本书的一大亮点是每章中都使用图表对大数据与传统数据处理方式进行对比。另外,本书注重启发式的学习策略,便于读者理解和掌握。全书每章均包括实际应用案例与关键词注释,方便读者查阅和自学,同时配备习题和参考答案。本书体系完整、内容丰富、注重应用、前瞻性强、适用性好,并有开放式的课程教学网站(http://www.cmu.edu.cn/computer)提供技术支持。本书既可以作为普通高校大数据技术的基础教材,也可以作为职业培