了解数据结构与算法是透彻理解计算机科学的前提。随着Python日益广泛的应用,Python程序员需要实现与传统的面向对象编程语言相似的数据结构与算法。本书是用Python描述数据结构与算法的开山之作,汇聚了作者多年的实战经验,向读者透彻讲解在Python环境下,如何通过一系列存储机制高效地实现各类算法。通过本书,读者将深刻理解Python数据结构、递归、搜索、排序、树与图的应用,等等。
Python数据分析 第2版
✍ Scribed by 阿曼多·凡丹戈
- Publisher
- 人民邮电出版社
- Year
- 2018
- Tongue
- Chinese
- Leaves
- 292
- Edition
- 2
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
Python作为一种程序设计语言,凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言。同时,Python语言的数据分析功能也逐渐为大众所认可。 本书就是一本介绍如何用Python进行数据分析的学习指南。全书共12章,从Python程序库入门、NumPy数组和Pandas入门开始,陆续介绍了数据的检索、数据加工与存储、数据可视化等内容。同时,本书还介绍了信号处理与时间序列、应用数据库、分析文本数据与社交媒体、预测性分析与机器学习、Python生态系统的外部环境和云计算、性能优化及分析、并发性等内容。在本书的最后,还采用3个附录的形式为读者补充了一些重要概念、常用函数以及在线资源等重要内容。 本书延续了上一版示例丰富、简单易懂的优点,非常适合对Python语言感兴趣或者想要使用Python语言进行数据分析的读者参考阅读。
✦ Table of Contents
封面
版权声明
内容提要
作者简介
技术审稿人简介
前言
目录
第1章 Python程序库入门
1.1 安装Python 3
1.1.1 安装数据分析程序库
1.1.2 Linux平台或Mac OS X平台
1.1.3 Windows平台
1.2 将IPython用作shell
1.3 学习手册页
1.4 Jupyter Notebook
1.5 NumPy数组
1.6 一个简单的应用
1.7 从何处寻求帮助和参考资料
1.8 查看Pyton库中包含的模块
1.9 通过Matplotlib实现数据的可视化
1.10 小结
第2章 NumPy数组
2.1 NumPy数组对象
2.2 创建多维数组
2.3 选择NumPy数组元素
2.4 NumPy的数值类型
2.4.1 数据类型对象
2.4.2 字符码
2.4.3 dtype构造函数
2.4.4 dtype属性
2.5 一维数组的切片与索引
2.6 处理数组形状
2.6.1 堆叠数组
2.6.2 拆分NumPy数组
2.6.3 NumPy数组的属性
2.6.4 数组的转换
2.7 创建数组的视图和拷贝
2.8 花式索引
2.9 基于位置列表的索引方法
2.10 用布尔型变量索引 NumPy数组
2.11 NumPy数组的广播
2.12 小结
2.13 参考资料
第3章 Pandas入门
3.1 Pandas的安装与概览
3.2 Pandas数据结构之DataFrame
3.3 Pandas数据结构之Series
3.4 利用Pandas查询数据
3.5 利用Pandas的DataFrame进行统计计算
3.6 利用Pandas的DataFrame实现数据聚合
3.7 DataFrame的串联与附加操作
3.8 连接DataFrames
3.9 处理缺失数据问题
3.10 处理日期数据
3.11 数据透视表
3.12 小结
3.13 参考资料
第4章 统计学与线性代数
4.1 用NumPy进行简单的描述性统计计算
4.2 用NumPy进行线性代数运算
4.2.1 用NumPy求矩阵的逆
4.2.2 用NumPy解线性方程组
4.3 用NumPy计算特征值和特征向量
4.4 NumPy随机数
4.4.1 用二项式分布进行博弈
4.4.2 正态分布采样
4.4.3 用Scipy进行正态检验
4.5 创建掩码式NumPy数组
4.6 忽略负值和极值
4.7 小结
第5章 数据的检索、加工与存储
5.1 利用NumPy和pandas对CSV文件进行写操作
5.2 二进制npy与pickle格式
5.3 使用PyTables存储数据
5.4 Pandas DataFrame与HDF5仓库之间的读写操作
5.5 使用Pandas读写Excel文件
5.6 使用REST Web服务和JSON
5.7 使用Pandas读写JSON
5.8 解析RSS和Atom订阅
5.9 使用Beautiful Soup解析HTML
5.10 小结
5.11 参考资料
第6章 数据可视化
6.1 Matplotlib的子库
6.2 Matplotlib绘图入门
6.3 对数图
6.4 散点图
6.5 图例和注解
6.6 三维图
6.7 Pandas绘图
6.8 时滞图
6.9 自相关图
6.10 Plot.ly
6.11 小结
第7章 信号处理与时间序列
7.1 statsmodels模块
7.2 移动平均值
7.3 窗口函数
7.4 协整的定义
7.5 自相关
7.6 自回归模型
7.7 ARMA模型
7.8 生成周期信号
7.9 傅里叶分析
7.10 谱分析
7.11 滤波
7.12 小结
第8章 应用数据库
8.1 基于sqlite3的轻量级访问
8.2 通过Pandas访问数据库
8.3 SQLAlchemy
8.3.1 SQLAlchemy的安装和配置
8.3.2 通过SQLAlchemy填充数据库
8.3.3 通过SQLAlchemy查询数据库
8.4 Pony ORM
8.5 Dataset:懒人数据库
8.6 PyMongo与MongoDB
8.7 利用Redis存储数据
8.8 利用memcache存储数据
8.9 Apache Cassandra
8.10 小结
第9章 分析文本数据和社交媒体
9.1 安装NLTK
9.2 NLTK简介
9.3 滤除停用字、姓名和数字
9.4 词袋模型
9.5 词频分析
9.6 朴素贝叶斯分类
9.7 情感分析
9.8 创建词云
9.9 社交网络分析
9.10 小结
第10章 预测性分析与机器学习
10.1 预处理
10.2 基于逻辑回归的分类
10.3 基于支持向量机的分类
10.4 基于ElasticNetCV的回归分析
10.5 支持向量回归
10.6 基于相似性传播算法的聚类分析
10.7 均值漂移算法
10.8 遗传算法
10.9 神经网络
10.10 决策树
10.11 小结
第11章 Python生态系统的外部环境和云计算
11.1 与MATLAB/Octave交换信息
11.2 安装rpy2
11.3 连接R
11.4 为Java传递NumPy数组
11.5 集成SWIG和NumPy
11.6 集成Boost和Python
11.7 通过f2py使用For ran代码
11.8 PythonAnywhere云
11.9 小结
第12章 性能优化、性能分析与并发性
12.1 代码的性能分析
12.2 安装Cython
12.3 调用C代码
12.4 利用multiprocessing创建进程池
12.5 通过Joblib提高for循环的并发性
12.6 比较Bottleneck函数与NumPy函数
12.7 通过Jug实现MapReduce
12.8 安装MPI for Python
12.9 IPython Parallel
12.10 小结
附录A重要概念
附录B常用函数
📜 SIMILAR VOLUMES
<p>了解数据结构与算法是透彻理解计算机科学的前提。随着Python日益广泛的应用,Python程序员需要实现与传统的面向对象编程语言相似的数据结构与算法。本书是用Python描述数据结构与算法的开山之作,汇聚了作者多年的实战经验,向读者透彻讲解在Python环境下,如何通过一系列存储机制高效地实现各类算法。通过本书,读者将深刻理解Python数据结构、递归、搜索、排序、树与图的应用,等等。</p>
本书由Python pandas项目创始人Wes McKinney亲笔撰写,详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。第2版针对Python 3.6进行全面修订和更新,涵盖新版的pandas、NumPy、IPython和Jupyter,并增加大量实际案例,可以帮助你高效解决一系列数据分析问题。 第2版中的主要更新包括: • 所有的代码,包括把Python的教程更新到了Python 3.6版本(第1版中使用的是Python 2.7) • 更新了Python第三方发布版Anaconda和其他所需Python包的安装指引 • 更新pandas库到201
<p> 《Python数据分析与可视化(第2版)-微课视频版/大数据与人工智能技术丛书》从Python数据分析的基础知识人手,结合大量的数据分析示例,系统地介绍数据分析与可视化方法,带领读者逐步掌握Python数据分析的相关知识,提高解决实际问题的能力。 《Python数据分析与可视化(第2版)-微课视频版/大数据与人工智能技术丛书》共13章,主要内容包括数据分析与可视化概述、Python编程基础、NumPy数值计算基础、Pandas统计分析基础、Pandas数据载人与预处理、Matplotlib数据可视化基础、Seaborn可视化、pyecharts可视化、时间序列数据分析、SciPy科
本书具体内容为SPSS简介、SPSS数据挖掘系统介绍、数据文件管理、数据预处理、基本统计分析、多重反应分析、均值的比较与检验、统计图制作、参数检验、回归分析、方差分析、相关分析、聚类分析、判别分析、因子分析、对应分析、信度分析、生存分析、对数线性模型、时间序列分析、缺失值分析,以及SPSS在财务智能、数据预测、股市分析、社会经济分析、金融数据分析等方面的数据挖掘应用。