本书围绕NoSQL数据库技术与应用进行详细讲解,全书共10章,第1章简单介绍NoSQL数据库;第2章讲解文档存储数据库MongoDB;第3章讲解MongoDB数据库的操作;第4章讲解MongoDB副本集相关的知识;第5章讲解MongoDB分片相关的知识;第6章讲解MongoDB存储大文件系统GridFS相关的知识;第7章讲解键值对存储数据库Redis的相关知识;第8章讲解列族存储数据库HBase的相关知识;第9章讲解图形存储数据库Neo4j相关的知识;第10章讲解一个综合案例.
数据科学技术与应用
✍ Scribed by 宋晖; 刘晓强
- Publisher
- 电子工业出版社
- Year
- 2018
- Tongue
- Chinese
- Leaves
- 160
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
本书内容涵盖数据科学基础知识,介绍了数据科学的工作流程,包括数据采集、数据整理和探索、数据可视化和数据建模预测等技术,并通过文本、图像、语音等前沿应用,引入人工智能技术在数据科学领域应用的最新成果。全书设计收集了多个数据分析案例,采用 Python 及相关科学计算工具包数据分析实现的方法,帮助读者通过实际应用理解数据科学知识,掌握实践技能,运用统计学、人工智能等技术解决实际问题。
本书通俗易懂、实例丰富、技术先进,并配备丰富的教学资源,可作为各类高等院校数据科学、大数据技术的入门教材,计算机基础教学较高层次课程的教材,也可以作为数据科学实践的技术参考书。
✦ Table of Contents
扉页
版权页
前言
目录
第1章 数据科学基础
1.1 数据科学概述
1.1.1 数据的力量
1.1.2 数据科学的知识结构
1.1.3 数据科学的工作流程
1.1.4 数据科学与大数据
1.2 Python数据分析工具
1.2.1 科学计算集成环境Anaconda
1.2.2 Python编译环境
1.2.3 Jupyter Notebook
1.3 Python语言基础
1.3.1 常用数据类型
1.3.2 流程控制
1.3.3 函数和方法库
综合练习题
第2章 多维数据结构与运算
2.1 多维数组对象
2.1.1 一维数组对象
2.1.2 二维数组对象
2.1.3 创建多维数组的常用方法
2.2 多维数组运算
2.2.1 基本算术运算
2.2.2 函数和矩阵运算
2.2.3 随机数组生成函数
2.3 案例:随机游走轨迹模拟
综合练习题
第3章 数据汇总与统计
3.1 统计基本概念
3.1.1 统计的含义
3.1.2 常用统计量
3.2 pandas数据结构
3.2.1 Series对象
3.2.2 Series数据访问
3.2.3 DataFrame对象
3.2.4 DataFrame 数据访问
3.3 数据文件读写
3.3.1 读写CSV和TXT文件
3.3.2 读取Excel文件
3.4 数据清洗
3.4.1 缺失数据处理
3.4.2 去除重复数据
3.5 数据规整化
3.5.1 数据合并
3.5.2 数据排序
3.6 统计分析
3.6.1 通用函数与运算
3.6.2 统计函数
3.6.3 相关性分析
3.6.4 案例:调查反馈表分析
综合练习题
第4章 数据可视化
4.1 Python绘图基础
4.1.1 认识基本图形
4.1.2 pandas快速绘图
4.1.3 Matplotlib精细绘图
4.2 可视化数据探索
4.2.1 绘制常用图形
4.2.2 绘制数据地图
综合练习题
第5章 机器学习建模分析
5.1 机器学习概述
5.1.1 机器学习与人工智能
5.1.2 Python机器学习方法库
5.2 回归分析
5.2.1 回归分析原理
5.2.2 回归分析实现
5.2.3 回归分析性能评估
5.3 分类分析
5.3.1 分类学习原理
5.3.2 决策树
5.3.3 支持向量机
5.4 聚类分析
5.4.1 聚类任务
5.4.2 K-means算法
5.4.3 聚类方法的性能评估
5.5 神经网络和深度学习
5.5.1 神经元与感知器
5.5.2 神经网络
5.5.3 神经网络分类实现
5.5.4 深度学习
综合练习题
第6章 文本数据处理
6.1 文本处理概述
6.1.1 文本处理的常见任务
6.1.2 文本处理的基本步骤
6.2 中文文本处理
6.2.1 中文分词
6.2.2 词性标注
6.2.3 特征提取
6.3 实例:垃圾邮件识别
6.3.1 数据来源
6.3.2 构建文本分类特征训练集
6.3.3 模型训练和验证
综合练习题
第7章 图像数据处理
7.1 数字图像概述
7.1.1 数字图像
7.1.2 数字图像类型
7.1.3 数字图像处理
7.2 Python图像处理
7.2.1 Python图像处理库
7.2.2 图像基本操作
7.3 案例:深度学习实现图像分类
7.3.1 卷积神经网络
7.3.2 深度学习库Keras
7.3.3 用Keras实现图像分类
综合练习题
第8章 时序数据与语音处理
8.1 时序数据概述
8.1.1 时序数据特性
8.1.2 时序数据特征的提取
8.2 时序数据分析方法
8.2.1 时序数据分析过程
8.2.2 股票预测实例
8.3 语音识别实例
8.3.1 语音识别技术简介
8.3.2 语音识别中的时序数据处理
8.3.3 语音识别实例
综合练习题
参考文献
📜 SIMILAR VOLUMES
本书以数据库初学者为读者对象,用通俗的语言和实例解释抽象的概念。在结构上采取“每部分突出一个主题、上升一个台阶”的做法,通过单机版和网络版应用系统开发实例,为读者自行开发小型信息管理系统提供切实可行的模板。本书以Access 2010和SQL Server 2008为操作环境,主要内容包括数据库系统概述、关系模型和关系数据操作、关系数据语言SQL、初识Access、单机系统开发数据表、单机系统开发窗体与报表、单机系统开发宏与VBA、网络应用系统开发、Web数据库应用开发实例、关系数据库设计、数据库保护、数据仓库的建立与应用、数据挖掘相关技术和上机实验安排。 本书可作为大学各专业本科学生“数据库
本书是将大数据这一计算机前沿科学和基本应用有机结合的典范教材,全面介绍大数据和相关的基础知识,由浅入深地剖析大数据的分析处理方法和技术手段,突出介绍大数据最新的发展趋势和技术成果。本书的一大亮点是每章中都使用图表对大数据与传统数据处理方式进行对比。另外,本书注重启发式的学习策略,便于读者理解和掌握。全书每章均包括实际应用案例与关键词注释,方便读者查阅和自学,同时配备习题和参考答案。本书体系完整、内容丰富、注重应用、前瞻性强、适用性好,并有开放式的课程教学网站(http://www.cmu.edu.cn/computer)提供技术支持。本书既可以作为普通高校大数据技术的基础教材,也可以作为职业培
<p> 吴秀丽、杜彦华、丁文英、冯爱兰编著的《数据库技术与应用(SQLServer2016中国高等学校计算机科学与技术专业应用型规划教材)》在基础理论部分详细介绍了数据库的基础理论知识,在应用部分介绍了微软公司的最新的数据库管理系统SQLServer2016,最后总结了数据库技术的发展前沿。本书用生</p> <p>活中常见的案例贯穿,强调理论和实践的结合,同时突出学科发展的特点。</p> <p>全书共分5篇12章:第一篇为基础知识篇(第1~5章),介绍数据库的基础理论知识;第二篇为数据库设计技术篇(第6~7章),介绍数据库设计的理论;第三篇为数据库安全篇(第8章),介绍数据库安全保护技术;
本书以一个“学生成绩管理系统”演示案例为主线,分三部分介绍数据库的基础知识和数据库系统的开发方法。第一部分(第1~2章)为基础部分,介绍现代数据管理技术的发展,大数据时代的数据的特征和处理方法,数据库的基本概念,数据库设计的方法与步骤; 第二部分(第3~6章)为技术部分,选用目前流行的关系型数据库管理系统SQL Server 2012,介绍其常用数据库对象的操作使用方法,包括数据库、表、约束、索引、视图、存储过程等,重点、详细地讲解了各种查询命令的设计方法; 第三部分(第7章)为应用部分,介绍演示案例的设计实现过程以及所用到的相关知识,分别采用了VB.NET和VC++ 6.0作为前台开发工具来
Access2010为软件支撑环境,以应用为目的,以案例为引导,融入计算思维,既考虑理论基础的系统性,又强调实践技术的应用,由浅入深、循序渐进地介绍关系数据库管理系统的基础理论及系统开发技术。全书分为8章,内容上以“学生成绩管理系统”来组织材料。应用系统贯穿全书,围绕它编排了大量翔实的实例,实例新颖、系统,相互呼应。实例涵盖表、查询、窗体、报表、宏、模块六大数据库对象的创建和使用方法。每章附有知识结构图,方便读者归纳、总结。本书力求内容系统、结构严谨、实例丰富、语言通俗易懂,突出“利用数据库技术进行数据综合分析和展示分析结果”能力的培养。本书既可以作为高等院校“数据库技术及应用”课程的教材,也