𝔖 Scriptorium
✦   LIBER   ✦

📁

白话大数据与机器学习

✍ Scribed by 高扬; 卫峥; 尹会生


Publisher
机械工业出版社
Year
2016
Tongue
Chinese
Leaves
329
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


本书通俗易懂,有高中数学基础即可看懂,同时结合大量案例与漫画,将高度抽象的数学、算法与应用,与现实生活中的案例和事件一一做了关联,将源自生活的抽象还原出来,帮助读者理解后,又带领大家将这些抽象的规律与算法应用于实践,贴合读者需求。同时,本书不是割裂讲解大数据与机器学习的算法和应用,还讲解了其生态环境与关联内容,让读者更全面地知晓渊源与未来,是系统学习大数据与机器学习的不二之选:

·大数据产业解读一一剖析产业情况,人才供需、职业选择与相应“武器”库;

·步入大数据之门一一解读数据、信息、算法,以及与大数据应用的关系;

·大数据基石一一结合大量示例和漫画,趣味讲解大数据算法应掌握的数学知识,无障碍学习;

·大数据算法奥义——信息论、向量空间、回归、聚类、分类等最为核心的算法的释义与应用,举重若轻;

·大数据热门应用——关联分析、用户画像、推荐算法、文本挖...

本书通俗易懂,有高中数学基础即可看懂,同时结合大量案例与漫画,将高度抽象的数学、算法与应用,与现实生活中的案例和事件一一做了关联,将源自生活的抽象还原出来,帮助读者理解后,又带领大家将这些抽象的规律与算法应用于实践,贴合读者需求。同时,本书不是割裂讲解大数据与机器学习的算法和应用,还讲解了其生态环境与关联内容,让读者更全面地知晓渊源与未来,是系统学习大数据与机器学习的不二之选:

·大数据产业解读一一剖析产业情况,人才供需、职业选择与相应“武器”库;

·步入大数据之门一一解读数据、信息、算法,以及与大数据应用的关系;

·大数据基石一一结合大量示例和漫画,趣味讲解大数据算法应掌握的数学知识,无障碍学习;

·大数据算法奥义——信息论、向量空间、回归、聚类、分类等最为核心的算法的释义与应用,举重若轻;

·大数据热门应用——关联分析、用户画像、推荐算法、文本挖掘、人工神经网络等最实用、最需要了解的应用的原理与实现;

·大数据主流框架一一介绍了主流的大数据框架(Hadoop、Spark和Cassandra);

·系统架构与调优一一从速度与稳定性方面给出调优的一般性“内功心法”;

·大数据价值与变现一一从运营指标、AB测试、大数据价值与变现场景多维度解读。


📜 SIMILAR VOLUMES


机器学习与大数据技术
✍ 牟少敏 📂 Library 📅 2018 🏛 电子工业出版社 🌐 Chinese

本书较为全面地论述了机器学习、深度学习、大数据技术与图像处理技术的基本概念、基础原理和基本方法,以农业为应用场景,力求通缩易懂,深入浅出的介绍了与机器学习、深度学习、大数据技术与图像处理技术问题联系密切的内容。全书主要分为4大部分:机器学习、大数据技术和图像处理技术的基础知识;经典的机器学习基本理论和方法,以及深度学习和大数据未来的发展;实践应用;机器学习和人工智能的数学基础与编程基础。

大话数据科学——大数据与机器学习实战(基于R语言)
✍ 陈文贤 📂 Library 📅 2020 🏛 清华大学出版社 🌐 Chinese

本书以独特的方式讲解数据科学,不仅让读者可以轻松学习数据科学理论,又可以动手(手算和机算)进行数据科学实战。本书特色:全彩印刷,图形、表格、思维导图丰富;避免深奥的数学证明,采用简单的数学说明;用各种学习图将本书内容贯穿起来;实战计算,包含小型数据的演算和大型数据的实战程序。 本书共13章,内容涵盖丰富的数据科学模型,包含关联分析、聚类分析、贝叶斯分类、近邻法、决策树、降维分析、回归模型等算法。利用小数据例题介绍计算步骤,同时用R语言验证计算结果。另外,也有大数据的案例数据,例如:推荐系统、支持向量机、集成学习等。另外,本书只有大数据的案例数据用R语言计算。 本书适合各个专业领域(

Python大数据分析与机器学习商业案例实战
✍ 王宇韬; 钱妍竹 📂 Library 📅 2020 🏛 机械工业出版社 🌐 Chinese

<p>大数据分析与机器学习技术已成为各行各业实现数字化变革的关键驱动力。本书以功能强大且较易上手的Python语言为编程环境,全面讲解了大数据分析与机器学习技术的商业应用实战。</p> <p>全书共16章,讲解了线性回归模型、逻辑回归模型、决策树模型、朴素贝叶斯模型、K近邻算法模型、随机森林模型、AdaBoost与GBDT模型、XGBoost与LightGBM模型、PCA(主成分分析)模型、聚类与分群模型(KMeans与DBSCAN算法)、协同过滤算法模型、Apriori关联分析模型、神经网络模型等十余种机器学习模型的原理和代码实现,每种模型都配有一到两个典型案例,涵盖金融、营销、医疗、社会

Python+Spark 2.0+Hadoop机器学习与大数据实战
✍ 林大贵 📂 Library 📅 2018 🏛 清华大学出版社 🌐 Chinese

<p>本书从浅显易懂的“大数据和机器学习”原理说明入手,讲述大数据和机器学习的基本概念,如分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用等。书中不仅加入了新近的大数据技术,还丰富了“机器学习”内容。 为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单机Windows系统上通过Virtual Box虚拟机安装多机Linux虚拟机,如何建立Hadoop集群,再建立Spark开发环境。书中介绍搭建的上机实践平台并不限制于单台实体计算机。对于有条件的公司和学校,参照书中介绍的搭

零起点Python足彩大数据与机器学习实盘分析
✍ 何海群著 📂 Library 📅 2017 🏛 电子工业出版社 🌐 Chinese

本书使用Python编程语言、Pandas数据分析模块、机器学习和人工智能算法对足彩大数据进行实盘分析,设计并发布了开源大数据项目tfbDat足彩数据包,汇总了2010—2017年全球近7万场足球比赛的赛事和赔率数据。此外,还介绍使用Python语言抓取网页数据、下载更新tfbDat足彩数据包、预测和分析比赛球队的取胜概率,同时提出了检测人工智能算法优劣的“足彩图灵”法则。

智能大数据与深度学习
✍ 朱定局 📂 Library 📅 2018 🏛 电子工业出版社 🌐 Chinese

本书是一本原创性的学术专著,分为两部分。