本书详细介绍了大数据挖掘技术,全书分为3篇,共12章。第1篇为大数据分析基础,包括第1~4章,分别为大数据概述、大数据相关技术、数据预处理、R语言工具的使用。第2篇为大数据挖掘技术,包括第5~11章,分别为线性分类方法、分类方法、聚类分析、关联规则、预测方法与离群点诊断、时间序列分析、大数据挖掘可视化。第3篇为大数据挖掘案例,包括第12章,介绍了大数据挖掘应用案例。 本书既可作为高等学校计算机科学与技术、数据科学与大数据技术、统计学、数据分析等专业的高等教育教材,也可作为科研人员、从事大数据相关工作的技术人员的参考书。
挖掘地球
✍ Scribed by 符宝
- Publisher
- 笔趣阁
- Tongue
- Chinese
- Edition
- 共477章
- Category
- Fiction
No coin nor oath required. For personal study only.
📜 SIMILAR VOLUMES
书签已装载, 书签制作方法请找 [email protected] 完全免费 很多学科都面临着一个普遍问题:如何存储、访问异常庞大的数据集,并用模型来描述和理解它们?这些问题使得人们对数据挖掘技术的兴趣不断增强。长期以来,很多相互独立的不同学科分别致力于数据挖掘的各个方面。本书把信息科学、计算科学和统计学在数据挖掘方面的应用融合在一起,是第一本真正和跨学科教材。 本书由三部分构成。第一部分是基础,介绍了数据挖掘算法及其应用所依赖的基本原理。讲座方法直观易懂,深入浅出。第二部分是数据挖掘算法,系统讲座了如何构建求解特定问题的不同算法。讲座的内容包括用于分类和回归的树及规则、关
<p>本书阐述文本数据挖掘的理论模型、实现算法和相关应用,主要内容包括:信息抽取和知识库构建、文本聚类、情感文本分析、热点发现、生物医学文本挖掘和多文档自动摘要等。写作风格力求言简意赅,深入浅出,通过实例说明实现相关任务的理论方法和技术思路,而不过多地涉及实现细节。本书可作为大学高年级本科生或研究生从事相关研究的入门文献,也可作为从事相关技术研发的开发人员的参考资料。</p>
本书全面总结了不确定数据环境下频繁模式挖掘领域的主要研究成果,从数据模型、问题定义、常用算法等方面系统介绍不确定频繁项集挖掘、不确定序列模式挖掘、不确定频繁子图模式挖掘、不确定高效用项集挖掘和不确定加权频繁项集挖掘技术。重点针对两类典型的不确定数据,即概率数据和容错数据,进行概率频繁模式挖掘和近似频繁模式挖掘的研究,并应用于传统中医药数据环境下,从主观不确定性和客观不确定性两个方面提出相应的解决方案,实现基于不确定数据的高效频繁模式挖掘,并通过实验验证了它们的有效性和实用性。 本书主要面向对数据挖掘和机器学习感兴趣的科研人员和学生,特别适合从事不确定数据挖掘、频繁模式挖掘和关联规则发现以及相关