《数据分析与数据挖掘》主要介绍数据挖掘和数据分析的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据立方体和OLAP技术、频繁模式挖掘、回归分析、分类、聚类、离群点分析。书中涉及到的模型和算法均给予了相应的实例。
社交网站的数据挖掘与分析
✍ Scribed by Matthew A. Russell / 师蓉
- Publisher
- 机械工业出版社
- Year
- 2012
- Tongue
- Chinese
- Leaves
- 315
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。
每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。
•获得对社交网络世界的直观认识
•使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据
•学习如何应用便捷的Python工具来交叉分析你所收集的数据
•通过XHTML朋友圈探讨基于微格式的社交联系...
Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。
每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。
•获得对社交网络世界的直观认识
•使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据
•学习如何应用便捷的Python工具来交叉分析你所收集的数据
•通过XHTML朋友圈探讨基于微格式的社交联系
•应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术
•通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化
✦ Table of Contents
封面
书名
版权
前言
目录
前言
第1章绪论:Twitter数据的处理
Python开发工具的安装
Twitter数据的收集和处理
小结
第2章微格式:语义标记和常识碰撞
XFN和朋友
使用XFN来探讨社交关系
地理坐标:兴趣爱好的共同主线
(以健康的名义)对菜谱进行交叉分析
对餐厅评论的搜集
小结
第3章邮箱:虽然老套却很好用
mbox:Unix的入门级邮箱
mbox+CouchDB=随意的Email分析
将对话线程化到一起
使用SIMILE Timeline将邮件“事件”可视化
分析你自己的邮件数据
小结
第4章Twitter:朋友、关注者和Setwise操作
REST风格的和OAuth-Cladded API
干练而中肯的数据采集器
友谊图的构建
小结
第5章Twitter: tweet,所有的tweet,只有tweet
笔PK剑:和tweet PK机枪(?!?)
对tweet的分析(每次一个实体)
并置潜在的社交网站(或#JustinBieber VS #TeaParty)
对大量tweet的可视化
小结
第6章Linkedin:为了乐趣(和利润?)将职业网络聚类
聚类的动机
按职位将联系人聚类
获取补充个人信息
从地理上聚类网络
小结
第7章GoogleBuzz:TF-IDF、余弦相似性和搭配
Buzz=Twitter+博客(???)
使用NLTK处理数据
文本挖掘的基本原则
查找相似文档
在二元语法中发Buzz
利用Gmail
在中断之前试着创建一个搜索引擎
小结
第8章博客及其他:自然语言处理(等)
NLP:帕累托式介绍
使用NLTK的典型NLP管线
使用NLTK检测博客中的句子
对文件的总结
以实体为中心的分析:对数据的深层了解
小结
第9章Facebook:一体化的奇迹
利用社交网络数据
对Facebook数据的可视化
小结
第10章语义网:简短的讨论
发展中的变革
人不可能只靠事实生活
期望
📜 SIMILAR VOLUMES
<p>《大数据分析与数据挖掘》综合大数据分析与数据挖掘的理论、技术和实际案例,以丰富的产学合作实务案例,深入浅出地剖析从大数据中掏金的秘诀。全书内容涵盖大数据分析与数据挖掘的基本概念、数据准备、大数据分析的方法与实证及相关的进阶运用,并佐以R语言及例题实作,提升读者的数据挖掘实战能力,开拓对大数据分析的洞察视野。</p> <p>随着移动通信和行动装置普及、物联网和网络发展,以及云端技术的不断进步,现今数据产生、搜集和储存方式比以往更为方便。数据挖掘与大数据分析可以从海量数据中,找到值得参考的样型或规则,转换成有价值的信息、洞察或知识,创造更多新价值。</p> <p>本书主要介绍数据挖掘与大
<p>本套丛书由国家银行业信息科技管理高层指导委员会组织编写,银监会尚福林主席担任丛书编委会主编并亲笔作序。编委会成员囊括了银监会、国内各大银行的领导,各书的编著者都是各大银行总行的信息技术技术专家。本套丛书系统性强,内容先进实用,既立足我国银行业实际,又注重总结本土银行业的实践经验和成功案例,既着眼于国际先进银行的信息技术发展态势,又对如何将这些先进技术和理念本土化结合进行了探索和思考。</p> <p>本书针对金融行业数据量大、更新快的特点,着重介绍了数据挖掘与分析技术在金融行业尤其是银行业中的应用。本书的主要内容包括:数据挖掘概述、金融数据挖掘概述、基于大数据的金融数据挖掘概述、数据仓库
<p>《数据仓库与数据挖掘》主要介绍数据仓库和数据挖掘技术的基本原理和应用方法,全书共分为12章,主要内容包括数据仓库的概念和体系结构、数据仓库的数据存储和处理、数据仓库系统的设计与开发、关联规则、数据分类、数据聚类、贝叶斯网络、粗糙集、神经网络、遗传算法、统计分析、文本和Web挖掘。《数据仓库与数据挖掘》既重视理论知识的讲解,又强调应用技能的培养。每章首先介绍算法的主要思想和理论基础,之后利用算法去解决实例中给出的任务,而且对于数据仓库的组建方法和多数章节中的数据挖掘算法,《数据仓库与数据挖掘》都使用Microsoft SQL Server 2005进行了操作实现。《数据仓库与数据挖掘》通过
书签已装载, 书签制作方法请找 [email protected] 完全免费 “如果你想学习如何用一款统计专家和数据挖掘专家所开发的免费软件包,那就选这本书吧。本书包括大量实际案例,它们充分体现了R软件的广度和深度。” —— Bernhard Pfahringer, 新西兰怀卡托大学 本书利用大量给出必要步骤、代码和数据的具体案例,详细描述了数据挖掘的主要过程和技术,广泛涵盖数据大小、数据类型、分析目标、分析工具等方面的各种具有挑战性的问题。 本书的支持网站(http://www.liaad.up.pt/~ltorgo/DataMiningWithR/)给出了案例研究的所有