𝔖 Scriptorium
✦   LIBER   ✦

📁

统计自然语言处理基础

✍ Scribed by Chris Manning; Hinrich Schütze


Publisher
电子工业出版社
Year
2005
Tongue
Chinese
Leaves
432
Series
国外计算机科学教材系列
Category
Library

⬇  Acquire This Volume

No coin nor oath required. For personal study only.

✦ Synopsis


《统计自然语言处理基础:国外计算机科学教材系列》是一本全面系统地介绍统计自然语言处理技术的专著,被国内外许多所著名大学选为计算语言学相关课程的教材。《统计自然语言处理基础:国外计算机科学教材系列》涵盖的内容十分广泛,分为四个部分,共16章,包括了构建自然语言处理软件工具将用到的几乎所有理论和算法。全书的论述过程由浅入深,从数学基础到精确的理论算法,从简单的词法分析到复杂的语法分析,适合不同水平的读者群的需求。同时,《统计自然语言处理基础:国外计算机科学教材系列》将理论与实践紧密联系在一起,在介绍理论知识的基础上给出了自然语言处理技术的高层应用(如信息检索等)。在《统计自然语言处理基础:国外计算机科学教材系列》的配套网站上提供了许多相关资源和工具,便于读者结合书中习题,在实践中获得提高。近年来,自然语言处理中的统计学方法已经逐渐成为主流。

✦ Table of Contents


封面
书名
版权
前言
目录
第一部分 基础知识
第1章 绪论
1.1 理性主义者和经验主义者的方法
1.2 科学内容
1.3 语言中的歧义问题是自然语言难以处理的原因
1.4 第一手资料
1.5 深入阅读
1.6 习题
第2章 数学基础
2.1 概率论基础
2.2 信息论基础
2.3 深入阅读
2.4 习题
第3章 语言学基础
3.1 词性和词法
3.2 短语结构
3.3 语义和语用
3.4 其他研究领域
3.5 深入阅读
3.6 习题
第4章 基于语料库的工作
4.1 基础知识
4.2 文本
4.3 数据标注
4.4 深入阅读
4.5 习题
第二部分 词法
第5章 搭配
5.1 频率
5.2 均值和方差
5.3 假设检验
5.4 互信息
5.5 搭配的概念
5.6 深入阅读
5.7 习题
第6章 统计推理:稀疏数据集上的n元语法模型
6.1 Bins:构造等价类
6.2 统计估计
6.3 组合估计法
6.4 结论
6.5 深入阅读
6.6 习题
第7章 语义消歧
7.1 预备知识
7.2 有监督消歧
7.3 基于词典的消歧
7.4 无监督消歧
7.5 什么是语义
7.6 深入阅读
7.7 习题
第8章 词汇获取
8.1 评价方法
8.2 动词子范畴
8.3 附着歧义
8.4 选择倾向
8.5 语义相似性
8.6 统计自然语言处理中词汇获取的作用
8.7 深入阅读
8.8 习题
第三部分 语法
第9章 马尔可夫模型
9.1 马尔可夫模型
9.2 隐马尔可夫模型
9.3 隐马尔可夫模型的三个基本问题
9.4 隐马尔可夫模型:实现、性质和变形
9.5 深入阅读
9.6 习题
第10章 词性标注
10.1 标注中的信息源
10.2 马尔可夫模型标注器
10.3 隐马尔可夫标注器
10.4 基于转换的标注学习
10.5 其他模型和语言
10.6 标注准确率和标注器的应用
10.7 深入阅读
10.8 习题
第11章 概率上下文无关文法
11.1 概率上下文无关文法的一些特征
11.2 概率上下文无关文法的问题
11.3 词串概率的计算
11.4 内部-外部算法的问题
11.5 深入阅读
11.6 习题
第12章 概率句法分析
12.1 一些概念
12.2 一些方法
12.3 深入阅读
12.4 习题
第四部分 应用与技术
第13章 统计对齐和机器翻译
13.1 文本对齐
13.2 词对齐
13.3 统计机器翻译
13.4 深入阅读
13.5 习题
第14章 聚类
14.1 层级聚类
14.2 非层级聚类
14.3 深入阅读
14.4 习题
第15章 信息检索
15.1 信息检索的背景
15.2 向量空间模型
15.3 词条分布模型
15.4 潜在语义索引
15.5 篇章分割
15.6 深入阅读
15.7 习题
第16章 文本分类
16.1 决策树
16.2 最大熵建模
16.3 感知器
16.4 к最近邻分类
16.5 深入阅读
16.6 习题
附录A 统计表
参考文献


📜 SIMILAR VOLUMES


自然语言处理入门
✍ 何晗 📂 Library 📅 2019 🏛 人民邮电出版社 🌐 Chinese

<p>这是一本务实的入门书,助你零起点上手自然语言处理。</p> <p>HanLP 作者何晗汇集多年经验,从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信 息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。书中通过对多种算法的讲解,比较了它们的优缺点和适用场景,同时详细演示生产级成熟代码,助你真正将自然语言处理应用在生产环境中。</p> <p>随着本书的学习,你将从普通程序员晋级为机器学习工程师,最后进化到自然语言处理工程师。</p>

自然语言处理研究前沿
✍ 孙茂松; 李涓子 📂 Library 📅 2019 🏛 上海交通大学出版社 🌐 Chinese

<p>本分册以类脑模式的深度学习为基础,对自然语言处理的不同层面及其应用进行介绍。本分册共分为10章,第1章介绍了自然语言中不同语言单元(包括词、句子和篇章)的表示,并介绍了深度神经网络的注意力计算模型;第2章和第3章分别介绍了自然语言词法和句子的经典分析算法和深度学习模型;第4章介绍了知识图谱和从大规模文本中获取知识的主要技术;第5章和第6章重点介绍了文本挖掘技术,包括文本分类和摘要以及文本情感分析;第7章至第10章分别介绍了自然语言处理在信息检索、自动问答、机器翻译和社会计算中的应用技术。</p>