前言与致谢 第一章 概论 博弈论是什么? 博弈论能做什么? 政治学的四个问题 为什么要建模? 社会性建模的理性选择方法 如何使用本书 本书的结构 进一步阅读 第二章 效用理论 理性的概念 效用函数如何预测行动? 一个例子:尼克松的“圣诞节大轰炸” 确定性、风险和不确定性 在风险的条件下的效用理论 对效用理论的一些常见误解 效用函数与偏好的类型 一个简单的例子:关于威慑的计算 另一个简单的例子:投票决策 为什么效用理论有可能行不通 回顾 进一步阅读 第三章 对博弈的描述 对情境的形式化表述:古巴导弹危机中的威慑 扩展式博弈 策略式博弈 回顾
博弈学习理论
✍ Scribed by (美)弗登伯格,(美)莱文
- Publisher
- 中国人民大学出版社
- Year
- 2004
- Tongue
- Chinese
- Leaves
- 348
- Series
- 当代世界学术名著·经济学系列
- Category
- Library
No coin nor oath required. For personal study only.
✦ Synopsis
内容简介 · · · · · ·
在经济学中,绝大多数的非合作博弈理论集中研究博弈中的均衡问题,尤其是纳什均衡及其精炼。对均衡什么时候出现以及为什么均衡会出现,传统解释是,均衡是在博弈的规则、参与人的理性以及参与人的支付函数都是共同知识的情况下,由参与人的分析和自省所得出的结果。不论是在概念上还是在实证上,这个理论都存在许多问题。
在《博弈学习理论》一书中,朱·弗登伯格和戴维·K·莱文提出了另一种解释:均衡是并非完全理性的参与人随时间的推移寻求最优化这一过程的长期结果。他们研究的模型为均衡理论提供了基础,并为经济学家评价和改进传统的均衡概念提供了有用的方法。
投诉
作者简介 · · · · · ·
朱·弗登伯格(Drew Fudenberg),哈佛大学经济系教授。1981年毕业于麻省理工学院,获得经济学博士学位。主要研究领域为博弈论和动态经济学。曾在加州大学伯克利分校、麻省理工学院、斯坦福大学和法国图卢兹大学任教。
✦ Table of Contents
封面
书名
版权
重要信息!!!
目录
丛书出版说明
总序
致谢
献词
第1章 引论
1.1 前言
1.2 大群体模型和匹配模型
1.3 三个常用的学习和/或进化模型
1.4 库诺特调整
1.5 库诺特动态分析
1.6 具有锁定功能的库诺特过程
1.7 回顾同时行动有限博弈
附录:动态系统和局部稳定性
参考文献
第2章 虚拟行动
2.1 引言
2.2 两人虚拟行动
2.3 虚拟行动中的渐近行动
2.4 对虚拟行动中循环的解释
2.5 多人虚拟行动
2.6 虚拟行动的支付
2.7 两战略博弈中的一致性和相关均衡
2.8 虚拟行动和最优反应动态
2.9 虚拟行动的一般化
附录:狄利克雷先验和多项抽样
参考文献
第3章 模仿者动态和相关的确定性进化模型
3.1 引言
3.2 同质群体中的模仿者动态
3.3 同质群体模仿者动态的稳定性
3.4 进化稳定战略
3.5 非对称模仿者动态模型
3.6 对模仿者动态方程的解释
3.7 模仿者动态的一般化和重复剔除严格劣战略
3.8 短视调整动态
3.9 集值极限点和漂移
3.10 廉价磋商和秘密握手
3.11 离散时间模仿者系统
附录:刘维尔(Liouville)定理
参考文献
第4章 随机虚拟行动和混合战略均衡
4.1 引言
4.2 收敛的概念
4.3 渐近短视和渐近经验主义
4.4 随机扰动支付与平滑最优反应
4.5 平滑虚拟行动和随机逼近
4.6 部分抽样
4.7 普遍一致性和平滑虚拟行动
4.8 刺激反应和作为学习模型的虚拟行动
4.9 对战略空间的学习
附录:随机逼近理论
参考文献
第5章 具有持续随机性的调整模型
5.1 引言
5.2 回顾随机调整模型
5.3 坎多里一迈拉斯一罗布(Kandori-Mailath-Rob)模型
5.4 讨论其他动态
5.5 局部相互作用
5.6 吸引域的半径和协半径
5.7 修正的协半径
5.8 具有异质群体的一致随机匹配
5.9 随机模仿者动态
附录A:有限马尔可夫链的回顾
附录B:随机稳定分析
参考文献
第6章 扩展式博弈和自确认均衡
6.1 引言
6.2 一个例子
6.3 扩展式博弈
6.4 一个简单的学习模型
6.5 自确认均衡的稳定性
6.6 异质的自确认均衡
6.7 一致自确认均衡
6.8 一致自确认均衡与纳什均衡
6.9 可理性化的自确认均衡和关于对手支付的先验信息
参考文献
第7章 纳什均衡,大群体模型和扩展式博弈中的变异
7.1 引言
7.2 相关信息集和纳什均衡
7.3 外生试验
7.4 在被比做吃角子老虎机问题的博弈中的学习
7.5 定态学习
7.6 “快速学习”模型中的随机调整和后向归纳
7.7 廉价磋商博弈中的变异和快速学习
7.8 试验和期限的长度
附录:吃角子老虎机问题回顾
参考文献
第8章 老练学习
8.1 引言
8.2 条件学习的三个范例
8.3 老练学习的贝叶斯方法
8.4 绝对连续条件的解释
8.5 选择专家
8.6 条件学习
8.7 折现
8.8 分类策略和循环
8.9 内省的分类规则,校准和相关均衡
8.10 模式识别中的索斯诺模型
8.11 操纵学习程序
参考文献
索引
📜 SIMILAR VOLUMES
<p>人生、商业经营、职场由一场又一场的博弈组成,每场博弈都包括博弈各方、博弈各方可以采取的行动、博弈各方可能得到的好处。而你我都在争取博弈的最大好处。</p> <p>•有的人为了争取加薪,有的人则为了确保员工能全力以赴;</p> <p>•有时候,我们能掌握一切,但有时,则必须猜测别人知道哪些我们不知道的事;</p> <p>•偶尔竞争对手间必须合作才能够共存,但在赢家通吃的情况下,合作则是不可能的事情。</p> <p>在博弈的世界里,大多数人只关心自己。所以,如果你加薪的前提是基于这对老板是一种“善行”,老板绝对不会帮你加薪。只有让老板相信,给你更多的钱对他有好处,你才加得了薪。</p> <p
<p>博弈论距离中国人的生活越来越近了。自从张维迎教授的“博弈论与信息经济学”问世以来,在中国的经济学界和管理学界,有关博弈论的应用,非但是听到了雷声,而且有时还看到了雨点。</p> <p>博弈论可以广泛地应用于包括政治、经济以及军事等各个领域。1999年4、5月间,我曾就北约轰炸南斯拉夫建立了一个粗糙的博弈模型。发现北约寻求的均衡解是:北约一轰炸,南斯拉夫就投降。但是它忽略了非均衡途径的情况:轰炸不能迫使南斯拉夫投降。读者将从本书中获知,忽略非均衡途径的策略不是的。因此,当时可以预测北约有可能陷入一个窘境:它一方面继续轰炸,一方面谋求第三者出面调停。造成这种局面的原因多种多样,交战双方对盈