运筹学博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷
基本模型
经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人 入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双 方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称“背叛”对方), 而对方保持沉默,此人将即时获释,沉默者将判监8年。 若二人都保持沉默(相关术语称互相“合作”),则二人同 样判监1年。 若二人都互相检举(互相“背叛”),则二人同样判监5年。
囚徒困境( Prisoners’Dilemma )
只达到效率很差的个体理性解,没有实现团体 理性解。 前者是稳定的,是自动实施的;尽管团体理性 解对大家都好,但它是不能自动实施的,需要改变 条件。
提示:该博弈揭示了个体理性与团体理性之间的矛 盾。——从个体利益出发的行为往往不能实现团体的 最大利益,同时也揭示了个体理性本身的内在矛盾— —从个体利益出发的行为最终也不一定能真正实现个 体的最大利益,甚至得到相当差的结果。
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
10.2 完全信息静态博弈
10.2.1 策略型博弈模型及占优战略博弈 10.2.2 重复剔除的占优战略博弈 10.2.3 纳什均衡
标志着博弈论作为一门独立科学的开始,也 标志着新古典经济学进入了一个新的发展阶 段。
3. 1994年三位获诺奖的博弈论学者
John Nash
John Harsany
Leihaden Selten
4. 1996年诺贝尔经 济学奖得主:詹姆 斯·莫里 斯:主要贡 献:不对称信息条 件下的激励理论
5. 2001年诺贝尔经济学 奖 得 主: 迈 克尔 ·斯 宾 塞:在不对称信息市场 分析方面所做出开创性
10.2.1 策略型博弈模型及占优战略博弈
非合作博弈模型从模型自身形式上可分为扩展型和 策略型两种,一般用策略型模型描述完全信息静态 博弈模型。
构成策略型博弈模型的三个要素: 局中人、策略、支付函数
参与人或局中人(Players) :独立决策、独立承 担博弈结果的个人或组织
博弈规则面前博弈方之间平等,不因博弈方 之间权利、地位的差异而改变
智猪博弈(大小猪博弈)
智猪博弈:假设猪圈里有两头猪,一头大猪,一头小猪, 猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制 猪食的供应。按一下按钮。将有10个单位的猪食进入猪食 槽,供两头猪食用。两头猪面临选择的策略有两个:自己 去按按钮或等待另一头猪去按按钮。如果某一头猪作出自 己去按按钮的选择,它必须付出如下代价:第一,它需要 收益相当于2个单位的成本;第二,由于猪食槽远离猪食, 它将比另一头猪后到猪食槽,从而减少吃食的数量。
博弈论:博弈论就是系统研究具有上述特征的博弈问 题,寻求各博弈方合理选择战略情况下博弈的解,并 对这些解进行讨论分析的理论。
博弈的分类及对应的均衡概念
完全信息
静态
完全信息静态博弈 纳什均衡
代表人物:纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
都有一定的规则 都有一个结果 策略至关重要,游戏者不同的策略选择常会带来不同的游戏
结果 策略和利益有相互依存性
第10章 博弈论
10.1博弈论概述 10.2完全信息静态博弈
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马博弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作 1943年,冯·诺依曼和摩根斯顿发表《博 弈论和经济行为》的一书,
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战略 均衡”(iterated dominance equilibrium).
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多 人博弈等。最常见的是两人博弈,单人博弈 是退化的博弈
策略或战略(strategies) :博弈中各博弈方 的选择内容。
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同,而且可选策 略数量也可不同
有限博弈:每个博弈方的策略数都是有限的
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白是A的wk.baidu.com
囚徒A 占优战略
坦白
抵赖
-5,-5 0,-8
-8,0 -1,-1
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
无限博弈:至少有某些博弈方的策略有无限多个
支付函数(Payoffs function) :各博弈方从博弈 中所获得的利益。
得益对应博弈的结果,也就是各博弈方策略的组 合
得益是各博弈方追求的根本目标及行为和判断的 主要依据
根据得益的博弈分类:零和博弈、常和博弈、变 和博弈
例10.1 囚徒困境博弈
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷
基本模型
经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人 入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双 方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称“背叛”对方), 而对方保持沉默,此人将即时获释,沉默者将判监8年。 若二人都保持沉默(相关术语称互相“合作”),则二人同 样判监1年。 若二人都互相检举(互相“背叛”),则二人同样判监5年。
囚徒困境( Prisoners’Dilemma )
只达到效率很差的个体理性解,没有实现团体 理性解。 前者是稳定的,是自动实施的;尽管团体理性 解对大家都好,但它是不能自动实施的,需要改变 条件。
提示:该博弈揭示了个体理性与团体理性之间的矛 盾。——从个体利益出发的行为往往不能实现团体的 最大利益,同时也揭示了个体理性本身的内在矛盾— —从个体利益出发的行为最终也不一定能真正实现个 体的最大利益,甚至得到相当差的结果。
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
10.2 完全信息静态博弈
10.2.1 策略型博弈模型及占优战略博弈 10.2.2 重复剔除的占优战略博弈 10.2.3 纳什均衡
标志着博弈论作为一门独立科学的开始,也 标志着新古典经济学进入了一个新的发展阶 段。
3. 1994年三位获诺奖的博弈论学者
John Nash
John Harsany
Leihaden Selten
4. 1996年诺贝尔经 济学奖得主:詹姆 斯·莫里 斯:主要贡 献:不对称信息条 件下的激励理论
5. 2001年诺贝尔经济学 奖 得 主: 迈 克尔 ·斯 宾 塞:在不对称信息市场 分析方面所做出开创性
10.2.1 策略型博弈模型及占优战略博弈
非合作博弈模型从模型自身形式上可分为扩展型和 策略型两种,一般用策略型模型描述完全信息静态 博弈模型。
构成策略型博弈模型的三个要素: 局中人、策略、支付函数
参与人或局中人(Players) :独立决策、独立承 担博弈结果的个人或组织
博弈规则面前博弈方之间平等,不因博弈方 之间权利、地位的差异而改变
智猪博弈(大小猪博弈)
智猪博弈:假设猪圈里有两头猪,一头大猪,一头小猪, 猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制 猪食的供应。按一下按钮。将有10个单位的猪食进入猪食 槽,供两头猪食用。两头猪面临选择的策略有两个:自己 去按按钮或等待另一头猪去按按钮。如果某一头猪作出自 己去按按钮的选择,它必须付出如下代价:第一,它需要 收益相当于2个单位的成本;第二,由于猪食槽远离猪食, 它将比另一头猪后到猪食槽,从而减少吃食的数量。
博弈论:博弈论就是系统研究具有上述特征的博弈问 题,寻求各博弈方合理选择战略情况下博弈的解,并 对这些解进行讨论分析的理论。
博弈的分类及对应的均衡概念
完全信息
静态
完全信息静态博弈 纳什均衡
代表人物:纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
都有一定的规则 都有一个结果 策略至关重要,游戏者不同的策略选择常会带来不同的游戏
结果 策略和利益有相互依存性
第10章 博弈论
10.1博弈论概述 10.2完全信息静态博弈
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马博弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作 1943年,冯·诺依曼和摩根斯顿发表《博 弈论和经济行为》的一书,
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战略 均衡”(iterated dominance equilibrium).
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多 人博弈等。最常见的是两人博弈,单人博弈 是退化的博弈
策略或战略(strategies) :博弈中各博弈方 的选择内容。
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同,而且可选策 略数量也可不同
有限博弈:每个博弈方的策略数都是有限的
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白是A的wk.baidu.com
囚徒A 占优战略
坦白
抵赖
-5,-5 0,-8
-8,0 -1,-1
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
无限博弈:至少有某些博弈方的策略有无限多个
支付函数(Payoffs function) :各博弈方从博弈 中所获得的利益。
得益对应博弈的结果,也就是各博弈方策略的组 合
得益是各博弈方追求的根本目标及行为和判断的 主要依据
根据得益的博弈分类:零和博弈、常和博弈、变 和博弈
例10.1 囚徒困境博弈