运筹学博弈论.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无限博弈:至少有某些博弈方的策略有无限多个
支付函数(Payoffs function) :各博弈方从 博弈中所获得的利益。
得益对应博弈的结果,也就是各博弈方策略的组合
得益是各博弈方追求的根本目标及行为和判断的主 要依据
根据得益的博弈分类:零和博弈、常和博弈、变和 博弈
例10.1 囚徒困境博弈
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多 人博弈等。最常见的是两人博弈,单人博弈 是退化的博弈
策略或战略(strategies) :博弈中各博 弈方的选择内容。
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同,而且可选策 略数量也可不同
有限博弈:每个博弈方的策略数都是有限的
第10章 博弈论
10.1博弈论概述 10.2完全信息静态博弈
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马博弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年 , 冯 ·诺 依 曼 和 摩 根斯顿发表《博弈论和经 济行为》的一书,
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的 囚徒A 占优战略
抵赖
-5,-5 0,-8
-8,0 -1,-1
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷
基本模型
经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人 入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双 方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称“背叛”对方), 而对方保持沉默,此人将即时获释,沉默者将判监8年。 若二人都保持沉默(相关术语称互相“合作”),则二人同 样判监1年。 若二人都互相检举(互相“背叛”),则二人同样判监5年。
智猪博弈(大小猪博弈)
智猪博弈:假设猪圈里有两头猪,一头大猪,一头小猪, 猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制 猪食的供应。按一下按钮。将有10个单位的猪食进入猪食 槽,供两头猪食用。两头猪面临选择的策略有两个:自己 去按按钮或等待另一头猪去按按钮。如果某一头猪作出自 己去按按钮的选择,它必须付出如下代价:第一,它需要 收益相当于2个单位的成本;第二,由于猪食槽远离猪食, 它将比另一头猪后到猪食槽,从而减少吃食的数量。
标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
3. 1994年三位获诺奖的博弈论学者
John Nash
John Harsany
Leihaden Selten
4. 1996年诺贝尔经 济学奖得主:詹姆 斯·莫里 斯:主要 贡献:不对称信息 条件下的激励理论
5. 2001年诺贝尔经济 学奖得主:迈克尔 ·斯 宾塞:在不对称信息市 场分析方面所做出开创
10.2.1 策略型博弈模型及占优战略博弈
非合作博弈模型从模型自身形式上可分为扩展型和 策略型两种,一般用策略型模型描述完全信息静态 博弈模型。
构成策略型博弈模型的三个要素: 局中人、策略、支付函数
参与人或局中人(Players) :独立决策、独 立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等,不因博弈方 之间权利、地位的差异而改变
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
都有一定的规则 都有一个结果 策略至关重要,游戏者不同的策略选择常会带来不同的游戏
结果 策略和利益有相互依存性
Hale Waihona Puke Baidu 囚徒困境( Prisoners’Dilemma )
只达到效率很差的个体理性解,没有实现团体 理性解。 前者是稳定的,是自动实施的;尽管团体理性 解对大家都好,但它是不能自动实施的,需要改变 条件。
提示:该博弈揭示了个体理性与团体理性之间的矛 盾。——从个体利益出发的行为往往不能实现团体的最 大利益,同时也揭示了个体理性本身的内在矛盾——从 个体利益出发的行为最终也不一定能真正实现个体的 最大利益,甚至得到相当差的结果。
性研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
博弈论:博弈论就是系统研究具有上述特征的博弈问 题,寻求各博弈方合理选择战略情况下博弈的解,并 对这些解进行讨论分析的理论。
博弈的分类及对应的均衡概念
完全信息
静态
完全信息静态博弈 纳什均衡
代表人物:纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
10.2 完全信息静态博弈
10.2.1 策略型博弈模型及占优战略博弈 10.2.2 重复剔除的占优战略博弈 10.2.3 纳什均衡
支付函数(Payoffs function) :各博弈方从 博弈中所获得的利益。
得益对应博弈的结果,也就是各博弈方策略的组合
得益是各博弈方追求的根本目标及行为和判断的主 要依据
根据得益的博弈分类:零和博弈、常和博弈、变和 博弈
例10.1 囚徒困境博弈
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多 人博弈等。最常见的是两人博弈,单人博弈 是退化的博弈
策略或战略(strategies) :博弈中各博 弈方的选择内容。
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同,而且可选策 略数量也可不同
有限博弈:每个博弈方的策略数都是有限的
第10章 博弈论
10.1博弈论概述 10.2完全信息静态博弈
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马博弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年 , 冯 ·诺 依 曼 和 摩 根斯顿发表《博弈论和经 济行为》的一书,
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的 囚徒A 占优战略
抵赖
-5,-5 0,-8
-8,0 -1,-1
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷
基本模型
经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人 入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双 方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称“背叛”对方), 而对方保持沉默,此人将即时获释,沉默者将判监8年。 若二人都保持沉默(相关术语称互相“合作”),则二人同 样判监1年。 若二人都互相检举(互相“背叛”),则二人同样判监5年。
智猪博弈(大小猪博弈)
智猪博弈:假设猪圈里有两头猪,一头大猪,一头小猪, 猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制 猪食的供应。按一下按钮。将有10个单位的猪食进入猪食 槽,供两头猪食用。两头猪面临选择的策略有两个:自己 去按按钮或等待另一头猪去按按钮。如果某一头猪作出自 己去按按钮的选择,它必须付出如下代价:第一,它需要 收益相当于2个单位的成本;第二,由于猪食槽远离猪食, 它将比另一头猪后到猪食槽,从而减少吃食的数量。
标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
3. 1994年三位获诺奖的博弈论学者
John Nash
John Harsany
Leihaden Selten
4. 1996年诺贝尔经 济学奖得主:詹姆 斯·莫里 斯:主要 贡献:不对称信息 条件下的激励理论
5. 2001年诺贝尔经济 学奖得主:迈克尔 ·斯 宾塞:在不对称信息市 场分析方面所做出开创
10.2.1 策略型博弈模型及占优战略博弈
非合作博弈模型从模型自身形式上可分为扩展型和 策略型两种,一般用策略型模型描述完全信息静态 博弈模型。
构成策略型博弈模型的三个要素: 局中人、策略、支付函数
参与人或局中人(Players) :独立决策、独 立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等,不因博弈方 之间权利、地位的差异而改变
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
都有一定的规则 都有一个结果 策略至关重要,游戏者不同的策略选择常会带来不同的游戏
结果 策略和利益有相互依存性
Hale Waihona Puke Baidu 囚徒困境( Prisoners’Dilemma )
只达到效率很差的个体理性解,没有实现团体 理性解。 前者是稳定的,是自动实施的;尽管团体理性 解对大家都好,但它是不能自动实施的,需要改变 条件。
提示:该博弈揭示了个体理性与团体理性之间的矛 盾。——从个体利益出发的行为往往不能实现团体的最 大利益,同时也揭示了个体理性本身的内在矛盾——从 个体利益出发的行为最终也不一定能真正实现个体的 最大利益,甚至得到相当差的结果。
性研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
博弈论:博弈论就是系统研究具有上述特征的博弈问 题,寻求各博弈方合理选择战略情况下博弈的解,并 对这些解进行讨论分析的理论。
博弈的分类及对应的均衡概念
完全信息
静态
完全信息静态博弈 纳什均衡
代表人物:纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
10.2 完全信息静态博弈
10.2.1 策略型博弈模型及占优战略博弈 10.2.2 重复剔除的占优战略博弈 10.2.3 纳什均衡