高级运筹学-博弈论精品PPT课件
合集下载
博弈论PPT课件
有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
运筹学博弈论
代表人物:纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
精品
智猪博弈(大小猪博弈)
精品
5. 2001年诺贝尔经济 学奖得主:迈克尔 ·斯 宾塞:在不对称信息市 场分析方面所做出开创 性研究。
精品
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
精品
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
精品
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
精品
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
精品
智猪博弈(大小猪博弈)
精品
5. 2001年诺贝尔经济 学奖得主:迈克尔 ·斯 宾塞:在不对称信息市 场分析方面所做出开创 性研究。
精品
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
精品
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
精品
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
精品
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
博弈论最全完整-讲解PPT课件
王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
.
32
导论
四、主要参考文献
.
33
张维迎著,《博弈论与信息经济学》,上海三联书店、 上海人民出版社,1996年版。
Roger B. Myerson著:Game Theory(原文版、译文 版),中国经济出版社,2001年版。
是关于动态博弈进行过程之中面临决策 或者行动的参与人对于博弈进行迄今的 历史是否清楚的一种刻划。
如果在博弈进行过程中的每一时刻,面 临决策或者行动的参与人,对于博弈进 行到这个时刻为止所有参与人曾经采取 的决策或者行动完全清楚,则称为完美 信息博弈;否则位不完美信息。
.
30
零和博弈与非零和博弈
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
.
4
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗?
对手和你一样聪明! 许多博弈相当复杂,博弈论并不
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。
博弈论PPT课件
第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······
运筹学博弈论 PPT
性研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的 囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒困境( Prisoners’Dilemma )
运筹学博弈论
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年 , 冯 ·诺 依 曼 和 摩 根斯顿发表《博弈论和经 济行为》的一书,
标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的 囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒困境( Prisoners’Dilemma )
运筹学博弈论
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年 , 冯 ·诺 依 曼 和 摩 根斯顿发表《博弈论和经 济行为》的一书,
标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
第九章 运筹学博弈论 ppt课件
则。
1988年 法国人莫里斯-阿莱斯(Maurice Allais)
获奖理由:在市场理论及资源有效利用方面做出了
开创性贡献,并对一般均衡理论重新做了系统阐述。
1987年 美国人罗伯特-索洛(Robert M. Solow)
获奖理由:对增长理论做出贡献。提出长期的经济
增长主要依靠技术进步,而不是依靠资本和劳动力的
获奖理由:对不同汇率体制下的货币和财政政策以及最
优货币区域的分析做出了伟大贡ppt献课件。
8
1998年 印度籍经济学家阿马蒂亚-森(Amartya Sen) 获奖理由:对福利经济学以及发展经济学做出了突破
性贡献。 1997年 美国经济学家迈伦-斯科尔斯(Myron S.
Scholes)和罗伯特-默顿(Robert C. Merton) 获奖理由:前者给出了著名的布莱克-斯科尔斯期权
获奖理由:在动态宏观经济学方面做出了
巨大贡献。 2003年 美国经济学家罗伯特-恩格尔
(Robert F. Engle III)和英国经济学家克莱夫格兰杰(Clive W.J. Granger)
获奖理由:在经济时间数列中运用了统计
学的方法。
ppt课件
7
2002年 美国学者丹尼尔-卡尼曼(Daniel Kahneman)和弗农-
ppt课件
4
在国外,1912年E.Zermelo用集合论研究过下棋 问题,四十年代由于生产和战争的需要,博弈理 论得到了发展,系统博弈理论的形成则以1944 年V.Neumann,O.Morgensten合著的《博弈论 和经济行为》一书为标志.1994年瑞士皇家科 学院决定将诺贝尔经济学奖授予纳什(Nash),哈 萨尼(Harsanyi)和泽尔腾(Selten)三人,表彰他们 在博弈理论和应用研究方面作出的杰出贡献. 目前,博弈论在定价,招投标,拍卖,委托代理以及 很多重要的经营决策中得到应用,它已成为现代 经济学的重要基础.
高等运筹对策论.ppt (恢复)
第三章 对策论(博弈论)
第一节 对策现象与对策论
国人自古喜博弈,你来我往较智力;古有齐王和田忌,赛马输去一千金; 纳什当今论均衡,阐明齐王为何笨;从此发展博弈论,用于经济和管理。
2
最近 20 年来,经济学经历了一场博弈论革命。 1994 年度的诺贝尔经济学奖授予三位博弈论专家——纳 什(Nash),泽尔滕(Selten)和海萨尼(Harsanyi)。 这是博弈论成为现代经济学重要内容的一个标志。 经典意义上的经济学,以经济主体人的自利行为及 相应的市场反应为研究的出发点。无论是消费者还是生 产者,也无论是竞争形式还是垄断形式,基本上是经济 主体人面对市场作出自己的最优决策。形势严峻也好宽 松也好,行为的结果是主体人自己决策的结果。
12
假定两个企业都采取比较低的价格,可以各得利润 30 亿;都 采取比较高的价格各得利润 50 亿;而一家采取比较低的价格而另 一家采取比较高的价格时,那么低价格的一家因多销而利润为 60 亿,而高价格的一家因滞销而利润为 20 亿。究竟是采用较低的价 格好还是采用较高的价格好呢?他们面临着一场博弈或对策……
11
价格大战和双赢对局 我们来看两个企业“价格大战”的例子。 两个企业垄断或几乎垄断了某种商品的市场,他们 都想打垮对手,争取更大的利润。可口可乐公司和百事 可乐公司,几乎垄断了美国碳酸饮料的市场,他们之间 的争斗,就是这个样子。争斗的目的,当然是想增加自 己企业的利润。如何制定自己的价格呢?是高价?还是 低价? 这里,要紧的因素是市场份额……
15
博弈论主要研究非合作的博弈。这有两方面的原因。 从经济的角度看,为谋求最大利益而结成联盟——“卡特尔”, 然而卡特尔行为的本身就提供了瓦解卡特尔的激励。在人类的经济 活动中,除了OPEC以外,成功的例子实在很少。 从政府管制的角度看…… 发达国家对垄断现象和卡特尔现象的限制往往更加严厉……
第一节 对策现象与对策论
国人自古喜博弈,你来我往较智力;古有齐王和田忌,赛马输去一千金; 纳什当今论均衡,阐明齐王为何笨;从此发展博弈论,用于经济和管理。
2
最近 20 年来,经济学经历了一场博弈论革命。 1994 年度的诺贝尔经济学奖授予三位博弈论专家——纳 什(Nash),泽尔滕(Selten)和海萨尼(Harsanyi)。 这是博弈论成为现代经济学重要内容的一个标志。 经典意义上的经济学,以经济主体人的自利行为及 相应的市场反应为研究的出发点。无论是消费者还是生 产者,也无论是竞争形式还是垄断形式,基本上是经济 主体人面对市场作出自己的最优决策。形势严峻也好宽 松也好,行为的结果是主体人自己决策的结果。
12
假定两个企业都采取比较低的价格,可以各得利润 30 亿;都 采取比较高的价格各得利润 50 亿;而一家采取比较低的价格而另 一家采取比较高的价格时,那么低价格的一家因多销而利润为 60 亿,而高价格的一家因滞销而利润为 20 亿。究竟是采用较低的价 格好还是采用较高的价格好呢?他们面临着一场博弈或对策……
11
价格大战和双赢对局 我们来看两个企业“价格大战”的例子。 两个企业垄断或几乎垄断了某种商品的市场,他们 都想打垮对手,争取更大的利润。可口可乐公司和百事 可乐公司,几乎垄断了美国碳酸饮料的市场,他们之间 的争斗,就是这个样子。争斗的目的,当然是想增加自 己企业的利润。如何制定自己的价格呢?是高价?还是 低价? 这里,要紧的因素是市场份额……
15
博弈论主要研究非合作的博弈。这有两方面的原因。 从经济的角度看,为谋求最大利益而结成联盟——“卡特尔”, 然而卡特尔行为的本身就提供了瓦解卡特尔的激励。在人类的经济 活动中,除了OPEC以外,成功的例子实在很少。 从政府管制的角度看…… 发达国家对垄断现象和卡特尔现象的限制往往更加严厉……
交通运筹学ppt-第10章博弈论
*** 博弈的结构和分类
• (1)根据参与方的数量可以分为单人博弈、两人博弈、多人博 弈;
• (2)根据博弈中所选择策略的数量可以分为有限博弈和无限博 弈;
• (3)根据得失函数的情况可以分为零和博弈、常和博弈及变和 博弈;
• (4)根据博弈过程可以分为静态博弈、动态博弈和重复博弈; • (5)根据信息结构可以分为完全信息博弈和不完全信息博弈,
• 这两条性质表明:矩阵博弈的值是惟一的, 即当一个局中人选择了最优纯策略后,他 的赢得值不依赖于对方的纯策略。
• *** 矩阵博弈的混合策略
• 矩阵博弈的求解方法 • 1、线性规划法 • 2.基于优超原则的解法
【例10.8】两个局中人进行博弈,规则是两人互相独立地各自 从1、2、3这三个数字中任意选写一个数字,如果两人所写的 数字之和为偶数,则局中人Ⅱ付给局中人Ⅰ以数量为此和数的 报酬;如果两人所写数字之和为奇数,则局中人Ⅰ付给局中人 Ⅱ以数量为此和数的报酬,试求出其最优策略。
• 求解矩阵博弈的最优纯策略的假设如下: • (1)每个局中人对双方拥有的全部策略及当
各自采取某一策略时的相互损失有充分了解; • (2)对策的双方是理智的,他们参与对策的
目的是力图扩大自己的收益,因而总是采取对 自己有利的策略; • (3)双方在相互保密的情况下选择自己的策 略,并不允许存在任何协议。 • 下面用一个例子来分析各局中人应如何选择最 有利策略。
第10章 博弈论
• 博弈论基本概念 • 博弈的结构和分类 • 有限二人零和博弈 • 数学定义 • 矩阵博弈的纯策略 • 矩阵博弈的混合策略
*** 博弈论基本概念
• 一般博弈模型包含三个基本要素。 • (1)局中人(players) • (2)策略集(strategies) • (3)得益函数(payoffs)
《运筹学》课件 第六章 博弈论
§1 基本概念
一、博弈论的定义 二、博弈理论的历史 三、博弈问题举例 四、博弈的分类
三、
1. 囚犯困境(Prisoners’ dilemma
囚犯困境是图克(Tucker)1950年提出的; 该博弈是博奕论最经典、著名的博弈; 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷。
所有局中人的策略组成的向量。)
s (s1,, si,, sn ) 表示n个局中人达成的
一个协议,当这个协议可以自动实施(Self-enforcing) 时,即没有任何局中人有积极性破坏这个协议,那么 这个协议就构成纳什均衡。
否则,若至少存在某些局中人有积极性偏离这个协 议,就构不成纳什均衡。
例:囚犯困境问题:
但是,尽管政府当时无力制止这种事情,公众也不 必担心彩电价格会上涨。这是因为,“彩电厂商自 律联盟”只不过是一种“囚徒困境”,彩电价格不 会上涨。在高峰会议之后不到二周,国内彩电价格 不是上涨而是一路下跌。这是因为厂商们都有这样 一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。
Ⅱ
坦白 抵赖
坦白
Ⅰ
-9,-9
0,-10
抵赖 -10,0 -1,-1
均衡解: 二人均坦白
相关概念介绍
➢博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
坦白 抵赖
➢ 博弈问题的基本要素 (1)局中人(Players)
现代博弈论主要指非合作博弈理论。非合作博弈 更受重视的原因:主导人们行为的主要还是个体理性, 而非集体理性;即,竞争是一切社会、经济关系的根 本基础,不合作是基本的,合作是有条件和暂时的。
高级运筹学(
第Biblioteka 章 博弈论 (对策论)第一节
1.1 博弈行为和博弈论
在日常生活中,经常会看到一些相互之间具有斗争或竞争性质的行为。譬如,两个人下 棋,任何一个人在走某一步之前,都需要考虑对方是怎么走的,以及对方在他走了一步之后 会怎么走, 以至无穷。 高手与俗手的区别往往就在于高手能够考虑 10 步甚至 20 步以后的变 化,最终的输赢不仅取决于你的决策,而且取决于你对手的决策,这就是博弈。博弈与决策 的根本区别在于是否考虑对方的行为, 具有竞争或对抗性质的行为称为博弈行为。 在这类行 为中,参加斗争或竞争的各方各自具有不同的目标和利益。为了达到各自的目标和利益,各 方必须考虑对手的各种可能的行动方案, 并力图选取对自己最有利或最合理的方案。 比如战 争活动中的双方,都力图选取对自己最有利的策略,千方百计去战胜对方;还比如在政治方 面,国际间的谈判、各种政治力量间的较量、各国际集团之间的角逐等都无一不具有对抗性 质;在经济活动中,各国之间、各公司企业之间的经济谈判,企业之间为争夺市场而进行的 竞争等,举不胜举。 博弈论(game theory),就是研究决策主体的行为发生直接相互作用时候的决策以及这种 决策的均衡问题的理论与方法, 即研究博弈行为中竞争各方是否存在着最合理行动方案, 以 及如何找到最合理行动方案的数学理论和方法。也就是说,当一个主体,好比说一个人或一 个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择 时的决策问题和均衡问题。 博弈论应是一种分析问题的方法, 它被设计用来帮助我们理解所观察到的决策主体相互 作用时的现象,其应用范围涉及经济学、政治学、犯罪学、军事、外交、国际关系、公共选 择等各个领域。博弈论思想的主要特征是各参与人所实施的行为方案(策略)相互依存,各方 在冲突或合作后所实现的损益得失结果不仅取决于自己所采取的行为方案, 同时也依赖于其 他参与方所实施的行为方案,是各参与方行为方案组合的函数。所以,博弈 论在我国也被称 为“对策论”。
1.1 博弈行为和博弈论
在日常生活中,经常会看到一些相互之间具有斗争或竞争性质的行为。譬如,两个人下 棋,任何一个人在走某一步之前,都需要考虑对方是怎么走的,以及对方在他走了一步之后 会怎么走, 以至无穷。 高手与俗手的区别往往就在于高手能够考虑 10 步甚至 20 步以后的变 化,最终的输赢不仅取决于你的决策,而且取决于你对手的决策,这就是博弈。博弈与决策 的根本区别在于是否考虑对方的行为, 具有竞争或对抗性质的行为称为博弈行为。 在这类行 为中,参加斗争或竞争的各方各自具有不同的目标和利益。为了达到各自的目标和利益,各 方必须考虑对手的各种可能的行动方案, 并力图选取对自己最有利或最合理的方案。 比如战 争活动中的双方,都力图选取对自己最有利的策略,千方百计去战胜对方;还比如在政治方 面,国际间的谈判、各种政治力量间的较量、各国际集团之间的角逐等都无一不具有对抗性 质;在经济活动中,各国之间、各公司企业之间的经济谈判,企业之间为争夺市场而进行的 竞争等,举不胜举。 博弈论(game theory),就是研究决策主体的行为发生直接相互作用时候的决策以及这种 决策的均衡问题的理论与方法, 即研究博弈行为中竞争各方是否存在着最合理行动方案, 以 及如何找到最合理行动方案的数学理论和方法。也就是说,当一个主体,好比说一个人或一 个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择 时的决策问题和均衡问题。 博弈论应是一种分析问题的方法, 它被设计用来帮助我们理解所观察到的决策主体相互 作用时的现象,其应用范围涉及经济学、政治学、犯罪学、军事、外交、国际关系、公共选 择等各个领域。博弈论思想的主要特征是各参与人所实施的行为方案(策略)相互依存,各方 在冲突或合作后所实现的损益得失结果不仅取决于自己所采取的行为方案, 同时也依赖于其 他参与方所实施的行为方案,是各参与方行为方案组合的函数。所以,博弈 论在我国也被称 为“对策论”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
囚徒困境反映了个人理性和集体理性的矛盾。 如果A和B都选择抵赖,各判刑1年,显然比 都选择坦白各判刑8年好得多。当然,A和B 可以在被警察抓到之前订立一个"攻守同盟", 但是这可能不会有用,因为它不构成纳什均衡 ,没有人有积极性遵守这个协定,显然最好的策 略是双方都抵赖.
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意 义。个人理性与集体理性的冲突,各人追 求利己行为而导致的最终结局是一个“纳 什均衡”,也是对所有人都不利的结局。 他们两人都是在坦白与抵赖策略上首先想 到自己,这样他们必然要服长的刑期。只 有当他们都首先替对方着想时,或者相互 合谋(串供)时,才可以得到最短时间的监 禁的结果。
Prisoner’s Dilemma
囚徒困境的例子
A. W. Tucker的囚犯困境(Prisoner‘s Dilemma):
囚徒B
坦白
抵赖
坦白 -8,-8 0 ,-10
囚徒A
抵赖 -10坦白、坦白)这个组合中,两囚徒A和B 都不能通过单方面的改变行动增加自己的收益 ,于是谁也没有动力游离这个组合,因此这个 组合是纳什均衡,也叫非合作均衡。
石油输出国 OPEC
几乎所有的卡特尔都会遭到失败,原因 就在于卡特尔的协定(类似囚犯的攻守 同盟)不是一个纳什均衡,没有成员有 兴趣遵守。那么是不是不可能有卡特尔 合作成功了?
理论上,如果是无限期的合作,双方考 虑长远利益,他们的合作是会成功的。 但只要是有限次的合作,合作就不会成 功。比如合作10次,那么在第九次博 弈参与人就会采取不合作态度。
博 弈 论
决策无处不在
工作,即便只是社交生活,也可以看做是一 个永无止息的决策过程; 通常人们的决策面临两种决策环境:比较伐 木工人和一个将军的决策会有什么区别:
– 伐木工人的工作环境是中立的,没有对抗; – 而将军的任何一种行动都会遭遇对手的抵抗;
研究前者的方法是决策论 研究后者的是博弈论
GAMES
对经典经济学的冲击
在新古典经济学理论中,理性地进行选择就是要 最大化自身的收益。在某种观点看来,这是一个 数学问题:在给定环境条件下选择最大化报酬的 行动。因而我们可以把理性的经济选择当作一个 数学问题的“解”。
在博弈论中,情况就更复杂了。既然结局不仅依
赖于自身的战略和“市场”条件,也直接依赖于 其他人所选择的战略,但我们仍然可以把理性的
对经典经济学的冲击
“纳什均衡”首先对亚当·斯密的“看不见的手 ”的原理提出挑战。按照斯密的理论,在市场 经济中,每一个人都从利己的目的出发,而最 终全社会达到利他的效果。
《国富论》:“通过追求(个人的)自身利益, 他常常会比其实际上想做的那样更有效地促进 社会利益。”
从“纳什均衡”我们引出了“看不见的手”的 原理的一个悖论:从利己目的出发,结果损人 不利己,既不利己也不利他。两个囚徒的命运 就是如此。从这个意义上说,“纳什均衡”提 出的悖论实际上动摇了西方经济学的基石。
光天化日之下的违法
在现实社会中,窃贼在公共场所比如公共 汽车上偷东西时,车上的乘客看到了,但 不敢吭声。没有被偷的人想,反正被偷的 待宰猴群的结局人不是我,我反抗了,我 得不到任何好处,反而遭到伤害;而不反 抗虽不得益,但也不受损,我何必要反抗 呢?这就是光天化日之下的偷窃行为为什 么总能成功的原因。
待宰的猴群
在一个笼子里关了一群猴子,主人每过一天就 打开笼子抓一只猴子去杀掉。每天主人来时, 每个猴子都紧张,它们不敢有任何举动,怕引 起主人的注意而被主人选中。当主人把目光落 在其中一只猴子身上时,其余的猴子就希望主 人赶快决定。当主人最终作出决定时,没有被 选中的猴子非常高兴。那个被选中的猴子拼命 反抗,其余猴子在一旁幸灾乐祸地观看,这只 猴子被杀掉了。这样的过程日复一日地进行着 ,最终猴子全部被宰杀掉了。
现实中的囚徒困境
“合作与社会两难困境研讨会”上的游戏:
–主持人拿来一只大信封,请在场的43位专家拿 出钱放入信封:
–如果到最后这个信封里的钱超过250元,则主持 人自掏腰包给每人10元;
–如果最后信封里的钱总数不超过250元,就统统 没收.
–到最后245.59
我国应试教育的困境
在现有的教育体制下,学生(或学生家长)有两个 可选择的策略:“减负”和“增负”。学生的精力 是有限的,如果选择“减负”策略,意味着学生有 更多的时间学习课本以外的东西,这样学生的素质 得到提高,因此,“减负”策略往往与素质教育联 系在一起;而如果选择“增负”策略,则意味着学 生花大量的时间做大量的习题,以“学透”、“学 精”课本规定的东西,此时,学生没有时间学习课 本以外的没有规定的内容。“减负”的结果是学生 的全面发展;而“增负”的结果是学生获得高的分 数。
战略选择当作一个数学问题——最大化行为互动 中的决策制定者群体的报酬——从而我们再次称 理性的结果是博弈的“解”。
博弈论的历史沿革
中国古代田忌赛马;
Cournot的寡头竞争模型 博 弈 理 论 开 始 于 1 9 4 4 年 由 冯 ·诺 依 曼 ( Von
军备竞赛
国与国之间的外交行为是地地道道的博 弈行为,而战争是一种特殊的博弈。 每年各国用于军备开支是一笔不小的数 目。
价格大战
厂家价格大战的结局也是一个“纳 什均衡”,而且价格战的结果是谁 都没钱赚。因为博弈双方的利润正 好是零。竞争的结果是稳定的,即 是一个“纳什均衡”。这个结果可 能对消费者是有利的,但对厂商而 言是灾难性的。所以,价格战对厂 商而言意味着自杀。
公共资源悲剧
哈丁(Garrit Hadin)1968年在《科学》杂志上发 表了一篇文章,题为The Tragedy of the Commons 。
哈丁举了这样一个具体事例:一群牧民面对向他 们开放的草地,每一个牧民都想多养一头牛,因 为多养一头牛增加的收益大于其购养成本,是合 算的,尽管因平均草量下降,可能使整个牧区的 牛的单位收益下降。每个牧民都可能多增加一头 牛,草地将可能被过度放牧,从而不能满足牛的 食量,致使所有牧民的牛均饿死。这就是公共资 源的悲剧。
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意 义。个人理性与集体理性的冲突,各人追 求利己行为而导致的最终结局是一个“纳 什均衡”,也是对所有人都不利的结局。 他们两人都是在坦白与抵赖策略上首先想 到自己,这样他们必然要服长的刑期。只 有当他们都首先替对方着想时,或者相互 合谋(串供)时,才可以得到最短时间的监 禁的结果。
Prisoner’s Dilemma
囚徒困境的例子
A. W. Tucker的囚犯困境(Prisoner‘s Dilemma):
囚徒B
坦白
抵赖
坦白 -8,-8 0 ,-10
囚徒A
抵赖 -10坦白、坦白)这个组合中,两囚徒A和B 都不能通过单方面的改变行动增加自己的收益 ,于是谁也没有动力游离这个组合,因此这个 组合是纳什均衡,也叫非合作均衡。
石油输出国 OPEC
几乎所有的卡特尔都会遭到失败,原因 就在于卡特尔的协定(类似囚犯的攻守 同盟)不是一个纳什均衡,没有成员有 兴趣遵守。那么是不是不可能有卡特尔 合作成功了?
理论上,如果是无限期的合作,双方考 虑长远利益,他们的合作是会成功的。 但只要是有限次的合作,合作就不会成 功。比如合作10次,那么在第九次博 弈参与人就会采取不合作态度。
博 弈 论
决策无处不在
工作,即便只是社交生活,也可以看做是一 个永无止息的决策过程; 通常人们的决策面临两种决策环境:比较伐 木工人和一个将军的决策会有什么区别:
– 伐木工人的工作环境是中立的,没有对抗; – 而将军的任何一种行动都会遭遇对手的抵抗;
研究前者的方法是决策论 研究后者的是博弈论
GAMES
对经典经济学的冲击
在新古典经济学理论中,理性地进行选择就是要 最大化自身的收益。在某种观点看来,这是一个 数学问题:在给定环境条件下选择最大化报酬的 行动。因而我们可以把理性的经济选择当作一个 数学问题的“解”。
在博弈论中,情况就更复杂了。既然结局不仅依
赖于自身的战略和“市场”条件,也直接依赖于 其他人所选择的战略,但我们仍然可以把理性的
对经典经济学的冲击
“纳什均衡”首先对亚当·斯密的“看不见的手 ”的原理提出挑战。按照斯密的理论,在市场 经济中,每一个人都从利己的目的出发,而最 终全社会达到利他的效果。
《国富论》:“通过追求(个人的)自身利益, 他常常会比其实际上想做的那样更有效地促进 社会利益。”
从“纳什均衡”我们引出了“看不见的手”的 原理的一个悖论:从利己目的出发,结果损人 不利己,既不利己也不利他。两个囚徒的命运 就是如此。从这个意义上说,“纳什均衡”提 出的悖论实际上动摇了西方经济学的基石。
光天化日之下的违法
在现实社会中,窃贼在公共场所比如公共 汽车上偷东西时,车上的乘客看到了,但 不敢吭声。没有被偷的人想,反正被偷的 待宰猴群的结局人不是我,我反抗了,我 得不到任何好处,反而遭到伤害;而不反 抗虽不得益,但也不受损,我何必要反抗 呢?这就是光天化日之下的偷窃行为为什 么总能成功的原因。
待宰的猴群
在一个笼子里关了一群猴子,主人每过一天就 打开笼子抓一只猴子去杀掉。每天主人来时, 每个猴子都紧张,它们不敢有任何举动,怕引 起主人的注意而被主人选中。当主人把目光落 在其中一只猴子身上时,其余的猴子就希望主 人赶快决定。当主人最终作出决定时,没有被 选中的猴子非常高兴。那个被选中的猴子拼命 反抗,其余猴子在一旁幸灾乐祸地观看,这只 猴子被杀掉了。这样的过程日复一日地进行着 ,最终猴子全部被宰杀掉了。
现实中的囚徒困境
“合作与社会两难困境研讨会”上的游戏:
–主持人拿来一只大信封,请在场的43位专家拿 出钱放入信封:
–如果到最后这个信封里的钱超过250元,则主持 人自掏腰包给每人10元;
–如果最后信封里的钱总数不超过250元,就统统 没收.
–到最后245.59
我国应试教育的困境
在现有的教育体制下,学生(或学生家长)有两个 可选择的策略:“减负”和“增负”。学生的精力 是有限的,如果选择“减负”策略,意味着学生有 更多的时间学习课本以外的东西,这样学生的素质 得到提高,因此,“减负”策略往往与素质教育联 系在一起;而如果选择“增负”策略,则意味着学 生花大量的时间做大量的习题,以“学透”、“学 精”课本规定的东西,此时,学生没有时间学习课 本以外的没有规定的内容。“减负”的结果是学生 的全面发展;而“增负”的结果是学生获得高的分 数。
战略选择当作一个数学问题——最大化行为互动 中的决策制定者群体的报酬——从而我们再次称 理性的结果是博弈的“解”。
博弈论的历史沿革
中国古代田忌赛马;
Cournot的寡头竞争模型 博 弈 理 论 开 始 于 1 9 4 4 年 由 冯 ·诺 依 曼 ( Von
军备竞赛
国与国之间的外交行为是地地道道的博 弈行为,而战争是一种特殊的博弈。 每年各国用于军备开支是一笔不小的数 目。
价格大战
厂家价格大战的结局也是一个“纳 什均衡”,而且价格战的结果是谁 都没钱赚。因为博弈双方的利润正 好是零。竞争的结果是稳定的,即 是一个“纳什均衡”。这个结果可 能对消费者是有利的,但对厂商而 言是灾难性的。所以,价格战对厂 商而言意味着自杀。
公共资源悲剧
哈丁(Garrit Hadin)1968年在《科学》杂志上发 表了一篇文章,题为The Tragedy of the Commons 。
哈丁举了这样一个具体事例:一群牧民面对向他 们开放的草地,每一个牧民都想多养一头牛,因 为多养一头牛增加的收益大于其购养成本,是合 算的,尽管因平均草量下降,可能使整个牧区的 牛的单位收益下降。每个牧民都可能多增加一头 牛,草地将可能被过度放牧,从而不能满足牛的 食量,致使所有牧民的牛均饿死。这就是公共资 源的悲剧。