博弈论分析视角26页PPT
合集下载
博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
博弈论及经典案例简介PPT课件
⑶ 上策均衡是纳什均衡的一种特殊情况,但纳什均 衡却不一定是上策均衡。
-
纳什均衡的意义
21
纳什均衡是指在对手策略既定的情况下,各自对局者所选择 的策略都是最好的。 合作是有利的“利己策略”。但它必须符合以下黄金律: 按照你愿意别人对你的方式来对别人,但只有他们也按同 样方式行事才行。也就是中国人说的“己所不欲勿施于 人”。但前提是人所不欲勿施于我。
– 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的 行为都必须考虑到对方可能作出的反映。
-
博弈论研究对象 10
博弈论是研究理性的决策主体在其行为发生直接的相 互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大收益的策略)。
论和经济行为”,推动了博弈论在经济管理中的应 用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔 经济学奖(1994),进一步推动了博弈论的研究。
-
博弈论的产生和发展 12
1. 博弈在中国
-
《学弈》(《孟子•告 子》) :弈秋,通国之善 弈也。使弈秋侮二人弈, 其一人专心致志,惟弈秋 之为听;一人虽听之,一 心以为有鸿鹄将至,思援 弓缴而射之。虽与之俱学, 弗若之矣。为是其智弗若 与?吾曰:非然也。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中 非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作 博弈理论的重大发展,甚至可以说是一场革命。
-
故事模型
A、B、C三人决斗,每人有2颗子弹,每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射,两轮后对决结束。
13
博弈又称博戏,是一门古老的游戏。《世 本》说,“乌曹作博”,乌曹乃是夏代著 名之能工巧匠。千百年来,博弈更是与人 们的生活紧紧相连,从博棋到牌戏,从斗 戏到彩票,中华民族的历史长河中就这样 形成了别具风情的博弈文化
-
纳什均衡的意义
21
纳什均衡是指在对手策略既定的情况下,各自对局者所选择 的策略都是最好的。 合作是有利的“利己策略”。但它必须符合以下黄金律: 按照你愿意别人对你的方式来对别人,但只有他们也按同 样方式行事才行。也就是中国人说的“己所不欲勿施于 人”。但前提是人所不欲勿施于我。
– 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的 行为都必须考虑到对方可能作出的反映。
-
博弈论研究对象 10
博弈论是研究理性的决策主体在其行为发生直接的相 互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大收益的策略)。
论和经济行为”,推动了博弈论在经济管理中的应 用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔 经济学奖(1994),进一步推动了博弈论的研究。
-
博弈论的产生和发展 12
1. 博弈在中国
-
《学弈》(《孟子•告 子》) :弈秋,通国之善 弈也。使弈秋侮二人弈, 其一人专心致志,惟弈秋 之为听;一人虽听之,一 心以为有鸿鹄将至,思援 弓缴而射之。虽与之俱学, 弗若之矣。为是其智弗若 与?吾曰:非然也。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中 非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作 博弈理论的重大发展,甚至可以说是一场革命。
-
故事模型
A、B、C三人决斗,每人有2颗子弹,每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射,两轮后对决结束。
13
博弈又称博戏,是一门古老的游戏。《世 本》说,“乌曹作博”,乌曹乃是夏代著 名之能工巧匠。千百年来,博弈更是与人 们的生活紧紧相连,从博棋到牌戏,从斗 戏到彩票,中华民族的历史长河中就这样 形成了别具风情的博弈文化
博弈论讲义共125页PPT
13
3、信息(Information):信息是参与人有关博 弈的知识,特别是有关自然的选择、其他参与 人的特征和行动的知识。
完全信息:每一个参与人对所有其他参与人 (包括自然)的特征、策略空间及支付函数有 准确的知识。否则,就是不完全信息。
共同知识:指的是所有参与人知道,而且所 有参与人知道所有参与人知道……的知识。 共同知识是一个非常强的假定。
案例
房地产开发项目-假设有A、B两家开发商 市场需求:可能大,也可能小 投入:1亿
❖假定市场上有两栋楼出售: ✓需求大时,每栋售价1.4亿, ✓需求小时,售价7千万; ❖如果市场上只有一栋楼 ✓需求大时,可卖1.8亿 ✓需求小时,可卖1.1亿
一 、博弈的基本概念及策略表述
博弈论的基本概念包括:
如果另一个犯罪嫌疑人也作了坦白,则两人 各被判刑8年;如果另一个犯罪嫌人没有坦 白而是抵赖,则以妨碍公务罪(因已有证据 表明其有罪)再加刑2年,而坦白者有功被 减刑8年,立即释放。如果两人都抵赖,则 警方因证据不足不能判两人的偷窃罪,但可 以私入民宅的罪名将两人各判入狱1年。
如何描述这个博弈? 他们将如何选择?
用博弈规则决定均衡。
1、参与人(Players):在博弈中独立决策、 独立承担博弈结果的个人或组织。也称局中 人。参与人的目的是通过选择行动或策略( 策略)以最大化自己的支付(效用)水平。 特殊的虚拟参与人-自然,其实质是决定 外生的环境参数的概率分布的一种机制。 i=1, ……, n代表参与人;N代表自然。
一 、博弈的基本概念及策略表述
博弈的策略式表述:
战略式表述给出: 1、博弈的参与人集合i:, (1,2,,n); 2、每个参与人的战略间空:Si,i 1,2,,n; 3、每个参与人的支付数函:ui (s1,, si,, sn),i 1,2,,n)
3、信息(Information):信息是参与人有关博 弈的知识,特别是有关自然的选择、其他参与 人的特征和行动的知识。
完全信息:每一个参与人对所有其他参与人 (包括自然)的特征、策略空间及支付函数有 准确的知识。否则,就是不完全信息。
共同知识:指的是所有参与人知道,而且所 有参与人知道所有参与人知道……的知识。 共同知识是一个非常强的假定。
案例
房地产开发项目-假设有A、B两家开发商 市场需求:可能大,也可能小 投入:1亿
❖假定市场上有两栋楼出售: ✓需求大时,每栋售价1.4亿, ✓需求小时,售价7千万; ❖如果市场上只有一栋楼 ✓需求大时,可卖1.8亿 ✓需求小时,可卖1.1亿
一 、博弈的基本概念及策略表述
博弈论的基本概念包括:
如果另一个犯罪嫌疑人也作了坦白,则两人 各被判刑8年;如果另一个犯罪嫌人没有坦 白而是抵赖,则以妨碍公务罪(因已有证据 表明其有罪)再加刑2年,而坦白者有功被 减刑8年,立即释放。如果两人都抵赖,则 警方因证据不足不能判两人的偷窃罪,但可 以私入民宅的罪名将两人各判入狱1年。
如何描述这个博弈? 他们将如何选择?
用博弈规则决定均衡。
1、参与人(Players):在博弈中独立决策、 独立承担博弈结果的个人或组织。也称局中 人。参与人的目的是通过选择行动或策略( 策略)以最大化自己的支付(效用)水平。 特殊的虚拟参与人-自然,其实质是决定 外生的环境参数的概率分布的一种机制。 i=1, ……, n代表参与人;N代表自然。
一 、博弈的基本概念及策略表述
博弈的策略式表述:
战略式表述给出: 1、博弈的参与人集合i:, (1,2,,n); 2、每个参与人的战略间空:Si,i 1,2,,n; 3、每个参与人的支付数函:ui (s1,, si,, sn),i 1,2,,n)
博弈论讲义完整PPT课件
• 两个寡头企业选择产量的博弈:
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
博弈论PPT课件
第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······
博弈论ppt课件
15
➢ 扩展术语:
信息:信息集; 完全信息(complete); 完美信息(perfect)。
共同知识:双方可能获取的相同信息; 彼此都能算清楚。
博弈结果:均衡策略组合;均衡行动组合。 均衡:所有局中人最优策略的组合。
博弈论2009
精选ppt课件
16
3. 博弈描述
➢博弈的策略型(标准型、正则型)表述:
33
博弈论2009Leabharlann 精选ppt课件34
毕业后先后在兰德研究所、普林斯顿大 学、MIT工作。
1957年他与MIT学生爱莉西娅结婚。
在而立之年患上了妄想型精神分裂症,九 十年代逐渐恢复了正常。
1994年纳什博士获诺贝尔经济学奖。
2002年来北京参加 “国际数学家大会”
博弈论2009
精选ppt课件
35
博弈论2009
则,不开发。(?)
博弈论2009
精选ppt课件
22
关键问题: 对自然状态的概率估计; 不同时间决策(决策顺序); 对对方先验信息的估计(即估计对方对信
息的掌握程度)。
现实困难: 对市场了解程度不同; 对对方了解程度不同; 如何向对方暗示自己的行动。
博弈论2009
精选ppt课件
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
乙 甲
理性的人是自私自利的; 理性选择不是全局最优。
博弈论2009
精选ppt课件
6
➢经济合作:
乙 甲
诚信的价值; 一报还一报策略; 人类生存环境启示。
博弈论2009
精选ppt课件
7
➢长街上的超市 (海滩占位模型)
*********************
博弈论PPT解读
判断是否劣于某个混合策略,证 明Z不是劣策略
> 假定参与人1对参与人2的信念, 证明Z是最优反应策略
≥
静态环境下的行为分析 (严格劣策略的重复剔除法)重复占优法留下可理性化策略,可理性化策略集
合为最优反应策略集合,可理性化策略基于某一信念无法剔除 R={(U,L)} R={A,B} X {X,Y}
博弈论
演讲人
2021-03-21
目录
01. 博弈的表述 02. 静态环境下的行为分析 03. 动态环境下的行为分析
01
博弈的表述
博弈的表述
扩展型表示博弈
信息集与决策节点的关系
策略
策略空间(策略集合)
S={H,L}
1
2
单个策略
s=H
策略组合
(A,B)
3
4
策略组合的集合
S={A,B}X{C,D}={(A, C ),(A,D),(B,C),(B,D)}
0
3
最后对剩下的策略进行 检验
两方博弈,最优反应策略集合=非严格劣策略集合,B=UD
找出参与人1以1的概率选择某策略时,参与人2的最优反应策略
在B中,因此也在UD中
两方博弈,最优反应策略集合=非严格劣策略集合,B=UD
找出劣于其他纯策略的策略
不在UD中,也不在B中
最后对剩下的策略 进行检验
(严格劣策略的重复剔除法)重复占优法留下可理性化策略,可理性化策略集合 为最优反应策略集合,可理性化策略基于某一信念无法剔除
R={(U,L)} R={A,B} X {X,Y}
静态环境下的行为分析
定位博弈与合伙人博弈
分阶段剔除劣策略从而获得可理性化策略的集合,当剔除所有劣策略时, 上界和下界都会收敛于各参与人最优反应曲线相交的点
> 假定参与人1对参与人2的信念, 证明Z是最优反应策略
≥
静态环境下的行为分析 (严格劣策略的重复剔除法)重复占优法留下可理性化策略,可理性化策略集
合为最优反应策略集合,可理性化策略基于某一信念无法剔除 R={(U,L)} R={A,B} X {X,Y}
博弈论
演讲人
2021-03-21
目录
01. 博弈的表述 02. 静态环境下的行为分析 03. 动态环境下的行为分析
01
博弈的表述
博弈的表述
扩展型表示博弈
信息集与决策节点的关系
策略
策略空间(策略集合)
S={H,L}
1
2
单个策略
s=H
策略组合
(A,B)
3
4
策略组合的集合
S={A,B}X{C,D}={(A, C ),(A,D),(B,C),(B,D)}
0
3
最后对剩下的策略进行 检验
两方博弈,最优反应策略集合=非严格劣策略集合,B=UD
找出参与人1以1的概率选择某策略时,参与人2的最优反应策略
在B中,因此也在UD中
两方博弈,最优反应策略集合=非严格劣策略集合,B=UD
找出劣于其他纯策略的策略
不在UD中,也不在B中
最后对剩下的策略 进行检验
(严格劣策略的重复剔除法)重复占优法留下可理性化策略,可理性化策略集合 为最优反应策略集合,可理性化策略基于某一信念无法剔除
R={(U,L)} R={A,B} X {X,Y}
静态环境下的行为分析
定位博弈与合伙人博弈
分阶段剔除劣策略从而获得可理性化策略的集合,当剔除所有劣策略时, 上界和下界都会收敛于各参与人最优反应曲线相交的点
第四篇博弈论PPT课件
• 此情况下由于博弈没有可预测的明确的博弈结果,所以就不能 确定博弈方的策略。但是是否在这样的博弈中,各博弈方选择 任何策略都是一样的,因此可以随意选择吗?
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式
博弈分析PPT教案学习
Max
Min(3,2,4) 2
2
Min(9,-1,-10) -10
所以,有均衡点 a22=2
Min(-3,0,6)
-3 Min
Max(-6,3,9,-3) 9 Max(1,2,-1,0) 2
2
局中人Ⅱ Max(-8,4,-10,6) 6
第13页/共32页
2021/4/27
14
以上分析表明,局中人Ⅰ和Ⅱ的 “理智行为”是分别选纯策略 a2 和 b2 ,这时局中人Ⅰ的赢得值和局中人Ⅱ的所失值绝对值相等 ,局中人Ⅰ得
第4页/共32页
2021/4/27
5
如在”齐王赛马”中,齐王和田忌的策略集合分别为S1 (a1, a2 ,..., a6 ) 和 S2 (b1 , b2 ,...,b6 ) .这样,齐王的任一策略 ai 和田忌的任一策略 bj 就
S
构成了一个局势 ij 。如两人分别采用策略 a1 和 b1 , 则齐王的赢得为 H1(S11) =3,田忌的赢得为H1(S11) -3 。在二人有限零和博弈中,每一
己的策略集合中选出一个策略,则全部的局势数
n
S Si
。
i 1
比如田忌赛马问题中,就总共有 6×6=36 个局势。当一个局势出现后 ,必
然会有一个竞争结局 ,把这种竞争结局用数量来表示,就称作赢得函数或
s
支付函数,用 H (i) ( ) 表示。一个局势实际就是一次较量,而赢得也
就是较量一次的结果。
王和田忌各自都有六个策略 (3!个):(上、中、下)、(上、下、中 )(, 中、
上、下)、(中、下、上)、(下、上、中)、(下、中、上)、
三、赢得函数
(支付函数)
一个博弈中,每位局中人所出策略形成的一博弈略称作一个局势。对
博弈论最全完整-讲解课件
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
• 因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
学习交流PPT
17
约翰· 海萨尼 1920年 生于美 国
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
学习交流PPT
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和 美国人威廉-维克瑞(William Vickrey)
托马斯·谢林
学习交流PPT
24
导论
三、博弈论的基本类型
学习交流PPT
25
合作博弈与非合作博弈
• 合作博弈(cooperative game) 达成有约束力的协议(binding
agreement),强调团体理性,强调效率、公 正、公平 • 非合作博弈(non-cooperative game)
强调个人理性,其结果可能有效率,也可能 无效率。
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进行分 析”领域做出了重要贡献。
学习交流PPT
21
迈克尔·斯彭斯 1948年生于美国的 新泽西,1972年获 美国哈佛大学博士 头衔,现兼任美国 哈佛和斯坦福两所
• 也就是说,需要的是对这样的情况下该选什么 的预期的收敛。这一使得参与者能够成功合作 的共同预期的策略被称为焦点。心有灵犀一点 通。
博弈论专题PPT课件
流浪汉 找工作 游荡
B 正面 反面
政 救济 3,2 -1,3 A 正面 -1,1 1,-1 府1,-1 -1,1
(一) 完全信息静态博弈:纳什均衡
----混合战略纳什均衡
• 纯战略: • 参与人在每一个给定信息的情况下只选择一个特定的行动 • 混合战略: • 参与人在每一个给定信息的情况下以某种概率分布随机地选
博弈信息:影响最后博弈结局的所有参与人的情报 “完美信息”-确定的结果 “不完美信息”-概率期望
依据支付结果分为零和博弈、常和博弈以及变和 博弈
非合作博弈理论
完全信息
静态 完全信息静态博弈
纳什均衡 纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡 海萨尼 (1967-1968)
such that no player has incentive to unilaterally change her action. Players are in
equilibrium if a change in strategies by any one of them would lead that player to earn
动态
完全信息动态博弈 子博弈精炼纳什均衡
泽尔腾(1965) 不完全信息动态博弈 精炼贝叶斯纳什均衡
泽尔腾(1975) Kreps和Wilson(1982)
Fudenberg和Tirole (1991)
(一)完全信息静态博弈:纳什均衡 Nash Equilibrium
A Nash equilibrium, named after John Nash, is a set of strategies, one for each player,