《博弈论》课程课件
合集下载
博弈论PPT课件
有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
第六讲博弈论课件
❖ 对于矩阵博弈,其主要的任务就是求出矩阵 博弈的Nash均衡解-----双方尽可能满意的结 果。
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪
踩
踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪
踩
踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。
博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
《博弈论》课程ppt课件
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
博弈论讲义完整PPT课件
• 两个寡头企业选择产量的博弈:
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
博弈论PPT课件
第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······
博弈论课件
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
博弈ห้องสมุดไป่ตู้分类
4 Part
课堂互动
假设我脸干净
A脸干净
如果我脸也干净
A
则
C一定知道自己脸脏 但C不知道
B
所以我脸脏
所以B一定知道自己脸脏 但B不知道,说明我的假设不正确 故我脸脏
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
Static Game Perfect Information
教CO学NT要EN求TS:
NO.1 知 占识优目策标略均衡 NO.2 能 重力复目剔标除占优均衡 NO.3 情 纳感什目均标衡 NO.4 重混点合难策点略均衡
Static Game Perfect Information
通过经典案例分析,掌握重复剔除的占优策略、纳什均 衡与混合策略均衡理论。 培养分析问题、解决问题的能力。 体会博弈论的应用价值,开拓视野,激发学习兴趣。
自测题目
教学大纲
教学课件
相关视频 参考书目
教学课件
Teaching courseware
目录
• 第一章 博弈论概述
006
• 第二章 完全信息静态博弈
041
第一节 占优策略均衡
043
第二节 重复剔除的占优均衡
066
第三节 纳什均衡
088
第四节 混合策略均衡
106
第一章
教学要求
知识目标 掌握博弈论的概念、发展、分类与要素
42
第二章 完全信息静态博弈
1.1 博弈的策略式表述
在博弈论中,一个博弈可以用两种不同的方式来表达: 策略式表达 和 扩展式表达 。策略式表达更适合于静态 博弈,而扩展式表达更适合于讨论动态博弈。
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
博弈ห้องสมุดไป่ตู้分类
4 Part
课堂互动
假设我脸干净
A脸干净
如果我脸也干净
A
则
C一定知道自己脸脏 但C不知道
B
所以我脸脏
所以B一定知道自己脸脏 但B不知道,说明我的假设不正确 故我脸脏
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
Static Game Perfect Information
教CO学NT要EN求TS:
NO.1 知 占识优目策标略均衡 NO.2 能 重力复目剔标除占优均衡 NO.3 情 纳感什目均标衡 NO.4 重混点合难策点略均衡
Static Game Perfect Information
通过经典案例分析,掌握重复剔除的占优策略、纳什均 衡与混合策略均衡理论。 培养分析问题、解决问题的能力。 体会博弈论的应用价值,开拓视野,激发学习兴趣。
自测题目
教学大纲
教学课件
相关视频 参考书目
教学课件
Teaching courseware
目录
• 第一章 博弈论概述
006
• 第二章 完全信息静态博弈
041
第一节 占优策略均衡
043
第二节 重复剔除的占优均衡
066
第三节 纳什均衡
088
第四节 混合策略均衡
106
第一章
教学要求
知识目标 掌握博弈论的概念、发展、分类与要素
42
第二章 完全信息静态博弈
1.1 博弈的策略式表述
在博弈论中,一个博弈可以用两种不同的方式来表达: 策略式表达 和 扩展式表达 。策略式表达更适合于静态 博弈,而扩展式表达更适合于讨论动态博弈。
博弈论课件
博弈论强调参与者之间的互动关系,通过数学模型和理论分析来研究 策略选择和均衡结果。
博弈论的发展历程
博弈论的起源可以追溯到20世纪初,当时数学家和经 济学家开始研究游戏中的策略和均衡。
1944年,冯·诺依曼和摩根斯坦合著的《博弈论与经济 行为》标志着博弈论的诞生。
随后,纳什、泽尔腾和哈萨尼等学者进一步发展了博弈 论,形成了现代博弈论的基础。
商业竞争与合作
商业竞争
博弈论可以用于分析商业竞争中的策略和行为,例如价格战、广告战等。通过 博弈论,企业可以更好地理解竞争对手的策略,制定出更有效的竞争策略。
商业合作
博弈论也可以用于分析商业合作中的策略和行为,例如供应链管理、合资企业 等。通过博弈论,企业可以更好地理解合作伙伴的需求和期望,制定出更有效 的合作策略。
贝叶斯纳什均衡
在不完全信息博弈中,如果所有参与 者都根据自己掌握的信息选择最优策 略,则所有参与者都能获得最大收益 。
静态博弈与动态博弈
01
静态博弈
02
动态博弈
所有参与者在同一时间点选择策略并获得收益。
参与者的选择有先后顺序,后选择的参与者可以观察到先选择的参与 者的策略和收益。
03
纳什均衡
纳什均衡的定义
博弈优化方法
线性规划
线性规划是一种数学优化方法, 用于找到在满足一组约束条件下 最大化或最小化目标函数的最优
解。
非线性规划
非线性规划是数学优化的一种方 法,用于找到一组变量的最优值 ,使得一个或多个目标函数达到
最优。
动态规划
动态规划是一种通过将问题分解 为相互重叠的子问题来解决问题 的方法,每个子问题的解被保存
博弈论课件
汇报人:
汇报时间:202X-01-04
精品课程《博弈论》PPT课件(全)
人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
《博弈论初步》课件
THANKS
感谢观看
02
纳什均衡是一种非合作博弈均衡 ,其中每个参与者都认为当前策 略是最好的,不会受到其他参与 者的欺骗或影响。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的策略,逐步逼近纳什均衡。这 种方法适用于较简单的博弈模型,但对于复杂的博弈模型 可能收敛速度较慢。
线性规划法
将纳什均衡问题转化为线性规划问题,通过求解线性规划 来找到纳什均衡。这种方法适用于具有线性特征的博弈模 型,但计算复杂度较高。
价格战与非价格战
博弈论分析了价格战和非价格战的利弊,为企业制定营销策略提供 博弈论可以用来分析选民的投票行为和政治立场,预测选举结果。
02
候选人策略
博弈论为候选人提供了制定最优竞选策略的方法,帮助他们在选举中获
胜。
03
政治联盟与利益交换
博弈论中的合作博弈理论可以用来分析政治联盟的形成和利益交换机制
特征值法
利用特征值和特征向量的性质来求解纳什均衡。这种方法 适用于具有矩阵特征的博弈模型,但需要一定的数学基础 。
纳什均衡的应用实例
1 2
价格竞争
在寡头市场中,企业之间通过价格策略进行竞争 ,最终形成价格均衡,即纳什均衡。
劳资谈判
劳资双方在谈判中会提出自己的工资要求,最终 达成工资协议,这也是一种纳什均衡。
博弈类型
合作博弈
定义
01
参与者通过合作达成共赢的博弈。
特点
02
存在合作协议,强调集体行动和收益分配。
应用场景
03
国际关系、商业合作、团队协作等。
非合作博弈
定义
应用场景
参与者追求各自利益最大化的博弈。
市场竞争、个人决策、资源分配等。
博弈论最全完整-讲解课件
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
第四篇博弈论PPT课件
• 此情况下由于博弈没有可预测的明确的博弈结果,所以就不能 确定博弈方的策略。但是是否在这样的博弈中,各博弈方选择 任何策略都是一样的,因此可以随意选择吗?
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式
博弈论课件
扩展一:不完全信息博弈
不完全信息博弈的定义
01
在博弈中,参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度,可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略,研究候选人如何 制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调,分析政策 制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作,分析国家如何通过 外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡 。
特点
纳什均衡是一种稳定的状态,任何参 与者单方面改变自己的策略都不会获 得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略, 该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略,该 策略都能为参与者带来更低的收益 。
特点
在优势策略下,参与者没有理由改 变自己的策略;在劣势策略下,参 与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降,还可能引发市场恶性竞争,破坏市场秩序。此外,价格战还可能导致产品质量 下降,损害消费者利益。
案例二:国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中,各国之间往往存在着复杂的博弈关系。为了维护自身利益,各 国会采取不同的博弈策略,如通过外交手段、经济制裁、军事威胁等方式来达 到自己的目的。
博弈论全套课件
三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。
《博弈论教程》课件
博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
结论:地球是圆的。
27
图1 地球是圆的?还是平的?。
做出上面这个思维实验的人就是大名鼎 鼎的希腊智者——亚里斯多德。
28
会( 现二 象) 用 囚 徒 困 境 解 释 各 种 社
( 一 ) 标 准 的 囚 徒 困 境
29
(一)囚徒困境 囚徒困境的策略式 1)参与者集合:囚徒1定义为1,囚徒2定 义为2,N = {1 , 2}。 (2)策略空间:囚徒1的策略空间S1 = {沉 默,招供},囚徒2的策略空间S2 = {沉默, 招供}。策略s11 = s21 = 沉默,s12 = s22 = 招 供。 (3)偏好和收益函数:囚徒1的偏好,从好 到差排序为(招供,沉默)……(沉默,招 供)。囚徒2与此类似。
姚国庆 yaogqing@
( 五 ) 博 弈 模 型 的 分 类
( 四 ) 博 弈 论 的 两 个 前 提 假 设
( 三 ) 纳 什 均 衡
( 二 ) 博 弈 表 达 的 科 学 式
( 一 、剪刀、布
猪八戒
(2)博弈的扩展式 博弈的扩展式就是非常详细地描绘出一个博弈的参 与者、策略、行动顺序以及行动时拥有的信息、可 能结果和收益等细节就称为博弈的扩展式。
7
1、博弈策略式的定义 在具体情况中,不同博弈的故事千差万别, 但其中总有一些本质的东西是不变的。通常 描述一个博弈必不可少的要素包含三个: (1)参加博弈有哪些“人”; (2)每个参与者都有些什么样的“策略”, 由于策略的定义比较复杂,这里我们先将策 略理解为“行动”; (3)偏好和效用函数(收益函数)。
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼底设防 成功,失败
失败,成功
失败,成功
3
例3 鸽派和鹰派
美 国 鸽派政策 苏联 鹰派政策
30
囚徒困境的博弈矩阵
囚徒2
沉默 沉默 招供 –9,0
囚徒1
– 1 ,– 1
招供
0 ,– 9
–6,–6
31
(二)用囚徒困境解释各种社会经济现象
a. 全球气候变暖与碳减排 b. 北京交通的拥堵 c. 人民公社为什么垮掉 d. 三个和尚没水喝 e. 为什么社会缺乏信用
f. 合同法能解决囚徒困境吗?
g. 道德的价值
22
表 1 博弈的分类和均衡概念
完全信息 静态 非完全信息
完全信息静态博弈 非完全信息静态博弈 (纳什均衡) (贝叶斯均衡)
完全信息动态博弈 非完全信息动态博弈 动态 (子博弈精炼均衡) (序列均衡)
23
非完全信息动态博弈
非完 全信 息静 态博 弈
完全 信息 动态 博弈
完全信息静态博弈
一般均衡
图1-2 四个博弈模型关系图
鸽派政策
鹰派政策
0,0
+1,–1
–1,+1
– ∞,– ∞
4
从上面的三个例子中,我们可以概括出一个博弈 所具有的共同特征:利益相冲突的参与者、参与 者总是根据对手可能采取的策略来采取相应的行 动----相互依存的策略和行动、参与者总是追求自 身利益最大化。根据这些共同特征我们就能给出 一个博弈的定义,只要符合这个定义,就可以将 其纳入到博弈论的研究范畴之中。
从博弈论的角度来看,父母的关爱越深切反而 会进一步削弱父母的威慑力,有趣的是,如果 女儿怀疑父母不爱她,反而有可能把对手的威 胁当真,这就是中国古语所说“异子而教”。
35
2、破釜沉舟
破釜沉舟这个成语故事对中国人来说妇孺皆知, 他之所以2千年了仍被人传唱,根本的原因就 是项羽成功的解决了不可置信的难题,并将其 变成了一种激励,鞭笞士兵拼命。
参与者1
参与者2
正面 反面
参与者1
正面
反面
+1, -1
-1, +1
-1, +1
+1, -1
17
二是,所谓混合策略是指参与者按照概率 来选择行动,这个概率分布就是所谓的混 合策略。
定义5 如果一个策略组合s* = (s1* , …, sn*) 是博弈G = {N, S, u}的一个纳什均衡,那么 对任一参与者i = 1, 2, …, n,对其任一个策 略 si,不等式 ui(s*i, s*– i) ≥ ui(si, s*– i) (1) 成立。
13
例5 取消管制 扩展式的一个等价形式就是所谓的博弈树。
政府 维持 进 2 取消 1
退 退
进
退
进
图2 取消管制
14
取消管制的扩展式为 Γ =(N, H, P, u),其中 (1)参与者集合:政府1,企业2和企业3, N={1, 2, 3}。 (2)全历史集合:维持为C,取消为D,进 入为E,退出为Q,那么全历史集合H ={(C), (D, [E, E]), (D, [E, Q]), (D, [Q, E]), (D, [Q, Q])。 (3)参与者函数:P(Ø ) = 1,P(D) = {2, 3}。 (4)偏好:对于政府而言,根据五个历史 对应的社会福利进行排序,对于企业1和企 业2而言,则为五个历史对应的利润排序。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来科 学地描述一个博弈,就称为博弈表达的策略式(或 基本式、标准式)。
18
博弈论在研究的过程中有两个基本前提假设 一是,理性人假设。 二是,博弈结构对参与者是公共知识。特别
是,参与者满足完美回忆。
19
例6 旅行者困境 两个旅行者在旅游圣地买了两个花瓶,但在 回程途中被航空公司打碎。航空公司知道花 瓶大约值100元,但并不清楚花瓶的确切价 格。于是,航空公司要求两位旅客各自写下 花瓶的价格,并按照两个旅客中所写的最低 价格进行赔偿(航空公司认为写最低价格的 旅客讲的是真话),为了鼓励旅客讲真话, 规定对讲真话的旅客奖励2元,对讲假话的旅 客罚款2元。容易证明,在理性人的假设下, 这个游戏唯一的结果是两人都写0。
32
这里我们首先考虑一个极端的例子,故事是
这样的,一个穷人威胁,如果富人不给他三 百万,那么穷人就要和富人同归于尽。我们 可以将这个博弈变成一个动态博弈,第一阶 段,富人首先行动已决定给不给钱(给钱或 是不给),第二阶段,穷人根据富人的行动 决定是否拉手榴弹。穷人的威胁是可置信的 吗?
33
手榴弹游戏的扩展式
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方
(0,2) (0,2) 失败,成功 成功,失败 成功,失败 (1,1) 成功,失败 失败,成功 成功,失败 (2,0) 成功,失败 成功,失败 失败,成功
攻方
(1,1) (2,0)
11
2、博弈扩展式
扩展式之所以称为“扩展”根本的原因在于 它比基本式“详细”。特别是对博弈中参与 者的行动顺序和信息状态做出了比基本式 “详细”得多地刻画。正因为如此,所以扩 展式通常被用来描述复杂的动态博弈。 通俗地说,我们把博弈中所有从开始到结束 的行动序列称为一个play(全历史或完整路 径),全历史中从开始到某个阶段就叫子历 史或路径。
15
纳什均衡是博弈论分析的基础,但纳什均衡
的概念实际上却非常简单。为了更好的理解 我们将从两个层面来加以理解。
一是,纳什均衡是指这样一种策略组合,其
中没有任何一个参与者有动机单方面改变策 略——单边背离。不存在单边背离的策略组 合即为纳什均衡。
16
纳什均衡——不存在单边背离
参与者2
左 中 1,2 3,3 0,1 右 0,1 1,1 2,0 上 中 下 1, 0 2,1 0,3
20
博弈中最重要的两个因素是信息与顺序。
信息上可以分为完全信息和非完全信息。
在博弈的顺序上则可以分为静态与动态。
21
完全信息和非完全信息,完全和非完全判 断的标准就是如果有些信息只有一部分参 与者知道,并不是所有的信息都是公共信 息,那么博弈就是非完全信息博弈。 静态博弈和动态博弈,静态和动态的区别 并不在于时间上是否同时,而是在行动上 是否同时。如果参与者1在行动时,不知道 参与者2的行动,反之也一样,即为同时行 动。
25
这个模型是这样的:
第一个模型 假设:地球是圆的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到远方驶来 船只的船桅,并逐渐看到船的下部(与现实 中观察到的事实相符)
26
第二个模型
假设:地球是平的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到的是整个 船身(与现实中观察到的事实相悖)
8
定义3 博弈表达的基本式(或策略式)由博 弈的参与者N,策略空间S和收益函数u三个 要素组成,即G = {N, S, u}。其中N为自然数 集合{1, …, n},S为n重笛卡尔集,Si为参与 者i的纯策略集合,u为参与者的收益函数集 合。 完全信息静态博弈是最简单的博弈,所以通 常用策略式来描述之,策略式最常见的一种 方式就是所谓的“博弈矩阵”。我们在前面 已经接触到。
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
27
图1 地球是圆的?还是平的?。
做出上面这个思维实验的人就是大名鼎 鼎的希腊智者——亚里斯多德。
28
会( 现二 象) 用 囚 徒 困 境 解 释 各 种 社
( 一 ) 标 准 的 囚 徒 困 境
29
(一)囚徒困境 囚徒困境的策略式 1)参与者集合:囚徒1定义为1,囚徒2定 义为2,N = {1 , 2}。 (2)策略空间:囚徒1的策略空间S1 = {沉 默,招供},囚徒2的策略空间S2 = {沉默, 招供}。策略s11 = s21 = 沉默,s12 = s22 = 招 供。 (3)偏好和收益函数:囚徒1的偏好,从好 到差排序为(招供,沉默)……(沉默,招 供)。囚徒2与此类似。
姚国庆 yaogqing@
( 五 ) 博 弈 模 型 的 分 类
( 四 ) 博 弈 论 的 两 个 前 提 假 设
( 三 ) 纳 什 均 衡
( 二 ) 博 弈 表 达 的 科 学 式
( 一 、剪刀、布
猪八戒
(2)博弈的扩展式 博弈的扩展式就是非常详细地描绘出一个博弈的参 与者、策略、行动顺序以及行动时拥有的信息、可 能结果和收益等细节就称为博弈的扩展式。
7
1、博弈策略式的定义 在具体情况中,不同博弈的故事千差万别, 但其中总有一些本质的东西是不变的。通常 描述一个博弈必不可少的要素包含三个: (1)参加博弈有哪些“人”; (2)每个参与者都有些什么样的“策略”, 由于策略的定义比较复杂,这里我们先将策 略理解为“行动”; (3)偏好和效用函数(收益函数)。
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼底设防 成功,失败
失败,成功
失败,成功
3
例3 鸽派和鹰派
美 国 鸽派政策 苏联 鹰派政策
30
囚徒困境的博弈矩阵
囚徒2
沉默 沉默 招供 –9,0
囚徒1
– 1 ,– 1
招供
0 ,– 9
–6,–6
31
(二)用囚徒困境解释各种社会经济现象
a. 全球气候变暖与碳减排 b. 北京交通的拥堵 c. 人民公社为什么垮掉 d. 三个和尚没水喝 e. 为什么社会缺乏信用
f. 合同法能解决囚徒困境吗?
g. 道德的价值
22
表 1 博弈的分类和均衡概念
完全信息 静态 非完全信息
完全信息静态博弈 非完全信息静态博弈 (纳什均衡) (贝叶斯均衡)
完全信息动态博弈 非完全信息动态博弈 动态 (子博弈精炼均衡) (序列均衡)
23
非完全信息动态博弈
非完 全信 息静 态博 弈
完全 信息 动态 博弈
完全信息静态博弈
一般均衡
图1-2 四个博弈模型关系图
鸽派政策
鹰派政策
0,0
+1,–1
–1,+1
– ∞,– ∞
4
从上面的三个例子中,我们可以概括出一个博弈 所具有的共同特征:利益相冲突的参与者、参与 者总是根据对手可能采取的策略来采取相应的行 动----相互依存的策略和行动、参与者总是追求自 身利益最大化。根据这些共同特征我们就能给出 一个博弈的定义,只要符合这个定义,就可以将 其纳入到博弈论的研究范畴之中。
从博弈论的角度来看,父母的关爱越深切反而 会进一步削弱父母的威慑力,有趣的是,如果 女儿怀疑父母不爱她,反而有可能把对手的威 胁当真,这就是中国古语所说“异子而教”。
35
2、破釜沉舟
破釜沉舟这个成语故事对中国人来说妇孺皆知, 他之所以2千年了仍被人传唱,根本的原因就 是项羽成功的解决了不可置信的难题,并将其 变成了一种激励,鞭笞士兵拼命。
参与者1
参与者2
正面 反面
参与者1
正面
反面
+1, -1
-1, +1
-1, +1
+1, -1
17
二是,所谓混合策略是指参与者按照概率 来选择行动,这个概率分布就是所谓的混 合策略。
定义5 如果一个策略组合s* = (s1* , …, sn*) 是博弈G = {N, S, u}的一个纳什均衡,那么 对任一参与者i = 1, 2, …, n,对其任一个策 略 si,不等式 ui(s*i, s*– i) ≥ ui(si, s*– i) (1) 成立。
13
例5 取消管制 扩展式的一个等价形式就是所谓的博弈树。
政府 维持 进 2 取消 1
退 退
进
退
进
图2 取消管制
14
取消管制的扩展式为 Γ =(N, H, P, u),其中 (1)参与者集合:政府1,企业2和企业3, N={1, 2, 3}。 (2)全历史集合:维持为C,取消为D,进 入为E,退出为Q,那么全历史集合H ={(C), (D, [E, E]), (D, [E, Q]), (D, [Q, E]), (D, [Q, Q])。 (3)参与者函数:P(Ø ) = 1,P(D) = {2, 3}。 (4)偏好:对于政府而言,根据五个历史 对应的社会福利进行排序,对于企业1和企 业2而言,则为五个历史对应的利润排序。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来科 学地描述一个博弈,就称为博弈表达的策略式(或 基本式、标准式)。
18
博弈论在研究的过程中有两个基本前提假设 一是,理性人假设。 二是,博弈结构对参与者是公共知识。特别
是,参与者满足完美回忆。
19
例6 旅行者困境 两个旅行者在旅游圣地买了两个花瓶,但在 回程途中被航空公司打碎。航空公司知道花 瓶大约值100元,但并不清楚花瓶的确切价 格。于是,航空公司要求两位旅客各自写下 花瓶的价格,并按照两个旅客中所写的最低 价格进行赔偿(航空公司认为写最低价格的 旅客讲的是真话),为了鼓励旅客讲真话, 规定对讲真话的旅客奖励2元,对讲假话的旅 客罚款2元。容易证明,在理性人的假设下, 这个游戏唯一的结果是两人都写0。
32
这里我们首先考虑一个极端的例子,故事是
这样的,一个穷人威胁,如果富人不给他三 百万,那么穷人就要和富人同归于尽。我们 可以将这个博弈变成一个动态博弈,第一阶 段,富人首先行动已决定给不给钱(给钱或 是不给),第二阶段,穷人根据富人的行动 决定是否拉手榴弹。穷人的威胁是可置信的 吗?
33
手榴弹游戏的扩展式
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方
(0,2) (0,2) 失败,成功 成功,失败 成功,失败 (1,1) 成功,失败 失败,成功 成功,失败 (2,0) 成功,失败 成功,失败 失败,成功
攻方
(1,1) (2,0)
11
2、博弈扩展式
扩展式之所以称为“扩展”根本的原因在于 它比基本式“详细”。特别是对博弈中参与 者的行动顺序和信息状态做出了比基本式 “详细”得多地刻画。正因为如此,所以扩 展式通常被用来描述复杂的动态博弈。 通俗地说,我们把博弈中所有从开始到结束 的行动序列称为一个play(全历史或完整路 径),全历史中从开始到某个阶段就叫子历 史或路径。
15
纳什均衡是博弈论分析的基础,但纳什均衡
的概念实际上却非常简单。为了更好的理解 我们将从两个层面来加以理解。
一是,纳什均衡是指这样一种策略组合,其
中没有任何一个参与者有动机单方面改变策 略——单边背离。不存在单边背离的策略组 合即为纳什均衡。
16
纳什均衡——不存在单边背离
参与者2
左 中 1,2 3,3 0,1 右 0,1 1,1 2,0 上 中 下 1, 0 2,1 0,3
20
博弈中最重要的两个因素是信息与顺序。
信息上可以分为完全信息和非完全信息。
在博弈的顺序上则可以分为静态与动态。
21
完全信息和非完全信息,完全和非完全判 断的标准就是如果有些信息只有一部分参 与者知道,并不是所有的信息都是公共信 息,那么博弈就是非完全信息博弈。 静态博弈和动态博弈,静态和动态的区别 并不在于时间上是否同时,而是在行动上 是否同时。如果参与者1在行动时,不知道 参与者2的行动,反之也一样,即为同时行 动。
25
这个模型是这样的:
第一个模型 假设:地球是圆的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到远方驶来 船只的船桅,并逐渐看到船的下部(与现实 中观察到的事实相符)
26
第二个模型
假设:地球是平的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到的是整个 船身(与现实中观察到的事实相悖)
8
定义3 博弈表达的基本式(或策略式)由博 弈的参与者N,策略空间S和收益函数u三个 要素组成,即G = {N, S, u}。其中N为自然数 集合{1, …, n},S为n重笛卡尔集,Si为参与 者i的纯策略集合,u为参与者的收益函数集 合。 完全信息静态博弈是最简单的博弈,所以通 常用策略式来描述之,策略式最常见的一种 方式就是所谓的“博弈矩阵”。我们在前面 已经接触到。
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。