第十章博弈论详解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 混合策略:以一定的概率选择策略
• 纯策略是混合策略的特例 • 纯策略可能不存在,但混合策略一定存在 • 甲厂商混合策略(p1,p2),乙厂商的混合策略(q1,q2)
• 混合策略组合((p1,p2),(q1,q2))
二、期望支付与条件混合策略
p2=1-p1 乙 q2 右 9, 1 2, 8
混合策略组合:


芭蕾
● (1,2)
简化的情侣博弈2
三、逆向归纳法精炼的纳什均衡不一定有效率
• 一个买主,两个卖主:A和B
• A和B愿意接受的最低价格都是100 • 买主先向A出价101 • 括号里的数字表示(A的净收益,B的净收益)
1A 不卖 卖 2B 卖 不卖 3A 不卖 卖 (3,0) 4B 卖 不卖 5A 卖 (5,0) 不卖 (0,0)
0, 0
2, 1
威胁或承诺能否改变博弈结果
如果B限定了自己的策略(威胁采取价格战,并委托第三方进行决策), 则B的威胁是有效的。最后A的选择为不进入,参与双方的报酬为( 1,9)
二、纳什均衡的精炼:排除不合理的均衡

足球 芭蕾
足球
● (2,1) ● (0,0) ● (-1,-1)
足球 男 ● 芭蕾
((p1, p2),( q1, q2))
• 甲的条件混合策略
q2=1-q1
甲 p1 p2 上 下
q1 左 4, 6 7, 3
• 甲和乙的期望支付
E甲=4p1q1+9p1(1-q1)+7(1-p1)q1+2(1-p1)(1-q1) =p1(7-10q1)+5q1+2 E乙=6p1q1+p1(1-q1)+3(1-p1)q1+8(1-p1)(1-q1) =5q1(2p1-1)-7p1+8
0.5
1
p1
第四节
完全信息动态博弈
参与人的决策有先有后,且后行动的参与人可以观察到先 行动的参与人已经采取的策略
一、博弈树与纳什均衡
• • 博弈树模型又称扩展式博弈模型 以博弈树来描述的序贯博弈又叫做扩展型博弈
价格战 不进入 行业外 企业A 进入 行业内 企业B 行业内 企业B 无价格战 价格战 无价格战 1, 9 1, 9
• 静态博弈常常无法确定最终实现的是哪一个均衡 • 动态博弈往往能够确定一个最终的均衡
第十章 博弈论
概念界定
静态博弈
动态博弈
第一节
一、博弈论
概念界定
• 研究在策略性环境中,进行策略性决策和采取策略性行动的
科学。
二、博弈论的基本要素
参与人/局中人( Player) 策略(Strategies) • 策略空间:参与者可以选择的策略的全体。 支付(Payoff) • 支付矩阵(Payoff Matrix,收益矩阵/报酬矩阵)
第二节 完全信息静态博弈:纯 策略均衡
一、条件策略与条件策略组合
乙厂商合作时,甲厂商

合作
甲 合作 5, 6
不合作
1, 5
• 条件策略:不合作 • 条件策略组合:(不合作,合作)
乙厂商不合作时,甲厂商
不Leabharlann Baidu作
7, 1
2, 3
• 条件策略:不合作 • 条件策略组合:(不合作,不合作)
甲厂商合作时,乙厂商
(1,0)
(0,2)
(0,4)
1A 不卖 卖 (1,0)
2B 卖 (0,2)
不卖
3A 不卖 卖 (3,0)
4B 卖 (0,4)
不卖
5A 卖 (5,0)
不卖 (0,0)
简化的蜈蚣博弈1
1A 不卖 卖 (1,0)
2B 卖 (0,2)
不卖
3A 不卖 卖 (3,0)
4B 卖 (0,4)
不卖
5A 卖 (5,0)
不卖 (0,0)
简化的蜈蚣博弈2
1A 不卖 卖 (1,0)
2B
不卖
3A 不卖
4B 卖 (0,4)
不卖
5A 卖 (5,0)
不卖 (0,0)

(0,2)

(3,0)
简化的蜈蚣博弈3
• A和B无论谁先选择,都在一开始就结束,因而无法得 到后续的可能更高净收益。
因为动态博弈有决策秩序,所以在出现多重纳什均衡时
三、博弈类别
二人博弈,多人博弈 零和博弈,非零和博弈 有限博弈,无限博弈 合作博弈,非合作博弈 完全信息博弈,不完全信息博弈 静态博弈(同时博弈),动态博弈(序贯博弈)
静态博弈:参与人同时进行决策或行动的博弈 动态博弈:参与人的决策与行动有先有后的博弈 静态和动态,取决于策略实施是否具有“同时性”,即某参与人 决策之前是否知道其他参与人的决策,而不一定与时间相关。
四、纳什均衡与社会福利
1. 囚犯困境
乙 坦白 甲 坦白 不坦白 -5,-5 -7,-1 不坦白 -1,-7 -2,-2
占优策略均衡(坦白、坦白)符合个人理性,但不符合集体理性
2. 囚犯困境模型的应用——寡头合作的不稳定性

合作 不合作
合 作
10 12
10 6
6 8
12 8

不合作
(合作、合作)﹥(不合作、不合作) 但是,有限次博弈中,这种合作是不稳定的,最后还是(不 合作、不合作)
3. 重复博弈:走出囚徒困境
无限次重复博弈
“以牙还牙”策略
(合作、合作)成为纳什均衡点

合作
合 作 不合作
10
10 6 6 8
12 8

不合作 12
•一些价格战就类似于一报还一报的策略。
第三节 完全信息静态博弈:混合 策略均衡
一、混合策略
q1 甲 p1 p2 上 下 乙 q2
左 右 4, 6 9, 1 7, 3 2, 8
• 条件优势策略/相对优势策略
/条件策略

• 条件策略:合作 条件优势策略组合/相对优势 • 条件策略组合:(合作,合作) 策略组合/条件策略组合
甲厂商不合作时,乙厂商
纳什均衡: (不合作,不合作)
• 条件策略:不合作 • 条件策略组合:(不合作,不合作)
二、均衡与纳什均衡
1. 均衡
• 博弈的均衡是博弈各方最终选取的策略组合,是博弈的最
1 p1 [0,1] 0
q1 0.7 q1 0.7 q1 0.7
• 乙的条件混合策略
0 q1 [0,1] 1
p1 0.5 p1 0.5 p1 0.5
三、混合策略的纳什均衡
q1
条件策略曲线-乙
1 条件策略曲线-甲 0.7
e
混合策略均衡 :
-纳什均衡:e点 ((0.5,0.5),(0.7,0.3))
终结果,是博弈的解。
2.纳什均衡
• 任何参与人单独改变策略都不会得到好处的策略组合。
三、纳什均衡的存在性、唯一性和最优性



乙 左 右 4, 6 9, 1 7, 3 2, 8
不一定存在

上 下
乙 左 右 5, 6 1, 4 4, 1 2, 3
不一定唯一 不一定稳定 不一定最优 (5,6)优于(2,3)



芭蕾
● (1,2)
情侣博弈
纳什均衡的精炼:逆向归纳法 足球 芭蕾
足球
● ● (2,1) ● (0,0) ● (-1,-1)

足球 男 ● 芭蕾


芭蕾
● (1,2)
简化的情侣博弈1
纳什均衡的精炼:逆向归纳法 足球 芭蕾
足球
● ● (2,1) ● (0,0) ● (-1,-1)

足球 男 ● 芭蕾
相关文档
最新文档