博弈论 ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
占优均衡:一个博弈的某个策略组合中的所 有策略都是各个博弈方各自的占优,必然是 该博弈比较稳定的结果
占优均衡不是普遍存在的(性别之战)
严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去
左中
右
上 1,0 1,3 0,1
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
赌胜博弈的特点是一方得等于另一方失,不 可能双赢,属于“零和博弈”
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
田忌赛马
取胜关键:不让对方猜到自己策略,尽可能 猜出对方策略
田忌
上中下
齐 上下中 威 中上下 王 中下上
下上中
下中上
上
上
中
下
下
中
3,-3√ 1,-1 1,-1 -1,1 1,-1 1,-1
囚徒的困境 赌胜博弈 审计博弈 性别之战 产量决策的古诺模型
囚徒的困境
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈
囚徒 2
坦白 不坦白
囚
坦白 -5, -5 0, -8
徒
1
不坦白 -8, 0 -1, -1
赌胜博弈
赌博、竞技等构成的博弈问题,在经济中也 有许多应用,赌胜博弈也是一类重要的博弈 问题,对经济竞争和合作也有很大启示
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
中 上 下
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
下 上 中
-1,1√ 1,-1 1,-1 1,-1 3,-3 1,-1
下 中 上
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
策略集SA=SB={石头,剪刀,布} 收益就是这个矩阵
石头
石头
0, 0
孩
子
剪刀
-1, 1
A
布
1, -1
孩子B
剪刀 1, -1 0, 0 -1, 1
布
-1, 1 1, -1 0, 0
占优均衡
占优:不管其它博弈方选择什么策略,一博 弈方的某个策略给他带来的得益始终高于其 它的策略,至少不低于其他策略的策略 (囚徒的困境中的“坦白”)
博弈论
博弈就是一些个人、队组或其他组织,面对一定的 环境条件,在一定的规则下,同时或先后,一次或 多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
合( s1*,…,si-1*,si+1*,…,sn* )的最佳对策,即ui( ss为1i+*1G,*,的……一,,个sis-纳1n**,什)s均i*对,衡任si+1意*,sij…∈,Si都sn*成)立≥,u则i(称s(1*,s1…*,,…si,-1*,sn*si)j,
所有别的游戏者策略的简记法
s-i=(s1,…,si-1,si+1,…, sn) 纳什均衡简述为:
得益矩阵
审计博弈
简单版(B<C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t
来自百度文库
务 局 不审计
0,0
B,-t
性别之战
是一种有两个以上纯策略均衡的博弈
看足球 何 佳 听音乐
张帅
看足球 听音乐
2,4
0,0
1,1
4,2
例子(石头、剪子、布)中的博弈方、策略和
收益
博弈方I(孩子A,孩子B)
连续变量的纳什均衡
解: 一阶最优条件为:
u1 q1
6
q2
2 q1
0
u2 q2
6 q1
2q2
0
得到:q1=q2=2
混合策略的引进
策略型(或标准型)博弈
三要素:名单、策略单和收益单。可用矩阵,或 函数形式表示的博弈收益情况。
猜硬币模型
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
三人古诺模型 i P q i [ 2 q 0 1 q 2 q 3 ] q i
几个经典博弈模型
务 局 不审计
0,0
B,-t
连续变量的纳什均衡
古诺的寡头模型
Qq1 q2 PP(Q) 8Q
c1 c2 2
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ 8 ( q 1 q 2 ) 2 ] q 1 6q1q1q2q12
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ 8 ( q 1 q 2 ) 2 ] q 2 6q2 q1q2 q22
下 0,4 0,2 2,0
1,3
左 1,0 0,4
中 1,3 0,2
左 1,0
中 1,3
纳什均衡
策略空间:S1,……Sn 博弈方i的第j个策略:sij∈Si 博弈方i的得益:ui 博弈:G={S1 ,…,Sn,u1,…,un} 纳由sn*什各)均个中衡博,:弈任在方一博的i博弈各弈G一方=个s{策i*S的略1 策,组略…成,,的都S某n,是个u对策1,其略…余组,博合u弈(n}方s中1策*,,略…如的,果组
选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限
多个
收益
收益:各博弈方从博弈中所获得的利益 收益对应博弈的结果,也就是各博弈方策略
的组合 收益是各博弈方追求的根本目标及行为和判
断的主要依据 根据收益的博弈分类:零和博弈、常和博弈、
变和博弈
ui(si*,s-i*)≥ui(si,s-i*), si∈Si
A
纳什均衡的求解——划线法
囚徒困境
-5, -5 -8, 0
猜硬币
-1, 1 1, -1
0, -8 -1, -1
1, -1 -1, 1
纳什均衡的求解——箭头法
审计博弈(B > C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t
占优均衡不是普遍存在的(性别之战)
严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去
左中
右
上 1,0 1,3 0,1
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
赌胜博弈的特点是一方得等于另一方失,不 可能双赢,属于“零和博弈”
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
田忌赛马
取胜关键:不让对方猜到自己策略,尽可能 猜出对方策略
田忌
上中下
齐 上下中 威 中上下 王 中下上
下上中
下中上
上
上
中
下
下
中
3,-3√ 1,-1 1,-1 -1,1 1,-1 1,-1
囚徒的困境 赌胜博弈 审计博弈 性别之战 产量决策的古诺模型
囚徒的困境
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈
囚徒 2
坦白 不坦白
囚
坦白 -5, -5 0, -8
徒
1
不坦白 -8, 0 -1, -1
赌胜博弈
赌博、竞技等构成的博弈问题,在经济中也 有许多应用,赌胜博弈也是一类重要的博弈 问题,对经济竞争和合作也有很大启示
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
中 上 下
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
下 上 中
-1,1√ 1,-1 1,-1 1,-1 3,-3 1,-1
下 中 上
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
策略集SA=SB={石头,剪刀,布} 收益就是这个矩阵
石头
石头
0, 0
孩
子
剪刀
-1, 1
A
布
1, -1
孩子B
剪刀 1, -1 0, 0 -1, 1
布
-1, 1 1, -1 0, 0
占优均衡
占优:不管其它博弈方选择什么策略,一博 弈方的某个策略给他带来的得益始终高于其 它的策略,至少不低于其他策略的策略 (囚徒的困境中的“坦白”)
博弈论
博弈就是一些个人、队组或其他组织,面对一定的 环境条件,在一定的规则下,同时或先后,一次或 多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
合( s1*,…,si-1*,si+1*,…,sn* )的最佳对策,即ui( ss为1i+*1G,*,的……一,,个sis-纳1n**,什)s均i*对,衡任si+1意*,sij…∈,Si都sn*成)立≥,u则i(称s(1*,s1…*,,…si,-1*,sn*si)j,
所有别的游戏者策略的简记法
s-i=(s1,…,si-1,si+1,…, sn) 纳什均衡简述为:
得益矩阵
审计博弈
简单版(B<C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t
来自百度文库
务 局 不审计
0,0
B,-t
性别之战
是一种有两个以上纯策略均衡的博弈
看足球 何 佳 听音乐
张帅
看足球 听音乐
2,4
0,0
1,1
4,2
例子(石头、剪子、布)中的博弈方、策略和
收益
博弈方I(孩子A,孩子B)
连续变量的纳什均衡
解: 一阶最优条件为:
u1 q1
6
q2
2 q1
0
u2 q2
6 q1
2q2
0
得到:q1=q2=2
混合策略的引进
策略型(或标准型)博弈
三要素:名单、策略单和收益单。可用矩阵,或 函数形式表示的博弈收益情况。
猜硬币模型
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
三人古诺模型 i P q i [ 2 q 0 1 q 2 q 3 ] q i
几个经典博弈模型
务 局 不审计
0,0
B,-t
连续变量的纳什均衡
古诺的寡头模型
Qq1 q2 PP(Q) 8Q
c1 c2 2
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ 8 ( q 1 q 2 ) 2 ] q 1 6q1q1q2q12
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ 8 ( q 1 q 2 ) 2 ] q 2 6q2 q1q2 q22
下 0,4 0,2 2,0
1,3
左 1,0 0,4
中 1,3 0,2
左 1,0
中 1,3
纳什均衡
策略空间:S1,……Sn 博弈方i的第j个策略:sij∈Si 博弈方i的得益:ui 博弈:G={S1 ,…,Sn,u1,…,un} 纳由sn*什各)均个中衡博,:弈任在方一博的i博弈各弈G一方=个s{策i*S的略1 策,组略…成,,的都S某n,是个u对策1,其略…余组,博合u弈(n}方s中1策*,,略…如的,果组
选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限
多个
收益
收益:各博弈方从博弈中所获得的利益 收益对应博弈的结果,也就是各博弈方策略
的组合 收益是各博弈方追求的根本目标及行为和判
断的主要依据 根据收益的博弈分类:零和博弈、常和博弈、
变和博弈
ui(si*,s-i*)≥ui(si,s-i*), si∈Si
A
纳什均衡的求解——划线法
囚徒困境
-5, -5 -8, 0
猜硬币
-1, 1 1, -1
0, -8 -1, -1
1, -1 -1, 1
纳什均衡的求解——箭头法
审计博弈(B > C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t