纳什均衡及应用举例-博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Outcome & Equilibrium ——结果与均衡
n
n
n n
博弈的结果是所有博弈方所关心的,如均 衡策略组合,均衡行动组合,均衡支付组 合。 在房地产开发博弈中,可能的结果是 (高需求,开发,开发),(uA,uB)=(4000,4000) (低需求,开发,不开发),(uA,uB)=(1000,0)
房地产开发博弈
需求大的情况 开发商A 开发 不开发 开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
需求小的情况 开发 不开发
开发商B 开发 不开发
-3000,-3000 0,1000 1000,0 0,0
开发商A
n
n n
n
如果B在市场需求情况未知下先行动,A在得知 B的行动后再行动。 B的战略SB=(开发,不开发) A的战略SA=({开发,开发},{开发,不开 发},{不开发,开发},{不开发,不开发}) 一个战略组合s=({不开发,开发},开发),A的 战略是“如果B开发,我不开发;如果B不开发, 我开发”,B的战略是“开发”。类似的可以 列出其他7个战略组合
非合作博弈论
非合作博弈的分类及对应的均衡概念
行动顺序 静态 信 息 完全信息静态博弈; 纳什均衡; 纳什(1950,1951) 完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965) 动态
完全信息
不完全信息静态博弈; 不完全信息动态博弈; 不完全信息 贝叶斯纳什均衡; 精炼贝叶斯纳什均衡; 海萨尼(1967- 泽尔腾(1975),Kreps和 1968) Wilson(1982),Fudenberg 和Tirole(1991)
Strategies & strategies set
n n n
n
n n
战略:是参与人选择行动的规则,它告诉参与人在 什么时候选择什么行动 战略组合 战略与行动是两个不同的概念,战略是行动的规 则而不是行动本身 “人不犯我,我不犯人;人若犯我,我必犯人”是 一种战略,这里的“犯”与“不犯”是两种行动, 战略规定了什么时候选择“犯”,什么时候选择 “不犯” 静态博弈中参与人同时行动。战略和行动是相同的 作为一种行动规则,战略必须是完备的,就是说, 它要给出参与人在每一种可想象到的情况下的行动 选择,即使参与人并不预期这种情况会实际发生
博弈的基本分析思路和方法
严格下策反复消去法
严格下策反复消去法例子
博弈方2
左 中 右
博弈方 1 博弈方
上 下
上 下
1, 0 0, 4
中
1, 3 0, 2
博弈方
0, 1 2, 0
博弈方2
左 中
博弈方2
左
1 , 0 1 ,3 0 ,4 0 ,2
上
1 ,0 1 ,3
严格下策反复消去法
划线法
博弈方2
Complete and Perfect ——完全信息与完美信息
n
n
如房地产开发博弈中,如果至少有一个 参与人不知道市场需求的大小,信息是 不完全的也是不完美的 如果两个参与人都知道市场需求是大的 还是小的,信息是完全的,但如果A不知 道B选择了什么行动,那么A的信息是不 完美的。
支付Payoff
第一章 完全信息静态信息博弈-纳什均衡
n n n n n
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 纳什均衡应用举例
博弈论的基本概念与求解
引例:房地产开发博弈
n
n n n
设一个房地产开发商A打算开发一栋写字 楼,面临的选择是开发或不开发;若开 发,投入资金1亿元,不开发资金投入为 0 另有一个开发商B也面临同样的选择。 影响因素:市场需求的大小 影响因素:竞争对手的选择
n
n
博弈分类
单人博弈
A左B左 A左B右 A右B左 A右B右
0 M 0 0
A
B
单人博弈
两人博弈
n
n n
两个博弈方之间并不总是相互对抗,有 时也会利益一致 掌握信息较多并不能保证得益较多 个人追求自身最大利益的行为常常并不 能导致实现社会的最大利益。
多人博弈例子
2,2,2 0,5,5
5,0,5 1,1,10 5,5,0 1,10,1 10,1,1 2,2,2
有限策略和无限策略
零和博弈
猜硬币方 正面 正面 反面
-1,1
反面
1,-1
盖硬币方
1,-1
-1,1
零和博弈
常和博弈
变和博弈
博弈的过程(1)
博弈的过程(2)
博弈的过程(2)
如何求解一个博弈问题?
n
什么是博弈问题的解
n
n
是一个策略组合,也是最优策略组合;即在给定 条件下,每一个博弈方最大化自己效用选择的结 果。 如在G={S1,…Sn;u1,…un}中,如果所有策略组合 (S1*,…,Si*,…,Sn*),其中任一博弈方i的策略 Si*都是对其余博弈方的策略组合 S-i*=(S1*,…, S*i-1,S*i+1…,Sn*)的最佳对策,则这个策略组合就 是博弈的解。
房地产开发博弈
需求大的情况 开发商A 开发 不开发 开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
需求小的情况 开发 不开发
开发商B 开发 不开发
-3000,-3000 0,1000 1000,0 0,0
开发商A
市场进入博弈
高
N
低
[P]
不进入
进入者
进入 不进入
[1-P]
第一章 完全信息静态信息博弈-纳什均衡
n n n n n
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 纳什均衡应用举例
二 占优战略均衡
n ü
完全信息静态博弈 完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解 静态:所有参与人同时选择行动且只选择一次。 同时:只要每个参与人在选择自己的行动时不 知道其他参与人的选择,就是同时行动 博弈分析的目的是预测均衡结果
Players
n n
决策主体:单人博弈、两人博弈和多人博弈。 目的是通过选择行动或策略以最大化自己的支付或效 用水平 自然人或团体,如企业、国家、OPEC、EU 重要的是每个决策主体必须有可供选择的行动或策略 和一个很好定义的偏好 而不做决策的被动主体只当作环境参数
n n
n n
虚拟参与人:“自然”(nature)作为“虚拟参与人” (pseudo-player)来处理。这里的自然指决定外生 随机变量的概率分布的机制
均衡
n
均衡是所有参与人的最优战略的组合,一般记为 S*= (S1*,…,Si*,…,Sn*) 其中, Si* 是Player i 在均衡情况下的最优策略。 在一般均衡理论中,均衡指由个人最优化行为导致的 一组价格,而在博弈论里,这一组价格只是均衡的结 果而不是均衡本身:均衡是指所有个人的买卖规则 (战略)的组合,均衡价格是这种战略组合的结果 在这里,“均衡”和“均衡结果”是两个不同的概 念
Information
n
是Player有关博弈的知识,特别是有关其他 参与人(对手)的特征和行动的知识.它是重 要的决策依据和决定博弈结果的重要因素。 信息集:参与人在特定时刻有关变量的值的 信息 Common Knowledge 即共同知识(所有参与 人知道,所有参与人知道所有参与人知道,)
n
n
引例:房地产开发博弈
n
n
如果市场上有两栋楼出售, 需求大时, 每栋售价1.4亿元,需求小时7000万元 如果市场上只有一栋楼出售,需求大时。 每栋售价1.8亿元,需求小时1.1亿元
房地产开发博弈
n n
n
n n n n n
需求大,A开发, B开发,利润各4000万元 需求大, A开发, B不开发,A8000万元,B为 0 需求大, A不开发, B开发, B为8000万元,A 为0 需求大, A不开发, B不开发,都为0 需求小, A开发, B开发,AB各为-3000万元 需求小, A开发, B不开发。A为1000万元B为0 需求小, A不开发, B开发A为0,B为1000万元 需求小, A不开发, B不开发,都为0
n
n
n
它是指在一个特定的策略组合下player得到 的确定的效用水平,或者指参与人得到的期 望效用水平。 这是player真正关心的东西,是player博弈 后所得利益。 他的目标就是在自己可以选择的战略集合里, 选择某个战略以最大化自己的期望效用函数 (v-N-M预期效用函数)。
支付
n
n
如果有n人博弈,令ui为Player i 的支付(效用 水平),u=(u1,…ui…un)为支付组合payoff profile, 博弈的一个基本特征是一个参与人的支付不 仅取决于自己的战略选择,而且取决于所有 其他参与人的战略选择,即ui是所有参与人 的战略选择的函数: 其中si是Player i 的战略选择。
左 上 下 中 右
博弈方
1 ,0 0 ,4
1 ,3 0 ,2
0 ,ห้องสมุดไป่ตู้ 2 ,0
划线法分析囚徒困境
-5,-5 -8,0
0,-8 -1,-1
划线法分析猜硬币困境
-1,1 1,-1
1,-1 -1,1
划线法分析夫妻之争
2,1 0,0
0,0 1,3
箭头法
箭头法分析例子
博弈方2
左 上 下 中 右
博弈方 1
ui=ui(s1,,…si,…sn),
房地产开发博弈
n
n n n n n n
参与人的利润水平即是他们的支付,如果A,B 同时行动
UA(需求大,A开发, B开发)=UB(需求大,A开发, B开 发)=4000 UA(需求小,A开发, B开发)=UB(需求小,A开发, B开 发)=-3000 UA(需求大,A开发, B不开发)=8000 UB(需求小,A不开发, B开发)=1000。。。。。。 例如A认为高需求的概率是0.5 ,给定B选择开发,A选 择开发的期望效用为: EuA(开发,开发)=0.5*4000+0.5*(-3000)=500
房地产开发博弈
n n
n n
若双方不同时决策,且市场需求不确定 设B在A之前决策, 且只有B了解市场 需求 若需求是大的,B选择开发 若需求是小的,B的选择依赖于他多大程 度上相信A 会开发,而A是否开发依赖于 A在多大程度上认为需求是大的。
博弈的基本概念
n n n n n n
Players Action Strategies & strategies set Information Payoff & payoff function Outcome & Equilibrium
Complete and Perfect ——完全信息与完美信息
n
n
n
n
两者主要区别是在对博弈结果与博弈进程知识的掌 握情况有差别: 若每一个参与人都知道所有其他参与人的支付或结 果,称为 完全信息博弈(CIG). 若有一个人不知道其他人的支付 ,称不完全信息博 弈IIG. 若每一个参与人都知道所有其他参与人的博弈进程, 即 动态博弈中轮到行为的博弈方完全了解此前行 为的各博弈方的行为,即了解全部博弈进程,称为 完美的,否则就是不完美的.
房地产开发博弈
需求大的情况 开发商A 开发 不开发 开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
需求小的情况 开发 不开发
开发商B 开发 不开发
-3000,-3000 0,1000 1000,0 0,0
开发商A
房地产开发博弈
n n n
若双方同时决策 若市场需求已知 若市场需求未知,是否开发依赖于各 自在多大程度上认为需求是大的,以对 方是否开发
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
箭头法分析猜硬币
-1,1 1,-1
1,-1 -1,1
箭头法分析夫妻之争
2,1 0,0
0,0 1,3
博弈的战略式表述
n
博弈的战略式表述:
战略式表述给出: 1、博弈的参与人集合: i , (1,2,, n); 2、每个参与人的战略空 间:Si,i 1,2,, n; 3、每个参与人的支付函 数:ui (s1 ,, si ,, sn ), i 1,2,, n) 用G S1, ,Sn ; u1 ,, un 代表战略式表述博弈。
进入
(0,300)
B
合作
在位者
斗争
(0,400)
B
合作
在位者
斗争
(40,50) (-10,0)
(30,80) (-10,100)
行动action
n n
n
n
n
行动:是参与人的决策变量 参与人的行动可以是离散的,也可以是 连续的。如Ai={开发,不开发} 行动组合:n个参与人的行动有序集(如 (不开发,开发)) 行动顺序:有关静态博弈和动态博弈的 区分 在博弈论中,一般假定参与人的行动 空间和行动顺序是所有参与人的共同知 识