纳什均衡及应用举例 博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Complete and Perfect ——完全信息与完美信息
如房地产开发博弈中,如果至少有一个 参与人不知道市场需求的大小,信息是 不完全的也是不完美的
如果两个参与人都知道市场需求是大的 还是小的,信息是完全的,但如果A不知 道B选择了什么行动,那么A的信息是不 完美的。
支付Payoff
用水平 自然人或团体,如企业、国家、OPEC、EU 重要的是每个决策主体必须有可供选择的行动或策略
和一个很好定义的偏好 而不做决策的被动主体只当作环境参数 虚拟参与人:“自然”(nature)作为“虚拟参与人”
(pseudo-player)来处理。这里的自然指决定外生 随机变量的概率分布的机制
有限策略博弈往往用支付矩阵、扩展形法将所有策略、结果 及支付罗列出来。
无限策略博弈其策略数种往往是一个连续数,只能用数集或 函数式加以表示。
有限策略与无限策略同时存在一个博弈问题中
零和博弈
零和博弈:
社会总得益,即各博弈方得益之和总是为
0
猜硬币方
正面
反面
正 盖面 硬 币 方反
面
-1,1 1,-1
在这里,“均衡”和“均衡结果”是两个不同的概 念
博弈分类
博弈中的博弈方
单人博弈 两人博弈 多人博弈
博弈中的策略
有限策略博弈 无限策略博弈
博弈中的得益
零和博弈 常和博弈 变和博弈
博弈的过程
静态博弈 动态博弈 重复博弈
单人博弈
A左B左 0 A左B右 M A右B左 0 A右B右 0
单人迷宫得益矩阵
两人博弈中的注意事项
两个博弈方之间并不总是相互对抗,有 时也会利益一致
掌握信息较多并不能保证得益较多 个人追求自身最大利益的行为常常并不
能导致实现社会的最大利益。
多人博弈例子
厂商3—新技术
厂商2
新技术 老技术
厂 新技术 商 1 老技术
2,2,2 5,0,5 0,5,5 1,1,10
(A)
另有一个开发Fra Baidu bibliotekB也面临同样的选择。 影响因素:市场需求的大小 影响因素:竞争对手的选择
引例:房地产开发博弈
如果市场上有两栋楼出售, 需求大时, 每栋售价1.4亿元,需求小时7000万元
如果市场上只有一栋楼出售,需求大时。 每栋售价1.8亿元,需求小时1.1亿元
房地产开发博弈
需求大,A开发, B开发,利润各4000万元 需求大, A开发, B不开发,A8000万元,B为
房地产开发博弈
需求大的情况 开发商A
开发商B 开发 不开发
开发 4000,4000 8000,0
不开发 0,8000
0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
如果B在市场需求情况未知下先行动,A在得知 B的行动后再行动。
房地产开发博弈
需求大的情况 开发商A
开发商B 开发 不开发
开发 4000,4000 8000,0
不开发 0,8000
0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
市场进入博弈 N
[P]
不进入
高
低
进入者
进入
不进入
(0,300)
“人不犯我,我不犯人;人若犯我,我必犯人” 是一种战略,这里的“犯”与“不犯”是两种行动, 战略规定了什么时候选择“犯”,什么时候选择 “不犯”
静态博弈中参与人同时行动。战略和行动是相同的
作为一种行动规则,战略必须是完备的,就是说, 它要给出参与人在每一种可想象到的情况下的行动 选择,即使参与人并不预期这种情况会实际发生
入口
A
B
出 口 (奖金M)
单人迷宫
单人博弈
A
(0) (M)
B
(0)
单人迷宫扩展形
两人博弈
两人博弈就是在两个各自独立决策,相互 具有策略依存关系的博弈方之间的决策问题
两人博弈是博弈中最普通、最常见,也是 研究得最多的博弈类型。如,囚徒的困境、 齐威王与田忌赛马、猜硬币、石头·剪子·布, 日常生活中的棋牌、球类比赛,以及经济活 动中两厂商之间的竞争、谈判、兼并收购、 劳资纠纷等等都是两人博弈问题
择开发的期望效用为: EuA(开发,开发)=0.5*4000+0.5*(-3000)=500
Outcome & Equilibrium ——结果与均衡
博弈的结果是所有博弈方所关心的,如均 衡策略组合,均衡行动组合,均衡支付组 合。
在房地产开发博弈中,可能的结果是 (高需求,开发,开发),(uA,uB)=(4000,4000) (低需求,开发,不开发),(uA,uB)=(1000,0)
变和博弈
变和博弈:
意味着在不同策略组合(结果)下各博弈方的得益之和不相 同的
变和博弈的特点:
➢最一般的博弈类型,常和博弈和零和博弈则都是它的特例 ➢存在着社会总得益较大的策略组合和社会总得益较小的策 略组合之间的区别,博弈方之间存在互相配合(不是指公 开的合作,只是指各博弈方在利益驱动下各自自觉、独立 采取的合作的态度和行为),争取较大的社会总得益和个 人得益的可能性。这种博弈的结果可以从社会总得益的角 度分为“有效率的”或“无效率的”、“低效率的” ➢各博弈方之间的关系复杂,它们的重复博弈就更加复杂了
它是指在一个特定的策略组合下player得到 的确定的效用水平,或者指参与人得到的期 望效用水平。
这是player真正关心的东西,是player博弈 后所得利益。
他的目标就是在自己可以选择的战略集合里, 选择某个战略以最大化自己的期望效用函数 (v-N-M预期效用函数)。
支付
如果有n人博弈,令ui为Player i 的支付(效用 水平),u=(u1,…ui…un)为支付组合payoff profile,
行动顺序:有关静态博弈和动态博弈的 区分
在博弈论中,一般假定参与人的行动 空间和行动顺序是所有参与人的共同知 识
Strategies & strategies set
战略:是参与人选择行动的规则,它告诉参与人在 什么时候选择什么行动
战略组合
战略与行动是两个不同的概念,战略是行动的规 则而不是行动本身
房地产开发博弈
需求大的情况 开发商A
开发商B 开发 不开发
开发 4000,4000 8000,0
不开发 0,8000
0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
房地产开发博弈
若双方同时决策 若市场需求已知 若市场需求未知,是否开发依赖于各
第一章 完全信息静态信息博弈-纳什均衡
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 纳什均衡应用举例
博弈论的基本概念与求解
引例:房地产开发博弈
设一个房地产开发商A打算开发一栋写字 楼,面临的选择是开发或不开发;若开 发,投入资金1亿元,不开发资金投入为 0
是Player有关博弈的知识,特别是有关其他 参与人(对手)的特征和行动的知识.它是重 要的决策依据和决定博弈结果的重要因素。
信息集:参与人在特定时刻有关变量的值的 信息
Common Knowledge 即共同知识(所有参与 人知道,所有参与人知道所有参与人知道,)
Complete and Perfect ——完全信息与完美信息
自在多大程度上认为需求是大的,以对 方是否开发
房地产开发博弈
若双方不同时决策,且市场需求不确定 设B在A之前决策, 且只有B了解市场
需求 若需求是大的,B选择开发 若需求是小的,B的选择依赖于他多大程
度上相信A 会开发,而A是否开发依赖于 A在多大程度上认为需求是大的。
博弈的基本概念
博弈的一个基本特征是一个参与人的支付不 仅取决于自己的战略选择,而且取决于所有 其 的他战参略与选人择的的战函略 数选 :择,即ui是所有参与人
ui=ui(s1,,…si,…sn),
其中si是Player i 的战略选择。
房地产开发博弈
参与人的利润水平即是他们的支付,如果A,B 同时行动
U发A)(=需4求00大0 ,A开发, B开发)=UB(需求大,A开发, B开 U发A)(=需-求30小00,A开发, B开发)=UB(需求小,A开发, B开 UA(需求大,A开发, B不开发)=8000 UB(需求小,A不开发, B开发)=1000。。。。。。 例如A认为高需求的概率是0.5 ,给定B选择开发,A选
两者主要区别是在对博弈结果与博弈进程知识的掌 握情况有差别:
若每一个参与人都知道所有其他参与人的支付或结 果,称为 完全信息博弈(CIG).
若有一个人不知道其他人的支付 ,称不完全信息博 弈IIG.
若每一个参与人都知道所有其他参与人的博弈进程, 即 动态博弈中轮到行为的博弈方完全了解此前行 为的各博弈方的行为,即了解全部博弈进程,称为 完美的,否则就是不完美的.
B的战略SB=(开发,不开发) A的战略SA=({开发,开发},{开发,不开
发},{不开发,开发},{不开发,不开发})
一个战略组合s=({不开发,开发},开发),A的 战略是“如果B开发,我不开发;如果B不开发, 我开发”,B的战略是“开发”。类似的可以 列出其他7个战略组合
Information
0 需求大, A不开发, B开发, B为8000万元,A
为0 需求大, A不开发, B不开发,都为0 需求小, A开发, B开发,AB各为-3000万元 需求小, A开发, B不开发。A为1000万元B为0 需求小, A不开发, B开发A为0,B为1000万元 需求小, A不开发, B不开发,都为0
Players Action Strategies & strategies set Information Payoff & payoff function Outcome & Equilibrium
Players
决策主体:单人博弈、两人博弈和多人博弈。 目的是通过选择行动或策略以最大化自己的支付或效
1,-1 -1,1
零和博弈
零和博弈的特点:
各博弈方之间的利益对立,“你死我活”的 关系,结果不能完全确定,不能让他们猜出 自己将选择的策略
用零和博弈构成的重复博弈与非零和博弈构 成的重复博弈会表现出很大的不同,零和博 弈重复进行多次不改变博弈方之间相互对立 的关系,其他博弈的重复博弈产生新的机会
B 在位者 (0,400)
斗争 合作
[1-P]
进入
在位者
B 斗争
合作
(40,50) (-10,0)
(30,80) (-10,100)
行动action
行动:是参与人的决策变量
参与人的行动可以是离散的,也可以是 连续的。如Ai={开发,不开发}
行动组合:n个参与人的行动有序集(如 (不开发,开发))
均衡
均衡是所有参与人的最优战略的组合,一般记为 S*= (S1*,…,Si*,…,Sn*) 其中, Si* 是Player i 在均衡情况下的最优策略。
在一般均衡理论中,均衡指由个人最优化行为导致的 一组价格,而在博弈论里,这一组价格只是均衡的结 果而不是均衡本身:均衡是指所有个人的买卖规则 (战略)的组合,均衡价格是这种战略组合的结果
常和博弈
常和博弈 :
每种结果之下各博弈方的得益之和不等于0,但总是等于一 个非零常数,零和博弈本身可被看作是常和博弈的特例
常和博弈的特点:
➢各博弈方之间的利益关系也是对立的,博弈方之间的基本 关系也是竞争
➢不一定要有输家,利益的对立性体现在利益的多少,结 果可能出现大家分得合理或者说满意的一份,因此也比较 容易相互妥协和和平共处。这种博弈往往有一个确定的结 果 ➢在重复博弈中,因为常和博弈的重复能使总得益增加, 因此情况就会复杂得多,并会创造出许多新的结果
厂商3—老技术
厂商2 新技术 老技术
厂 新技术 5,5,0 10,1,1 商 1 老技术 1,10,1 2,2,2
(B)
有限策略和无限策略
不同的博弈问题中各博弈方可选策略的多少不同, 一般分为:有限策略博弈和无限策略博弈
有限策略(所有博弈方都只有有限种可选策略)的博弈只有 有限种结果(一种结果就是每个博弈方各一种可选策略构成 的一个组合,全部可能的结果的数量因而就等于各博弈方可 选策略数的连乘积)