1.完全信息静态博弈实验指南(2020)
完全信息静态博弈及其纳什均衡解
第三章完全信息静态博弈及其纳什均衡解1.完全信息静态博弈定义 3.1.完全信息静态博弈。
完全信息静态是指,博弈中的参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动;同时博弈参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”。
两个特点:(1)静态;(2)完全信息。
完全信息静态博弈例子。
例1:锤子-剪刀-布例2:交通行驶非“完全信息静态博弈”例子:英式拍卖——动态博弈;第一密封价格及第二密封价格拍卖——不完全信息博弈。
2.纳什均衡及其判定定义3.2 纳什均衡。
在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,一个策略组合{s1*,s2*,…,s n*},若满足u i(s1*,…,s i*,…s n*)≥u i(s1*,…s i,…,s n*)(i=1…n),则称这个策略组合为{s1*,s2*,…,s n*}为该博弈G的一个纳什均衡。
某策略组合是纳什均衡指的是,在该策略组合上任何一个参与人的收益在其他人策略不改变的情况下都至少是弱优的。
特点:(1)每个人没有单独改变策略的动机;(2)局部最优。
纳什均衡判定方法:用定义来判定:某点是均衡看它是否符合纳什均衡的定义。
求解纳什均衡的方法:(2)用定义来求解(3)对于策略空间为连续的博弈,用求极值的方法来求得。
3.纳什均衡存在定理:(纳什)定理3.1.在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,如果n是有限的,且对每个i, S i是有限的,则博弈至少存在一个纳什均衡。
这里的均衡可能包含混合策略均衡。
证明:略例子3:囚徒困境的均衡例1:“锤子-剪刀-布”的均衡?4.混合策略与混合策略的均衡纯策略与混合策略概念。
定义.3.3.一个策略是纯策略指的是参与人策略空间中的某个确定策略;而一个混合策略是参与人策略空间上的一个概率分布,一般地,某个人i的策略空间为{s i1,s i2,…,s ik},则参与人i在策略空间上的一个概率分布p i=(p i1,p i2,…,p ik)构成他的一个混合策略,其中p i1+p i2+…+p ik=1。
1 完全信息静态博弈
(Game Theory and Information Economics)
第2章:完全信息静态博弈
Chapter 2: Static Game of Complete Information
完全信息静态博弈
静态博弈(同时行动博弈)
所有参与人同时选择行动,而且只选择一次 如,罚点球时,守门员和对方射手必须同时决策 “同时”是一个信息概念,而不一定与日历上的时间一致 在博弈中,如果参与者在不知道对手如何选择的情况下行 动,该博弈就是静态的。
1 囚徒困境与占优战略均衡
现实生活中其他囚徒困境的例子
曾经威胁世界整个甚至人类的军备竞赛
公共资源过度开采/公共品供给短缺
大学扩招、研究生扩招、大学贷款基建 年年都有的评优评先活动 各种资格考试广泛盛行 备受批评却日益严重的应试教育
1 囚徒困境与占优战略均衡
如何走出囚徒困境?
基于收益矩阵的模型描述: 参与人
囚徒 B 坦白 抵赖囚徒B可 选策略囚徒 A坦白 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒 A 的支付
囚徒 B 的支付
1 囚徒困境与占优战略均衡
博弈中参与人只拥有有限个离散型的纯战略供其选择。 如篮球比赛中的运球、过人和投篮 离散型策略 另一些博弈中,在其他博弈中,每个参与者的纯策略可以是 来自一个连续范围的一个数。如厂商定价 连续策略
离散型策略静态博弈通常用支付表来表示 ——博弈的战略式表述
1 囚徒困境与占优战略均衡
从一方的角度看,选择“坦白”比选择“抵赖”好,无论他 关 于对方的选择持有何等信念。 我们就说,对于囚徒而言,“坦白”的策略是一个占优策略, 以不变应万变 或者说“抵赖”的策略是一个劣策略。
一完全静态博弈 ppt课件
2020/12/27
33
公共牧场的比喻
• 哈丁所讲的公共牧场则是研究具有同一行为动机结构 的一种特殊的多人情况。
• 那些在会议上高谈阔论却又言之无物的人们,可能看 上去就像牧场上的牛一样,他们一边吃一边践踏,而 另一头牛正在眼巴巴地看着草。
• 现在这个词已经被广泛地应用于研究在公共水域倾倒 污水的行为,在公共石油层开采石油行为,在公海猎 捕鲸鱼的行为,甚至于将地球和地球上的资源比喻成 一个公共养殖场,人类在其中过度繁衍后代。还有中 国的小煤窑的开发以及高校科研经费的申请等。
31
解释
• 寡头竞争的总产量大于垄断产量的原因 在于每个企业在选择自己的最优产量时, 只考虑对本企业利润的影响,而忽视对 另一个企业的外部负效应。这是典型的 囚徒困境问题。
• 这个模型使用重复剔除严格劣战略的方 法找出均衡解。
2020/12/27
32
(2)公共地的悲剧
• 公共地的悲剧(tragedy of the commons)是制度经济 学家非常熟悉的例子。
需求函数取如下线性形式
paq1q2
那么,最优化的一阶条件分别是:
1
q1
a q1 q2 q1
c 0
2020/12/27
2
q2
a q1 q2 q2 c 0
29
反应函数为
q1
R1q2
1 2
a
q2
c
q2
R2 q1
1 2
a
q1
c
解两个反应函数,我们得纳什均衡为
q1
q2
1ac
3
每个企业的纳什利润分别是
2020/12/27
12
关于行动顺序
• 同样的参与人,同样的行动集合,行动 顺序不同,每个参与人的最优选择就不 同,博弈的结果就不同。
经济博弈论 02 完全信息静态博弈(Park)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
完全信息静态博弈实验
在实验中,通常会设定每个策略都 有一个相应的收益值,这些收益值 可以是正面的,也可以是负面的。 参与人的目标是在给定其他参与人 策略选择的情况下,选择一个最佳
的策略,以最大化自己的收益
2
实验步骤
设定参与人数和策略 数量
确定每个参与人的策 略选择
分析博弈结果:包括 最佳策略选择、博弈 均衡以及影响因素等
的策略来增加自己的收益
除了得出最优策略组合外,实验结果还 可以分析不同因素对博弈结果的影响。 例如,参与人的风险偏好、信息不完全 程度、时间限制等因素都可能对博弈结
果产生影响
4
完全信息静态博弈实验是一种经 典的博弈模型,常用于分析策略 选择和决策行为。通过实验可以 得出最优策略组合以及不同因素 对博弈结果的影响。在实际应用 中,完全信息静态博弈也可以用 于研究各种不同领域的问题,例 如经济学、政治学、社会学等。 通过分析不同因素对博弈结果的 影响,可以更好地理解各种问题 的本质和规律,为决策提供参考
完全信息静态博弈实验还可以用 于研究人类的决策行为和心理。 例如,通过实验可以观察到人们 在面对风险和不确定性时的决策 偏好和行为特点。此外,完全信 息静态博弈实验还可以用于研究 人类的合作和竞争行为,以及如 何通过合作和竞争来实现共赢
结论
-
XXXX
感谢观看
汇报人:xxxx
时间:20XX.XX.XX
-
完全信息静态博弈实验
完全信息静态博弈实验
67 LOREM
完全信息静态博弈是一种经典的博弈 模型,其特点是参与人在进行决策时, 对于其他参与人的策略选择和收益情 况都有完全的了解。这种博弈模型常 用于分析策略选择和决策行为,以及
研究不同因素对博弈结果的影响
完全信息静态博弈及其纳什均衡解
袈第四章完全信息动态博弈及其均衡解蝿1.完全且完美信息动态博弈蒆完全信息博弈指的是参与者的收益是共同知识。
螄完全且完美信息动态博弈指的是:博弈中的每一步中参与人都知道这一步之前博弈进行的整个过程。
因此,我完全且完美信息动态博弈的特点:(1)行动是顺序发生的;(2)下一步行动选择之前所有以前的行动都可以被观察到;( 3)每一可能的行动组合下的参与人的收益都是公共知识。
羈而不完美信息博弈指的是,在某一步参与人不知道以往博弈所进行的历史或者没有观察到以往的所有行动。
:假定甲在开采一个价值4万元的金矿时需要1 万元资金,乙有袅例4.1 .我们来考虑这样一个动态博弈1万元资金。
甲向乙借钱来开金矿。
在这个博弈的第一阶段,甲向乙承诺:如果乙借钱给他的话,那么他就会将采到的金子与乙对半分成,即(2 , 3)――乙得到2万元的金子,同时收回自己的1万元投资。
对于甲的承诺,乙如果不借钱给甲的话,那么博弈到此为止,双方收益为(0,1)。
如果乙借钱给甲的话,那么博弈进入第二个阶段。
在第二阶段中,若甲遵守他的承诺,分给乙一半的金子,这样两人的收益为(2 , 3),其中1万元为投资成本。
〖JP3〗然而,若甲违背自己的承诺,博弈就会进入到第三个阶段:如果乙同甲打官司,那么由于打官司费时费力,两个人的收益为(0 , 1);若乙不打官司,那么两个人的收益就为(5 , 0)。
参见图1。
膄甲肇乙不借葿(1, 2) ( 5, 0)芄图1.借钱博弈的博弈树袂蚆2.逆向归纳法与子博弈纳什均衡解羆逆向归纳法(Backward induction )又称逆推法,是指这样一种动态博弈求解方法:从博弈的最后一步开始,计算最后一步的参与人的最优行动, 逐步逆推到博弈开始时进行第- 步的参与人的最优行动,从而确定每个参与人的最优行动。
蚁在动态博弈中逆向归纳法能够进行的前提: 参与人是理性的 任何一步参与人都选择 最优策略;理性是公共知识一一参与人选择最优策略是其他人所能够预测的。
第2讲 完全信息静态博弈【博弈论经典】
第2讲 完全信息静态博弈
• 例2:公共产品的供给也是一个囚徒困境问题。 如果大家都出钱兴办公共事业,所有人的福利都会增加。问题是,如果我出钱你 不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以,每 个人的最优战略是“不出钱”,这种情况下,使得所有人的福利都得不到提高。
例3:“军备竞赛”。 例4:经济改革本身也可能是这样,在许多改革中,改革要付出成本(包括风险), 而改革的成果大家共享,结果是:尽管人人都认为改革好,却没有人真正去改革, 大家只好在都不满意的体
第们集中讨论完全信息静态博弈。 • “完全信息”指的是每个参与人对所有其他参与人的特征(包括战略空间、支付
函数等)有完全的了解。 • “静态”指的是所有参与人同时选择行动且只选择一次。“同时行动”是一个信
息概念而非日历上的时间概念:只要每个参与人在选择自己的行动时不知道其他 参与人的选择,我们就说他们在同时行动。
的组合。 定义:在博弈的战略式表述中,如果对于所有的i,si*是i的占优
战略,那么,战略组合s* = s1*,...,s*n 称为占优战略均衡(do min ant
strategy equilibrium)
第2讲 完全信息静态博弈
• 在一个博弈里,如果所有参与人都有占优战略存在,那么,占优战略均衡是可以 预测的到惟一的均衡,因为没有一个理性的参与人会选择劣战略。
• 纳什均衡是完全信息博弈解的一般概念,也是所有其他类型博弈解的基本要求。
第2讲 完全信息静态博弈
• 1.纳什均衡 纳什对博弈论的贡献有两个方面:一是合作博弈理论中的讨价还价模型,称为纳什 讨价还价解(Nash bargaining solution); 二是非合作博弈论方面,这是他的 主要贡献所在。 纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般意义 上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样就奠定了非合作 博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它如同瓦尔拉斯均衡一样, 已成为经济学中的专家术语。
第一章:完全信息静态博弈
2019/9/18
博弈论(陈艳)
1.1-2博弈论的战略式表达
一个博弈可以用两种不同的方式来表述,一种是战略式 表述,另一种是扩展式表述。尽管从理论上讲,这两种 表述形式几乎是完全等价的,但从分析的方便性的角度 看,战略式表述更适合于静态博弈,而扩展式表述更适 合于讨论动态博弈。
信息集
完美信息:一个参与人对其他参与人(包括虚拟参与人“自然”)的行 动选择有准确了解的情况,即每个信息集只包含一个值
完全信息:自然不首先行动或自然的初始行动被所有参与人准确观察到 的情况,即没有事前的不确定性。
共同知识:所有参与人知道,所有参与人知道所有参与人知道,所有参 与人知道所有参与人知道所有参与人知道…的知识。
2019/9/18
博弈论(陈艳)
6、结果:是博弈分析者所感兴趣的所有东西,如均衡战 略组合、均衡行动组合、均衡支付组合等。
7、均衡:是所有参与人的最优战略的组合,一般记为: s*=(s1*, …,si*, …,sn*)。
为了把一个特定参与人与其他参与人相区别,我们将用 s-i=(s1, …,si-1,si+1,…,sn)表示由除i之外的所有参与 人的战略组成的向量。
博弈的战略式表述:G={N,(Si)iN,(Ui)iN} 有三个基本要素:
(1)参与人(players)iN={1,2,…,n} ;
(2)战略(strategies),siSi(战略空间); (3)支付(payoffs),ui=ui(s-i,si)。
2019/9/18
博弈论(陈艳)
案例1:囚犯困境
3、不管是否沟通过,无法做出有约束力的承诺(非合作)
经济博弈论完全信息静态博弈
19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
第一课应用博弈论第二讲 完全信息静态博弈
们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
21
例3
为什么只有大企业才会花巨额金钱打广 告?
大企业是大猪,中小企业是小猪。大企 业投入大量资金为产品打广告,中小企 业等大企业的广告为产品打开销路形成 市场后才生产类似产品进行销售。
经开始对日本和德国这两个法西斯轴心国展开大反 攻。
在欧洲,以艾森豪威尔为总司令的盟国远征军,准
备横渡英吉利海峡,在欧洲开辟第二战场。欧洲只
有东翼的苏德战场是两大阵营对抗的正面战场,前
苏联方面一再要求美英同盟国及早在欧洲大陆开辟
第二战场。1944年春天,英美联军在北非战场中彻
底摧毁了德国隆美尔元帅的抵抗,德军已经完全收
德军在欧洲西线的总兵力是58个师,要布防的海岸线 长达3000公里。因此,德军只能把主要兵力放在它认为 盟国最有可能渡海登陆的地方。同时,盟军在英国能够 用于渡海作战的兵力,由于受登陆舰船容量的限制,数 量也有限,只能考虑集中有限的兵力重点进攻一个地方。 因此,无论是对于盟军还是对于德军,选择和判断盟军 将在那里登陆已经成为这次跨海作战成败的关键。
生活中其实有很多相关的例子。
19
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
第一章完全信息静态博弈
二人对称矩阵博弈小结
参与人B
合作 不合作 s, t p, p
参与 人A
合作 不合作
r, r t, s
• • • •
囚徒困境博弈: t>r>p>s 胆小鬼博弈: t>s>(=,<)r>p 求同存异博弈: t>s>p>r 共同投资问题: r>p=(>)t> s
(4)共同投资(打猎)问题
• 当参与者共同投资大项目时将获得更高
的收益,但当另一方玩花样而投资于小 项目时,大项目投资者将被套 。 B
联合 单独
0,1
A
联合
2,2
单独
1,0
1 ,1
在该博弈中,双方都投资于小项目是风 险占优均衡 。
启 示
• 该类博弈与求同存异有相似之处,双方有
共同的利益,差异在于求同的两种结果中 ,一种是风险占优的,一种是帕累托占优 的。 • 考试作弊问题
理性经济人 行为互动假设 决策及其均衡问题
一、双人策略型博弈的经典例子
• 双人博弈又可分为:
对称博弈:博弈参与者是无差异的 非对称博弈:局中人地位不一样,因而 策略选择不一样,支付也不同 • 以下考查二人二种策略博弈问题。 二种策略是指将局中人的策略抽象为合 作(投对方所好)和非合作两种类型。
1、二人对称博弈
囚徒困境
• 博弈中的(坦白,坦白)是双方的占优策
略均衡。 囚徒B 抵赖 抵赖 囚徒A 坦白 -1,-1 0,-10 坦白 -10, 0 -8,-8
智猪博弈
小猪 按 按 大猪 等待 5,1 9,-1 等待 4,4 0,0
•对小猪而言,等待是其占优策略;大猪没有 占优策略。 •大猪理性的,知道小猪将选择等待而不会选 择按,在小猪选择等待时,对大猪而言按是 其占优策略。
经济博弈论02完全信息静态博弈(Park)
合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
完全信息静态博弈ppt课件演示文稿
招认
囚徒2 招认 沉默 –5, -5 0, -8
-8, 0 -1 , -1
囚徒1
沉默
囚徒的困境
We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game;(2)the strategies available to each player;(3)the payoff received by each player for each combination of strategies that could be chosen by the players.
Definition: The normal-form representation of an-n-player game specifies the players‘ strategy spaces S1 , … , Sn and their payoff functions u1 ,…, un. We denote this game by G={S1, … ,Sn;u1, … , un}. 教材 P22
≥ ui( s1*…, sn-1* , si , sn+1* ,…, sn* ) ……………………………………….(NE)
for every feasible strategy si in Si; That is , si*solves max ui( s1*…, sn-1* , si, sn+1* ,…, sn* ). si∈Si
参与人2 左 中 右 上 1, 0 1, 2 0, 1
参与人1 下 0, 3 0,1 2,0 第二
1 完整信息静态博弈
布
1 ,-1
当参与人的个数为有限数且每个参与人的战略空间中的元素只有限个时,
称博弈为有限博弈(finite game)。
例 2: 囚徒困境 (The Prisoner’s Dilemma)
囚徒 1
不Hale Waihona Puke 白 坦白不坦白囚徒 2
-1 ,-1 -9 ,0 0 ,-9 -6 ,-6
囚徒 1 的考虑:无论对方选不坦白还是坦白,自己选“坦白”好于 “不坦白”。
完全信息静态博弈中,一个参与人的战略是他采取的一个行动 (action)
参与人 i 的战略:si. 参与人 i 的战略空间: Si. 战略的一个组合: s ={s1,s2, …, sn}. 简化表示:s- i={ s1,…, s i -1, s i+1, …, sn }.
(3) 收益 (payoff):参与人在博弈结束后从博弈中获得的效用,一般 是所有参与人的策略或行动的函数
博弈论与最优化理论
1.0.2 博弈的类型 (1)参与者行动的时间与顺序 同时行动——静态博弈; 先后行动——动态博弈。 (2)参与者的信息多少 知道对手的特征、策略空间、支付函数等——完全信息博弈; 不知道对手的特征、策略空间、支付函数等——不完全信息博弈。 将上述两个角度的划分结合起来,我们就得到四种不同类型的博弈, 这就是:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和 不完全信息动态博弈。 (3)参与人之间是否存在具有约束力的协议 有——合作博弈 无——非合作博弈 (4)参与人各方的得益总和是常数还是变数。 常数——常和博弈 变数——变和博弈
囚徒 2 的考虑: 无论对方选什么,“坦白”好于“不坦白”。 两人的选择: (坦白,坦白)。
1.1.2 纳什均衡 (1)占优战略均衡(dominant-strategy equilibrium),是指当所有参 与人都选择各自的严格占优战略时所出现的战略组合
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
西方经济学实验一:完全信息静态博弈实验指南一、博弈论概述博弈论(game theory)又被称为“对策论”、“赛局论”。
博弈论是研究相互依赖、相互影响的决策主体的理性决策行为及这些决策的均衡结果的理论。
博弈主要包括局中人、行动、信息、战略、支付(效用)、结果和均衡等要素,其中,局中人、战略和支付是描述一个博弈所需的最少要素。
局中人、行动和结果统称为“博弈规则”。
(1)依据博弈参与者相互作用时能否达成一个具有约束力的协议,可将博弈分为合作博弈和非合作博弈。
如果有具有约束力的协议,就是合作博弈;如果没有,就是非合作博弈。
(2)依据博弈局中人行为的时间序列性,可将博弈分为静态博弈、动态博弈两类。
静态博弈是指在博弈中,局中人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
(3)按照局中人对其他局中人的了解程度,可将博弈分为完全信息博弈和不完全信息博弈。
完全信息博弈是指在博弈过程中,每位局中人对其他局中人的特征、策略空间及收益函数有准确的信息。
不完全信息博弈是指如果局中人对其他局中人的特征、策略空间及收益函数信息了解得不够准确,或者不是对所有局中人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。
目前经济学家们所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博理论复杂,在理论上的成熟度远远不如非合作博弈论。
非合作博弈可分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,其对应的均衡概念和理论研究的代表人物如表1所示。
(1)纳什均衡纳什均衡(Nash equilibrium)的核心思想是:博弈的理想结局是,每个局中人选择的策略是对其他局中人所选策略的最佳反应,其中每一个局中人都不能因单方面改变自己的策略而获益。
纳什均衡有一个很重要的特点,是可以自我实施的,即信念和选择之间的一致性。
就是说,基于信念的选择是合理的,同时支持这个选择的信念也是正确的。
如果所有人都认为这个结果会出现,这个结果就真的会出现。
如果局中人事前达成一个协议,在不存在外部强制的情况下,每个人都有积极性遵守这个协议,这个协议就是纳(2)混合战略纳什均衡工人偷懒 不偷懒老板监督 不监督员工不偷懒、老板不监督是最好的(总收益最大)但如果员工知道老板不监督,员工则偷懒;如果老板知道员工偷懒,老板则监督……形成一个循环。
假如老板认为员工偷懒的概率是P ,不偷懒的概率是1-P ,从老板的角度看,监督的预期收益是: 1×P+(-1)×(1-P)=2P-1……(1) 不监督的预期收益为: (-2)×P+2×(1-P)=1-4P ……(2) 令(1)=(2),得P=1/3,这时,员工选择以1/3的概率偷懒,2/3的概率不偷懒,老板监督与不监督,老板的收益一样的。
假如员工认为老板监督的概率为Q ,不监督的概率为1-Q ,这时,从员工的角度,偷懒的预期收益是: (-1)×Q+3×(1-Q)=3-4Q (3)不偷懒的预期收益为: 2×Q+2×(1-Q)=2 (4)要使员工的选择在这两者之间无差异,则令(3)=(4),得Q=1/4;意味着老板以1/4的概率监督,3/4的概率不监督,员工的的收益一样的。
因此,混合战略纳什均衡是:员工以1/3的概率偷懒,2/3的概率不偷懒;老板以1/4的概率监督,3/4的概率不监督。
***纳什均衡的存在性问题:(一般存在奇数个纳什均衡)1、每一个有限博弈至少存在一个纳什均衡(纯战略或混合战略);2、如果一个博弈存在两个纯战略纳什均衡,那么,一定存在第三个混合战略纳什均衡。
(3)高风险下的纳什均衡在一些特殊情况下,即使犯错误的可能性很小也可能导致大的灾难(比如核电站,出问题就非常严重),纳什均衡就可能不会产生有说服力的解释。
考虑如下博弈:乙甲上下 这个例子说明,个体可能不想我们所假设的那样完全理性,在遇到高风险的情况下,人们会考虑风险,从而使得最终结果可能偏离纳什均衡战略。
(4)占优策略均衡在一些特殊博弈中,一个局中人的最优策略选择可能并不依赖于其他局中人的策略选择,即无论其他局中人选择什么策略,他的最优策略是唯一的,这种最优策略被称为“占优策略”。
该策略只要求行动者是理性的,对手是否理性不作要求。
在一个博弈里,如果所有局中人都有占优策略存在,那么占优策略均衡是可以预测到的唯一的均衡,因为没有一个理性的局中人会选择劣策略。
(5)重复剔除占优均衡“劣”战略:无论对方选择什么,如果自己选择A 得到的收益总是小于选择B 得到的收益,A 就是相对于B 的劣战略。
把这个劣战略剔除;然后再剔除剩下的博弈中对手的劣战略;继续这个过程,直到没有劣战略存在。
如果剩下的战略组合是唯一的,这个唯一的战略组合就是“重复剔除占优均衡”。
最初的智猪博弈收益矩阵首先剔除小猪行动劣策略所得的收益矩阵为: 其次,再剔除了大猪等待劣策略的智猪博弈均衡小猪小猪 小猪大猪 行动大猪 行动 大猪行动等待等待 等待理性共识:0阶理性共识:每个人都是理性的,但不知道其他人是否是理性的;1阶理性共识:每个人是理性的,并且知道其他每个人也都是理性的,但并不知道其他人是否知道自己是理性的;2阶理性共识:每个人是理性的,并且知道其他每个人也都是理性的,并且知道其他人知道自己是理性的,但不知道其他人是否知道自己知道其他人都是理性的……三阶、四阶……n 阶依次类推。
重复剔除不仅要求每个人是理性的,而且要求每个人知道其他人都是理性的,每个人知道每个人知道每个人是理性的,如此等等,即理性是“共识”。
(1)囚徒困境:假定有两个犯罪嫌疑人共同作案。
警察抓住他们以后,分开拘押,并告诉他们:可以选择坦白,或是不坦白;如果一个人坦白,而另一个人不坦白,则坦白的一方会被立即释放,而不坦白的一方被判10年;如果两人都坦白,则会每人各判8年;如果两人都抵赖,因证据不足,则每人在关押1年后释放。
那么,这两个犯罪嫌疑人该如何选择呢?该博弈体现了哪种均衡?乙甲坦白 不坦白我们假设局中人是理性的,都不想坐牢,能少坐牢尽量少坐牢。
我们先考虑甲的选择,他面对的问题是:如果乙坦白的话,自己坦白判8年,不坦白判10年,那么坦白比不坦白好;如果乙不坦白,自己坦白会被立即释放,不坦白则判1年,坦白还是比不坦白好。
因此,不论对方坦白不坦白,甲或乙自己的最优选择都是坦白。
由囚徒困境我们可以看出,一个人的最优选择并不依赖于他人的选择,因此囚徒困境博弈有占优均衡,所以其结果很容易预测。
(2)智猪博弈假设猪圈里有一头大猪、一头小猪。
猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,谁先按按钮,谁会后到食槽边。
而且按按钮的那一方就少吃2个单位的食物(按按钮的成本),若大猪按按钮,那么小猪先到槽边,大小猪吃到食物的收益比是4∶4,如果两只猪同时按按钮,它们同时到槽边,大小猪吃到的食物比是5∶1;如果小猪按按钮,那么大猪先到槽边,大小猪吃到的食物比是9∶-1;当然如果两只猪都选择等待,那么没有食物进入食槽,两只猪的收益比就为0:0。
小猪行动 等待(3)混合战略纳什均衡足球队的点球手走向罚球点时需要做一个重要决策:踢向网的左边还是右边(为了简单起见,忽略踢向中间或高球或低平球的选项)。
守门员将力图预测点球手的行为,决定扑向左边还是右边。
如果他扑向了罚点球的方向,那他很有可能将球扑出;如果他扑错了方向,那点球手就很可能取得进球。
再次地,为了简单起见,假定守门员扑的方向正确就一定能扑出点球,不正确就会失球。
相应的支付矩阵:守门员点球手左右下地通过抛硬币来决定你罚点球的方向。
正面朝上就踢向右边,反面朝上就踢向左边;或者反之。
如果某个局中人有n 个纯战略,那么,混合战略就是在这n 个纯战略上的概率分布 (p 1,p 2,...,p n ),即以 p i 的概率选择纯战略i,11=∑=ni ip。
若p i =0,则说明纯战略i 被选到的概率为0。
indifferent )。
原因在于,如果某个纯战略严格地好于其他纯战略,那么,该局中人应该以1的概率选择那个纯战略,而这与混概率选择的纯战略差。
原因在于,如果局中人的均衡混合战略中以正概率选择的纯战略比以0概率选择的纯战略差,那么,该局中人的那个所谓均衡混合战略就不是他的最优选择,这与混合战略纳什均衡矛盾。
(2)梅西罚丢点球应该得到原谅! (3)博弈论的主旨是换位思考。
二、实验目的通过完全信息静态博弈实验,使学生直接参与博弈游戏并亲身感受“囚徒困境”,从而让学生进一步理解博弈论中的占优战略、纳什均衡等有关概念,并能够应用这些概念分析完全信息静态博弈问题。
三、实验过程1、实验材料(扑克牌)一副,用作标记实验参与者身份及编号;2、每位实验参与者有1份“完全信息静态博弈实验者收益记录表”,8轮均有“完全信息静态博弈决策(第X 轮)”;3、工作人员填写“完全信息静态博弈实验记录表”、“完全信息静态博弈实验数据汇总表”、“完全信息静态博弈实验全班收益汇总表”。
1、抽取4-5人为试验工作人员,保证全班按照偶数原则落实实验参与者。
2、按红、黑扑克牌颜色将实验者分为两组,编号分别为A1、A2、……An;编号分别为B1、B2、……Bn。
A组坐教室一边,B组坐教室另一边,中间隔离,方便工作人员收发扑克牌。
3、按照特定牌落实工作人员。
1、在博弈过程中不允许合谋、欺诈欺骗等行为发生,出牌前不能让对方任何人看到自己的决策;2、每个实验者都以追求最大收益为目标;3、每位实验参与者在每轮博弈中仅可做出“红”或“黑”的选择。
4、本实验分两个阶段共8轮实验,每轮实验流程相同。
首先,AB两组工作人员随机发牌,每位实验参与者需要确定自己的牌和身份编号。
分发“完全信息静态博弈实验者收益记录表”,每位实验参与者填写相关信息。
其次,AB两组工作人员分发“完全信息静态博弈决策”,每位实验参与者填写“完全信息静态博弈决策”,并在“完全信息静态博弈实验者收益记录表”中记录“我的牌”、“我的编号”、“我的决策”。
将填写好的“完全信息静态博弈决策”交给本组的工作人员。
第三,AB组工作人员清点“完全信息静态博弈决策”无误后,交给统计人员。
第四,AB组工作人员回收扑克牌,洗牌,等待“本轮实验结束,开始下一轮实验”指令。
5、教师公布配对博弈规则,工作人员记录每轮每对实验参与者的决策结果,填写每一轮的“完全信息静态博弈实验记录表”。
记录完毕以后,向全体实验参与者宣读配对结果,全体实验参与者自行计算本轮个人收益,并将结果填入“完全信息静态博弈实验者收益记录表”。