博弈论第二章——博弈规则.
博弈论PPT课件
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论(第一、二章)
游戏2:摘柿子
甲 跑
摇 跑
乙
摇 跑
甲
摇
乙 跑
摇 跑
甲
不跑 (2,2)
(0,0)
(0,1) (2,0)
(0,3) (4,0)
游戏3:免费彩票博弈
每个人可以免费购买任意数量彩票,随机 抽取1张彩票中奖,奖金总额为1000万元/n,n 为彩票数量。
博弈论:研究理性人行为选择的理论
博弈论作用:帮助个人、组织等决策主 体深刻理解策略并明智的选择行动。
第二章 完全信息静态博弈
� 基本分析思路和方法 � 纳什均衡 � 混合策略 � 纳什均衡的选择
第一节 基本分析思路和方法
行动或策略(acቤተ መጻሕፍቲ ባይዱion or strategy)
si:局中人i的一个特定策略 Si:局中人i的策略集(strategy set)或策略空间 (strategy space),可以是离散的或连续的。
纳什的基本贡献是证明了非合作博弈均衡解 及其存在性,建立了作为博弈论基础的“纳 什均衡”概念;海萨尼则把不完全信息纳入 到博弈论方法体系中;泽尔腾的贡献在于将 博弈论由静态向动态的扩展,建立了“子博 弈精练纳什均衡”的概念。
1996莫里斯(James A.Mirrlees)和维克瑞(William Vickrey)
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
C -1 +1 +1
游戏1:军事游戏-进攻和防守
博弈结果表
守方
B 攻方 a -1 b -1 c +1 +1 +1 -1 +1 -1 -1
第2讲 博弈的类型与表述
1. 博弈的基本要素
博弈的类型与表述
—— 参与人 参与人(Player)是博弈中的决策主体。一般表示为:
i I 1, 2,
, n
一局国际象棋的参与人是两位棋手;在囚徒困境的例子中,参与人是囚徒甲和囚徒乙。 —— 博弈规则 博弈的规则(Rule),规定了每位参与人何时行动,以及在轮到每位参与人行动时,他能够选 择哪些行动。 国际象棋有其详细的规则;在囚徒困境的例子中,规则就是两名囚徒分别决定是“坦白”还 是“抗拒” 。 —— 行动 在一个博弈中,在不同的阶段可能有不同的参与人需要“行动(action)” ,这些参与人在这博 弈的一阶段的行动,共同决定着博弈在这一阶段的结果。 在一个博弈中, 并非每名参与人在每一阶段都要有行动, 但是没有一名参与人在整个博弈的 任何阶段都不行动。 —— 策略 在一个博弈中,一名参与人的一个“策略(strategy,也叫‘战略’)”是该参与人的“一整套 行动计划” ,在该博弈每个轮到该参与人行动的位置,为该参与人规定一个行动。通常用 si Si 表示参与人 i 的策略,其中 Si 表示参与人 i 的“策略集” 。 策略是博弈中最重要的概念,我们在之后还会详细介绍这一概念。 —— 结果 在一个博弈中, 一个 “结果(Outcome)” 由每名参与人选择的一个策略(战略)共同组成, 因此, 博弈的一个结果就是博弈所有参与人的一个策略组合:
u u s u1 s , u2 s ,
, un s
要注意区分博弈的“结果”和“支付”—— 博弈的“结果”只是指“最终发生了什么” ,博 弈的“支付”是指“最终每个参与人获得了什么” 。但是,博弈的每个结果都必然对应着一个支 付向量,为每名参与人规定了一个支付。 例如,在囚徒困境的例子中, “甲选择‘坦白’ ,乙选择‘抗拒’ ”是一个结果,这一结果对 应的支付向量是(0,-8)。 在现实中,有时我们无法直接改变博弈的规则和各种可能出现的结果,但是,如果我们能够 通过各种办法改变博弈的各种结果对应的支付, 就能够改变博弈参与人面临的支付, 从而将博弈 导向不同的均衡结果。(举例) —— 博弈的 3 个基本要素 在上述所有有关博弈的概念之中,给定博弈的规则,构成一个 n 人博弈 n 由 3 个基本要素 是:参与人、结果和支付:
博弈论-入门
人接受了这五十万,其中的一个人说:“自己没有钱
,父母苦了一辈子了,临老了生病没钱医治,为了父
母,放弃了爱情吧。”
男人接着开出了第三个价格“500万!”
现场更静了,男人的第一个动作都是看身边的女
人,也许是在权衡什么。一半的男人沉默了,另一半
的男人怯生生的说:“我要爱情。”身边的女友也有
点呆住了,一个女孩子站起来说:“如果一个男人肯
去年七八月间,陈某儿子与赖某离婚;同年9月17日,陈某也 与王某办理了事实婚姻的离婚手续。仅仅四天后,陈某就与原 儿媳赖某登记结婚。结婚当天,他就向高新区公安分局户籍管 理部门申请办理儿媳、孙女的户籍迁移,欲将她们的户口迁到 上王村。工作人员将陈某的申请材料退了回来,口头告知他说 ,要迁户口,需先取得所在村委会的同意,并开具证明。
博弈 game—— “下棋”、“玩牌”,赌博和其他许 多智力游戏在内的对抗性游戏、对抗性体育竞 赛。博弈就是策略性的互动决策,通俗的说就 基于交叉效应的有意识的行为互动 交叉效应 参与人意识到交叉效应
博弈论,英文为Game theory,是研究相互依 赖、相互影响的决策主体的理性决策行为以及 这些决策的均衡结果的理论。
以利交者,利尽则散!以色交者,色衰则疏! 以貌交者,久之则腻!唯有以心交者,方能永恒!
理性
每个参与人均以获取最大支付为目标 理性内涵:对自己利益完全了解并能完美计算出何种
行动可最大化其利益 理性不意味着:
参与人自私 着眼于短期利益 与其他参与人有相同价值体系
男人无所谓忠诚,忠诚是因为背叛的砝码太低; 女人无所谓忠贞,忠贞是因为受到的引诱不够.
2
田忌策略:
结 果:
谋士孙膑 策略: 结 果:
精品课程《博弈论》PPT课件(全)
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
博弈论课件 第二章
2.3 无限策略博弈分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性
2.3.1 古诺的寡头模型
假设条件:
市场总产量Q q1 q2 市场出清价格 P P(Q) 8Q 边际成本c1 c2 2,无固定成本 两厂商同时决定各自产的量
2.2.1 纳什均衡的定义
博弈、博弈方的策略空间和得益的一般表示法 G 表示一个博弈; n个博弈方;
S1,S2, ,Sn表示每个博 策弈 略方 集的 合可 , 空 选 称 间为 ”“ ; sijSi表示博 i的 弈第 j个 方策略; 博弈i的 方得益 ui表 用示ui, 是各博弈方策 函略 数的 ;多元
★★★学习博弈论,大家一定要记忆一些基本的模型。因为很多
时候,我们总是基于已有的模型,对其做出修订来考察一些新的 问题。完全创新的模型是很少见的,当我们记忆的模型多了,就 很容易在分析问题时套用模型,并修订模型的条件来考察自己研 究的问题。
其实大家学习西方经济学理论的时候,会发现它与大家曾接触 的马克思主义经济学理论,以及国内一些逻辑思辩型的经济学研 究范式一个很大不同就在于,它采取的是一种模型化的思维。我 们学习西方经济学的时候,会发现始终在学习一些模型,因为模 型是帮助我们简单地理解现实世界的有用工具。经济学中的数学 模型,其实与生物课教学的塑料人体模型等在本质上并无不同。
左
中
右
博弈的解:(上,中)
博上 弈 方 一
下
1,0 0,4
1,3 0,2
0,1 2,0
2.1.3 划线法
囚徒困境
囚 坦白 徒 1 不坦白
囚徒 2 坦白
2 完全信息静态博弈
2 政府
救济 3,
3
-1,
1 0 0,
1 )( ( )) ( 01
不救济 -1,
求微分,得到政府最优化的一阶条件:
同样,可以根据流浪汉 的期望效用函数找到政 府的最优混合策略。??
即:流浪汉以0.2的概率选择寻 找工作,0.8的概率选择游荡
四. 混合策略纳什均衡
社会福利博弈
四. 混合策略纳什均衡
社会福利博弈
救济 政府
流浪汉
寻找工作 2 3, 1 不救济 -1, 0, -1, 0 流浪 3
设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的策略都是给定对方混合策略时的最优策略
四. 混合策略纳什均衡
四. 混合策略纳什均衡
策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
纯策略:如果一个策略规定参与人在每一个给定的信 息情况下只选择一种特定的行动,该策略为 纯策略。 混合策略:如果一个策略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行动, 则该策略为混合策略。
由于混合策略伴随的是支付的不确定性,因此参与 人关心的是其期望效用。
最优混合策略:是指使期望效用函数最大的混合策 略(给定对方的混合策略) 在两人博弈里,混合策略纳什均衡是两个参与人的 最优混合策略的组合。
支付最大 化法
四. 混合策略纳什均衡
流浪汉
寻找工作 流浪
假定政府的混合战略是 G , ); ( 1 流浪汉的混合战略是 L , )。 ( 1 政府的期望效用函数为: v( G, L) (3 1 ( )( )) 1 (5 1 ) vG 5 1 0 故 * 0.2
博弈论-博弈规则
4.1:回应规则之威胁
威胁的策略接近于管理学上的“热炉效应”,形象地阐述了惩罚的规则:
1.热炉火红,不用手去摸也知道炉子是热的,是会灼伤人的—警告性原则
2.每当你碰到热炉肯定会被灼伤—必然性原则
3.每当你碰到热炉,立刻就会被灼伤—即时性原则
4.不管谁碰到了热炉,都会被灼伤—公平性原则
威胁的最大优点在于你不需要率先行动,只要在对手行动之前公布你的行动策略就可以形成威胁。
4.2:回应规则之承诺
承诺是在别人与自己合作后给与的回报。
它给别人带来的是一种预期的效益。
如果是一次性博弈,违背承诺当然能给自己带来额外的收益,所以在一次性博弈中承诺的话往往不算数的。
但是在多次博弈中,如果承诺没有兑现,那么随后的博弈中承诺将变成毫无意义的空话。
4.3:不要忽视你身边的任何一个人
博弈无处不在正是因为我们的对手无处不在。
并不是所有的人都纯粹地依靠理性来行动,他们还受到情感的、道德的、法律的规则来约束。
因而并不是每个人都会成为我们博弈的对手。
只要你能善待不是你敌人的每一个人,你的潜在对手或许会变成你的朋友。
善待你身边的人,别让他变成你的敌人,永远也不要把自己投进博弈的海洋。
博弈论讲义2
三 重复剔除的占优均衡
重复剔除严格劣策略:
思路:首先找到某个参与人的劣策略(假定存 在),把这个劣策略剔除掉,重新构造一个不包 含已剔除策略的新的博弈,然后再剔除这个新的 博弈中的某个参与人的劣策略,一直重复这个过 程,直到只剩下唯一的策略组合为止。 这个唯一剩下的策略组合就是这个博弈的均衡 解,称为“重复剔除的占优均衡”。
独木桥
进
A
退
B
进退 -3,-3 2,0
0,2 0,0
纳什均衡:A进,B退;A退,B进
斗鸡博弈
村子里有两户富户,有两种可能:一家修,另 一家就不修;一家不修,另一家就得修。
冷战期间美苏抢占地盘:一方抢占一块地盘, 另一方就占另一块。
夫妻吵架,一方厉害,另一方就出去躲躲。
注意:在混合策略纳什均衡条件下,也可能两 败俱伤。
注意: 如果所有人都有(严格)占优策略存在,
那么占优策略均衡就是可以预测的唯一 均衡。 占优策略只要求每个参与人是理性的, 而不要求每个参与人知道其他参与人是 理性的(也就是说,不要求理性是共同 知识)。为什么?
二 占优策略均衡
案例-囚徒困境
囚徒A
囚徒 B
坦白
坦白 -8,-8
抵赖
0,-10 -8大于-10
相安无事;第二天,相安无事……;直到第100天 ,突然,每个妻子都把丈夫杀了。为什么会这样?
这是一个推理和行动的过程。如果她的丈夫不忠的话,她就杀 死他;如果没有证据证明她的丈夫不忠的话,她便相信他,不 杀死他。
如果村里只有一个男人是不忠的话,在老太太作了宣布之
后的第一天,这个男人的妻子在老太太宣布之后马上就能知道
两只猪一起去按,然后一起回槽边进食, 由于大猪吃得快可吃下8个单位的食物, 小猪只能吃到2个单位食物。
第二章同时决策博弈静态博弈(博弈论教程石家庄经济
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
➢二、寻找优势策略:定义法
➢(一)案例:超市中的可乐价格大战
➢
PESPI
➢
低价
高价
➢ ➢COCO ➢
低价 高价
3,3 1,6
6,1 5,5
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
都是各参与人各自的上策 Ø(低价,低价) Ø特征:博弈中的稳定结果
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
➢三、优势策略均衡
➢(二)寻找优势策略均衡
➢艺术家公明要求看装修商的设计方案
➢
装修商
➢
给看 不给看
➢
要求看 800,600 0,0
➢公明 ➢
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
第二节 优势策略与优势策略均衡
Ø二、寻找优势策略:定义法
Ø(四)结论 Ø严格优势策略组合(低价,低价)
Ø囚徒困境:对个人而言最优的策略 (低价),对集体而言非最优。个人 理性与集体理性冲突
Ø原因:只关心己方利益,双输
2020/12/10
第二章同时决策博弈静 态博弈(博弈论教程石家
庄经济
2020/12/10
第二章同时决策博弈静态博弈(博弈 论教程石家庄经济
夫妻吵架——斗鸡博弈
Ø特征
Ø1.双方了解各种情况下的得益:完全
信息
Ø进——胜利
•亲爱的,你先 吵,你吵完了
Ø退——丢面子
我再吵?
博弈论最全完整-讲解
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的
逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
例3:为什么教授如此苛刻?
问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺?
他必须找到某种使拒绝变得强硬和可信 的方法。
拿行政程序或者学校政策来做挡箭牌 在课程开始时做出明确和严格的宣布 通过几次严打来获得“冷面杀手”的声
誉
导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
按照大家是否清楚对局情况下每个 局中人的得益。
“各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识 (common knowledge)。
据“共同知识”的掌握分为完全信 息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
博弈论——精选推荐
博弈论第1章博弈论基本模型1、在⼀个博弈中,所有的局中⼈都选择合作⾏为,该博弈是否为合作博弈?答:如果在⼀项活动中,参与⼈具有合作的意向,⽽合作的⾏为⼜能得到有⼒的保障,则称这种博弈活动为合作博弈。
存在有⼒的保障,实际上说明了合作博弈问题的博弈⽅之间既存在共同利益,但利益⼜不完全⼀致。
⽽事实上合作博弈协议的内容除了约定⾏为以外就是利益分配,达成协议的前提是通过讨价还价就利益分割达成⼀致。
因此,并不是所有局中⼈选择合作⾏为,就是合作博弈。
2、完全信息静态博弈问题必须⽤策略型博弈模型刻画,完全信息动态博弈模型必须⽤扩展型博弈模型刻画,是否正确?答:不正确。
博弈论模型从形式可分为策略型模型与扩展型模型。
扩展型模型完整地刻画了⼀项博弈活动。
策略型博弈模型的结构简单,但它忽略了博弈的时序与信息,其侧重点在于分析参与⼈的策略选择。
只不过是相对⽽⾔,对于信息完全静态博弈⽤策略型博弈刻画更为合适;对信息完全的动态博弈,⽤扩展型博弈模型描述更为合适。
3、⼀个博弈问题既可⽤策略型博弈模型刻画,也可⽤扩展型博弈模型刻画,是否正确?答:博弈论从形式可分为策略型和扩展型模型。
扩展型完全地刻画了⼀项博弈活动,⽽策略型则结构简单,忽略了博弈的时序与信息,重点在于分析参与⼈的策略选择。
因此,对于⼀个博弈问题,要视乎所要解决的问题是完整的还是只分析参与⼈的策略选择。
4、策略就是⾏动吗?答:○1称参与⼈i∈N在博弈中所有可能选择的⾏动构成的集合A i为局中⼈i的⾏动集合。
A i中的元素a i称为局中⼈i的⾏为。
○2局中⼈i=1,2,…,n的策略集合⽤Si表⽰,S i中的元素si称为局中⼈i的策略。
它定义为局中⼈i的信息集类I i到⾏动集Ai的映射:S i:I i→A i,S i(I ik)=a i∈A i,i=1,2,…,r i○3从以上的定义,清楚地表明了策略是信息集的映射,⾏动是映射值,两者是不同的。
5、策略与⾏动何时是⼀致的?答:在静态博弈模型中,局中⼈的策略与⾏动等同。
博弈论第二章——博弈规则
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
博弈论第二章 (1)
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3
3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略
二、重复剔除严格劣战略
(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
博弈论2纳什均衡及应用举例
房地产开发博弈
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 开发商A 开发商B 开发 不开发
4000,4000 8000,0
0,8000
0,0
开发商B 开发 不开发
-3000,-3000 0,1000 1000,0 0,0
不开发
房地产开发博弈
若双方同时决策 若市场需求已知 若市场需求未知,是否开发依赖于 (1)各自在多大程度上认为需求是大的, (2)对方是否开发
Complete and Perfect ——完全信息与完美信息
如房地产开发博弈中,如果至少有一个 参与人不知道市场需求的大小,信息是 不完全的也是不完美的 如果两个参与人都知道市场需求是大的 还是小的,信息是完全的,但如果A不知 道B选择了什么行动,那么A的信息是不 完美的。
支付Payoff
房地产开发博弈
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 开发商A 开发商B 开发 不开发
4000,4000 8000,0
0,8000
0,0
开发商B 开发 不开发
-3000,-3000 0,1000 1000,0 0,0
不开发
市场进入博弈
高
N
低
[P]
不进入
进入者
进入 不进入
[1-P]
有限策略与无限策略同时存在一个博弈问题中
零和博弈
零和博弈: 社会总得益,即各博弈方得益之和总是为 0 猜硬币方
正面 正 面 反 面 反面
盖 硬 币 方
-1,1
1,-1
1,-1
-1,1
零和博弈
零和博弈的特点:
博弈规则新版
博弈规则解读中国历史上的进退之道第一章:困境中弱者的选择人类的天性是趋利避害的,从动物状态走出来的人是自私的。
每个自私的人在交往中为了自己的利益进行选择而产生的结果正是一种囚徒困境。
“囚徒困境”是博弈论中一个基本的模式,这一模式代表了处在相同困境状态下,不同的人面对同样的几种选择,最后必将背叛其别人,作出最利于自己选择的一种情况。
“囚徒困境”包含了几个基本的预设前提:处在困境下,各方都不知道别人的选择,因而只能猜测;每个人都是理性的人,从自己的利益出发去做出选择:他们与困境之间,是一种不可逆转的关系,即他们无法通过自己的力量去左右局势,只能在困境的局势下想办法尽也许让自己的损失最小。
这就是一种弱者的选择。
当然,这只是一种博弈论的模型,具体到现实领域,没有哪个具体的事件是完全符合“囚徒困境”的模型的。
但是,这种“弱者对损失最小化的选择”的基本精神却是存在的。
比如篡改诏书、拥胡亥继位的宦官赵高,其之所以这么做,是由于让扶苏继位的话,他就面临或被流放、或被杀身的危险。
这时的赵高是处在弱势地位的,那么,为保全自己,使自己的损失最小化,他的最优选择就是——拥立一个对自己有利的皇帝。
这就是囚徒困境中弱者的选择。
1 借力谋权的生存之路2 为谋长利而改诏书3 残暴之徒的最终下场4 为保全自己而陷害太子5 绝境中的反抗6 小不忍则乱大谋7 出类拔萃,惹祸上身8 惨遭迫害的士大夫9 跳出困境的卑鄙手段10 采用缓兵之策是弱者的最佳选择第二章:弱者冲突中的进与退试图有两只公鸡碰到一起,每只公鸡有两个行动选择:一是退下来,一是进攻。
假如一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;假如对方也退下来,双方打个平手;假如自己不退下来,而对方退下来,自己则胜利,对方则失败;假如两只公鸡都前进,那么则两败俱伤。
因此,对每只公鸡来说,最佳的结果是,对方退下来,而自己不退。
然而,现实未必都如人们所愿。
当两只公鸡对峙时,关键就是在双方力量对比相差不大的情况下,如何猜测到对方的策略,从而制定出可以克制对方的策略来获得胜利。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E(equilibrium)
▪ 均衡(equilibrium):是所有参与人的最 优战略的组合。
▪ 所谓博弈均衡,它是一种稳定的博弈结 果。
▪ 纳什均衡(Nash Equilibrium):一策 略组合中,所有的参与者面临这样的一 种情况:当其他人不改变策略时,他此 时的策略是最好的。
▪ 谢识予:给定你的 策略,我的策略是最 好的的策略,给定我的 策略,你的策略 也是最好的的策略
是指博弈分析者 感兴趣的要素的
嫌 疑 人
B
集合。是均衡行
动的组合。
坦白t
不坦 白n
嫌疑人A 坦白t 不坦白n -8,-8 0,-10 -10, 0 -1,-1
U(t,t)=0.5*(-8)+ 0.5*(-8)=-8 U(t,n)=0.5*0+ 0.5*(-10)=-5 U(n,t)=0.5*(-10)+ 0.5*0=-5 U(n,n)=0.5*(-1)+ 0.5*(-1)=-1
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
“博弈论”译自英文“Game
Theory”,直译就是“游戏理论”。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
博弈论(game theory): 又称对策论,是Go研ver究nin相g 互依 赖、相互影响的Dy决na策mic主s 体的 理性决策行为以及这些决策 的均衡结果的理论。
2.1.2 博弈论的基本概念
博弈论的基本假设
人 是 理 性 人 ( rational , 也 说自私人):行动者具有推理 能力,在具体策略选择时的 目的是使决策者自己的目标 效用最大化。
通俗地讲,博弈论是一种“游戏理 论”。其较对博弈为准确的理解是: 一些个人、团队或其他组织,面对 一定的环境条件,在一定的规则约 束下,依靠所掌握的信息,同时或 先后,一次或多次,从各自允许选 择的行为或策略进行选择并加以实 施,并从中各自取得相应结果或收 益的过程。
2.1.3博弈论的模型简介
博弈论模型可以用七个方面来描述
描述博弈的最少要素:参与人,战略,支付。 行动和信息是其积木
参与人、行动、结果统称为“博弈规则” 博弈分析的目的:是使用博弈规则预测均衡
第二节 博弈论的结构与分类
博弈论模型可以用七个方面来描述
G={P,A,S,I,U,O,E}
2.2.1 博弈方 2.2.2 博弈的行动过程 2.2.3 策略 2.2.4 支付(效用、得益) 2.2.5 博弈的信息结构 2.2.6 博弈方的能力和理性 2.2.7 博弈的分类和理论结构
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
G={P,A,S,I,U,O,E}
P(players)
▪ P(players): 为局中人,博弈的
参与者,也称为“博弈方”,局中
人以最终实现自身利益最大化为目
标。
个人
双方
虚拟参与人:
团体
多方
Nature
A(action)
▪ A(action) :为各局中人的所有可能的 策略或行动的集合。
▪ 行动的顺序(The order of play)
▪ 分类:根据博弈各方对各种局势下所 有局中人的信息掌握情况分:
完全信息博弈 不完全信息博弈
U( utility )
▪ U( utility ):也称为支付(pay off).为局中人获得利益,或者是 指参与人的期望效用水平。也是博 弈各方追求的最终目标。
▪ 分类:根据各方得益的不同情况
零和博弈
田忌赛马
游戏的共有特征 1. 一定的规则 2. 有一个结果(且可以折算
成数字) 3.策略的相互依存性 4.策略至关重要
ห้องสมุดไป่ตู้弈论-无处不在的游戏
“要想在现代社会做一 个有文化的人,你必须对 博弈论有一个大致了解”。
—保罗·萨缪尔森
年光似鸟翩翩过,世事 如棋局局新。
——(宋)僧志文
2.1.2 博弈论的基本概念
变和博弈
囚徒困境
▪ Ua(t,t)=-8 Ua(t,n)=0 Ua(n,n)=-1 Ua(n,t)=-10
▪ Ub(t,t)=-8 Ub(t,n)=-10 Ub(n,n)=-1 Ub(n,t)=0
b
嫌疑人a
坦白t
不坦白 n
嫌 疑
坦白t -8,-8
0,-10
人
不坦 白n
-10, 0
-1,-1
▪ 结果(outcome)
囚徒困境
嫌疑人A
一个纳什 均衡点!
嫌 疑 坦白 人 B 不坦白
坦白
不坦白
-8,-8 0,-10 -10,0 -1,-1
情侣博弈
王菲
两个纳什 均衡点!
足球
演唱会
李 亚
足球
2,1
鹏 演唱会 -1,-
1
0,0 1,2
2.1.3 博弈论的模型简介
博弈论模型可以用五个方面来描述
G={P,A,S,I,U,O,E}
先动优势 后动优势
▪ 根据该集合是有限还是无限进行分类:
S(strategies)
▪ S(strategies) :博弈的进程,也是 博弈进行的次序。它规定什么人在 什么时候选择什么行动。因此,战 略是参与人的 “相机行动方案” (contingent action plan)
▪ 分类:根据后行动的人是否能够看 到先行动人的具体行动
静态博弈 动态博弈
行动与策略的区别?
▪ 行动是指参与者可能有的具体行动 ▪ 战略是行动的规则而不是行动本身
毛泽东:
人不犯我我不犯人 人若犯我我必犯人
敌进我退 敌退我追 敌驻我扰 敌疲我打
I(information)
▪ I(information) :博弈信息。指的是 参与人在博弈中的知识,特别是有关 其他参与人(对手)的特征和行为的 知识