经济博弈论第三讲混合博弈
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 上述两个博弈的显著特征是,每个参与人 都想猜透对方的策略,而每一个参与人又 都不能让对方猜透自己的策略。这样的情 况出现在诸如体育比赛和战争等情况中都 会出现。在这类博弈中,都不存在纳什均 衡。
• 上述两个博弈不存在纯策略纳什均衡,但 是存在下面将要定义的混合策略纳什均衡。 这里的混合策略是指参与人以一定的概率 选择某种策略,比如说,参与人以0.3概率 选择第一种策略,以0.2的概率选择第二种 策略,以0.5的概率选择第三种策略。如果 一个采取混合策略,他的对手就不能准确 猜出他实际上会选择的策略,但在均衡点 可以知道对手不同策略的概率分布。
• 混合策略纳什均衡的求法,可以通过计算各方的 期望得益,寻求使自己期望得益最大化的最佳反 应函数,求各博弈方的最佳反应函数的公共解。 可以用求最佳反应函数交点的方法,也可以用解 方程组得方法。还可以应用下面的原则来计算: 任何博弈方的在混合策略纳什均衡中的所选策略Βιβλιοθήκη Baidu 都必须使其他博弈方选择其任何策略的期望得益 相同。即自己的选择要使对方无机可乘,不能通 过有针对性的倾向是某一策略成为优势策略。再 举一个例子。
• 1.制式问题 彩电有不同的制式,采用相同的制 式,则不同厂商间的零部件可以通用,相关设备 可以相互匹配,对大家有一定的好处,但也有互 相竞争的压力和损失。设两个厂商要引进生产线, 面临A、B 两个制式,其得益矩阵如下: • 厂商2 • A B • A 1,3 0,0 • 厂商1 • B 0,0 2,2
• 2.市场机会 设两个厂商都发现了一个市场机会,但市场 容量不大。若只有一家进入,能赚100,若同时进入,则 各亏50. • 厂商2 • 进 不进 • 进 -50,-50 100, 0 • 厂商1 • 不进 0 ,100 0 , 0,0 • 本博弈也有两个纯策略纳什均衡(不进,进),(进,不 进)但它们分别有利于两个厂商,因此这两个均衡都不容 易实现,都应采取混合策略。 • 请同学们自己计算混合策略纳什均衡及得益。
混合策略的定义:在博弈G={s1,s2, …,sn}中,博弈方i的策 略空间为Si=(si1,si2, …,sik),则博弈方以pi=(pi1,pi2, …,pik) 随机选择k个可选策略称为一个混合策略。其中,0≤pik≤1, k=1,2, …,k,且pi1+pi2+…+pik=1 相对于这种以一定概率分布在一些策略中随机选择,原来的 确定性的具体的策略称为纯策略,原来的纳什均衡也称为 纯策略纳什均衡。纯策略也可看作特殊的混合策略。 我们把纳什均衡的概念也作相应的扩大:对一个策略组合, 无论它是纯策略还是混合策略,只要满足各博弈方都不想 单独偏离它,就称其为纳什均衡。
• 同样,设乙的混合策略为(q,1-q) ,则乙的纳什 均衡策略也必须使甲无论选A还是选B的期望收益 相等。即: • q×2+(1-q) ×5=q×3+(1-q) ×1 • 解得 q=0.8 即乙的混合策略也是(0.8,0.2) • 容易算出在这个混合策略纳什均衡下,甲乙各自 的得益都是2.6.它的意义是说,虽然在一次博弈 中,其结果只能是得益矩阵中四个得益的一种, 但多次独立重复进行,平均结果是双方各得2.6.
• 例 某博弈的得益矩阵为 • 乙 • C • A 2,3 • 甲 • B 3,1
D 5,2 1,5
• 这个博弈没有纯策略纳什均衡。要计算混合策略纳什均衡, 设甲的混合策略为(p,1-p), • 则甲的选择必须使乙选C和选D的期望得益相等,即: p×3+(1-p) ×1=p×2+(1-p) ×5 • 解得p=0.8。即甲的混合策略是(0.8,0.2)
在包括混合策略的情况下,严格劣策略消去 法有时仍然使用。因为严格劣策略消去法 不会消去任何纳什均衡。如下面的例子: • 乙 • A B • C 3,1 0,2 • 甲 D 0,2 3,3 •
• 甲、乙的策略没有好坏之分。但若甲以混合策略 (0.5,0.5,0)选择C、D、E,则博弈方乙选择 纯策略A时,甲期望得益 • 0.5×3+0.5×0+0×1=1.5 • 乙选择纯策略B时,甲期望得益 • 0.5×0+0.5×3+0×1=1.5 • 乙选择混合策略(q,1-q) 时,甲期望得益 • 0.5×q×3+0.5×(1-q) ×0+0.5×q×0 • +0.5×(1-q) ×3=1.5
• 可见,无论乙采用什么策略,甲采用混合 策略都大于采用E的得益1,因此,E是甲的 严格劣策略。因此去掉E,博弈就简化为: • 乙
• • • • 甲 A C 3,1 D 0,2 E 1,3 B 0,2 3,3 1,1
• 新的博弈中,在次应用劣策略消去法,可 得(D,B)是唯一的纳什均衡。
• 容易看出,该博弈有两个纯策略纳什均衡: • (A,A)和(B,B),但会出现哪一个均衡呢?可以看 出,厂商1喜欢后一个而厂商2 喜欢前一个均衡。没有必 然的结果,因此,双方的决策要进行混合策略决策。 • 不难算出厂商1的纳什均衡混合策略是(0.4,0.6) • 厂商2的混合策略纳什均衡策略是(0.67,0.33) • 在此均衡下,双方的期望得益分别为0.664 和1.926,都 小于任何一个纯策略纳什均衡的得益。 • 由此可见,政府或行业组织制定统一的标准或规定是非常 重要的。这也是世界上各国甚至国际间对许多重要产品规 定统一规格、标准的原因。 • 当然因为技术垄断等因素,也有相反的、各厂商间不统一 的例证:如打印机墨盒、手机充电器等。
•
• • • •
救济 政府 不救济
流浪汉
找工作 3,2
-1,1
游荡 -1,3
0,0
• 设想政府以1/2的概率选择救济,1/2的概率选择不救济。对流浪汉来 说,选择寻找工作的期望效用是1/2×2+ 1/2×1=1.5,选择游荡带来 的期望效用为1/2×3+ 1/2×0=1.5。所以流浪者的任何一种策略(纯 的或混合)都是对政府所选择的混合策略的最优反应。 • 如果流浪汉以0.2的概率选择找工作,以0.8的概率选择游荡,政府的 任何一种策略(纯的或混合)都是对流浪汉所选择的混合策略的最优 反应。每一个参与人的混合策略都是给定对方混合策略时的最佳选择, 这一混合策略组合就是一个纳什均衡
第三讲混合策略纳什均衡
• 我们将纳什均衡定义为一组满足所有参与 人的效用最大化要求的策略组合,即 ( s1*,…, si* , … , sn* )是一个纳什 均衡,当且仅当(ui(si*, s-i *) ≥ ui(si′, s-i *)。 根据这一定义,有些博弈不存在纳什均衡 的。
• 社会福利博弈 • • • 救济 • 政府 • 不救济
流浪汉 找工作 游荡 3,2 -1,3
-1,1
0,0
• 这个博弈不存在纳什均衡。给定政府救济, 流浪汉的最优策略是游荡;给定流浪汉游 荡,政府的最优策略是不救济;给定政府 不救济,流浪汉的最优策略是找工作;给 定流浪汉找工作,政府的最优战略是救济; 如此等等,没有一个策略组合构成纳什均 衡。
• 猜谜游戏(A决定,B来猜;B猜中,奖励;否则,惩罚) • B • 正面 反面 • 正面 -1,1 1,-1 • A • 反面 1,-1 -1,1