经济博弈论第2章课件(2013)
合集下载
《经济博弈论》课件
常见博弈形式
合作博弈
指博弈者之间相互合作,以达到共同利益最大 化的博弈形式。
非合作博弈
指博弈者在无法达成合作的情况下,各自进行 决策,追求自身利益的博弈形式。
零和博弈
又称为固定和博弈,指博弈者的利益互为相反, 一方得到的利益与另一方失去的利益பைடு நூலகம்和为零。
零和博弈的例子
经典的零和博弈例子是两个囚犯的囚徒困境, 其中一方的得益必定意味着另一方的损失。
引言
博弈论是一门研究理性个体在决策过程中相互影响与相互制约的科学。它研究的是决策者如何在不确定环境中 做出选择,以及这些选择如何影响他人。
博弈论概述
- 什么是博弈论?博弈论是研究决策者之间相互作用和互动的数学模型框架。 - 博弈论的基本概念包括:博弈者、策略、支付、纳什均衡等。 - 博弈论的应用领域广泛,包括经济学、政治学、生物学、社会学等。
博弈论中的重要概念
1 纳什均衡
指博弈中的一组策略,每个博弈者都在这些策略下选择自己的最佳反应。没有进一步改 变策略的动机。
2 支配策略
指在任何情况下,选择该策略所带来的利益总是大于或等于其他策略的策略。
3 动态博弈
指博弈中的决策是基于时间顺序进行的,后续决策往往会受到前期决策的影响。
博弈论的实际应用
《经济博弈论》PPT课件
This presentation will introduce the key concepts of economic game theory, its applications, and highlight important strategies and examples. Get ready to delve into the fascinating world of strategic decision-making.
经济博弈论 02 完全信息静态博弈(Park)
ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
经济博弈论ppt课件
• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
《经济博弈论》PPT课件
13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
第二章 纳什均衡 《博弈论与经济》 PPT课件
▪ G的纳什均衡可由以下划线法求得。
▪ 1.对局中人1的每个策略i (i 1,2,, m) ,寻找局中人2的最
优反应。若最优反应为
j
,即 bij
max
k 1,2,,n
bik
,则在支付矩
阵元素 bij 下划一短线。
▪ 2.对局中人2的每个策略 j ( j 1,2,, n) ,寻找局中人1的
最优反应,若最优反应为 i
▪ 考虑由商店A, B构成的市场,A与B分别销售不同品牌的商 品,进行价格竞争。假设生产的单位成本为零。消费者 分为两类, n A ( 0)个消费者偏好于产品A,nB ( 0)个消费者 偏好于产品B。A,B两种品牌价格分别为 PA , PB 。设消费 者可从A或B处购买单位商品。
▪ 用 0表示由于购买不喜欢的产品所付出的厌恶成本,假 设消费者具有如下的效用函数
按 等待
等按待
(5,1) (9,1)
4,4
(0, 0)
▪ 严格纳什均衡为大猪“按”,小猪“等待”。
▪ 例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护
不维护
不维维护护 ((1
4,4) 0,1 4)
((1140,,1100))
▪ 利用划线法可得纳什均衡(维护,维护),(不维护, 不维护)。
▪ 为了保护生命财产的安全,政府可以立法,如果参与人
第2章 纳什均衡
2.1 纳什均衡的定义
▪ 纳什均衡是博弈论中最重要的概念,各种非合作博弈模型的均衡概念都是建 立在纳什均衡基础之上的。
▪ 纳什均衡是个策略组合 s* (si*, s*i ) ,它满足两个要求。
▪
1.对每个局中人 i N
,能够预期到对手采用策略组合s
经济博弈论2课件
2, 1 0, 0
0, 0 1, 3
一是作为领导干部一定要树立正确的 权力观 和科学 的发展 观,权 力必须 为职工 群众谋 利益, 绝不能 为个人 或少数 人谋取 私利
剪头法说明
剪头法与划线法不同,但两者都是基于 策略之间相对优劣关系进行分析的,得 到的结论也是一致的。
这种通过反映各博弈方选择的箭头,寻 找博弈中具有稳定性的策略组合的方法, 就是“剪头法”。
2, 1 0, 0
0, 0 1, 3
一是作为领导干部一定要树立正确的 权力观 和科学 的发展 观,权 力必须 为职工 群众谋 利益, 绝不能 为个人 或少数 人谋取 私利
划线法的补充说明
此法以策略之间的相对优劣关系为基础,因此 在分析用得益矩阵表示的博弈问题时具有普遍 适用性。
并不意味着每个用得益矩阵表示的博弈都可以 用划线法求出确定性的博弈结果。如猜硬币、 夫妻之争
略都是各个博弈方各自的上策,必然是该博弈
比较稳定的结果 上策均衡不是普遍存在的
寡高 价 头 1低 价
寡头2 高价 低价 5,5 1,6
6,1 3,3
双寡头的得益矩阵
一是作为领导干部一定要树立正确的 权力观 和科学 的发展 观,权 力必须 为职工 群众谋 利益, 绝不能 为个人 或少数 人谋取 私利
一是作为领导干部一定要树立正确的 权力观 和科学 的发展 观,权 力必须 为职工 群众谋 利益, 绝不能 为个人 或少数 人谋取 私利
2.1 基本分析思路和方法
2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法
一是作为领导干部一定要树立正确的 权力观 和科学 的发展 观,权 力必须 为职工 群众谋 利益, 绝不能 为个人 或少数 人谋取 私利
《经济博弈论》教材教学课件
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖
寡头市场厂商的产量决策;市场开发竞争中策略较量和策 略依存;投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 政治、军事和社会的决策较量 博弈论不能称作游戏理论,也不完全称作对策论
1.1.2 一个非技术性定义
企业之间相互沟通信誓旦旦,价格战仍然会爆发;美 苏两国经常会晤,甚至签订核不扩散条约,但军费一年 高过一年。这些现象都反映了上面所说明的问题。
囚徒困境说明了什么?
在(坦白、坦白)这个组合中,囚徒1和囚徒2都不 能通过单方面的改变行动增加自己的收益,于是谁 也没有动力游离这个组合,因此这个组合是纳什均 衡。
《经济博弈论》教材 教学课件
第一章 导论
本章介绍博弈论的基本概念,包括什么 是博弈和博弈论,给出一些经典博弈例子。 对博弈分类和博弈理论的结构作一些讨论, 对博弈论的发展历史等作简单介绍。目标是 让读者对博弈论的内容和博弈模型有更直观 的概念和印象,本教材的基本内容,以及博 弈分析的基本思想方法等形成初步的认识, 为后面各章展开详细分析作好铺垫和准备。
定义:博弈就是一些个人、队组或其他组织,面对一 定的环境条件,在一定的规则下,同时或先后,一次 或多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
四个核心方面
博弈的参加者(Player)——博弈方(单人、两人和多人)
各博弈方的策略(Strategies)或行为(Actions) (有 限策略、无限策略)
有人提出:利用囚徒困境解决反腐败 问题。个体理性与团体理性的矛盾。
囚徒 2
坦白
不坦白
囚坦白 徒 1
不坦白
寡头市场厂商的产量决策;市场开发竞争中策略较量和策 略依存;投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 政治、军事和社会的决策较量 博弈论不能称作游戏理论,也不完全称作对策论
1.1.2 一个非技术性定义
企业之间相互沟通信誓旦旦,价格战仍然会爆发;美 苏两国经常会晤,甚至签订核不扩散条约,但军费一年 高过一年。这些现象都反映了上面所说明的问题。
囚徒困境说明了什么?
在(坦白、坦白)这个组合中,囚徒1和囚徒2都不 能通过单方面的改变行动增加自己的收益,于是谁 也没有动力游离这个组合,因此这个组合是纳什均 衡。
《经济博弈论》教材 教学课件
第一章 导论
本章介绍博弈论的基本概念,包括什么 是博弈和博弈论,给出一些经典博弈例子。 对博弈分类和博弈理论的结构作一些讨论, 对博弈论的发展历史等作简单介绍。目标是 让读者对博弈论的内容和博弈模型有更直观 的概念和印象,本教材的基本内容,以及博 弈分析的基本思想方法等形成初步的认识, 为后面各章展开详细分析作好铺垫和准备。
定义:博弈就是一些个人、队组或其他组织,面对一 定的环境条件,在一定的规则下,同时或先后,一次 或多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
四个核心方面
博弈的参加者(Player)——博弈方(单人、两人和多人)
各博弈方的策略(Strategies)或行为(Actions) (有 限策略、无限策略)
有人提出:利用囚徒困境解决反腐败 问题。个体理性与团体理性的矛盾。
囚徒 2
坦白
不坦白
囚坦白 徒 1
不坦白
经济博弈论02完全信息静态博弈(Park)
合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
经济博弈论第二章a 博弈论课件
2 q P ( Q ) C q q 8 ( q q ) 2 q 6 q q q q 博弈方2利润: u 2 2 2 2 2 1 2 2 2 1 2 2
* 在本博弈中, ( q 1* , q 2 ) 的纳什均衡的充分必要条件是 q 大值问题: * 2
* 1
和q
q2 (0,6)
R1(q2)
(2,2) 6 R2(q1)
(0,3)
0
(3,0)
(6,0)q1
从左图可以看出,当一方的 选择为0时,另一方的最佳反应 为3,这正是我们前面所说过的 实现总体最大利益的产量,因为 一家产量为零,意味着另一家垄 断市场。当一方的产量达到6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
2.3.2 应用
混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样 可应用于存在多个纯策略纳什均衡的博弈问题。 丈 夫 例 夫妻之争 时装 足球 该博弈与上一个博弈的不同之处在 0, 0 于每一方所希望对方知道自己的策略选 妻 时装 2,1 择以达到有利于自己的结果。现实中, 1, 3 子 足球 0,0 这类问题多通过协商解决以免两败俱伤。 在此我们假设夫妻双方不可协商,互不通消息。 令pw(时), pw(足)分别表示妻子选择时装表演和足球的概率; ph(时), ph(足)为丈夫选择时装表演和足球的概率。 同样的分析方法可得pw(时)=0.75, pw(足)=0.25; ph(时)=1/3, ph(足)=2/3.双方的期望得益分别为uwe=0.67, uhe=0.75。
d 2 b * 1 2 P ( a bc ) ( a b c ) 1 2 22 1 1 1 4 b b dd 4 b b dd 1 2 1 2 1 2 1 2 d 2 b * 2 1 P ( a b c ) ( a bc ) 2 1 11 2 22 4 b b dd 4 b b dd 12 1 2 12 1 2
* 在本博弈中, ( q 1* , q 2 ) 的纳什均衡的充分必要条件是 q 大值问题: * 2
* 1
和q
q2 (0,6)
R1(q2)
(2,2) 6 R2(q1)
(0,3)
0
(3,0)
(6,0)q1
从左图可以看出,当一方的 选择为0时,另一方的最佳反应 为3,这正是我们前面所说过的 实现总体最大利益的产量,因为 一家产量为零,意味着另一家垄 断市场。当一方的产量达到6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
2.3.2 应用
混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样 可应用于存在多个纯策略纳什均衡的博弈问题。 丈 夫 例 夫妻之争 时装 足球 该博弈与上一个博弈的不同之处在 0, 0 于每一方所希望对方知道自己的策略选 妻 时装 2,1 择以达到有利于自己的结果。现实中, 1, 3 子 足球 0,0 这类问题多通过协商解决以免两败俱伤。 在此我们假设夫妻双方不可协商,互不通消息。 令pw(时), pw(足)分别表示妻子选择时装表演和足球的概率; ph(时), ph(足)为丈夫选择时装表演和足球的概率。 同样的分析方法可得pw(时)=0.75, pw(足)=0.25; ph(时)=1/3, ph(足)=2/3.双方的期望得益分别为uwe=0.67, uhe=0.75。
d 2 b * 1 2 P ( a bc ) ( a b c ) 1 2 22 1 1 1 4 b b dd 4 b b dd 1 2 1 2 1 2 1 2 d 2 b * 2 1 P ( a b c ) ( a bc ) 2 1 11 2 22 4 b b dd 4 b b dd 12 1 2 12 1 2
经济博弈论第二讲
▪ 每个人的得益来自于各自对房间的干净程度的效用减去 他打扫花费的时间。
▪ 请画出策略组合及得益矩阵,并分析博弈结果。
课后作业2(分析智猪博弈)
▪ 在博弈论经济学中,“智猪博弈”是一个著名例子 ▪ 假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪
食槽,另一头安装着控制猪食供应的按钮,按一下按 钮会有10个单位的猪食进槽,但是谁按按钮就会首先 付出2个单位成本,若大猪先到槽边,大小猪吃到食 物的收益比是9:1;同时到槽边,收益比是7:3;小 猪先到槽边,收益比是6:4。 ▪ 在两头猪都有是有智慧的前提下,请分析猪的选择策 略。
▪ 上策均衡是反映了所有博弈方的绝对偏好,因此 非常稳定。根据上策均衡,就可以对博弈结果作 出最肯定的预测。
▪ 因此,进行博弈分析时,应首先判断各个博弈方是 否都有上策,博弈中是否存在上策均衡。
▪ 上策均衡分析采用的决策思路是一种选择法的思路, 是在所有可选择策略中选出最好的一种的思路。
▪ 因为博弈方的最优策略随其他博弈方的策略而变化 是博弈的根本特征,是博弈关系相互依存性的主要 表现形式,所以上策均衡不是普遍存在的。
1, 0 0, 4
1, 3 0, 2
囚
0, 1
徒
困
2, 0
境
-5, -5 -8, 0
0, -8 -1, -1
▪许多博弈不存在确定性的结果
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
夫 妻
2, 1
之
0, 0
争
0, 0 1, 3
2.1.4 箭头法
▪ 对博弈中每个策略组合进行分析,考察每个策略组合处各个博弈方 能否通过单独改变自己的策略而增加得益。
▪ 请画出策略组合及得益矩阵,并分析博弈结果。
课后作业2(分析智猪博弈)
▪ 在博弈论经济学中,“智猪博弈”是一个著名例子 ▪ 假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪
食槽,另一头安装着控制猪食供应的按钮,按一下按 钮会有10个单位的猪食进槽,但是谁按按钮就会首先 付出2个单位成本,若大猪先到槽边,大小猪吃到食 物的收益比是9:1;同时到槽边,收益比是7:3;小 猪先到槽边,收益比是6:4。 ▪ 在两头猪都有是有智慧的前提下,请分析猪的选择策 略。
▪ 上策均衡是反映了所有博弈方的绝对偏好,因此 非常稳定。根据上策均衡,就可以对博弈结果作 出最肯定的预测。
▪ 因此,进行博弈分析时,应首先判断各个博弈方是 否都有上策,博弈中是否存在上策均衡。
▪ 上策均衡分析采用的决策思路是一种选择法的思路, 是在所有可选择策略中选出最好的一种的思路。
▪ 因为博弈方的最优策略随其他博弈方的策略而变化 是博弈的根本特征,是博弈关系相互依存性的主要 表现形式,所以上策均衡不是普遍存在的。
1, 0 0, 4
1, 3 0, 2
囚
0, 1
徒
困
2, 0
境
-5, -5 -8, 0
0, -8 -1, -1
▪许多博弈不存在确定性的结果
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
夫 妻
2, 1
之
0, 0
争
0, 0 1, 3
2.1.4 箭头法
▪ 对博弈中每个策略组合进行分析,考察每个策略组合处各个博弈方 能否通过单独改变自己的策略而增加得益。
最新经济博弈论2精品资料
19
1
下
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
2,0
1
策略组合(上,中)
博 弈 方上
博弈方2 左 中 1,0 1,3
15
1
严格下策反复消去法在分析许多博弈时都能应用,特 别是有些博弈不存在上策均衡,但却存在某些严格下 策,所以一般来讲,严格下策反复消去法的适用范围 要比上策均衡分析大一些。 但是严格下策反复消去法不能解决所有的博弈分析问 题,存在一定缺陷: (1)有些博弈无严格下策;如抛硬币博弈。 (2)即使有严格下策,也只可能消去一部分。 此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。 严格下策反复消去法是博弈分析的标准工具之一。
18
划线法——应用
通过在每一博弈方针对对方每一策略的最大可能得益下划线 以求解博弈的方法 例子: 博 弈 方
左 上
博弈方2
中
右
结论: 图中得益矩阵所表示的博弈中就存在唯一的两数字下都划有短 线 的此策略组合(上,中)是该得益矩阵表示的博弈的具有稳定性的解
2.1.1 2.1.2 2.1.3 2.1.4 上策均衡 严格下策反复消去法 划线法 箭头法
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方的某 个策略给他带来的得益始终高于其它的策略, 至少不低于其他策略 不难理解,上述“某个策略”必然是该博弈方愿意选 择的策略。 例如囚徒困境博弈中的“坦白”、双寡头削价中“低 价”,就是这样的策略(对两个博弈方都成立)。
100,100
低 价
20,105
低 价
150,20
70,70
1
下
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
2,0
1
策略组合(上,中)
博 弈 方上
博弈方2 左 中 1,0 1,3
15
1
严格下策反复消去法在分析许多博弈时都能应用,特 别是有些博弈不存在上策均衡,但却存在某些严格下 策,所以一般来讲,严格下策反复消去法的适用范围 要比上策均衡分析大一些。 但是严格下策反复消去法不能解决所有的博弈分析问 题,存在一定缺陷: (1)有些博弈无严格下策;如抛硬币博弈。 (2)即使有严格下策,也只可能消去一部分。 此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。 严格下策反复消去法是博弈分析的标准工具之一。
18
划线法——应用
通过在每一博弈方针对对方每一策略的最大可能得益下划线 以求解博弈的方法 例子: 博 弈 方
左 上
博弈方2
中
右
结论: 图中得益矩阵所表示的博弈中就存在唯一的两数字下都划有短 线 的此策略组合(上,中)是该得益矩阵表示的博弈的具有稳定性的解
2.1.1 2.1.2 2.1.3 2.1.4 上策均衡 严格下策反复消去法 划线法 箭头法
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方的某 个策略给他带来的得益始终高于其它的策略, 至少不低于其他策略 不难理解,上述“某个策略”必然是该博弈方愿意选 择的策略。 例如囚徒困境博弈中的“坦白”、双寡头削价中“低 价”,就是这样的策略(对两个博弈方都成立)。
100,100
低 价
20,105
低 价
150,20
70,70
经济博弈论第2章(23) ppt课件
4 1
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
uG 1, 4 1 uG 0,
0.2
PPT课件
18
• 解二: 支付等值法
如果一个混合策略是政府的最优选择,那一定意
味着流浪汉在寻找工作与游闲之间是无差异的,
即:
流浪汉
找工作
游荡
政府 救济 不救济
3,2 -1 , 1
-1 , 3 0,0
uL 1, 1 3 uL 0,
0.5
PPT课件
19
五、混合战略纳什均衡
• 对 * 0.2 的解释: • 如果流浪汉找工作的概率小于0.2, 则政府选择不
救济,如果大于0.2,政府选择救济 ,只有当概率等 于0.2时,政府才会选择混合战略或任何纯战略. • 对 * 0.5 的解释 • 如果政府救济的概率大于0.5,流浪汉的最优选择 是流浪,如果政府救济的概率小于0.5,流浪汉的最 优选择是寻找工作.
1 , -1 -1 , 1
假设A出红牌的概率为 p;B出红牌的概率为 q ;则
U A( p, q) 2 p(1 2q) (2q 1)
因此A的最佳反应函数为
p 1
0, 当q 1/ 2
p [0,1],当q 1/ 2
1, 当q 1/ 2
PPT课件
0
1/2
1 q 27
第二章 完全信息静态信息博弈-纳什均衡
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 混合战略纳什均衡 六 纳什均衡存在性及相关讨论
PPT课件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
五、混合战略纳什均衡
• 混合战略纳什均衡的含义:
• 纳什均衡要求每个参与人的混合战略是给定对方的混合战 * 0.2, *=0.5 略下的最优选择。因此在社会福利博弈中, 是唯一的混合战略纳什均衡。 • 从反面来说,如果政府认为流浪汉选择寻找工作的概率严 格小于0.2,那么政府的唯一最优选择是纯战略:不救济; • 如果政府以1的概率选择不救济,流浪汉的最优选择是寻 找工作,这又将导致政府选择救济的战略,流浪汉则选择 游荡。如此等等。
§扑克牌对色游戏
• AB玩扑克牌对色游戏,每人都有红黑两张扑克牌, 约定如果出牌颜色一样,A输B赢,如果出牌颜色 不一样,则A赢B输。
• 找到这个博弈的纳什均衡。
B 红 红 A 黑 -1, 1 黑 1, -1
1, -1
-1, 1
例 扑克牌对色游戏 反应函数法 A 红
B
黑
红 黑
-1 , 1 1 , -1
纳什均衡是:政府以1/2的概 率选择救助,流浪汉以1/5的 概率选择找工作。
1/5
1
r
p 1
练习2:利用反应函数法找出情侣博弈的所有纳什均衡
女 足球 男 足球 2 , 1 芭蕾 0 , 0
芭蕾
0,0 1,2
2/3
0
1/3
1
q
激励的悖论
• 一小偷欲偷有守卫看守的仓库,若小偷去偷时 守卫睡觉(不负责),则小偷偷窃成功(令其 价值是V),若守卫没有睡觉(尽职尽责), 则小偷会被抓住坐牢(设其效用为-A);再假 设守卫睡觉而未被偷的效用为S,守卫睡觉而 被偷则被解雇,其效用为-D。写出得益矩阵, 并分析如果想减少小偷偷东西的现象发生,如何 做效果更好?
1、假定政府采用混合策略:
G ,1 1 的概率选择不救济。 即政府以的概率选择救济,
2、流浪汉的混合策略为:
L ,1 1 的概率选择游闲。 即流浪汉以 的概率选择寻找工作,
解一: 支付最大化
流浪汉 找工作 游荡
政府 救济 不救济
流浪汉
寻找工作的概率小于0.2
政府
概率为1:不救济
流浪汉
寻找工作
政府 救济
讨论
• 上面的均衡要求每个参与人以特定的概率选择纯 策略。也就是说,一个参与人选择不同策略的概 率不是由他自己的支付决定的,而是由他的对手 的支付决定的。 • 正是由于这个原因,许多人认为混合策略纳什均 衡是一个难以令人满意的概念。
第二章 完全信息静态信息博弈-纳什均衡
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡
四 纳什均衡
五 混合战略纳什均衡
六 纳什均衡存在性及相关讨论
五、混合战略纳什均衡
猜谜游戏
两个儿童各 拿一枚硬币,
若同时正面 朝上或朝下, A给B 1分钱, 若只有一面 朝上,B给A 1分钱。 正面 反面
• 经济学上的监督博弈也是这样一个例子。如税收 检查、质量检查、惩治犯罪、雇主监督雇员等都 可以看成猜谜博弈。
五、混合战略纳什均衡
• 练习:模型化下述划拳博弈: • 两个老朋友在一起喝酒,每个人有四个纯战 略:杠子、老虎、鸡和虫子,输赢规则是: 杠子降老虎,老虎吃鸡,鸡吃虫子,虫子降 杠子,两人同时出令。如果一个打败另一个, 赢的效用为1,输的效用为-1,否则效用为0, 写出这个博弈的支付矩阵,这个博弈有纯战 略均衡吗?计算其混合战略纳什均衡。
五、混合战略纳什均衡
• 上述博弈的特征是:
在这类博弈中,都不存在纯纳什均衡。
参与人的支付取决于其他参与人的战略;以某 种概率分布随机地选择不同的行动 每个参与人都想猜透对方的战略,而每个参与 人又不愿意让对方猜透自己的战略。
这种博弈的类型是什么?如何找到均衡?
五、混合战略纳什均衡
• 请举一些这样的例子:
q
同理
U B ( p, q) 2q(2 p 1) (2 p 1)
因此B的最佳反应函数为
p 1 1/2 0
1, 当p 1 / 2 q [0,1],当p 1 / 2 0, 当p 1 / 2
p 1 1/2 0
1
q
( P* , q* ) (1/ 2,1/ 2)
纳什均衡是:A和B出红牌还 是出黑牌的概率都是1/2.
1/2 1 q
反应函数法
练习1:利用反应函数法找出政府与流浪汉博弈的纳什均衡
流浪汉 找工作 游荡 政府 救济 不救济 3,2
-1 , 1
-1 , 3
0,0
假设政府救济的概率为 ;流浪汉找工作的概率为 ; 则
u (5 1) , u
3,2 -1 , 1
, 3 0,0
假设政府救济的概率为 ;流浪汉找工作的概率为 ; 则 政府的期望效用函数为:
uG 3 11 1 01 5 1
解一: 支付最大化
uG 3 11 1 01 5 1
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
uG 1, 4 1 uG 0, 0.2
• 解二: 支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即: 流浪汉
1
2
[1 2 ] 3
0, 当r 1 / 5 [0,1],当r 1 / 5 1, 当r 1 / 5
1, 当 1 / 2 r [0,1],当 1 / 2 0, 当 1 / 2
1 1/2 0
( * , r * ) (1 / 2,1 / 5)
(3,2) (-1,3) (-1,1) (0,0)
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这个 博弈有没有纯策略的纳什均衡? • 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜得对方的策略,就可以采用针对 性的策略,使自己的支付增加。
求解混合策略纳什均衡
0.5
maxu G [3 (1 )] (1 )( )
maxu L [2 (1 )] 3(1 )
则 0.5, 0.2
解二: 支付等值法
• 政府选择救济策略
1
• 政府选择不救济策略
0
期望效用 期望效用 uG 1, 3 11 uG 0, 1 01 4 1
1 , -1 -1 , 1
假设A出红牌的概率为 p;B出红牌的概率为 q ;则
U A ( p, q) 2 p(1 2q) (2q 1)
因此A的最佳反应函数为
p 1
0, 当q 1 / 2 p [0,1],当q 1 / 2 1, 当q 1 / 2
0
1/2
1
零和博弈
博弈参与者有 输有赢,但结 果永远是0。
正面
1 -1,
反面
-1 1,
-1
1, -1,
1
没有一个战略组合构成纳什均衡
社会福利博弈
流浪汉
找工作 游荡
政府 救济 不救济 3, 2 -1,1 -1,3 0, 0
五、混合战略纳什均衡
• 警察与小偷
1万元
2万元
酒馆
东边
小偷
警察
银行 西边
警察与小偷的最优策略各是什么?
对上述效用函数求微分,得到政府最优化的一阶条 件为:
uG 5 1 0 0.2
就是说,从政府的最优化条件找到流浪汉混 合策略——流浪汉以0.2的概率选择寻找工作,0 .8 的概率选择游闲。
解一:支付最大化
流浪汉 找工作 游荡
政府 救济 不救济
3,2 -1 , 1
• 事实上,正是因为它在几个(或全部)策略之间 是无差异的,他的行为才难以预测,混合策略纳 什均衡才会存在。
讨论
• 尽管混合策略不像纯策略那样直观,但它确实是 一些博弈中参与人的合理行为方式。扑克比赛、 垒球比赛、划拳就是这样的例子,在这一类博弈 中,参与比赛的总是随机行动以使自己的行为不 被对方所预测。
五、混合策略纳什均衡
• 混合策略与期望支付 • 计算混合策略纳什均衡的三种方法
• 支付最大值法
• 支付等值法 • 反应函数法 • 多重纳什均衡及其甄别 • 混合博弈在现实经济中的运用案例
五、混合策略纳什均衡
• 纯策略(pure strategies):如果一个策略规定参与 人在一个给定的信息情况下只选择一种特定的行 动。 • 混合策略(mixed strategies):如果一个策略规定 参与人在给定的信息情况下,以某种概率分布随 机地选择不同的行动。
激励的悖论
• 用支付最大化值求出:
A 1 q* V VA 1 A
当加大对小偷的处罚,守卫 偷懒的概率会增加 A q*
S 1 p* S D 1 D S
找工作 政府 救济 不救济 3,2 游荡 -1 , 3
-1 , 1
0,0
u L 1, 1 3 u L 0, 0.5
五、混合战略纳什均衡
• 对 * 0.2 的解释:
• 如果流浪汉找工作的概率小于0.2, 则政府选择不 救济,如果大于0.2,政府选择救济 ,只有当概率等 于0.2时,政府才会选择混合战略或任何纯战略. • 对 * 0.5 的解释 • 如果政府救济的概率大于0.5,流浪汉的最优选择 是流浪,如果政府救济的概率小于0.5,流浪汉的最 优选择是寻找工作.
激励的悖论
• 小偷与守卫博弈