数学建模讲座之博弈论(一)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一次或者多次,从各自允许选择的行为或者策略
中进行选择并加以实施,最终达到各自取得利益
最优化均衡的理论。
(三)
应用范围
经济学、 军事战略、 政治学、国际关系、心理学、犯 罪学、哲学等。
一 博弈概述
(四)博弈论的基本要素
一个博弈一般由以下几个要素组成,包括:局中 人、得益、信息、策略、均衡、行动等。
1.局中人:博弈中选择行动以最大化自己效用的
(五)最大最小策略
不管其他决策者如何做,确保在可能 的最坏结果中得到最好的结果。——风险 厌恶型策略
企业2
无新产品 有新产品 企业1最小
无新产品 4,4
3,6
3
企业1 有新产品
6,3
2,2
2
企业2最小 3
2
纳什均衡:3,6 或6,3 该策略均衡 4,4
(六)混合策略
当不存在纯策略时,不等于局中人就不进
行游戏了。由于获利的刺激,也许局中人
还乐意多玩几次。在每次操作时,为了获
利,任何局中人不愿把自己选择何种纯策
略暴露给对方。所以每个局中人都给自己
每个纯策略赋予选择概率
Pi
(
p 1, i
p 2 ... i
p n) i
因此称概率向量Pi为局中人i的混合策略
(六)混合策略
二人博弈的盈利矩阵
局中人2
L
M
R
博 弈 论(Game Theory)
博弈论主讲内容
对博弈论的认识 完全静态博弈 博弈论几个经典例子 博弈论的应用(寡头垄断模型)
长街上的超市
细心的我们肯定会发现在不少的街上一些超市似乎总“喜欢” 拥挤在一起。有人指责这属于“资源浪费”现象,因为他们在 想,如果把超市均匀的设在长街各处,无疑对远离中心的居 民提供极大的方便。 为什么会出现这种拥挤的现象呢?
由1/4Q到5/16Q产量增加了1/16Q
中石油面临的市场需求为:
1- 5/16Q =11/16Q
博弈结果
中石油的均衡产量为: Q(1/2―1/8―1/32―……)=1/3 Q
中石化的均衡产量为: Q(1/4+1/16+1/64+……)=1/3 Q
行业的均衡总产量为: 1/3 Q+1/3 Q=2/3 Q
解决的问题:请你用博弈论的观点帮助两家巨头 分析一下,两家公司如何决策会使得各自的收益 最大
P D=f(P)
P1
F
MR
O
Q1
Q
中石油的决策为: 生产1/2Q需求的石油;
中石化面临的市场需求为: Q- 1/2Q需求=1/2Q
P D=f(P)
MR
P2
G H
中石化的O 决策为:
Q2
Q
生产1/2*1/2Q=1/4Q需求的石油;
二 博弈的分类
1、从行动的先后次序来分,博弈可以分为 静态博弈和动态博弈。 静态博弈指在博弈中,参与人同时选择行 动,或虽非同时但后行动者并不知道前 行动者采取了什么具体行动; 动态博弈指的是参与人的行动有先后顺序, 且后行动者能够观察到先行动者所选择 的行动的博弈。
二 博弈的分类
2、 从参与人对其他参与人的各种特征信息 的获得差异来分,博弈可分为完全信息博 弈和不完全信息博弈。 完全信息指的是每一个参与人对所有其他 参与人的特征,如策略集合及得益函数都 有准确完备的知识;否则就是不完全信息。 将上述两个角度的划分结合起来,我们就 得到四种不同类型的博弈,这就是:完全 信息静态博弈,完全信息动态博弈,不完 全信息静态博弈和不完全信息动态博弈。
不坦白 D -8
-5 E -1 -8
-1 F -2
-2
例二,智猪博弈
猪圈里圈两头猪,一头大猪,一头小猪。猪
圈的一头有一个猪食槽,另一头安装一个安钮,
控制着猪食的供应。按一下按钮会有10单位的猪
食进槽。但谁按按钮谁就需要支付2个单位的成
本。若大猪先到,大猪吃到9个单位,小猪只能
吃1个单位;同时到,大猪吃7个单位,小猪吃3
(一)利润最大化的决策原则
1. 数学证明
T TR TC dT dTR dTC
dQ dQ dQ
Tπ:总利润 TC:总成本 TR:总收益
dT 0时,利润最大,从而有
dQ
MR MC MR:边际收益 MC:边际成本
利润最大化条件:MR=MC即当MR=MC=0时厂 商的利润最大,当MR=0时,厂商的利润达到最 大。
个单位;若小猪先到,大猪吃6个单位,小猪吃4
个单位。
表 3 智猪博弈支付矩阵
小猪
按
等待
大按
5, 1
4, 4
猪 等待 9, -1
0, 0
(四)寡头垄断模型
1、假设: (1)两个厂商生产同样的产品,知道市 场需求总量并且需求曲线是线性的。 (2)两厂商都是在已知对方产量的情况 下,各自确定能够给自己带来最大利润的 产量。 (3)边际成本MC=0
中,什么情况下选择什么行动的预先安排;
5.均衡:所有参与人的最优策略或行动的组合;
6.行动:参与人在博弈进程中轮到自己选择时所作
的某个具体决策;
二 博弈的分类
根据参与人的多少,可将博弈分为两人博 弈或多人博弈;
根据参与人是否合作,可将博弈分为合 作博弈或非合作博弈;
根据博弈结果的不同,又可分为零和博 弈、常和博弈与变和博弈。
低价格 D -$100 -$10 F -$50 -$50
两者都有占优策略——占优均衡
(三)纳什均衡(Nash equilibrium)
这样的策略组合,为了极大化自己的利益每 一个局中人所采取的策略一定是关于其他局 中人所取策略的最佳反应。因此没有一个局 中人会偏离这个策略组合而使自己蒙受损失。 寻找纳什均衡的方法:划线法
2
期望盈利为:
u1( 1, 2)
1 (0 3
4
1 2
5
1 2
6)
(局中人1取U时的期望盈利( 1 U))
(六)混合策略
1 (0 2 1 8 1 3)
3
2
2
(局中人1取M时的期望盈利( 1 M))
1 (0 3 1 9 1 2)
3
2
2
(局中人1取D时的期望盈利(1 D))
11
6
(六)混合策略
类似地,我们可以求得该情况下局中人2的 期望盈利为:
u2
(
1
,
2)
0
1 2
(
1 3
1
1 3
4
1 3
6)
1 (1 2 1 6 1 8) 27
23 3 3
6
三、博弈论中几个著名的例子
例一,囚徒困境(prisoners’ dilemma)
囚犯B
坦白
不坦白
囚犯A
坦白 C -5
结论:当中石油和中石化的产量均为市场总 需求的1/3时,两个石油公司的收益最大
与博弈论相关的赛题
2010年国际赛B题——预测犯罪 地点 2010年东三省A题——企业的营 销管理问题
Q
Q
3. 边际收益MR 增加一件产品给企业带来的销售收入增
加量
MR dTR a 2bQ dQ
P
O a/2b
a/b
Q
MR
MR=0时的产量是当时市场总需求产量的一半, 所以厂商都会把产量定在1/2*Q需求
(三)双寡头模型(duopoly model)
中石油和中石化是我国石油行业的两大巨头, 现已将中国的石油资源全部垄断。那么如果这两 个厂商不考虑市场需求只想着我多卖多赚钱,从 而盲目生产,这样不仅不能获得最大得益还有可 能为负值。那么在什么时候这两个厂商才能不打 价格战使收益最大呢?
(二)收益函数
1. 总收益TR 企业售出产品的价格(P)与数量(Q)的乘积。
TR=P Q 如果 P=a-bQ 则 TR=P Q
=(a- bQ)Q = a Q- bQ^2
2. 平均收益AR
平均每件产品给企业带来的销售收入, 是企业在一定产量水平上售出的产品的市 场价格。
AR TR aQ bQ2 a bQ =P
8,0
7,7
局中人1、2都没有占优策略——存在两个纳什 均衡
没有纳什均衡
上 A
下
B
左
右
00
0
-1
10
-1
3
(四)被支配策略
不管别的决策者如何决策,某策略的收益 比其他一些策略收益都低。——排除法 橄榄球:
防守策略
拦截带球 撤回线卫 突袭
进攻 带球
2
策略 传球
8ຫໍສະໝຸດ Baidu
6
14
7
10
突袭是最差的决策——排除
一 博弈概述
(一)指导思想
在一定时间内,事物之 间矛盾的对立和统一性, 推动事物达到一种良好 的状态。即假设你现在 正面对着你的对手或你 的合作伙伴,你怎样做 才能达到你的利益最大 化。
一 博弈概述
(二)博弈论概念
博弈即一些理性个人、团队或者是组织,面对一
定的环境条件,在一定的规则下,同时或者先后,
中石油面临的市场需求为:
Q-1/4Q=3/4Q
P
G
P1
D=f(P)
MR
中石油O 的决策为Q1:
Q
生产1/2*3/4Q需求=3/8Q的石油;
由1/2Q到3/8Q产量减少了1/8Q
中石化面临的市场需求为:
1- 3/8Q =5/8Q
P
D=f(P)
MR
F
P2
O
中石化的决策为:
Q2
Q
生产1/2* 5/8Q需求=5/16Q的石油;
二 博弈的分类
博弈的分类和均衡
信息次序
静态
动态
信息
完全信息
纳什均衡 纳什
子博弈精练纳什 均衡
泽尔腾
不完全信息
贝叶斯均衡 海萨尼
精炼贝叶斯均衡 泽尔腾等
三 完全信息静态博弈
所谓完全信息静态博弈指的是各博弈方 同时决策,或者决策行动虽有先后, 但后行动者不知道先行动者的具体行 动是什么且各博弈方对博弈中各种策 略组合情况下所有参与人相应的得益 都完全了解的博弈。
(一)占优策略(上策dominant stratege)
无论其他博弈者采用何种策略,该博弈者 的策略总是最好的。
(二)占优均衡(dominant equilibrium )
在两个博弈者都采用占优策略时,称这种结果为 占优均衡。
支付矩阵
一个 单元
B
正常价格
低价格
正常价格 C $10 $10 E -$10 -$100 A
U 4,3 5, 1 6,2
局中人1 M 2 , 1 D
3,0
8, 4 3,6 9, 6 2,8
(六)混合策略
若局中人1的混合策略取为
(
1
(U
),
1
(M
)
1
(
D))
(
1 3
,
1 3
,
1) 3
而局中人2的混合策略取为
(
2
(L),
2
(M
),
2
(
R))
(0,
1 2
,
1 2
)
那么在混合策略剖面(
1,
)下局中人1的
决策主体(可以是个人,也可以是团体);
2.得益:参与人在博弈结束后从博弈中获得的效
用,一般是所有参与人的策略或行动的函数,这 是每个参与人最关心的东西;(在混合策略中为 期望盈利)
3.信息:参与人在博弈中所知道的关于自己以及
其他参与人的行动、策略及其得益函数等知识;
一博弈概述
4.策略:指参与人选择行动的规则,即在博弈进程
非合作性均衡 1. 一个纳什均衡 2. 二个纳什均衡 3. 没有纳什均衡
一个纳什均衡
高价格
B 正常价格
高价格 C $100 $200 E -$20 $150
A
正常价格 D $150 -$30 F $10 $10
A占优策略,B没有—— 一个纳什均衡
两个纳什均衡
U 局中人1
D
局中人2
L
R
9,9
0,8