博弈论和竞争策略
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从顾客利益出发,最优解在1/4处和3/4处
假设街的长度是1。两个商场的位置分别 在a和b(a<b)。
假设顾客走单位路程的成本是1。 X处的顾客到商店的最短距离是R(x):
a x x a R( x) b x x b x (0, a ) ab x (a, ) 2 ab x( , b) 2 x (b,1)
总费用
1
C R( x)dx 0.75a 2 0.75b 2 0.5ab b 0.5
0
求解最小值问题:
min C 0.75a2 0.75b2 0.5ab b 0.5
a=1/4,b=3/4
极大极小策略(Maximin Strategy)
极大极小策略(Maximin Strategies)
PV1合作
10 10 10 10(1 i) 10 ... 2 3 1 i (1 i) (1 i) i
PV1.欺骗 10(1 i ) 50 PV1.合作 i
厂商 1的极大极小策略是不投资 厂商 2的极大极小策略是投资
如果1 知道 2 采用极大极小策略,1将 会投资
囚徒困境
囚徒 B
坦白 不坦白
坦白
-5, -5
-1, -10
囚徒 A
不坦白
-10, -1
-2, -2
囚徒困境
求:
占优策略
囚徒 B
坦白 不坦白
纳什均衡
极大极小解
囚徒 A
不坦白 坦白
厂商 2
不投资 投资
不投资
0, 0
-10, 10
厂商 1
投资
-100, 0
20, 10
极大极小策略
wenku.baidu.com观察
厂商 2的占优策 略: 投资 纳什均衡
厂商 2
不投资 投资
厂商 1: 投资 厂商 2: 投资
不投资
0, 0
-10, 10
厂商 1
投资
-100, 0
20, 10
极大极小策略
观察
如果厂商 2 不 投资, 厂商 1会 招致显著的损失 厂商 1 也许会
零和博弈和非零和博弈
完全信息博弈和不完全信息博弈
完美信息和不完美信息博弈
博弈和决策
“如果我相信我的竞争对手是理性的和 追求利润最大化的,在我自己作出利润 最大化决策时,我应当怎样考虑他们的 行为?”
博弈和决策
非合作博弈与合作博弈
合作博弈
各博弈方可以谈定能使他们设计联合策略 的有约束力的合同,该博弈就是合作的
位置博弈
Ocean
C
0
B
Beach
A
200 米
2) 类似的例子还有:
加油站的选址 顾客的口味 总统选举
讨论题
在一条长街的两边住着许多居民(假定均匀分 布),现拟建设一个大型商场。
从方便居民生活出发,商场应该建在什么地方 ?从商场经营者的利益出发,又应建在什么地 方? 若预测到商场建成后可获巨额利润,引起另一 竞争者进入,那么
博弈方 B
正面
正面
反面
1, -1
-1, 1
博弈方 A
反面
-1, 1
1, -1
性别战
琼
摔跤 歌剧
摔跤
2,1
0,0
吉姆
歌剧
0,0
1,2
性别战
纯策略
都去看摔跤 都去看歌剧
摔跤
琼
摔跤 歌剧
混合策略
2,1
0,0
吉姆以2/3的概 率选择摔跤 琼以1/3的概率 选择摔跤
吉姆
歌剧
0,0
1,2
投标和拍卖
博弈参加者。博弈论分析假定参与者都 是理性的。 行动或策略空间。博弈论参与者必须知 道他自己及其对手伙伴的策略选择范围 。 决策行为结果。博弈论用数字表示这类 结果,并称之为支付(Payoff)。
博弈的分类
同时博弈(静态博弈)和顺序博弈(动态博 弈)
一次性博弈和重复博弈
合作博弈和非合作博弈
选择不投资
厂商 2
不投资 投资
不投资
0, 0
-10, 10
厂商 1
投资
使损失极小化 (为10)—— 极大极小策略
-100, 0
20, 10
纳什均衡的回顾
极大极小策略
如果双方是理性的和完全信息的
两个厂商都会投资 纳什均衡
纳什均衡的回顾
极大极小策略
考虑
如果博弈方2是非理性的或者不完全信息的
例子:卖方和买方就一个产品或一种服务讨
价还价,或两个厂商建立合资企业 (比如, Microsoft 和 Apple) 两个厂商签订一份分配联合利润的有约束力 的合同是可能的
博弈和决策
非合作博弈与合作博弈
非合作博弈
签订有约束力的合同是不可能的
博弈方个各自作出其最佳的决策
博弈和决策
观察
A和B的占优策略 都是“做广告” 不用担心其他博 弈方的选择
做广告
厂商 B
做广告
不做广告
10, 5
15, 0
(做广告,做广 告)是占优策略 均衡
厂商 A
不做广告
6, 8
10, 2
占优策略
并非每个博弈都有占优策略
此时,一个博弈方的最优策略依赖于其他博
弈方的选择
修改过的广告博弈
厂商 B
-5, -5
-1, -10
-10, -1
-2, -2
纳什均衡的回顾
混合策略
纯策略
博弈方做确定的选择
混合策略
博弈方基于特定的概率在两个或多个可能的
行动中做随机的选择
对硬币
博弈方 B
正面 反面
正面
1, -1
-1, 1
博弈方 A
反面
-1, 1
1, -1
对硬币
观察
纯策略: 不存在 纯策略纳什均衡 混合策略: 随机 选择成为纳什均 衡 厂商会基于随机 选择假设来定价 吗?
竞争性的定价方式
拍卖的形式
公开喊价拍卖
英式(攀高)拍卖
拍卖人低价起拍,向竞价者一次次提高征 求价格, 直到只有一个投标人。
荷式(递减)拍卖
拍卖人高价起拍,向竞价者一次次减低征 求价格,直到有人举手应拍
拍卖的形式
密封投标: 者
每个竞价者把竞价密封交给卖
第一价格密封投标
出价最高的投标人获胜,并以此价成交 第二价格密封投标 出价最高的投标人获胜,但以第二最高价成交
只能容纳一个公司的脆麦片市场
只能容纳一个公司的甜麦片市场
每个厂商只有推出一种产品的资源
非合作
产品选择问题
厂商 2
脆 甜
脆
-5, -5
10, 10
厂商 1
甜
10, 10
-5, -5
产品选择问题
问题
厂商 2
脆 甜
存在纳什均衡 吗? 如果不存在, 为什么? 如果存在,该 纳什均衡如何 达到?
厂商 B
做广告 不做广告广告
做广告
10, 5
15, 0
厂商 A
不做广告
6, 8
10, 2
广告博弈的支付矩阵
观察
厂商 B
做广告 不做广告广告
A: 不论B怎样决 策,做广告总是 最好的 B:不论A怎样决 策,做广告总是 最好的
做广告
10, 5
15, 0
厂商 A
不做广告广告
6, 8
10, 2
广告博弈的支付矩阵
竞价B (v=8) 8
6
重复博弈(Repeated Games)
囚徒困境是静态的,均衡是个体理性的,并非 最有效的解
很多情况下,寡头厂商是在进行重复博弈。
在囚徒困境的不断重复中,厂商可以建立起他 们行为的声誉,并研究竞争对手的行为 因此,在重复博弈中,惩罚成为可能,在惩罚 的作用下,博弈的各方可能会考虑长远利益, 采用合作解(团体理性解,或卡特尔解)
非合作博弈与合作博弈
“策略设计基于你对竞争对手的观点的理解 ,并且(假设你的对手的理性的)推导出对 手对你的行动的可能的反应”
占优策略
占优策略(Dominant Strategy)
无论对手如何选择都是最好的 例子
A 和 B 销售竞争的产品
他们正在决定是否做广告
广告博弈的支付矩阵
脆
-5, -5
10, 10
厂商 1
甜
10, 10
-5, -5
位置博弈
问题
两个卖软饮料的竞争者 Y 和 C 200米长的海滩 晒太阳的人均匀地分布在海滩上
Y 的价格= C 的价格
顾客总是就近购买
位置博弈
Ocean
C
0
B
Beach
A
200 米
竞争者应该选址在何处 (何处是纳什 均衡)?
比如,下棋打牌,核军备竞赛,美伊战争,广告 战,价格战
博弈论
博弈论(Game Theory)又名对策论, 游戏论:研究在多个决策者策略相互 依赖、相互作用的条件下的最优化问 题的学科。
是研究理性的决策者之间冲突及合作 的学科。 应用:被广泛地应用于政治、外交、 军事、经济的研究领域
博弈的三个要素
博弈论和竞争策略
将要讨论的问题
博弈和决策 占优策略 纳什均衡的回顾
重复博弈
将要讨论的问题
序列博弈 威胁、承诺和可信性 阻止进入
讨价还价策略
拍卖
博弈论
单人优化问题:在给定的环境下或条件下, 个人如何做才可以取得最好的结果
比如,消费者均衡问题,生产均衡问题
多人优化问题:多个人的决策相互依赖,必 须考虑其他人的反应。也称博弈问题。
私人估价
竞价者有着不同的保留价格
每个竞价着必须选择合适的策略
英式拍卖
选择停止竞价的价格
荷式拍卖
选择预期的竞价价格
私人估价
问题: 各种拍卖有什么差别?
对拍卖者收入有何影响?
对投标者预期效用有何影响?
私人估价
例: 两个竞价者,有不 同的保留价格 , 最 高价成交.
竞价A(v=9)
11
10
9
7
低报竞价是上策.
-50, 100
50, 50
重复博弈
结论:
在重复博弈中
利用以牙还牙策略,重复囚徒困境博弈能形 成合作解
这种情况最可能出现在:
厂商较少 稳定的需求 稳定的成本 合作是困难的,因为在长期中,这些因素可能 是变化的
例子:触发策略
寡头厂商1 寡 头 厂 商 2 战略 低价格 高价格 低价格 0,0 -10,50 高价格 50,-10 10,10
无限重复博弈 :一次一次无 止境地行动, 参与人从每次 行动中得到收 益;
存在货币的时 间价值问题; 采用 “触发战 略” 有助于形 成共谋。
无限重复博弈:一般地,利率低时,厂商会发现
共谋索取高价可获最大利润。
若1欺骗,其利润的现值为 PV1· 欺骗 = 50+0+0+…… 若1不欺骗,每期收益为10,合作的现值为
占优策略
“我所做的是不管你做什么我所能做的最好 的” “你所做的是不管我做什么你所能做的最好 的”
纳什均衡的回顾
纳什均衡
“我所做的是给定你所做的我所能做到的最 好的” “你所做的是给定我所做的你所能做到的最 好的”
纳什均衡的回顾
产品选择问题
多个纳什均衡的例子
两个麦片公司面临两个市场:
定价问题
厂商 2
低价 高价
低价
10, 10
100, -50
厂商 1
高价
-50, 100
50, 50
定价问题
非重复博弈
策略是(低价, 低价)
低价
厂商 2
低价 高价
重复博弈
10, 10
100, -50
一项模拟试验表 明,以牙还牙策 略(Tit-fortat )是盈利性 最好的策略
厂商 1
高价
0, -2 -2 , 0 -2 , 0 0, -2 0, 0 0, 0 0, -2 0, 0 0, 2
竞价B (v=8) 8
6
私人估价
例: 两个竞价者,有不同 的保留价格 , 第二最 高价成交.
竞价A(v=9)
11
10
9
7
诚实竞价是上策.
0, -1 -1, 0 1, 0 0, 1 0, 1 1, 0 0, 3 0, 3 0, 3
投标者的投标是根据对标的的估价
拍卖估价
私人估价Private Valuation auction (PV)
每一个竞价者都有其个人估价的角度和信息 不同的人有不同的估价(即使信息相同)
公共估价Common Value auctions (CV)
每个竞价者具有不同的估价信息,但实际上拍 卖品对所有人的价值(转卖价值)是一样的
从方便居民生活出发,两个商场应该分别建在 什么地方?从两个商场经营者各自的利益出发 ,又应建在什么地方?
从商场利益出发,均衡解是大家都位于中点
如果不是这样,任何一个商场向对方移 动都会使得其顾客增加,从而使得收入 增加。 只有都位于中点,才是均衡。也就是说 ,此时,任何一方的移开都会使自己的 收入减少。
问题
两个销售文件加密软件的相互竞争的厂商 他们都采用相同的加密标准(用一种软件 加密后可以用另一种软件解密——对顾客 有好处)
极大极小策略(Maximin Strategy)
极大极小策略
问题
厂商 1 的市场份额比厂商 2大许多 双方都在考虑投资一个新的加密标准
极大极小策略(Maximin Strategy)
做广告 不做广告
做广告
10, 5
15, 0
厂商 A
不做广告
6, 8
20, 2
修改过的广告博弈
观察
A: 不存在占优
策略,选择依赖 于B的选择
做广告
厂商 B
做广告 不做广告
B: 做广告
厂商 A
不做广告
10, 5
15, 0
问题
6, 8
20, 2
A应该如何选择 ? (提示:考虑 B的选择)
纳什均衡的回顾