关于定价的博弈论模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CH13 关于定价的博弈论模型
分析寡头市场的最大困难在于策略问题。在此情形下,市场上仅有几家企业,每一家企业在做决策时,都必须在一定程度上考虑其它企业的行为。博弈论就是用以研究策略选择的一种主要的工具。
一、基本概念
在一些情况下,个人或企业必须作出策略性选择,并且最终的结果依赖于每一个行动者的选择,这种情况就可以看成是一个博弈。 1.博弈的三要素
任何一个博弈都必须具备三个要素: (1)博弈的参与者
参与人的具体身份无关紧要,在博弈中没有“好人”与“坏蛋”之分,我们只是简单地假设每个参与者在考虑到对手行为的前提下,做出最有利的策略性选择。 (2)策略
策略是博弈参与者的行动规则。
在非合作博弈中,参与者之间不能就策略选择达成一个有约束力的协议。 (3)支付(payoffs )
支付是参与者的最终受益。支付包括了与博弈结果相关的所有方面,既包括显性的货币报酬,也包括隐性的参与者关于结果的心理感受。 2. 符号
两个参与者(A 和B )之间的博弈G 用下式表示 [,,(,),(,)]A B A B G S S U a b U a b
其中,A S 和B S 分别表示参与者A 和参与者B 的可选策略,(,)A U a b 和(,)B U a b 分别表示当参与者A 和B 分别选择策略a 和策略b 时,各自所得到的支付(,A B a S b S ∈∈)。
二、Nash 均衡
市场均衡:在均衡价格和产量下,买方和卖方都没有动力去改变自己的行为。
Nash 均衡:对于策略组合(**
,a b ),如果给定其它参与者的策略,没有一个参与者会选择单方面偏离,那么这个策略组合就构成一个Nash 均衡。也就是说
***
(,)(,)A A U a b U a b '≥ 对于所有A a S '∈ ***
(,)(,)B B U a b U a b '≥ 对于所有B b S '∈
对纳什均衡的理解
设想所有参与者在博弈之前达成一个(没有约束力的)协议,规定每个参与人选择一个特定的战略。那么,给定其他参与人都遵守此协议,是否有人不愿意遵守此协议?如果没有参与人有积极性单方面背离此协议,我们说这个协议是可以自动实施的(self-enforcing ),这个协议就构成一个纳什均衡。否则,它就不是一个纳什均衡。
三、一个例子
两个厂商(A 和B )决定自己花多少钱用于做广告。每个厂商可以选择较高的预算(H )或较低的预算(L )。 1.博弈的扩展式表述
图13.1
2.博弈的策略式(规范式)表述
表13.1
3.占优策略和Nash 均衡
从表13.1可以看出,低预算(L )是厂商B 的占优策略,即不管厂商A 选择哪一种策略,L 都是厂商B 的最佳选择。由于该博弈的结构是公共知识,厂商A 也知道L 是厂商B 的占优策略,所以厂商A 将选择L 。因此,该博弈的均衡是(L ,L )。 请验证(L ,L )构成一个Nash 均衡,而其它三个策略组合都不是Nash 均衡。
四、混合策略Nash 均衡
上面的博弈存在唯一的Nash 均衡,但是并非所有博弈都是如此。在下图所示的猜谜博弈中,没有上述意义上的Nash 均衡存在;而在“性别之战”博弈中,存在两个Nash 均衡。
儿童B H(正面) T(反面) 儿童A
H(正面)
T(反面)
表13.2 猜谜博弈
表13.3 “性别之战”
Nash 均衡不存在的一个主要原因是参与人的策略较少,缺乏灵活性。在以下两种情况下,参与者的潜在策略数无穷大,就可以保证博弈至少存在一个均衡:(1)参与者的策略是某一区间内的连续变量(比如厂商对产量或价格的选择);(2)参与者使用混合策略——以一定的概率选择某种概率。相应地,以概率1选择某种行动的策略叫做“纯策略”。 下面,我们来求解“猜谜博弈”的混合策略Nash 均衡。
Suppose that the players decide to randomize amongst his strategies and play a mixed strategy. Player A could flip a coin and play H with probability r and T with probability 1-r , and player B flip a coin and play H with probability s and T with probability 1-s.
Given these probabilities, the outcomes of the game occur with the following probabilities: H-H , rs ; H-T, r (1-s ); T-H, (1-r )s ; T-T,(1-r )(1-s ). Player A ’s expected utility is then given by ()(1)(1)(1)(1)(1)(1)(1)(1)A E u rs r s r s r s =+--+--+-- 42212(21)21rs r s r s s =--+=--+
Oviously, A ’s optimal choice of r depends on B ’s probability, s. If 12s <, utility is maximized by choosing 0r =. If 12s >, A should opt for 1r =. And when 12s =, A ’s expected utility is 0 no matter what value of r is choosen. A ’s best response function is
0, 12()1, 12[0,1], 12if s r s if s if s <⎧⎪
=>⎨⎪=⎩