第二章 战略式博弈 静态博弈与纳什均衡

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 企业2的战略集 S2 就包含以下四个战略: 1 1 战略 s1 : , s s ( x ) a 2 2 ( x2 ) a 2 1 2 2 2 战略 s2 : , s s2 ( x1 ) a 2 ( x2 ) b 3 3 3 战略 s2 :s2 , s ( x1 ) b 2 ( x2 ) a 4 4 4 s 战略 s2 : , s2 ( x1 ) b 2 ( x2 ) b • 企业1的战略集 S1 就包含以下两个战略: 1 :1 战略 s1 s1 a 企业1的战略集和 战略 s12 :s12 b
组合是纳什均衡,也叫非合作均衡。
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的
意义。个人理性与集体理性的冲突,各 人追求利己行为而导致的最终结局是一 个“纳什均衡”,也是对所有人都不利 的结局。
对经典经济学的冲击
古典经济学的创始人亚当·斯密曾经描
述,市场机制这只“看不见的手”,会 引导人们自利的行为促进社会的福利。 博弈论的“囚徒困境”却揭示,非合作 的自利行为可能导致两败俱伤的情景。
• 此外,还有所谓的“完美信息”假设: 完美信息:指在轮到某一参与人行动 时,对其他参与人的行动选择有准确的了 解的情况,否则则为不完美信息; • 完美信息一般针对什么类型的博弈而言?
二、战略式博弈
• 战略式博弈(strategic form game)是博弈问 题的一种规范性描述,有时亦称标准式 博弈。 • 战略式博弈是一种相互作用的决策模型, 这种模型假设每个参与人仅选择一次行 动或战略,并且这些选择是同时进行的。
5. 信息
• 信息(information),是参与人所具有的有 关博弈的所有知识,如有关其它参与人 行动或战略的知识、有关参与人支付的 知识等等。 • 信息是对博弈问题进行系统科学分析的 基础,在不同的博弈问题中,根据具体 情况博弈问题具有不同的关于博弈信息 的假设。
• 在“新产品开发博弈”中,如果两个企业 都知道市场需求,那么这样的博弈情形就 是我们前面所提到的完全信息假设; • 如果两个企业中至少有一个不知道市场需 求,那么这样的博弈情形就是我们前面所 提到的不完全信息假设。
• 除特别指出外,一般都假设参与人为满 足完全理性的决策主体,并且用
i 1, 2, ,n
表示n人博弈中的参与人; • {1, 2, , n} 表示所有参与人的集合。 • 在“新产品开发博弈”中, {1,2} 。
2. 行动
• 行动(action),是参与人在博弈的某个时 点的决策变量。 • 例如,“新产品开发博弈”中企业的选 择——“开发”和“不开发”。 • 在博弈分析中,一般假设参与人都必须 有多个(两个或两个以上)可供选择的行 动。
G {;(Si );(ui )} 来表示战略式博弈。
例1 完全信息静态博弈的战略式描述
考察“新产品开发博弈”。试用战 略式博弈对两个企业都知道市场需求且 企业同时决策的博弈情形,即完全信息 静态的“新产品开发博弈”进行建模。
“新产品开发博弈”的战略式博弈(需求大 时)
企业2
开发
开发
300, 300 0, 800
结论:个人理性与集体理性的矛盾
囚徒 2 不坦白 坦 白 囚 坦 白 -5, -5 徒 1 不坦白 -8, 0
囚徒1:坦白 囚徒2:坦白 0, -8 -1, -1
两个罪犯的得益矩阵
囚徒困境说明了什么

在(坦白、坦白)这个组合中,两囚徒A和B 都不能通过单方面的改变行动增加自己的收益 ,于是谁也没有动力游离这个组合,因此这个
定义:战略式博弈
战略式博弈包含以下三个要素: 1 参与人集合 {1, 2,..., n} ; 2 每位参与人非空的战略集 S i ,即;
i , Si n 3 每位参与人定义在战略组合 si (s1 ,..., si ,..., sn )
上的效用函数 ui (s1,..., si ,..., sn ) 。
a (a1 , a2 , , an ) 是n个参与人的行动组合(action profile)。 • 它表示博弈中每个参与人 i(i 1, 2, , n) 采取一 个行动的一种博弈情形,其中 ai 表示参与人i所 采取的行动。
在“新产品开发博弈”中: • 行动组合(开发,开发) (即( a, a ) )表示博弈中企 业1和2都采取行动“开发”; • 行动组合(不开发,开发) ( 即 (b, a ) )表示博弈中 企业1采取行动“不开发”,而企业2采取行动 “开发”。 • 用A表示所有行动组合的集合。在“新产品开 发博弈”中,存在四个行动组合,即
• 在“新产品开发博弈”中,参与人的利润就是 其支付; • 在市场需求大的情况下: 如果参与人都选择“开发”,则其支付都 为 300万元,即 u1 (a, a) 300 , u2 (a, a) 300; 如果参与人1选择“开发”,而参与人2选 择“不开发”,则参与人1的支付为800万元, 而参与人2的支付为0, u2 (a, b) 0 。 即 u1 (a, b) 800 ,
行动集相同。
完全信息静态博弈的战略
• 在完全信息静态博弈中,由于不存在决 策时序上的差异,所有参与人在同一决 策时点即博弈开始的那一时刻决策,因 此,所有参与人面临的决策情形都只有 一种,所以,参与人的战略集与行动集 相同。
关于战略组合的标记
• 在n人博弈中,用 s (s1, s2 , , sn )表示 n个参与 人的战略组合(strategy profile),它表示博弈中 每个参与人 i(i 1, 2, , n) 采取战略 si 的一种博 弈情形。
A {(a, a),(a, b),(b, a),(b, b)}
3. 战略
• 战略(strategy),是参与人的行动规则, 它规定了参与人在每一种轮到自己行 动的情形下,应该采取的行动。它是 与博弈的行动顺序相关的行动的有序 集,也是构成博弈问题的基本要素之 一。
• 在“新产品开发博弈”中,假设博弈参与人 的行动顺序(决策时序)是:企业1先行动,企 业2观测到企业1的行动后再行动。 • 在这样的博弈行动顺序下,轮到企业2行动时, 可能面临的决策情形就会有两种:企业1已采 取行动“开发”和企业1已采取行动“不开 发”。 • 企业2的战略就必须告诉(规定)企业1: 当企业1采取行动“开发”时,自己应该 怎样行动(“开发”还是“不开发”);当企业 1采取行动“不开发”时,自己应该怎样行动 (“开发”还是“不开发”)。
一、基本概念
1. 参与人; 2. 行动; 3. 战略; 4. 支付; 5. 信息;
1. 参与人
• 参与人(player,亦称局中人),是指博弈中 选择行动以最大化自己效用的决策主体, 既可能是个人,也可能是团体,如国家、 企业或组织等。 • 例如,“新产品开发博弈”中的企业1和2。
有关参与人的标记
• 用 si (s1, , si1, si1, , sn )表示除参与人i以 外其他参与人的战略组合,则
s (s1 , s2 , , sn ) (si , si )
• 因此,参与人 i(i 1, 2, 示为:
, n) 的支付就可表
ui ui (si , si )
新产品开发中参与人支付的标记
第二章战略式博弈与Nash均 衡
主要内容: 一、占优行为 二、重复剔除劣战略行为; 三、Nash均衡。
战略式博弈
主要内容: 一、基本概念; 二、战略式博弈。
引例:新产品开发博弈
两企业(不妨称为企业1和企业2)准备各自开 发同一新产品,并投放市场。
对手不开发,获利800万元 需求大 对手开发,获利300万元 开发(a ):投入2千万元资金 对手不开发,获利200万元 企业 需求小 对手开发,赔400万元 不开发(b):不投入资金,利润为0
关于支付的标记
• 用 ui (i 1, 2, , n) 表示参与人i的支付(效用水平), 支付组合 u (u1, u2 , , un )表示参与人在特定博弈 情形下所得到的支付,其中为参与人i的支付。 • 博弈中每种特定博弈情形的出现都是参与人相 互作用的结果,因此,参与人在每种博弈情形 下的支付(效用水平),不仅与自己的选择(行动 或战略)有关,而且还与其他参与人的选择(行 动或战略)有关。参与人 i(i 1, 2, , n)的支付可 表示为: ui ui (s1 , s2 , , sn )
有关行动的标记
• • • • 用 ai 表示参与人 i(i 1, 2, , n) 的行动, Ai {ai } 表示参与人所有行动的集合。 A1 A2 {a, b} 例如,“新产品开发博弈”中, 行动不仅可以为离散型变量,也可以是 连续型变量。
• 在n人博弈中,n个参与人行动的有序集
公共资源悲剧
哈丁(Garrit Hadin)1968年在《Science》杂志上 发表了一篇文章,题为The Tragedy of the Commons。 哈丁举例:一群牧民面对向他们开放的草地,每 一个牧民都想多养一头牛,因为多养一头牛增加 的收益大于其购养成本,是合算的,尽管因平均 草量下降,可能使整个牧区的牛的单位收益下降 。每个牧民都可能多增加一头牛,草地将可能被 过度放牧,从而不能满足牛的食量,致使所有牧 民的牛均饿死。这就是公共资源的悲剧。
i 1
• 一般而言,如果我们要用战略式博弈对 一个博弈问题进行建模(或者描述),那么 我们只需要说清楚博弈问题的三个构成 要素即可,即博弈问题所涉及到的参与 人、每位参与人有哪些战略可供选择使 用以及每位参与人定义在战略组合上的 效用函数。
战略式博弈的标记
• 如果 且 i ,Si ,也就是,如果博弈 中参与人的人数以及每个参与人的战略有限,则 称这个博弈问题为有限博弈(finite game)。 • 对于有限博弈,我们一般用三元组
si : X i Ai
• 用 Si {si } 表示参与人所有战略的集合。
新产品开发中参与人战略的标记
• 在“新产品开发博弈”中,假设博弈中参与人 的行动顺序(决策时序)是:企业1先采取行动, 企业2观测到企业1的行动后再采取行动。那么 企业2行动时面临的决策情形就有以下两种: • 情形 x1 :企业1已采取行动“开发”; • 情形 x2 :企业1已采取行动“不开发”。 • 所以, X 2 {x1 , x2 }
• 例如,在“新产品开发博弈”中,战略组合 (s1 , s2 ) 1 表示博弈中企业1采用战略 s1 (即博弈开始采取 3 行动“开发”),企业2采用战略 s2 。
1 3
4. 支付
• 支付(payoff),是指参与人在博弈中的所 得。 • 在博弈分析中,除特别说明外,一般情 况下也是用效用函数来表示参与人在博 弈中的所得(即支付)。因此,参与人的支 付就可表示为一种特定博弈情形下参与 人得到的确定效用水平或期望效用水平。
关于战略的标记
• 在n人博弈中,用 si 表示参与人 i(i 1, 2,, n) 的战略; • X i 表示参与人 i(i 1, 2,, n) 在博弈中可能 面临的所有决策情形的集合,称为观测 集。
• 参与人 i(i 1, 2, , n) 在博弈中的战略可以 定义为从观测集 X i 到行动集 Ai 的映射关 系,即
不开发
800, 0 0, 0
企业1
不开发
“新产品开发博弈”的战略式博弈(需求小 时)
企业2
开发
不开发
200, 0 0, 0
开发
-400, -400 0, 200
企业1百度文库
不开发
• 需要指出的是,由于战略式博弈是一种假设每 个参与人仅选择一次行动或战略,并且参与人 同时进行选择的决策模型,因此,从本质上来 讲战略式博弈是一种静态模型,一般适用于描 述不需要考虑博弈进程的完全信息静态博弈问 题。 • 对于完全信息动态博弈问题,虽然可以给出博 弈问题的战略式描述,但无法看到原问题所具 有的动态特性 。
相关文档
最新文档