《博弈论基础》
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
01-3-2 6
2、博弈规则(续)
( 3) 行 动 的 先 后 顺 序 ● 静 态 ( S tatic 同 时 ) ● 动 态 ( D y nam ic 先 后 ) ( 4) 信 息 结 构 : 参 与 人 在 行 动 时 知 道 了 什 么 (5)战略(Strategy) S = ( s 1, s 2, … , s k) = ( s k, s -k)
01-3-2
17
2、NE的求解
例 1:囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证:{s*1=(C,C) ;s*2=(C,C)}为 NE 战略 ●但 Pareto 改进(-2,-2)未能自发达到——外部性 ●个人理性与集体理性产生冲突
<The Theory of Games & Economic Behavior> ●John Harsanyi & John Nash & Reinhard Selten
01-3-2 1
3、应用阶段
(1)宏观经济学:●政策动态一致性(SPNE) ●劳动力市场 ●(金融)信贷市场 (2)微观经济学 ●外部性 ●公共产品的投资激励 ●工资(薪酬)决定
四、博弈的表示方式
1. 矩 阵 博 弈 例 : 囚 犯 困 境 囚 犯B C
囚 犯C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例:性别战(Battle of Sexes)
● 新婚夫妇: Opera Opera Sandy Football ● 百年夫妻: Opera Opera Sandy Football
01-3-2
{犯;不犯}
9
2、博弈规则(续)
而我的战略集合: {s1, s2, s3, s4} 其中, s1= (犯,犯) ; s2= (犯,不犯) s3= (不犯,犯) ; s4= (不犯,不犯) 上述例子,我的战略为 s2 ( 6 )支付( Payoff) : U K( s1, s2,…, sn) =U K( sk, s-k)
01-3-2 14
例:囚犯两难(困境)矩阵博弈与博弈树的转换
( -5 , -5 ) C B○ C A○ DC B○ DC ( -2 , -2 ) C ( -1 0 , 0 ) DC ( 0 , -1 0 )
01-3-2
15
五、均衡(Equilibrium)
静态 完全信息 不完全信息
NE
动态
SPNE
BNE
PBNE
01-3-2
16
纳什均衡(NE)
1、 定 义 : ● 战 略 S * = ( s* 1 , s* 2 , … , s* n ) 为 N E 战 略 等 价 于 对 k=1, 2, … , n, 有 s* k ∈ a rg · M a x { U k ( s* k , s* -k ) } ● 也 就 是 说 ,在 均 衡 战 略 下 ,如 果 他 人 不 改 变 战 略 , 任意参与人不会单方面改变战略
第六讲 博弈论基础
一. 博弈论的发展阶段
1.传统阶段: ●Theory of Oligopoly: Cournot(1838) Betrand(1883) ●Theory of Bargaining: Edgeworth(1887) Hicks(1932) 2.现代阶段: ●Von Neumann & Morgenstern (1944)
01-3-2
∈∏Sk
7
2、博弈规则(续)
●参与人 k 的战略应说明 k 在各种可能情况下的行动 方针,如:胡荣华与赵国荣下一盘象棋,胡自始至 终的行动计划称为“战略” ;而每一步棋称为“行 动” ● 静 态 时 , 战 略 =行 动 ●动态时,战略≠行动
01-3-2 8
2、博弈规则(续)
●“兵来将挡、水来土掩” ●“以不变应万变” 、 “以静制动” ●毛主席语录: “人不犯我,我不犯人;人若犯我,我 必犯人”—这里, 人的行动集:{犯;不犯}; 人的战略集:{犯;不犯} 我的行动集:
01-3-2 4
三、非合作博弈
1 . 引 例 ( 1 ) 零 和 博 弈 ( 对 抗 性 ) ● 猜 拳 ● 打 牌 、 下 棋 ( 2 ) 非 零 和 博 弈 ● 囚 犯 困 境 ● 体 育 比 赛
01-3-2
● 航 空 公 司 价 格 战
5
2、博弈规则
(1)参与人(Players) : ●k=1,2,…,n(虚拟参与人——自然) ●参与人是理性的(即谋求效用最大化) (2)参与人的行动集(Action Set) : ●行动 ak∈AK(行动集合) ,k=1,2,…,n ●行动组合(Profile) : a=(a1,a2,…,an)=(ak,a-k)∈∏Ak
01-3-2
10
2、博弈规则(续)
●博弈:规定谁在什么时候行动;行动时知道了什么; 有什么可供选择;得到多少 ●有限博弈:参与人有限;行动集合有限 ●博弈规则为共同知识的博弈称为完全信息博弈 ●所有参与人在行动时均知道其他参与人之前的行动 的博弈称为完美信息博弈 ●完美→完全;不完全→不完美
01-3-2 11
01-3-2 2
应用阶段(续)
( 3)市场营销 ● Sales Force Mgt. ● Channel Mgt. ● Pricing Startegy ( 4)产业组织理论 ● 市场竞争与 R&D 竞争 ● 市场进入与反进入 ● 广告方法选择
01-3-2● 产业规制3二、合作博弈
● Cartel ( OPEC ) ● RJVs ● 合作讨价还价模型( Nash , 1950 ) : Max{ ( X 1-D 1) ( X 2-D 2) } S. T. X 1+X 2≤ 1 其中, D 1、 D 2 分别为 1 与 2 的初始禀赋, 成为威胁点 ( Threat Point) ,产权配置改变 D 1、 D 2。 当 D 1=D 2, X 1=X 2=1/2
01-3-2
Paul Football
1 0 0 1 0 2 2 0
Paul Football
0 1 0 1 2 0 2 0
13
2、博弈树
例 : 欧 盟 航 空 公 司 空 中 争 夺 战 中 陆 ¥ 380 法 航 380 490 380 ¥ 490 法 航 490
( 8 , 8 ) ( 1 3 , 4 ) ( 4 , 1 3 )( 1 0 , 1 0 )
2、博弈规则(续)
( 3) 行 动 的 先 后 顺 序 ● 静 态 ( S tatic 同 时 ) ● 动 态 ( D y nam ic 先 后 ) ( 4) 信 息 结 构 : 参 与 人 在 行 动 时 知 道 了 什 么 (5)战略(Strategy) S = ( s 1, s 2, … , s k) = ( s k, s -k)
01-3-2
17
2、NE的求解
例 1:囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证:{s*1=(C,C) ;s*2=(C,C)}为 NE 战略 ●但 Pareto 改进(-2,-2)未能自发达到——外部性 ●个人理性与集体理性产生冲突
<The Theory of Games & Economic Behavior> ●John Harsanyi & John Nash & Reinhard Selten
01-3-2 1
3、应用阶段
(1)宏观经济学:●政策动态一致性(SPNE) ●劳动力市场 ●(金融)信贷市场 (2)微观经济学 ●外部性 ●公共产品的投资激励 ●工资(薪酬)决定
四、博弈的表示方式
1. 矩 阵 博 弈 例 : 囚 犯 困 境 囚 犯B C
囚 犯C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例:性别战(Battle of Sexes)
● 新婚夫妇: Opera Opera Sandy Football ● 百年夫妻: Opera Opera Sandy Football
01-3-2
{犯;不犯}
9
2、博弈规则(续)
而我的战略集合: {s1, s2, s3, s4} 其中, s1= (犯,犯) ; s2= (犯,不犯) s3= (不犯,犯) ; s4= (不犯,不犯) 上述例子,我的战略为 s2 ( 6 )支付( Payoff) : U K( s1, s2,…, sn) =U K( sk, s-k)
01-3-2 14
例:囚犯两难(困境)矩阵博弈与博弈树的转换
( -5 , -5 ) C B○ C A○ DC B○ DC ( -2 , -2 ) C ( -1 0 , 0 ) DC ( 0 , -1 0 )
01-3-2
15
五、均衡(Equilibrium)
静态 完全信息 不完全信息
NE
动态
SPNE
BNE
PBNE
01-3-2
16
纳什均衡(NE)
1、 定 义 : ● 战 略 S * = ( s* 1 , s* 2 , … , s* n ) 为 N E 战 略 等 价 于 对 k=1, 2, … , n, 有 s* k ∈ a rg · M a x { U k ( s* k , s* -k ) } ● 也 就 是 说 ,在 均 衡 战 略 下 ,如 果 他 人 不 改 变 战 略 , 任意参与人不会单方面改变战略
第六讲 博弈论基础
一. 博弈论的发展阶段
1.传统阶段: ●Theory of Oligopoly: Cournot(1838) Betrand(1883) ●Theory of Bargaining: Edgeworth(1887) Hicks(1932) 2.现代阶段: ●Von Neumann & Morgenstern (1944)
01-3-2
∈∏Sk
7
2、博弈规则(续)
●参与人 k 的战略应说明 k 在各种可能情况下的行动 方针,如:胡荣华与赵国荣下一盘象棋,胡自始至 终的行动计划称为“战略” ;而每一步棋称为“行 动” ● 静 态 时 , 战 略 =行 动 ●动态时,战略≠行动
01-3-2 8
2、博弈规则(续)
●“兵来将挡、水来土掩” ●“以不变应万变” 、 “以静制动” ●毛主席语录: “人不犯我,我不犯人;人若犯我,我 必犯人”—这里, 人的行动集:{犯;不犯}; 人的战略集:{犯;不犯} 我的行动集:
01-3-2 4
三、非合作博弈
1 . 引 例 ( 1 ) 零 和 博 弈 ( 对 抗 性 ) ● 猜 拳 ● 打 牌 、 下 棋 ( 2 ) 非 零 和 博 弈 ● 囚 犯 困 境 ● 体 育 比 赛
01-3-2
● 航 空 公 司 价 格 战
5
2、博弈规则
(1)参与人(Players) : ●k=1,2,…,n(虚拟参与人——自然) ●参与人是理性的(即谋求效用最大化) (2)参与人的行动集(Action Set) : ●行动 ak∈AK(行动集合) ,k=1,2,…,n ●行动组合(Profile) : a=(a1,a2,…,an)=(ak,a-k)∈∏Ak
01-3-2
10
2、博弈规则(续)
●博弈:规定谁在什么时候行动;行动时知道了什么; 有什么可供选择;得到多少 ●有限博弈:参与人有限;行动集合有限 ●博弈规则为共同知识的博弈称为完全信息博弈 ●所有参与人在行动时均知道其他参与人之前的行动 的博弈称为完美信息博弈 ●完美→完全;不完全→不完美
01-3-2 11
01-3-2 2
应用阶段(续)
( 3)市场营销 ● Sales Force Mgt. ● Channel Mgt. ● Pricing Startegy ( 4)产业组织理论 ● 市场竞争与 R&D 竞争 ● 市场进入与反进入 ● 广告方法选择
01-3-2● 产业规制3二、合作博弈
● Cartel ( OPEC ) ● RJVs ● 合作讨价还价模型( Nash , 1950 ) : Max{ ( X 1-D 1) ( X 2-D 2) } S. T. X 1+X 2≤ 1 其中, D 1、 D 2 分别为 1 与 2 的初始禀赋, 成为威胁点 ( Threat Point) ,产权配置改变 D 1、 D 2。 当 D 1=D 2, X 1=X 2=1/2
01-3-2
Paul Football
1 0 0 1 0 2 2 0
Paul Football
0 1 0 1 2 0 2 0
13
2、博弈树
例 : 欧 盟 航 空 公 司 空 中 争 夺 战 中 陆 ¥ 380 法 航 380 490 380 ¥ 490 法 航 490
( 8 , 8 ) ( 1 3 , 4 ) ( 4 , 1 3 )( 1 0 , 1 0 )