博弈论与政治第五讲_349108625
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7
YP 3 12 0.5PD 12 0.5PD PP PP2 dYP 2 Pp 12 0.5PD 0 dPP 2 Pp 12 0.5PD PP 7.5 0.25PD PP 10 PP 7.5 0.25 7.5 0.25 PP
第五讲:同时行动与序贯行动并存的博弈
图示同时行动赛局 纳许平衡(Nash Equilibrium):a game involving two or more players, in which each player is assumed to know the equilibrium strategies of the other players, and no player has anything to gain by changing only his own strategy unilaterally. If each player has chosen a strategy and no player can benefit by changing his or her strategy while the other players keep theirs unchanged, then the current set of strategy choices and the corresponding payoffs constitute a Nash equilibrium.
◦ 如果每个参与人都有占优策略,那此赛局一定有纳什均 衡点。
安全赛局(Game of Assurance) 懦夫赛局(Chicken) 性别战赛局(Battle of Sex) 弱优势(Weak Dominance) 纯策略赛局没有均衡点的情形
纯策略是连续型变量(Continuous Variables)的 情形 最优反应分析规则:在均衡点时, 每个参与人的 行动一定是对于其他参与人的最优反应之最优反 应。 最优反应曲线: 某个参与人所有相对于其他参与 人所有策略的最优反应(比较:效用曲线)。
纳芙拉蒂洛娃
慢速对角球
埃弗特
快速直球
20,80 80,20
慢速对角球
后动优势
(c)序贯行动博弈:纳芙拉蒂洛娃先行动
埃弗特 快速直球 快速直球 慢速对角球 50,50 10,90
纳芙拉蒂洛娃
慢速对角球
埃弗特
快速直球
20,80 80,20
慢速对角球
双方都获益 (a) 同时行动
联邦储备银行 低利率 国会 预算平衡 预算赤字 3,4 4,1 高利率 1,3 2,2
图示同时行动赛局
妻子
认罪 抵赖
丈夫
认罪 10,10
25,1
抵赖 1,25
3,3
占优策略(Dominant Strategies): 连续删除劣策略(Dominated Strategies) 零和游戏的最大最小值方法(Minimax Strategies) 逐个单位格检查法(Cell-By-Cell Inspection)
第一阶段:投资博弈(代入第二阶段的逆推报酬) 全球对话
不投资
串音
投资 0,14 -2,-2
不投资 投资
0,0 14,0
懦夫赛局
单位:10亿美元
懦夫赛局
迪恩
转向(懦夫) 直线(勇士)
转向(懦夫)
詹姆士
0, 0
-1, 1
直线(勇士)
1, -1
-2, -2
第二阶段:价格博弈 全球对话 高 投资 串音 不投资 第二阶段: 定价决策 低 0,14 串音 高 2,2 低 -10,6
改变进 攻方式 进攻方 不改变 进攻方式
有准备 防守方 无准备 -10
6
尾随于同时行动赛局后的序贯行动
结果不变 (a) 同时行动
妻子 认罪(背叛) 抵赖(合作) 丈夫 认罪(背叛) 抵赖(合作) 10,10 25,1 1,25 3,3
结果不变 (a) 同时行动
妻子 认罪(背叛) 抵赖(合作) 丈夫 认罪(背叛) 抵赖(合作) 10,10 25,1 1,25 3,3
低
6,-10
-2,-2
高
一个公司以投资的情况下的两阶段博弈
0,6 单位:10亿美元
第二阶段:价格博弈 全球对话 高 投资 串音 不投资 第二阶段: 定价决策 低 0,14 串音 高 2,2 低 -10,6
低
6,-10
-2,-2
高
一个公司以投资的情况下的两阶段博弈
0,6 单位:10亿美元
第二阶段:价格博弈 全球对话 高 投资 串音 不投资 第二阶段: 定价决策 低 0,14 串音 高 2,2 低 -10,6
詹姆士
直行
迪恩
转向
1,-1 -2,-2
直行
先动优势
(c)序贯行动博弈:迪恩先行动
詹姆士 转向 迪恩 转向 直行 0,0 -1,1
直行
詹姆士
转向
1,-1 -2,-2
直行
先动优势
(c)序贯行动博弈:迪恩先行动
詹姆士 转向 迪恩 转向 直行 0,0 -1,1
直行
詹姆士
转向
1,-1 -2,-2
直行
第二阶段:全球对话的定价决策 14
高 全球对话
低
6
第二阶段:串音的定价决策 高 串音 低 6
14
第二阶段:价格博弈
全球对话
高 低 -10,6 -2,-2 高 低 2,2 6,-10 单位:10亿美元
串音
第一阶段:投资博弈 全球对话 不投资 串音 不投资 投资 0,0 ,0 投资 0,
第二阶段:全球对话的定价决策 14
第一阶段:投资博弈 全球对话 不投资 串音 不投资 投资 0,0 ,0 投资 0,
第二阶段:全球对话的定价决策 14
高 全球对话
低
6
第二阶段:串音的定价决策 高 串音 低 6
14
第二阶段:价格博弈
全球对话
高 低 -10,6 -2,-2 高 低 2,2 6,-10 单位:10亿美元
串音
第一阶段:投资博弈 全球对话 不投资 串音 不投资 投资 0,0 ,0 投资 0,
双方都获益 (a) 同时行动
联邦储备银行 低利率 国会 预算平衡 预算赤字 3,4 4,1 高利率 1,3 2,2
双方都获益
(b)序贯行动博弈:联邦储备银行先行动
国会 低利率 预算平衡 预算赤字 4,3 1,4
联邦储备银行 高利率 国会 预算平衡 3,1 2,2
预算赤字
双方都获益
(b)序贯行动博弈:联邦储备银行先行动
价格、数量函数
QDonna 12 PDonna 0.5PPierce QPierce 12 PPierce 0.5PDonna
这是对称赛局
收益函数 Y P COST Q
YP PP 3 QP
PP 312 PP 0.5PD 12 PP 36 PP2 3PP 0.5PP PD 1.5PD 3 12 0.5PD 12 0.5PD PP PP2
国会 低利率 预算平衡 预算赤字 4,3 1,4
联邦储备银行 高利率 国会 预算平衡 3,1 2,2
预算赤字
双方都获益
(c)序贯行动博弈:国会先行动
联邦储备银行 预算平衡 国会 预算赤字 联邦储备银行 低利率 4,1 2,2 低利率 高利率 3,4 1,3
高 全球对话
低
6
第二阶段:串音的定价决策 高 串音 低 6
14
第二阶段:价格博弈
全球对话
高 低 -10,6 -2,-2 高 低 2,2 6,-10 单位:10亿美元
串音
第一阶段:投资博弈(代入第二阶段的逆推报酬) 全球对话
不投资
串音
投资 0,14 -2,-2
不投资 投资
0,0 14,0
单位:10亿美元
后动优势 (a) 同时行动
纳芙拉蒂洛娃 快速直球 埃弗特 快速直球 慢速对角球 50 90 慢速对角球 80 20
后动优势 (a) 同时行动
纳芙拉蒂洛娃 快速直球 埃弗特 快速直球 慢速对角球 50 90 慢速对角球 80 20
后动优势
(b)序贯行动博弈:埃弗特先行动
纳芙拉蒂洛娃 快速直球 埃弗特 快速直球 慢速对角球 50,50 80,20
慢速对角球
纳芙拉蒂洛娃
快速直球
90,10 20,80
慢速对角球
后动优势
(b)序贯行动博弈:埃弗特先行动
纳芙拉蒂洛娃 快速直球 埃弗特 快速直球 慢速对角球 50,50 80,20
慢速对角球
纳芙拉蒂洛娃
快速直球
90,10 20,80
慢速对角球
后动优势
(c)序贯行动博弈:纳芙拉蒂洛娃先行动
埃弗特 快速直球 快速直球 慢速对角球 50,50 10,90
第二阶段:全球对话的定价决策 14
全球对话
子 博 低 弈
高
6
第二阶段:串音的定价决策 高 串音 低
子 博 弈
14
第二阶段:价格博弈
6
串音
子 博 弈
全球对话
高 高 低 2,2 6,-10 单位:10亿美元 低 -10,6 -2,-2
第一阶段:投资博弈 全球对话 不投资 串音 不投资 投资 0,0 ,0 投资 0,
参与人:全球对话、串音。 目标:投资100亿采购光线网络产品。 策略:
◦ 第一阶段:投资或不投资 ◦ 第二阶段:定价高或低
报酬:
◦ 都不投资,报酬0。 ◦ 一家不投资,投资者决定:
◦ 两家都投资:
定高价,可吸引6000万顾客,每名带来400美元收益。6000万 *400元-100亿=140亿元。 定低价,可吸引8000万顾客,每名带来200美元收益。8000万 *200元-100亿=60亿元 都定高价,分别获得3000万顾客,每名带来400美元收益。3000 万*400元-100亿=20亿元。 都定低价,分别获得4000万顾客,每名带来200美元收益。4000 万*200元-100亿=-20亿元。 一高一低,低者获全部8000万顾客,每名带来200美元收益。 定低者收益8000万*200元-100亿=60亿元;定高者收益0100亿=-100亿元
抵赖
丈夫
认罪
25,1 3,3
抵赖
结果不变
(c)序贯行动博弈:妻子先行动
丈夫 认罪 妻子 认罪 抵赖 10,10 1,25
抵赖
丈夫
认罪
25,1 3,3
抵赖
先动优势 (a) 同时行动
迪恩 转向(懦夫) 直行(勇士) 詹姆士 转向(懦夫) 直行(勇士) 0,0 1,-1 -1,1 -2,-2
先动优势 (a) 同时行动
低
6,-10
-2,-2
高
一个公司以投资的情况下的两阶段博弈
0,6 单位:10亿美元
第二阶段:教练选择方式 防守方由准备 安全 进攻方 安全 冒险 2 30 冒险 6 2
改变进 攻方式 进攻方 不改变 进攻方式
有准备 防守方 无准备 -10
6
尾随于同时行动赛局后的序贯行动
第一阶段:教练选择方式 防守方由准备 安全 进攻方 安全 冒险 2 30 冒险 6 2
迪恩 转向(懦夫) 直行(勇士) 詹姆士 转向(懦夫) 直行(勇士) 0,0 1,-1 -1,1 -2,-2
先动优势
(b)序贯行动博弈:詹姆士先行动
迪恩 转向 转向 直行 0,0 -1,1
詹姆士
直行
迪恩
转向
1,-1 -2,-2
直行
先动优势
(b)序贯行动博弈:詹姆士先行动
迪恩 转向 转向 直行 0,0 -1,1
结果不变
(b)序贯行动博弈:丈夫先行动
妻子 认罪 丈夫 认罪 抵赖 10,10 1,25
ຫໍສະໝຸດ Baidu
抵赖
妻子
认罪
25,1 3,3
抵赖
结果不变
(b)序贯行动博弈:丈夫先行动
妻子 认罪 丈夫 认罪 抵赖 10,10 1,25
抵赖
妻子
认罪
25,1 3,3
抵赖
结果不变
(c)序贯行动博弈:妻子先行动
丈夫 认罪 妻子 认罪 抵赖 10,10 1,25
8
对两者最佳化的情形(联合垄断):
YP YD P 312 P 0.5P P 312 0.5P P 13.5
9
Pierce’s Price, PPierce
Donna’s best response
Joint profit maximized
13.5
10
Pierce’s best response
Nash equilibrium
7.5
7.5
10
13.5
Donna’s Price, P Donna
10
在现实中,博弈往往同时存在同时及序贯 行动博弈。 博弈树(扩展式)说明序贯行动博弈,支付表 (策略式)来说明同时行动博弈。 可以用这两种方式中的任一种来说明所有 类型的博奕。 纳许均衡可以拓展到序贯行动博弈中,逆 推均衡是纳许均衡的特例—纳许精炼均衡。
YP 3 12 0.5PD 12 0.5PD PP PP2 dYP 2 Pp 12 0.5PD 0 dPP 2 Pp 12 0.5PD PP 7.5 0.25PD PP 10 PP 7.5 0.25 7.5 0.25 PP
第五讲:同时行动与序贯行动并存的博弈
图示同时行动赛局 纳许平衡(Nash Equilibrium):a game involving two or more players, in which each player is assumed to know the equilibrium strategies of the other players, and no player has anything to gain by changing only his own strategy unilaterally. If each player has chosen a strategy and no player can benefit by changing his or her strategy while the other players keep theirs unchanged, then the current set of strategy choices and the corresponding payoffs constitute a Nash equilibrium.
◦ 如果每个参与人都有占优策略,那此赛局一定有纳什均 衡点。
安全赛局(Game of Assurance) 懦夫赛局(Chicken) 性别战赛局(Battle of Sex) 弱优势(Weak Dominance) 纯策略赛局没有均衡点的情形
纯策略是连续型变量(Continuous Variables)的 情形 最优反应分析规则:在均衡点时, 每个参与人的 行动一定是对于其他参与人的最优反应之最优反 应。 最优反应曲线: 某个参与人所有相对于其他参与 人所有策略的最优反应(比较:效用曲线)。
纳芙拉蒂洛娃
慢速对角球
埃弗特
快速直球
20,80 80,20
慢速对角球
后动优势
(c)序贯行动博弈:纳芙拉蒂洛娃先行动
埃弗特 快速直球 快速直球 慢速对角球 50,50 10,90
纳芙拉蒂洛娃
慢速对角球
埃弗特
快速直球
20,80 80,20
慢速对角球
双方都获益 (a) 同时行动
联邦储备银行 低利率 国会 预算平衡 预算赤字 3,4 4,1 高利率 1,3 2,2
图示同时行动赛局
妻子
认罪 抵赖
丈夫
认罪 10,10
25,1
抵赖 1,25
3,3
占优策略(Dominant Strategies): 连续删除劣策略(Dominated Strategies) 零和游戏的最大最小值方法(Minimax Strategies) 逐个单位格检查法(Cell-By-Cell Inspection)
第一阶段:投资博弈(代入第二阶段的逆推报酬) 全球对话
不投资
串音
投资 0,14 -2,-2
不投资 投资
0,0 14,0
懦夫赛局
单位:10亿美元
懦夫赛局
迪恩
转向(懦夫) 直线(勇士)
转向(懦夫)
詹姆士
0, 0
-1, 1
直线(勇士)
1, -1
-2, -2
第二阶段:价格博弈 全球对话 高 投资 串音 不投资 第二阶段: 定价决策 低 0,14 串音 高 2,2 低 -10,6
改变进 攻方式 进攻方 不改变 进攻方式
有准备 防守方 无准备 -10
6
尾随于同时行动赛局后的序贯行动
结果不变 (a) 同时行动
妻子 认罪(背叛) 抵赖(合作) 丈夫 认罪(背叛) 抵赖(合作) 10,10 25,1 1,25 3,3
结果不变 (a) 同时行动
妻子 认罪(背叛) 抵赖(合作) 丈夫 认罪(背叛) 抵赖(合作) 10,10 25,1 1,25 3,3
低
6,-10
-2,-2
高
一个公司以投资的情况下的两阶段博弈
0,6 单位:10亿美元
第二阶段:价格博弈 全球对话 高 投资 串音 不投资 第二阶段: 定价决策 低 0,14 串音 高 2,2 低 -10,6
低
6,-10
-2,-2
高
一个公司以投资的情况下的两阶段博弈
0,6 单位:10亿美元
第二阶段:价格博弈 全球对话 高 投资 串音 不投资 第二阶段: 定价决策 低 0,14 串音 高 2,2 低 -10,6
詹姆士
直行
迪恩
转向
1,-1 -2,-2
直行
先动优势
(c)序贯行动博弈:迪恩先行动
詹姆士 转向 迪恩 转向 直行 0,0 -1,1
直行
詹姆士
转向
1,-1 -2,-2
直行
先动优势
(c)序贯行动博弈:迪恩先行动
詹姆士 转向 迪恩 转向 直行 0,0 -1,1
直行
詹姆士
转向
1,-1 -2,-2
直行
第二阶段:全球对话的定价决策 14
高 全球对话
低
6
第二阶段:串音的定价决策 高 串音 低 6
14
第二阶段:价格博弈
全球对话
高 低 -10,6 -2,-2 高 低 2,2 6,-10 单位:10亿美元
串音
第一阶段:投资博弈 全球对话 不投资 串音 不投资 投资 0,0 ,0 投资 0,
第二阶段:全球对话的定价决策 14
第一阶段:投资博弈 全球对话 不投资 串音 不投资 投资 0,0 ,0 投资 0,
第二阶段:全球对话的定价决策 14
高 全球对话
低
6
第二阶段:串音的定价决策 高 串音 低 6
14
第二阶段:价格博弈
全球对话
高 低 -10,6 -2,-2 高 低 2,2 6,-10 单位:10亿美元
串音
第一阶段:投资博弈 全球对话 不投资 串音 不投资 投资 0,0 ,0 投资 0,
双方都获益 (a) 同时行动
联邦储备银行 低利率 国会 预算平衡 预算赤字 3,4 4,1 高利率 1,3 2,2
双方都获益
(b)序贯行动博弈:联邦储备银行先行动
国会 低利率 预算平衡 预算赤字 4,3 1,4
联邦储备银行 高利率 国会 预算平衡 3,1 2,2
预算赤字
双方都获益
(b)序贯行动博弈:联邦储备银行先行动
价格、数量函数
QDonna 12 PDonna 0.5PPierce QPierce 12 PPierce 0.5PDonna
这是对称赛局
收益函数 Y P COST Q
YP PP 3 QP
PP 312 PP 0.5PD 12 PP 36 PP2 3PP 0.5PP PD 1.5PD 3 12 0.5PD 12 0.5PD PP PP2
国会 低利率 预算平衡 预算赤字 4,3 1,4
联邦储备银行 高利率 国会 预算平衡 3,1 2,2
预算赤字
双方都获益
(c)序贯行动博弈:国会先行动
联邦储备银行 预算平衡 国会 预算赤字 联邦储备银行 低利率 4,1 2,2 低利率 高利率 3,4 1,3
高 全球对话
低
6
第二阶段:串音的定价决策 高 串音 低 6
14
第二阶段:价格博弈
全球对话
高 低 -10,6 -2,-2 高 低 2,2 6,-10 单位:10亿美元
串音
第一阶段:投资博弈(代入第二阶段的逆推报酬) 全球对话
不投资
串音
投资 0,14 -2,-2
不投资 投资
0,0 14,0
单位:10亿美元
后动优势 (a) 同时行动
纳芙拉蒂洛娃 快速直球 埃弗特 快速直球 慢速对角球 50 90 慢速对角球 80 20
后动优势 (a) 同时行动
纳芙拉蒂洛娃 快速直球 埃弗特 快速直球 慢速对角球 50 90 慢速对角球 80 20
后动优势
(b)序贯行动博弈:埃弗特先行动
纳芙拉蒂洛娃 快速直球 埃弗特 快速直球 慢速对角球 50,50 80,20
慢速对角球
纳芙拉蒂洛娃
快速直球
90,10 20,80
慢速对角球
后动优势
(b)序贯行动博弈:埃弗特先行动
纳芙拉蒂洛娃 快速直球 埃弗特 快速直球 慢速对角球 50,50 80,20
慢速对角球
纳芙拉蒂洛娃
快速直球
90,10 20,80
慢速对角球
后动优势
(c)序贯行动博弈:纳芙拉蒂洛娃先行动
埃弗特 快速直球 快速直球 慢速对角球 50,50 10,90
第二阶段:全球对话的定价决策 14
全球对话
子 博 低 弈
高
6
第二阶段:串音的定价决策 高 串音 低
子 博 弈
14
第二阶段:价格博弈
6
串音
子 博 弈
全球对话
高 高 低 2,2 6,-10 单位:10亿美元 低 -10,6 -2,-2
第一阶段:投资博弈 全球对话 不投资 串音 不投资 投资 0,0 ,0 投资 0,
参与人:全球对话、串音。 目标:投资100亿采购光线网络产品。 策略:
◦ 第一阶段:投资或不投资 ◦ 第二阶段:定价高或低
报酬:
◦ 都不投资,报酬0。 ◦ 一家不投资,投资者决定:
◦ 两家都投资:
定高价,可吸引6000万顾客,每名带来400美元收益。6000万 *400元-100亿=140亿元。 定低价,可吸引8000万顾客,每名带来200美元收益。8000万 *200元-100亿=60亿元 都定高价,分别获得3000万顾客,每名带来400美元收益。3000 万*400元-100亿=20亿元。 都定低价,分别获得4000万顾客,每名带来200美元收益。4000 万*200元-100亿=-20亿元。 一高一低,低者获全部8000万顾客,每名带来200美元收益。 定低者收益8000万*200元-100亿=60亿元;定高者收益0100亿=-100亿元
抵赖
丈夫
认罪
25,1 3,3
抵赖
结果不变
(c)序贯行动博弈:妻子先行动
丈夫 认罪 妻子 认罪 抵赖 10,10 1,25
抵赖
丈夫
认罪
25,1 3,3
抵赖
先动优势 (a) 同时行动
迪恩 转向(懦夫) 直行(勇士) 詹姆士 转向(懦夫) 直行(勇士) 0,0 1,-1 -1,1 -2,-2
先动优势 (a) 同时行动
低
6,-10
-2,-2
高
一个公司以投资的情况下的两阶段博弈
0,6 单位:10亿美元
第二阶段:教练选择方式 防守方由准备 安全 进攻方 安全 冒险 2 30 冒险 6 2
改变进 攻方式 进攻方 不改变 进攻方式
有准备 防守方 无准备 -10
6
尾随于同时行动赛局后的序贯行动
第一阶段:教练选择方式 防守方由准备 安全 进攻方 安全 冒险 2 30 冒险 6 2
迪恩 转向(懦夫) 直行(勇士) 詹姆士 转向(懦夫) 直行(勇士) 0,0 1,-1 -1,1 -2,-2
先动优势
(b)序贯行动博弈:詹姆士先行动
迪恩 转向 转向 直行 0,0 -1,1
詹姆士
直行
迪恩
转向
1,-1 -2,-2
直行
先动优势
(b)序贯行动博弈:詹姆士先行动
迪恩 转向 转向 直行 0,0 -1,1
结果不变
(b)序贯行动博弈:丈夫先行动
妻子 认罪 丈夫 认罪 抵赖 10,10 1,25
ຫໍສະໝຸດ Baidu
抵赖
妻子
认罪
25,1 3,3
抵赖
结果不变
(b)序贯行动博弈:丈夫先行动
妻子 认罪 丈夫 认罪 抵赖 10,10 1,25
抵赖
妻子
认罪
25,1 3,3
抵赖
结果不变
(c)序贯行动博弈:妻子先行动
丈夫 认罪 妻子 认罪 抵赖 10,10 1,25
8
对两者最佳化的情形(联合垄断):
YP YD P 312 P 0.5P P 312 0.5P P 13.5
9
Pierce’s Price, PPierce
Donna’s best response
Joint profit maximized
13.5
10
Pierce’s best response
Nash equilibrium
7.5
7.5
10
13.5
Donna’s Price, P Donna
10
在现实中,博弈往往同时存在同时及序贯 行动博弈。 博弈树(扩展式)说明序贯行动博弈,支付表 (策略式)来说明同时行动博弈。 可以用这两种方式中的任一种来说明所有 类型的博奕。 纳许均衡可以拓展到序贯行动博弈中,逆 推均衡是纳许均衡的特例—纳许精炼均衡。