博弈论第二章_博弈规则
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
先动优势 后动优势
▪ 根据该集合是有限还是无限进行分类:
S(strategies)
▪ S(strategies) :博弈的进程,也是 博弈进行的次序。它规定什么人在 什么时候选择什么行动。因此,战 略是参与人的 “相机行动方案” (contingent action plan)
▪ 分类:根据后行动的人是否能够看 到先行动人的具体行动
变和博弈
囚徒困境
▪ Ua(t,t)=-8 Ua(t,n)=0 Ua(n,n)=-1 Ua(n,t)=-10
▪ Ub(t,t)=-8 Ub(t,n)=-10 Ub(n,n)=-1 Ub(n,t)=0
b
嫌疑人a
坦白t
不坦白 n
嫌 疑 坦白t -8,-8 0,-10 人
不坦 白n
-10, 0
-1,-1
▪ 结果(outcome)
2.无限博弈(infinite games) :如 果博弈中至少有某些博弈方的策 略是无限多个的,称为无限博弈。
(函数表示)
2.2.3 博弈的行动过程
1. 静态博弈(static games):所有博弈方同时 选择策略的博弈。 2 . 动态博弈(dynamic games):各博弈方的 选择和行动有先后次序,而且后选择的、后行动 的博弈方,在自己选择行动方案之前,可以看到 其他博弈方的选择和行动。也称为多阶段博弈 (multistage games) 3. 重复博弈(repeated games):同一个博弈 反复进行多构成的博弈。
寡头定价 联通b
高价g 低价d
移 动
高价 g
50,50
10,80
a
低价 d
80, 10
30,30
Ug= Uag+ Ubg=50+10+50+10=120 Ud= Uad+ Ubd=30+80+30+80=220
2.2.5 博弈的信息结构
1.关于得益的信息 完全信息和不完全信息
(1) 完全信息(complete information)是 指在博弈过程中,每一位博弈方对其他博弈 方的特征、策略空间及收益函数有准确的信 息。
2.2.4 博弈的支付 (效用,得益)
效用的计算方法:将每一个博弈方在同一策 略结果中的得益相加,算出所有博弈方的 得益总和。
Ua(1,2)= Ua1+Ua2 Ub(1,2)= Ub1+Ub2
1. 零和博弈: Ua(1,2)= Ub(1,2) =0
2 . 常和博弈: Ua(1,2)= Ub(1,2) = m
博弈论(game theory): 又称对策论,是Go研ver究nin相g 互依 赖、相互影响的Dy决na策mic主s 体的 理性决策行为以及这些决策 的均衡结果的理论。
2.1.2 博弈论的基本概念
博弈论的基本假设
人 是 理 性 人 ( rational , 也 说自私人):行动者具有推理 能力,在具体策略选择时的 目的是使决策者自己的目标 效用最大化。
▪ 分类:根据博弈各方对各种局势下所 有局中人的信息掌握情况分:
完全信息博弈 不完全信息博弈
U( utility )
▪ U( utility ):也称为支付(pay off).为局中人获得利益,或者是 指参与人的期望效用水平。也是博 弈各方追求的最终目标。
▪ 分类:根据各方得益的不同情况
零和博弈
田忌赛马
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
“博弈论”译自英文“Game
Theory”,直译就是“游戏理论”。
游戏的共有特征 1. 一定的规则 2. 有一个结果(且可以折算
成数字) 3.策略的相互依存性 4.策略至关重要
博弈论-无处不在的游戏
“要想在现代社会做一 个有文化的人,你必须对 博弈论有一个大致了解”。
—保罗·萨缪尔森
年光似鸟翩翩过,世事 如棋局局新。
——(宋)僧志文
2.1.2 博弈论的基本概念
E(equilibrium)
▪ 均衡(equilibrium):是所有参与人的最 优战略的组合。
▪ 所谓博弈均衡,它是一种稳定的博弈结 果。
▪ 纳什均衡(Nash Equilibrium):一策 略组合中,所有的参与者面临这样的一 种情况:当其他人不改变策略时,他此 时的策略是最好的。
▪ 谢识予:给定你的 策略,我的策略是最 好的的策略,给定我的 策略,你的策略 也是最好的的策略
囚徒困境
嫌疑人A
一个纳什 均衡点!
嫌 疑 坦白 人 B 不坦白
坦白
不坦白
-8,-8 0,-10 -10,0 -1,-1
情侣博弈
王菲
两个纳什 均衡点!
足球
演唱会
李 亚
足球
2,1
鹏 演唱会 -1,-
1
0,0 1,2
2.1.3 博弈论的模型简介
博弈论模型可以用五个方面来描述
G={P,A,S,I,U,O,E}
(2)不完全信息(incomplete information): 如果博弈方对其他博弈方的特征、策略空间 及收益函数信息了解的不够准确、或者不是 对所有博弈方的特征、策略空间及收益函数 都有准确的准确信息,在这种情况下进行的 博弈就是不完全信息博弈。也成不对称信息 或者信息不对称(asymmetric information)
静态博弈 动态博弈
行动与策略的区别?
▪ 行动是指参与者可能有的具体行动 ▪ 战略是行动的规则而不是行动本身
毛泽东:
人不犯我我不犯人 人若犯我我必犯人
敌进我退 敌退我追 敌驻我扰 敌疲我打
I(information)
▪ I(information) :博弈信息。指的是 参与人在博弈中的知识,特别是有关 其他参与人(对手)的特征和行为的 知识
此人怎样决策?
自然
好天气 坏天气 (75%) (25%)
商 人 水路 -7000 -16000
陆路 -10000 -10000
2.双人博弈
囚徒wenku.baidu.com境
嫌疑人A
嫌 疑 坦白 人 B 不坦白
坦白
-8,-8 -10,0
不坦白
0,-10 -1,-1
情侣博弈
王菲
李 亚
足球
鹏 演唱会
足球
演唱会
2,1
-1,- 1
描述博弈的最少要素:参与人,战略,支付。 行动和信息是其积木
参与人、行动、结果统称为“博弈规则” 博弈分析的目的:是使用博弈规则预测均衡
第二节 博弈论的结构与分类
博弈论模型可以用七个方面来描述
G={P,A,S,I,U,O,E}
2.2.1 博弈方 2.2.2 博弈的行动过程 2.2.3 策略 2.2.4 支付(效用、得益) 2.2.5 博弈的信息结构 2.2.6 博弈方的能力和理性 2.2.7 博弈的分类和理论结构
0,0 1,2
选修课--另一版本
王菲
李 亚 博弈论 鹏
舞蹈
博弈论
舞蹈
4,3 1,1
2,2 3,4
石头·剪子·布
博弈方2
石头 剪子 布
博 弈 石头
0,0 1,-1 -1,1
方 剪子 -1,1 0,0 1,-1
1
布 1,-1 -1,1 0,0
双人博弈小结
注意二点: 1. 博弈方之间并非总是对抗的。 2. 个人理性决策常不能实现自己的
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
是指博弈分析者 感兴趣的要素的
嫌 疑 人
B
集合。是均衡行
动的组合。
坦白t
不坦 白n
嫌疑人A 坦白t 不坦白n -8,-8 0,-10 -10, 0 -1,-1
U(t,t)=0.5*(-8)+ 0.5*(-8)=-8 U(t,n)=0.5*0+ 0.5*(-10)=-5 U(n,t)=0.5*(-10)+ 0.5*0=-5 U(n,n)=0.5*(-1)+ 0.5*(-1)=-1
a
囚徒困境
嫌疑人b
坦白t
不坦白 n
嫌 疑
坦白t -8,-8
0,-10
人
不坦 白n
-10, 0
-1,-1
Ut= Uat+ Ubt=-8+0-8+0=-16 Un= Uan+ Ubn=-1-10-10-1=-22
▪ Uag(g,g)=5 Uag(g,d)=7 Uad(d,g)=3
Uad(d,d)=5
▪ Ubg(g,g)=5 Ubg(d,g)=7 Ubd(g,d)=3 Ubd(d,d)=5
奖金分配
王菲b
李
绩效高g 绩效低d
亚
鹏 绩效高g 5,5 7,3
a
绩效低d 3,7 5,5
Ug= Uag+ Ubg=5+7+5+7=24
Ud= Uad+ Ubd=3+5+3+5=16
▪ Uag(g,g)=50 Uag(g,d)=10 Uad(d,g)=80
Uad(d,d)=30
▪ Ubg(g,g)=50 Ubg(d,g)=10 Ubd(g,d)=80 Ubd(d,d)=30
通俗地讲,博弈论是一种“游戏理 论”。其较对博弈为准确的理解是: 一些个人、团队或其他组织,面对 一定的环境条件,在一定的规则约 束下,依靠所掌握的信息,同时或 先后,一次或多次,从各自允许选 择的行为或策略进行选择并加以实 施,并从中各自取得相应结果或收 益的过程。
2.1.3博弈论的模型简介
博弈论模型可以用七个方面来描述
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
最大利益。
3、多人博弈
三个或三个以上的博弈方参加的博弈。
竞争者
竞争者
破坏者
北京申办2000年奥运会失利
第一轮 第二轮 第三轮 第四轮
北京 32
37
40
43
悉尼 28
30
37
45
曼彻斯特 11
11
11
柏林
9
10
伊斯坦布 8
尔
2.2.2 策略
1. 有限博弈(finite games) :如 果博弈中每个博弈方的策略是有 限的,称为有限博弈。
石头·剪子·布
博弈方2
石头 剪子 布
博 弈 石头
0,0 1,-1 -1,1
方 剪子 -1,1 0,0 1,-1
1
布 1,-1 -1,1 0,0
▪ Uag(g,g)=2 Uag(g,d)=0 Uad(d,g)=-1 李 Uad(d,d)=1 亚
周末约会
王菲b
足球g 演唱会d
▪ Ubg(g,g)=1 鹏 足球g 2,1
2.关于博弈过程的信息 完美信息和不完美信息
完美信息(perfect information):对 已经发生的的事情有清楚的了解,称具 有完美信息。否则,称为不完美信息 (imperfect information)
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
G={P,A,S,I,U,O,E}
P(players)
▪ P(players): 为局中人,博弈的
参与者,也称为“博弈方”,局中
人以最终实现自身利益最大化为目
标。
个人
双方
虚拟参与人:
团体
多方
Nature
A(action)
▪ A(action) :为各局中人的所有可能的 策略或行动的集合。
▪ 行动的顺序(The order of play)
0,0
Ubg(d,g)=-1 Ubd(g,d)=0
a
演唱会d
-1,-1
1,2
Ubd(d,d)=2
UU= Uag+ Ubg=2+0+1-1=2
Ud= Uad+ Ubd=-1+1+0+2=2
▪ Uat(t,t)=-8 Uat(t,n)=0 Uan(n,t)=-10 Uan(n,n)=-1
▪ Ubt(t,t)=-8 Ubt(n,t)=0 Ubn(t,n)=-10 Ubn(n,n)=-1
3. 变和博弈: Ua(1,2)〒 Ub(1,2)
猜硬币游戏
▪ 两个人通过猜硬币的正反赌输赢,其 中一人用手盖住一枚硬币,有另一方 在是正面还是反面朝上。若猜对,则 猜着赢1元,盖着输1元;若猜错,则 猜着输1元,盖着赢1元。
▪ 假设赢着收益为1,输者收益为-1。
▪ U1z(z,z)=-1
U1z(z,f)=1
▪ 根据该集合是有限还是无限进行分类:
S(strategies)
▪ S(strategies) :博弈的进程,也是 博弈进行的次序。它规定什么人在 什么时候选择什么行动。因此,战 略是参与人的 “相机行动方案” (contingent action plan)
▪ 分类:根据后行动的人是否能够看 到先行动人的具体行动
变和博弈
囚徒困境
▪ Ua(t,t)=-8 Ua(t,n)=0 Ua(n,n)=-1 Ua(n,t)=-10
▪ Ub(t,t)=-8 Ub(t,n)=-10 Ub(n,n)=-1 Ub(n,t)=0
b
嫌疑人a
坦白t
不坦白 n
嫌 疑 坦白t -8,-8 0,-10 人
不坦 白n
-10, 0
-1,-1
▪ 结果(outcome)
2.无限博弈(infinite games) :如 果博弈中至少有某些博弈方的策 略是无限多个的,称为无限博弈。
(函数表示)
2.2.3 博弈的行动过程
1. 静态博弈(static games):所有博弈方同时 选择策略的博弈。 2 . 动态博弈(dynamic games):各博弈方的 选择和行动有先后次序,而且后选择的、后行动 的博弈方,在自己选择行动方案之前,可以看到 其他博弈方的选择和行动。也称为多阶段博弈 (multistage games) 3. 重复博弈(repeated games):同一个博弈 反复进行多构成的博弈。
寡头定价 联通b
高价g 低价d
移 动
高价 g
50,50
10,80
a
低价 d
80, 10
30,30
Ug= Uag+ Ubg=50+10+50+10=120 Ud= Uad+ Ubd=30+80+30+80=220
2.2.5 博弈的信息结构
1.关于得益的信息 完全信息和不完全信息
(1) 完全信息(complete information)是 指在博弈过程中,每一位博弈方对其他博弈 方的特征、策略空间及收益函数有准确的信 息。
2.2.4 博弈的支付 (效用,得益)
效用的计算方法:将每一个博弈方在同一策 略结果中的得益相加,算出所有博弈方的 得益总和。
Ua(1,2)= Ua1+Ua2 Ub(1,2)= Ub1+Ub2
1. 零和博弈: Ua(1,2)= Ub(1,2) =0
2 . 常和博弈: Ua(1,2)= Ub(1,2) = m
博弈论(game theory): 又称对策论,是Go研ver究nin相g 互依 赖、相互影响的Dy决na策mic主s 体的 理性决策行为以及这些决策 的均衡结果的理论。
2.1.2 博弈论的基本概念
博弈论的基本假设
人 是 理 性 人 ( rational , 也 说自私人):行动者具有推理 能力,在具体策略选择时的 目的是使决策者自己的目标 效用最大化。
▪ 分类:根据博弈各方对各种局势下所 有局中人的信息掌握情况分:
完全信息博弈 不完全信息博弈
U( utility )
▪ U( utility ):也称为支付(pay off).为局中人获得利益,或者是 指参与人的期望效用水平。也是博 弈各方追求的最终目标。
▪ 分类:根据各方得益的不同情况
零和博弈
田忌赛马
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
“博弈论”译自英文“Game
Theory”,直译就是“游戏理论”。
游戏的共有特征 1. 一定的规则 2. 有一个结果(且可以折算
成数字) 3.策略的相互依存性 4.策略至关重要
博弈论-无处不在的游戏
“要想在现代社会做一 个有文化的人,你必须对 博弈论有一个大致了解”。
—保罗·萨缪尔森
年光似鸟翩翩过,世事 如棋局局新。
——(宋)僧志文
2.1.2 博弈论的基本概念
E(equilibrium)
▪ 均衡(equilibrium):是所有参与人的最 优战略的组合。
▪ 所谓博弈均衡,它是一种稳定的博弈结 果。
▪ 纳什均衡(Nash Equilibrium):一策 略组合中,所有的参与者面临这样的一 种情况:当其他人不改变策略时,他此 时的策略是最好的。
▪ 谢识予:给定你的 策略,我的策略是最 好的的策略,给定我的 策略,你的策略 也是最好的的策略
囚徒困境
嫌疑人A
一个纳什 均衡点!
嫌 疑 坦白 人 B 不坦白
坦白
不坦白
-8,-8 0,-10 -10,0 -1,-1
情侣博弈
王菲
两个纳什 均衡点!
足球
演唱会
李 亚
足球
2,1
鹏 演唱会 -1,-
1
0,0 1,2
2.1.3 博弈论的模型简介
博弈论模型可以用五个方面来描述
G={P,A,S,I,U,O,E}
(2)不完全信息(incomplete information): 如果博弈方对其他博弈方的特征、策略空间 及收益函数信息了解的不够准确、或者不是 对所有博弈方的特征、策略空间及收益函数 都有准确的准确信息,在这种情况下进行的 博弈就是不完全信息博弈。也成不对称信息 或者信息不对称(asymmetric information)
静态博弈 动态博弈
行动与策略的区别?
▪ 行动是指参与者可能有的具体行动 ▪ 战略是行动的规则而不是行动本身
毛泽东:
人不犯我我不犯人 人若犯我我必犯人
敌进我退 敌退我追 敌驻我扰 敌疲我打
I(information)
▪ I(information) :博弈信息。指的是 参与人在博弈中的知识,特别是有关 其他参与人(对手)的特征和行为的 知识
此人怎样决策?
自然
好天气 坏天气 (75%) (25%)
商 人 水路 -7000 -16000
陆路 -10000 -10000
2.双人博弈
囚徒wenku.baidu.com境
嫌疑人A
嫌 疑 坦白 人 B 不坦白
坦白
-8,-8 -10,0
不坦白
0,-10 -1,-1
情侣博弈
王菲
李 亚
足球
鹏 演唱会
足球
演唱会
2,1
-1,- 1
描述博弈的最少要素:参与人,战略,支付。 行动和信息是其积木
参与人、行动、结果统称为“博弈规则” 博弈分析的目的:是使用博弈规则预测均衡
第二节 博弈论的结构与分类
博弈论模型可以用七个方面来描述
G={P,A,S,I,U,O,E}
2.2.1 博弈方 2.2.2 博弈的行动过程 2.2.3 策略 2.2.4 支付(效用、得益) 2.2.5 博弈的信息结构 2.2.6 博弈方的能力和理性 2.2.7 博弈的分类和理论结构
0,0 1,2
选修课--另一版本
王菲
李 亚 博弈论 鹏
舞蹈
博弈论
舞蹈
4,3 1,1
2,2 3,4
石头·剪子·布
博弈方2
石头 剪子 布
博 弈 石头
0,0 1,-1 -1,1
方 剪子 -1,1 0,0 1,-1
1
布 1,-1 -1,1 0,0
双人博弈小结
注意二点: 1. 博弈方之间并非总是对抗的。 2. 个人理性决策常不能实现自己的
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
是指博弈分析者 感兴趣的要素的
嫌 疑 人
B
集合。是均衡行
动的组合。
坦白t
不坦 白n
嫌疑人A 坦白t 不坦白n -8,-8 0,-10 -10, 0 -1,-1
U(t,t)=0.5*(-8)+ 0.5*(-8)=-8 U(t,n)=0.5*0+ 0.5*(-10)=-5 U(n,t)=0.5*(-10)+ 0.5*0=-5 U(n,n)=0.5*(-1)+ 0.5*(-1)=-1
a
囚徒困境
嫌疑人b
坦白t
不坦白 n
嫌 疑
坦白t -8,-8
0,-10
人
不坦 白n
-10, 0
-1,-1
Ut= Uat+ Ubt=-8+0-8+0=-16 Un= Uan+ Ubn=-1-10-10-1=-22
▪ Uag(g,g)=5 Uag(g,d)=7 Uad(d,g)=3
Uad(d,d)=5
▪ Ubg(g,g)=5 Ubg(d,g)=7 Ubd(g,d)=3 Ubd(d,d)=5
奖金分配
王菲b
李
绩效高g 绩效低d
亚
鹏 绩效高g 5,5 7,3
a
绩效低d 3,7 5,5
Ug= Uag+ Ubg=5+7+5+7=24
Ud= Uad+ Ubd=3+5+3+5=16
▪ Uag(g,g)=50 Uag(g,d)=10 Uad(d,g)=80
Uad(d,d)=30
▪ Ubg(g,g)=50 Ubg(d,g)=10 Ubd(g,d)=80 Ubd(d,d)=30
通俗地讲,博弈论是一种“游戏理 论”。其较对博弈为准确的理解是: 一些个人、团队或其他组织,面对 一定的环境条件,在一定的规则约 束下,依靠所掌握的信息,同时或 先后,一次或多次,从各自允许选 择的行为或策略进行选择并加以实 施,并从中各自取得相应结果或收 益的过程。
2.1.3博弈论的模型简介
博弈论模型可以用七个方面来描述
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
最大利益。
3、多人博弈
三个或三个以上的博弈方参加的博弈。
竞争者
竞争者
破坏者
北京申办2000年奥运会失利
第一轮 第二轮 第三轮 第四轮
北京 32
37
40
43
悉尼 28
30
37
45
曼彻斯特 11
11
11
柏林
9
10
伊斯坦布 8
尔
2.2.2 策略
1. 有限博弈(finite games) :如 果博弈中每个博弈方的策略是有 限的,称为有限博弈。
石头·剪子·布
博弈方2
石头 剪子 布
博 弈 石头
0,0 1,-1 -1,1
方 剪子 -1,1 0,0 1,-1
1
布 1,-1 -1,1 0,0
▪ Uag(g,g)=2 Uag(g,d)=0 Uad(d,g)=-1 李 Uad(d,d)=1 亚
周末约会
王菲b
足球g 演唱会d
▪ Ubg(g,g)=1 鹏 足球g 2,1
2.关于博弈过程的信息 完美信息和不完美信息
完美信息(perfect information):对 已经发生的的事情有清楚的了解,称具 有完美信息。否则,称为不完美信息 (imperfect information)
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
G={P,A,S,I,U,O,E}
P(players)
▪ P(players): 为局中人,博弈的
参与者,也称为“博弈方”,局中
人以最终实现自身利益最大化为目
标。
个人
双方
虚拟参与人:
团体
多方
Nature
A(action)
▪ A(action) :为各局中人的所有可能的 策略或行动的集合。
▪ 行动的顺序(The order of play)
0,0
Ubg(d,g)=-1 Ubd(g,d)=0
a
演唱会d
-1,-1
1,2
Ubd(d,d)=2
UU= Uag+ Ubg=2+0+1-1=2
Ud= Uad+ Ubd=-1+1+0+2=2
▪ Uat(t,t)=-8 Uat(t,n)=0 Uan(n,t)=-10 Uan(n,n)=-1
▪ Ubt(t,t)=-8 Ubt(n,t)=0 Ubn(t,n)=-10 Ubn(n,n)=-1
3. 变和博弈: Ua(1,2)〒 Ub(1,2)
猜硬币游戏
▪ 两个人通过猜硬币的正反赌输赢,其 中一人用手盖住一枚硬币,有另一方 在是正面还是反面朝上。若猜对,则 猜着赢1元,盖着输1元;若猜错,则 猜着输1元,盖着赢1元。
▪ 假设赢着收益为1,输者收益为-1。
▪ U1z(z,z)=-1
U1z(z,f)=1