博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论(对手论)
Game Theory
主讲人:张化祥
前言
如果代理将环境中的其他代理看成 环境中的一部分,多代理问题,则多代 理问题就转化为单代理问题。 1994年的诺贝尔经济学奖授予3位 博弈论专家 : 美国伯克利加利福尼亚 大学的约翰· 海萨尼(J.Harsanyi)、普 林斯顿大学约翰· 纳什(J.Nash)和德国 波恩大学的赖因哈德· 泽尔滕(Reinhard Selten)。
一、概论
4.几个经典例子 4.1囚徒困境(prisoner’s dilemma):假设有两个小偷A和B联合犯 事、私入民宅被警察抓住。警方将两人分别置于不同的两个房 间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如 果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿, 两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白, 另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表 明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。 如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但 可以私入民宅的罪名将两人各判入狱1年。(Nash的合作伙伴 Tucker于50年代,matrix game)下表1给出了这个博弈的支付矩 阵:
A获利1000亿 B获利0 A获利0 B获利1000亿 A获利0 B获利0
B开发
A不开发 B不开发
二、完全信息静态博弈
1.优势战略(占优战略)及均衡(dominant strategy) 占优战略: 定义:博弈中,参与者的效用函数为所有参与者战略的函数, 效用受其他参与者战略选择的影响。有时,参与者的最优战略 可能不依赖于其他参与人的战略,即无论对方如何选择,他的 最优战略是唯一的,这样的最优战略称为优势战略。 举例:囚徒困境 坦白是其优势战略
二、完全信息静态博弈
2.占优战略求解:
小猪 行动 等待
大猪
行动
等待
5, 1
9,-1
表6
4,
4
对小猪来说;等待是占优战略, 但大猪没有占优战略。 如何求解?
0, 0
理性推理过程:假定小猪理性,只能选择等待 假定大猪知道小猪是理性的,大猪会预测到小猪 “等待”,大猪只能是选择“按”。 思想:重复剔除严格劣战略(iterated elimination of strictly dominant strategy)
前言
●
约翰· 海萨尼:分析了信息不完备情况下的博弈,提出了“海萨 尼转换”,定义了“贝叶斯纳什均衡”,从而使得不可分析问 题变成了可分析问题。
约翰· 纳什:他的两篇关于非合作博弈论的重要论文,彻底改 变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡 解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示 了博弈均衡与经济均衡的内在联系。2000年北京召开的数学家 大会作主题发言 ●赖因哈德· 泽尔滕:在60年代中期将纳什均衡概念引入动态分 析,在1965年发表《需求减少条件下寡头垄断模型的对策论描 述》一文,提出了“子博弈精炼纳什均衡”的概念,又称“子 对策完美纳什均衡”。这一研究对纳什均衡进行了第一次改进, 选择了更具说服力的均衡点。
5.2纯战略与混合战略 如果决策主体的均衡策略为某一个具体的策略,如上述例子,则 称为纯战略,若为多个策略的概率组合,则称为混合战略,如 以0.1概率选上,以0.9概率选下。
二、完全信息静态博弈
示例:市场有两栋楼出售,需求大时,每栋可售1.4亿,需求小 时,每栋可售7000万,若只有一栋楼,需求大时可售1.8亿,小 时可售1.1亿 有两个开发商A和B,各有1亿元资金,是否投资开发? 特点:双方同时决策;决策时不知道对方的决策;市场需求对方 共知;一次性决策 参与人:开发商A和B 行动:开发/不开发 知识:已有竞争者知道,已有参与者知道…….
都是对其余博弈方策略的组合
* * * * * * *
ui ∈Si都成立,则称为 对任意sij( s1 ,...si 1, si , si 1, ...sn ) ui ( s1 ,...si 1, sij , si 1, ...sn ) 为G的一个纳什均衡。
小猪 行动 大猪 行动 等待 表2 5, 1 9,-1 等待 4, 4 0, 0
举例:股市炒股;穷人富人
一、概论
4.3斗鸡博弈(chicken game)(懦夫博弈):有一个独木桥,一次只 允许一个人经过,现在有两个人分别从桥的两头想往对面走,若各不 相让,则双双落水,若一方想让,则另一方获胜。因此,对每个人来 说,最好的结果是,对方先不走,而自己先过去。
●
前言
现代宏观、微观经济学研究,广泛应用时序理论,随机过程、 统计、回归模型,对博弈论知识,尤其是计量经济学,作为一 个经济学理论……. 最早博弈论开始于1944年,由冯· 诺依曼(Von Neumann ) 和摩根斯坦(Morgenstern )对合作博弈的研究开始,主要研究 合作博弈。后来约翰· 纳什,于1951年发表了两篇非合作博弈方 面的文章,从而奠定了非合作博弈的基础,随后在此基础上产 生了约翰· 海萨尼、赖因哈德· 泽尔滕等人对博弈论的研究工作。 博弈论最早被归为数学,但后来博弈论在经济学方面的应用 取得了成功,同时很多经济学家也做了很多工作,人们借此认 为它成为经济学分支,实际上,博弈论在很多方向都有很好的 应用,如政治,经济,计算机科学,社会科学,生物学,军事 战略等方面。
一、概论
4.2智猪博弈:假设猪圈里有一头大猪、一头小猪。猪圈的一头 有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会 有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的 成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同 时到槽边,收益比是7:3,小猪先到槽边,收益比是6:4,那么, 在两头猪都有智慧的前提下,最终结果是小猪选择等待. 用博弈论中的收益矩阵(表2)可以更清晰的刻画出小猪的选择:
D
0,3
表8
0,1
M总比K优 B L M
A U
1,0
表9
1,2
(U,M)为占优战略
二、完全信息静态博弈
3.纳什均衡(NE)
定义: 在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个
* * 策略组成的某个策略组合 ( s1 ,... sn )
中,任一博弈方i的策略si*,
* * ( s1 ,... si*1, si*1, ...sn ) 的最佳对策,也即 * * *
一、概论
1.博弈论定义: 研究决策主体的行为发生直接相互作用时的决策及这种决策 的均衡问题。 注:发生相互作用,表明主体决策受到其他主体决策的影响。 此时,主体效用(决策结果的好坏),不单纯依赖于自己的 选择,同时还依赖于决策中其他主体的选择,此时,个体的最 优选择是其他主体选择的函数。 2.博弈论分类: 一般认为,博弈主要可以分为合作博弈和非合作博弈: 合 作博弈强调的是团体理性;非合作博弈强调个体理性,个体决 策,最大化个体效用。非合作博弈又分为:完全信息静态博弈, 完全信息动态博弈,不完全信息静态博弈,不完全信息动态博 弈。从行为的时间序列性,博弈论进一步分为静态博弈、动态 两类 。按照参与人对其他参与人的了解程度分为完全信息博弈 和不完全信息博弈;按参与的人数可以分为单人博弈,双人博 弈,三人博弈……。按收益可分为零和博弈(zero-sum game), 常和博弈(constant-sum game),变和博弈(variant sum game )。
二、完全信息静态博弈
s i' 和 si'' 2.1定义:令
si si 成立 ,称
于
si' , si" si 是决策主体i可选的两个战略,
u 如果对于 j N , j N 的策略组合s-i,有: i ( si' , si ) ui ( si" , si ),
s
s i'
的占优均衡。它是重复剔除劣战略后剩下的唯一战略组合,如果这 个战略组合存在,我们就说该博弈是重复剔除占优可解的
(dominance solvable).
二、完全信息静态博弈
示例:
对于A: U总比D优
B
B L A U D 1,0 0,3
表7
L K 0,1 2,0 对于B: A U 1,0
M 1,2
Байду номын сангаас
M 1,2 0,1
一、概论
A\B 坦白 抵赖 坦白 -8,-8 -10, 0 抵赖 0,-10 -1,-1
表1 囚徒困境反映了个体理性与具体环境的矛盾,即使建立攻守同 盟也没用,它不构成均衡 举例:(1)现在的贪官与夫人,朋友等建立攻守同盟 (2)国家与国家之间用来购买武器,生产武器的钱都用来发 展经济,人类社会会进步得很快 (3) 小国在大国之间求生存也是一种博弈
一、概论
3.博弈的基本要素 主体(参与者)、行动、信息、战略、收益函数、均衡;其中, 主体、战略、收益函数是三个最基本的组成要素。 主体:决策的参与者,最大化自己的效用 行动:参与者的决策变量 战略:参与者选择行动的规则 信息:决策主体在博弈中有关的知识 效用函数:参与者从博弈中收益的一个指标,用于衡量决策的 “好”、“坏”。 均衡:是所有决策主体的最优战略或行动的组合
二、完全信息静态博弈
分析如下: 有八种可能结果:
B开发
A获利4000万 B获利4000万
A获利8000万 B获利0 A获利0 B获利8000万 A获利0 B获利0
A开发 B不开发 需求大
B开发
A不开发 B不开发
二、完全信息静态博弈
B开发 A开发 B不开发 需求小
A获利-3000万 B获利-3000万
一、概论
劣战略1: 在n个参与者标准式博弈G中,如果重复剔除严格劣战略,剔除掉 除NE以外的所有战略,则称该博弈有唯一的NE. 若战略如下:
2
左 中 1,2
0,1
表4
右 0,1
2,0
上
1,0
0,3
1
下
对于2来说:不管1为上或下,“中”总比“右”好,“右”为劣战略 对于1来说:“上”总比“下”好;
一、概论
A\B 坦白 抵赖 坦白 -8,-8 -10, 0
表5
抵赖 0,-10 -1,-1
对于A来说,坦白是占优战略
二、完全信息静态博弈
形式化: s* si* 称为决策主体i的严格占优战略,如果对应已有的s-i,i 是u 的严格最优选择, s-i为除i外,其他已有决策参与者的策略组 ' * u 合, i ( si* , si ) ui ( si' , si ) si s1 i si' si* 已有的 si si 称为“劣战略”。 占优战略均衡(dominant-strategy equilibrium) * s 定义:在博弈战略式表达中,如果对于任一决策参与者i , i * * 是i的占优战略,则战略组合s*( s1 ,....sn ) ,称为该博弈的占优 战略均衡。 如上例:对于A和B来讲,坦白都是最好的选择,此时(坦白, 坦白)就是一个占优战略均衡。 对于开放商的例子:当市场需求大时,(开发,开发)就是一 个占优战略均衡。
赢利矩阵(payoff matrix)如下表3 : B 前进 A 前进 后退 -3, -3 0,2 表3 后退 2, 0 0, 0
分析: 有两个均衡: (进,退)、(退,进)
举例:夫妻双方因琐事吵架
一、概论
5.博弈的表示(标准式) 5.1定义 ni:参与者,i=1,2……n si: 表示第i个参与者的战略集合 ui:表示第i个参与者的收益 定义1:在一个n人的博弈中,参与者的战略空间 S = {s1,..sn}, 收益函数 U = {u1,u2…un}, G U S 称为博弈的标准式。 定义2:在n个参与者的标准式博弈 G ={s1…sn,u1…un}中,如果战 * s 略组合 {s1* ,...sn } 满足对每个参与者i, i* 为针对其他n-1个参与者所 * * * 选策略 {s1* , s2 ...si*1 , si*1 ,...sn } 的最优反应策略,则称 {s1* ,...sn } 为该博弈 的纳什均衡(NE: Nash Equilibrium ).
' 为相对于 i
s
'' 的劣战略,称 i
' si'为相对
的占优战略。
2.2求解占优战略:对于决策参与者的每个战略,不断地剔出相 对于它的劣战略,如果最后剩下唯一的战略组合,此战略组合就
是该博弈重复剔除的占优均衡。
二、完全信息静态博弈
2.3博弈的占优可解性:战略组合
* * s * ( s1 ,..., sn ) 称为重复剔除
Game Theory
主讲人:张化祥
前言
如果代理将环境中的其他代理看成 环境中的一部分,多代理问题,则多代 理问题就转化为单代理问题。 1994年的诺贝尔经济学奖授予3位 博弈论专家 : 美国伯克利加利福尼亚 大学的约翰· 海萨尼(J.Harsanyi)、普 林斯顿大学约翰· 纳什(J.Nash)和德国 波恩大学的赖因哈德· 泽尔滕(Reinhard Selten)。
一、概论
4.几个经典例子 4.1囚徒困境(prisoner’s dilemma):假设有两个小偷A和B联合犯 事、私入民宅被警察抓住。警方将两人分别置于不同的两个房 间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如 果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿, 两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白, 另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表 明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。 如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但 可以私入民宅的罪名将两人各判入狱1年。(Nash的合作伙伴 Tucker于50年代,matrix game)下表1给出了这个博弈的支付矩 阵:
A获利1000亿 B获利0 A获利0 B获利1000亿 A获利0 B获利0
B开发
A不开发 B不开发
二、完全信息静态博弈
1.优势战略(占优战略)及均衡(dominant strategy) 占优战略: 定义:博弈中,参与者的效用函数为所有参与者战略的函数, 效用受其他参与者战略选择的影响。有时,参与者的最优战略 可能不依赖于其他参与人的战略,即无论对方如何选择,他的 最优战略是唯一的,这样的最优战略称为优势战略。 举例:囚徒困境 坦白是其优势战略
二、完全信息静态博弈
2.占优战略求解:
小猪 行动 等待
大猪
行动
等待
5, 1
9,-1
表6
4,
4
对小猪来说;等待是占优战略, 但大猪没有占优战略。 如何求解?
0, 0
理性推理过程:假定小猪理性,只能选择等待 假定大猪知道小猪是理性的,大猪会预测到小猪 “等待”,大猪只能是选择“按”。 思想:重复剔除严格劣战略(iterated elimination of strictly dominant strategy)
前言
●
约翰· 海萨尼:分析了信息不完备情况下的博弈,提出了“海萨 尼转换”,定义了“贝叶斯纳什均衡”,从而使得不可分析问 题变成了可分析问题。
约翰· 纳什:他的两篇关于非合作博弈论的重要论文,彻底改 变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡 解,并证明了均衡解的存在性,即著名的纳什均衡。从而揭示 了博弈均衡与经济均衡的内在联系。2000年北京召开的数学家 大会作主题发言 ●赖因哈德· 泽尔滕:在60年代中期将纳什均衡概念引入动态分 析,在1965年发表《需求减少条件下寡头垄断模型的对策论描 述》一文,提出了“子博弈精炼纳什均衡”的概念,又称“子 对策完美纳什均衡”。这一研究对纳什均衡进行了第一次改进, 选择了更具说服力的均衡点。
5.2纯战略与混合战略 如果决策主体的均衡策略为某一个具体的策略,如上述例子,则 称为纯战略,若为多个策略的概率组合,则称为混合战略,如 以0.1概率选上,以0.9概率选下。
二、完全信息静态博弈
示例:市场有两栋楼出售,需求大时,每栋可售1.4亿,需求小 时,每栋可售7000万,若只有一栋楼,需求大时可售1.8亿,小 时可售1.1亿 有两个开发商A和B,各有1亿元资金,是否投资开发? 特点:双方同时决策;决策时不知道对方的决策;市场需求对方 共知;一次性决策 参与人:开发商A和B 行动:开发/不开发 知识:已有竞争者知道,已有参与者知道…….
都是对其余博弈方策略的组合
* * * * * * *
ui ∈Si都成立,则称为 对任意sij( s1 ,...si 1, si , si 1, ...sn ) ui ( s1 ,...si 1, sij , si 1, ...sn ) 为G的一个纳什均衡。
小猪 行动 大猪 行动 等待 表2 5, 1 9,-1 等待 4, 4 0, 0
举例:股市炒股;穷人富人
一、概论
4.3斗鸡博弈(chicken game)(懦夫博弈):有一个独木桥,一次只 允许一个人经过,现在有两个人分别从桥的两头想往对面走,若各不 相让,则双双落水,若一方想让,则另一方获胜。因此,对每个人来 说,最好的结果是,对方先不走,而自己先过去。
●
前言
现代宏观、微观经济学研究,广泛应用时序理论,随机过程、 统计、回归模型,对博弈论知识,尤其是计量经济学,作为一 个经济学理论……. 最早博弈论开始于1944年,由冯· 诺依曼(Von Neumann ) 和摩根斯坦(Morgenstern )对合作博弈的研究开始,主要研究 合作博弈。后来约翰· 纳什,于1951年发表了两篇非合作博弈方 面的文章,从而奠定了非合作博弈的基础,随后在此基础上产 生了约翰· 海萨尼、赖因哈德· 泽尔滕等人对博弈论的研究工作。 博弈论最早被归为数学,但后来博弈论在经济学方面的应用 取得了成功,同时很多经济学家也做了很多工作,人们借此认 为它成为经济学分支,实际上,博弈论在很多方向都有很好的 应用,如政治,经济,计算机科学,社会科学,生物学,军事 战略等方面。
一、概论
4.2智猪博弈:假设猪圈里有一头大猪、一头小猪。猪圈的一头 有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会 有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的 成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同 时到槽边,收益比是7:3,小猪先到槽边,收益比是6:4,那么, 在两头猪都有智慧的前提下,最终结果是小猪选择等待. 用博弈论中的收益矩阵(表2)可以更清晰的刻画出小猪的选择:
D
0,3
表8
0,1
M总比K优 B L M
A U
1,0
表9
1,2
(U,M)为占优战略
二、完全信息静态博弈
3.纳什均衡(NE)
定义: 在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个
* * 策略组成的某个策略组合 ( s1 ,... sn )
中,任一博弈方i的策略si*,
* * ( s1 ,... si*1, si*1, ...sn ) 的最佳对策,也即 * * *
一、概论
1.博弈论定义: 研究决策主体的行为发生直接相互作用时的决策及这种决策 的均衡问题。 注:发生相互作用,表明主体决策受到其他主体决策的影响。 此时,主体效用(决策结果的好坏),不单纯依赖于自己的 选择,同时还依赖于决策中其他主体的选择,此时,个体的最 优选择是其他主体选择的函数。 2.博弈论分类: 一般认为,博弈主要可以分为合作博弈和非合作博弈: 合 作博弈强调的是团体理性;非合作博弈强调个体理性,个体决 策,最大化个体效用。非合作博弈又分为:完全信息静态博弈, 完全信息动态博弈,不完全信息静态博弈,不完全信息动态博 弈。从行为的时间序列性,博弈论进一步分为静态博弈、动态 两类 。按照参与人对其他参与人的了解程度分为完全信息博弈 和不完全信息博弈;按参与的人数可以分为单人博弈,双人博 弈,三人博弈……。按收益可分为零和博弈(zero-sum game), 常和博弈(constant-sum game),变和博弈(variant sum game )。
二、完全信息静态博弈
s i' 和 si'' 2.1定义:令
si si 成立 ,称
于
si' , si" si 是决策主体i可选的两个战略,
u 如果对于 j N , j N 的策略组合s-i,有: i ( si' , si ) ui ( si" , si ),
s
s i'
的占优均衡。它是重复剔除劣战略后剩下的唯一战略组合,如果这 个战略组合存在,我们就说该博弈是重复剔除占优可解的
(dominance solvable).
二、完全信息静态博弈
示例:
对于A: U总比D优
B
B L A U D 1,0 0,3
表7
L K 0,1 2,0 对于B: A U 1,0
M 1,2
Байду номын сангаас
M 1,2 0,1
一、概论
A\B 坦白 抵赖 坦白 -8,-8 -10, 0 抵赖 0,-10 -1,-1
表1 囚徒困境反映了个体理性与具体环境的矛盾,即使建立攻守同 盟也没用,它不构成均衡 举例:(1)现在的贪官与夫人,朋友等建立攻守同盟 (2)国家与国家之间用来购买武器,生产武器的钱都用来发 展经济,人类社会会进步得很快 (3) 小国在大国之间求生存也是一种博弈
一、概论
3.博弈的基本要素 主体(参与者)、行动、信息、战略、收益函数、均衡;其中, 主体、战略、收益函数是三个最基本的组成要素。 主体:决策的参与者,最大化自己的效用 行动:参与者的决策变量 战略:参与者选择行动的规则 信息:决策主体在博弈中有关的知识 效用函数:参与者从博弈中收益的一个指标,用于衡量决策的 “好”、“坏”。 均衡:是所有决策主体的最优战略或行动的组合
二、完全信息静态博弈
分析如下: 有八种可能结果:
B开发
A获利4000万 B获利4000万
A获利8000万 B获利0 A获利0 B获利8000万 A获利0 B获利0
A开发 B不开发 需求大
B开发
A不开发 B不开发
二、完全信息静态博弈
B开发 A开发 B不开发 需求小
A获利-3000万 B获利-3000万
一、概论
劣战略1: 在n个参与者标准式博弈G中,如果重复剔除严格劣战略,剔除掉 除NE以外的所有战略,则称该博弈有唯一的NE. 若战略如下:
2
左 中 1,2
0,1
表4
右 0,1
2,0
上
1,0
0,3
1
下
对于2来说:不管1为上或下,“中”总比“右”好,“右”为劣战略 对于1来说:“上”总比“下”好;
一、概论
A\B 坦白 抵赖 坦白 -8,-8 -10, 0
表5
抵赖 0,-10 -1,-1
对于A来说,坦白是占优战略
二、完全信息静态博弈
形式化: s* si* 称为决策主体i的严格占优战略,如果对应已有的s-i,i 是u 的严格最优选择, s-i为除i外,其他已有决策参与者的策略组 ' * u 合, i ( si* , si ) ui ( si' , si ) si s1 i si' si* 已有的 si si 称为“劣战略”。 占优战略均衡(dominant-strategy equilibrium) * s 定义:在博弈战略式表达中,如果对于任一决策参与者i , i * * 是i的占优战略,则战略组合s*( s1 ,....sn ) ,称为该博弈的占优 战略均衡。 如上例:对于A和B来讲,坦白都是最好的选择,此时(坦白, 坦白)就是一个占优战略均衡。 对于开放商的例子:当市场需求大时,(开发,开发)就是一 个占优战略均衡。
赢利矩阵(payoff matrix)如下表3 : B 前进 A 前进 后退 -3, -3 0,2 表3 后退 2, 0 0, 0
分析: 有两个均衡: (进,退)、(退,进)
举例:夫妻双方因琐事吵架
一、概论
5.博弈的表示(标准式) 5.1定义 ni:参与者,i=1,2……n si: 表示第i个参与者的战略集合 ui:表示第i个参与者的收益 定义1:在一个n人的博弈中,参与者的战略空间 S = {s1,..sn}, 收益函数 U = {u1,u2…un}, G U S 称为博弈的标准式。 定义2:在n个参与者的标准式博弈 G ={s1…sn,u1…un}中,如果战 * s 略组合 {s1* ,...sn } 满足对每个参与者i, i* 为针对其他n-1个参与者所 * * * 选策略 {s1* , s2 ...si*1 , si*1 ,...sn } 的最优反应策略,则称 {s1* ,...sn } 为该博弈 的纳什均衡(NE: Nash Equilibrium ).
' 为相对于 i
s
'' 的劣战略,称 i
' si'为相对
的占优战略。
2.2求解占优战略:对于决策参与者的每个战略,不断地剔出相 对于它的劣战略,如果最后剩下唯一的战略组合,此战略组合就
是该博弈重复剔除的占优均衡。
二、完全信息静态博弈
2.3博弈的占优可解性:战略组合
* * s * ( s1 ,..., sn ) 称为重复剔除