博弈论知识点总结完整版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论
(一):基本知识
1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。
1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。
1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。
合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。
博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈:
a、完全信息静态博弈,纳什均衡,Nash(1950)
b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965)
c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968)
d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991)
1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈
1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form)
1.6占优均衡:
a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。
对于所有的s-i,si*称为参与
人i的严格占优战略,如果满
足:
ui(si*,s-i)>ui(si',s-i) "s-i, "
si' ¹si*
b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。
1.7重复剔除严劣策略均衡:
a、“严劣”和“弱劣”的含义:
设s i’和s i’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立
u i(s i’, s-i) < u i(s i’, s-i), 则说策略s i’严劣于策略s i’。
上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’。
b、定义:重复剔除严格策略就是
各参与人在其各自策略集中,
不断剔除严劣策略…如果最终
各参与人仅剩下一个策略,则
该策略组合就被称为重复剔除
严劣策略均衡。
(二):纳什均衡(Nash Equilibrium)
2.1纳什均衡定义:对于一个策略式表述的博弈G={N,S i, u i,i∈N},称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡,如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, …,s i-1*, s i+1*, …,s n*} 情况下参与人i的最优策略(经济理性策略),即:u i(s i*, s-i*) ≥u i(s i, s-i*), 对于任意的s i∈S i ,任意的i∈N均成立。
通俗定义:纳什均衡是一种策略组合,给定对手的策略,每个参与人选择自己的最优策略。纳什均衡是一种稳定的策略组合:当所有参与人的选择公开以后,每个人都满意自己作出了正确的选择;没有人能得到更好的结果了。在博弈论中这种结果被称为纳什均衡(NE)。
2.2定理:
Nash在1950年证明:任何有限博弈,都至少存在一个NE——Existence of Nash Equilibrium。即在一个有n个参与人的策略式博弈G={S1,…,Sn; u1,…,un}中,如果n是有限的,且Si是有限集(i=1,…,n),则该博弈至少存在一个纳什均衡(在混合策略意义下)
Wilson(1971)证明,几乎所有有限博弈,都存在有限奇数个NE,包括纯策略NE 和混合策略NE。——Oddness Theorem
2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系
定理a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡,但反过来不一定成立;
定理b 纳什均衡一定不能通过重复剔除严劣策略方法剔除。
2.4划线法
先找出自己针对其他博弈方每种策略或策略组合(对多人博弈)的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得益的策略(这种相对最佳策略总是存在的,不过不一定唯一),然后在此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。这就是划线法。
2.5箭头法
箭头法对于理解博弈关系很有好处,是寻找相对稳定性策略组合的分析方法。对博弈中的每个策略组合进行分析,考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组。最后综合对每个策略组合的分析情况,形成对博弈结果的判断。划线法和箭头法的结果是一致的,可以相互替代。
(三):混合策略(Mixed Strategies)纳什均衡
3.1定义:混合策略的定义:在博弈G={N, Si, ui, i∈N}中,假设参与人i的纯策略构成的策略集合为Si={si1,…, sik},若参与人i以概率分布pi=(pi1,…, pik) 在其k个可选策略中随机选择“策略”,称这样的选择方式为混合策略。这里,0≤pij ≤1,对于j=1 ,…, k都成立,且有, pi1+…+ pik=1。纯策略可看成特殊的混合策略。上述定义是在有限博弈前提下进行的。
3.2混合策略意义下策略组合的表述