博弈论及其简单的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
则,它规定参与人在什么时候选择什么 行动。 战略与行动:战略是行动的规则而不是 行动本身。 在静态博弈中,战略和行动是相同的。 战略必须是完备的,要给出参与人在每 一种可想象得到的情况下的行动选择。
16
支付payoff(效用utility)
在一个特定的战略组合下参与人得到的
确定效用水平,或是指参与人得到的期 望效用水平。
2
2、张维迎的定义
“博弈论是研究决策主体的行为发生直接
相互作用时候的决策以及这种决策的均 衡问题的”也就是说,当一个主体,好 比说一个人或一个企业的选择受到其他 人、其他企业选择的影响,而且反过来 影响到其他人、其他企业选择时的决策 问题和均衡问题。所以在这个意义上说, 博弃论又称为“对策论”.
32
博弈论的重要性
博弈论是一个强有力的分析工具。现在,它不
仅在经济学领域、在军事、政治、商业征战、 社会科学领域以及生物学等自然科学领域都有 非常重大的影响,工程学中如控制论工程也少 不了它。帮助大家形成博弈论的基本概念,实 际上它是非常精深的。现在与它紧密联系的经 济学分支是信息经济学。信号游戏、拍卖形式、 激励机制、委托人--代理人理论和公共财政学 是博弈论和信息经济学研究的重要课题
合作是有利的“利己策略”。但它必须
符合以下黄金律:按照你愿意别人对你 的方式来对别人,但只有他们也按同样 方式行事才行。 所谓“己所不欲勿施于 人”。但前提是人所不欲勿施于我。
9
二、博弈论的要素
参与人 players
一个博弈中的决策主体,他的目的是通
过选择行动(或战略)以最大化自己的 支付(效用水平)。参与人可能是自然 人,也可能是团体,如企业,国家等。 重要的是:每个参与人必须有可供选择 的行动和一个很好定义的偏好函数。不 做决策的被动主体只能被当作环境参数。
17
均衡equilibrium
指所有参与人的最优战略的组合。
18
Selten and Harsanyi
泽尔腾(1965)将纳 而海萨尼则发展了刻
什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概 念;以及进一步刻画 不完全信息动态博弈 的“完备贝叶斯纳什 均衡”
画不完全信息静态博 弈的“贝叶斯纳什均 衡”(1967-1968)。 总之,他俩进一步将 纳什均衡动态化,加 入了接近实际的不完 全信息条件。他们的 工作为后人继续发展 博弈论,提供了基本 思路和模型
27
价格战
厂家价格大战的结局也是一个“纳什均衡”,而且价
格战的结果是谁都没钱赚。因为博弈双方的利润正好 是零。竞争的结果是稳定的,即是一个“纳什均衡”。 这个结果可能对消费者是有利的,但对厂商而言是灾 难性的。所以,价格战对厂商而言意味着自杀。 1996年3月26日,作风强悍,霸气十足的长虹董事长倪 润峰宣布,所有品种彩电一律大幅度让利销售,降价 幅度从8%到18%。随后,猝不及防的其他中国厂家纷 纷选择跟进。 2005年4月16日,长虹公布了2004年年报,抛出中国股 市有史以来上市公司亏损之最:36.81亿元。价格战的 发明者和坚决的拥护者,为最后的豪赌交出了最昂贵 的学费。
清华诚志 6
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意
义。个人理性与集体理性的冲突,各人 追求利己行为而导致的最终结局是一个 “纳什均衡”,也是对所有人都不利的 结局。他们两人都是在坦白与抵赖策略 上首先想到自己,这样他们必然要服长 的刑期。只有当他们都首先替对方着想 时,或者相互合谋(串供)时,才可以得到 最短时间的监禁的结果。
3
3.博弈论的通俗名称
博弈论的提法可能太过于学术化,容易让人们
退避三舍。其实它有一个非常通俗的名字--游 戏理论(博弈论的英文名字叫做"Game T heory",如果直译,就是"游戏理论")。 博弈论在我国还有一个名字,叫对策论。这些 名字都很好理解,博弈字面意思就是赌博、下 棋,赌博和下棋当然是游戏了,赌博和下棋的 时候常常要千方百计地应付对手,自然是要讲 究对策了。
12
行动的顺序
对于博弈的结果非常重要。有关静态和
动态博弈的区分就是基于行动的顺序做 出的。 同样的行动集合,行动的顺序不同,每 个参与人的最有决策就不同,博弈的结 果也不同。尤其在不完全信息博弈中, 后行动者依赖观察先行动者的行动来获 取信息。
13
信息 information
参与人有关博弈的知识,特别是有关自
33
四.博弈论与运筹学
运筹学是近代应用数学的一个分支,主要是将
生产、管理等事件中出现的一些带有普遍性的 运筹问题加以提炼,然后利用数学方法进行解 决。前者提供模型,后者提供理论和方法。 运筹学本身也在不断发展,现在已经是一个包 括好几个分支的数学部门了。比如:数学规划 (又包含线性规划;非线性规划;整数规划; 组合规划等)、图论、网络流、决策分析、排 队论、可靠性数学理论、库存论、对策论、搜 索论、模拟等等。
逃税 纳 纳税人 税 人 不逃税
税收机关 检查 A-C+F,-A-F 不检查
A-C, -A
0,0
A,-A
30
纳税检查边际
S 为税务机关检查的概率,E为纳税人逃
税概率。给定E,税收机关选择检查与否 的期望收益: K(1,E)=(A-C+F)E+(A-C)(1-E) =EF+A-C K(0,E)=0E+A(1-E)=A(1-E) 解K(1,E)= K(0,E),得:E=C/(A+F)纳税人 逃税概率小于E,税收机关的最优决策是 不检查,否则则反。
20
非合作博弈
而非合作博弈则主要研究人们在利益相
互影响的局势中如何选择策略使得自己 的收益最大,强调个人理性、个人最优 决策,其结果是有时有效率,有时则不 然。目前经济学家谈到博弈论主要指的 是非合作博弈,也就是各方在给定的约 束条件下如何追求各自利益最大化,最 后达到力量均衡。
21
例子
比如两家企业A、B合作建设一条汽车的生产
博弈的划分可以从参与人行动的次序和
参与人对其它参与人的特征、战略空间 和支付的知识、信息,是否了解两个角 度进行。把两个角度结合就得到了4种 博弈:完全信息静态博弈,完全信息动 态博弈,不完全信息静态博弈,不完全 信息动态博弈
24
博弈的分类及对应的均衡
静态 完全 信息 完全信息静态博弈; 纳什均衡; Nash(1950) 不完全信息静态博弈; 贝叶斯纳什均衡; 海萨尼(1967-1968) 动态 完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965) 不完全信息动态博弈, 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991)
清华诚志 7
NASH均衡
1950年和1951年纳什的两篇关于非合作
博弈论的重要论文,彻底改变了人们对 竞争和市场的看法。他证明了非合作博 弈及其均衡解,并证明了均衡解的存在 性,即著名的纳什均衡。从而揭示了博 弈均衡与经济均衡的内在联系。因为在 现实世界中,非合作博弈要比合作博弈 普遍得多。
NASH均衡条件下的行为规则
然的选择,其他参与人的特征和行动的 知识。 完美信息perfect information:指一个参与 人对其他参与人的行动选择有准确的理 解,即每个信息集只包含一个值。
14
共同知识common knowledge
所有参与人知道每一步的信息集。
15
战略strategies
参与人在给定信息集的情况下的行动规
10
虚拟参与人pseudo-player
为了分析方便,自然nature被当作虚拟参
与人。 自然代表决定外生随机变量的概率分布 的机制。比如房地产开发中市场需求的 大小。
11
行动 ACTIONS OR MOVES
参与人在博弈的某个时点的决策变量。
(坦白) N个参与人的行动的有序集称为行动组合 (坦白,抵赖)。
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的
思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式
28
纯战略与混合战略
如果一个战略规定参与人在每一个给定
的信息情况下只选择一种特定的行动, 称为纯战略。 如果一个战略规定参与人在给定的信息 情况下以某种概率分布随机地选择不同 的行动,称为混合战略。
29
监督博弈的纳税检查
A 为应纳税款,C为检查成本, F是偷税
罚款。假定 C<A+F。不存在纯战略纳什 均衡。
31
逃税边际
给定S,纳税人选择逃税与否的期望收益
是: K(S,1)=(-A-F)S+0(1-S)=-(A+F)S K(S,0)=-AS+(-A)(1-S)=-A 解K(S,1)= K(S,0) ,得S=A/(A+F)即,如 果税收机关检查的概率小于S,纳税人的最 优选择是逃税,否则交税。 混合纳什均衡是S,E,即税收机关以S的概 率查税,而纳税人以E的概率逃税。
22
顺序和信息
博弈论非常强调时间和信息的重要性,
认为时间和信息是影响博弈均衡的主要 因素。在博弈过程中,参与者之间的信 息传递决定了其行动空间和最优战略的 选择;同时,博弈过程中始终存在一个 先后问题SequenceOrd er,参与人的行动次序对博弈最后 的均衡有直接的影响。
23
wk.baidu.com
分类
25
不完 全信 息
主要思想
博弈论并不是经济学的一个分支,它只是一种
方法,这也是为什么许多人将其看成数学的一 个分支的缘故。博弈论已经在政治、经济、外 交和社会学领域有了广泛的应用,它为解决不 同实体的冲突和合作提供了一个宝贵的方法。 在对参与者行为研究这一点上,博弈论和经济 学家的研究模式是完全一样的。经济学越来越 转向人与人关系的研究,特别是人与人之间行 为的相互影响和相互作用,人与人之间利益和 冲突、竞争与合作,而这正是博弈论的研究对 象。
博弈论及其简单应用
2010年3月16日
陈敬灿
一、介绍博弈论
(一)概念,什么是博弈论
1.概念:博弈论Game Theo ry,又称对策论,是使用严谨的数学 模型研究冲突对抗条件下最优决策问题 的理论,是研究竞争的逻辑和规律的数 学分支。简单地说,博弈论是研究决策 主体在给定信息结构下如何决策以最大 化自己的效用,以及不同决策主体之间 决策的均衡。
4、囚徒困境的例子
A. W. Tucker的囚犯困境(Prisoner‘s
Dilemma):
囚徒B 坦白 囚徒A 坦白 抵赖 抵赖
-8,-8 -10,0
0,-10 -1,-1
囚徒困境说明了什么
在(坦白、坦白)这个组合中,A和B都不能
通过单方面的改变行动增加自己的收益,于是 谁也没有动力游离这个组合,因此这个组合是 纳什均衡,也叫非合作均衡。 囚徒困境反映了个人理性和集体理性的矛盾。 如果A和B都选择抵赖,各判刑1年,显然比 都选择坦白各判刑8年好得多。当然,A和B 可以在被警察抓到之前订立一个"攻守同盟", 但是这可能不会有用,因为它不构成纳什均衡, 没有人有积极性遵守这个协定,显然最好的策略 是双方都抵赖.
线,协议由A方提供生产汽车的技术,B方则 提供厂房和设备。在对技术和设备进行资产评 估时就形成非合作博弈,因为每一方都试图最 大化己方的评估值,这时B方如果能够获得A 方关于技术的真实估价或参考报价这类竞争情 报,则可以使自己在评估中获得优势;同理, A方也是一样。至于自己的资产评估是否会影 响合作企业的总体运行效率这样的"集体利益", 则不会非常重视。这就是非合作博弈,参与人 在选择自己的行动时,优先考虑的是如何维护 自己的利益。
19
(三)分类和主要思想
博弈论根据其所采用的假设不同而分为
合作博弈理论和非合作博弈理论。两者 的区别在于参与人在博弈过程中是否能 够达成一个具有约束力的协议。倘若不 能,则称非合作博弈Non-Coo perative Game。 合作博弈强调的是集体主义,团体理性 Collective Ration ality,是效率、公平、公正;