金融数学博弈论第一章4-1
博弈论第一章 绪论PPT资料54页
Definition
Game theory attempts to mathematically capture behaviour in strategic situations, in which an individual's success in making choices depends on the choices of others.
博弈论(对策论、赛局理论)是研究具有斗争 或竞争性质现象的理论和方法。
Definition
Game theory is a branch of applied mathematics that is widely used in the biology, engineering, social sciences, and most notably in economics.
press 罗伯特.吉本斯 博弈论概论
参考资料
J. Tirole, D. Fudenberg, Game Theory, MIT Press
O. Martin, A. Rubinstein, A Course in Game Theory. MIT Press
其他主流教学参考书
考试
期末考试占60% 平时作业占30% 出勤占10%
博弈论是应用数学的分支,现在广泛应用于经济 学、管理学、生物学、计算机科学和政治学等学 科的研究中。
有人说......
"Game theory is a sort of umbrella or 'unified field' theory for the rational side of social science, where 'social' is interpreted broadly, to include human as well as nonhuman players (computers, animals, plants)." ——R. Aumann
北京大学博弈论课件第1章_博弈论概述
纳什的代表作
1.多人博弈的均衡(Equilibrium points in n-person games) 国家科学院学报(Proceedings National Academy of Sciences),36: 48 – 49,1950年。 2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。 3.讨价还价问题(The bargaining problem)。计量经济学杂志 (Econometrica)18: 155 – 162,1950年。 4.非合作博弈(Non-cooperative games)数学年报(Annals of Mathematics),54: 286 – 295,1951年。
第一章
博弈论概述
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
2012-8-28
博弈参与者(Player) 博弈策略(Strategy) 博弈的收益(Payoff) 博弈的均衡(Equilibrium)
一、博弈参与者(Player)
博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人
产量博弈模式 价格博弈模式 领先者、跟随者博弈模式
大国之间关于汇率政策的博弈 经典博弈实例:囚徒困境(Prisoner's Dilemma)
1博弈论第一章
n n
n
厂商i的收益:
i 1
qi P( qi ) cqi qi [ P( qi ) c]
i 1
厂商i的收益不仅与自己既定成本和产量有关,还与 其他厂商的产量决策有关。
1.3.1 博弈中的参与人 1.3.2 博弈中的策略 1.3.3 博弈中的收益 1.3.4 博弈的过程 1.3.5 博弈的信息 1.3.6 参与人的能力和理性 1.3.7 博弈的分类
哲理:相生相克,以柔克刚
猜硬币方 正 面 反 面 1, -1 -1, 1 参 与 人 1 石 头 剪 子 布 石 头 0, 0 -1, 1 1, -1 参与人2 剪 子 1, -1 0, 0 -1, 1 布 -1, 1 1, -1 0, 0
盖 硬 币 方
正 面 反 面
-1, 1 1, -1
1.2.3 产量决策Cournot模型
4
2015/12/5
1.3.1 博弈中的参与人
参与人:独立决策、独立承担博弈结果的个 人或组织。只要在一个博弈中统一决策、统一行动、
统一承担结果,不管一个组织有多大,甚至大到一个国家 或多国,都可以作为一个参与人。囚徒困境中的警察、田 忌赛马中的孙膑都不是参与人。
一、单人博弈——只有一个参与人的博弈
严格地讲,单人博弈由于不存在其他参与人的反应和反 作用,因此不属于博弈论的研究对象。但是讨论单人 博弈会使理论更完整,为多人博弈提供基础和启示。 例一:单人迷宫 扩展型
入口 右 A B 0 出口(奖金M) 右 M
A,1
左 B,1
博弈规则面前参与人之间平等,不因参与 人之间权利、地位的差异而改变 参与人数量对博弈结果和分析有影响。根
两个囚徒的收益矩阵
博弈论最全完整-讲解PPT课件
王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
.
32
导论
四、主要参考文献
.
33
张维迎著,《博弈论与信息经济学》,上海三联书店、 上海人民出版社,1996年版。
Roger B. Myerson著:Game Theory(原文版、译文 版),中国经济出版社,2001年版。
是关于动态博弈进行过程之中面临决策 或者行动的参与人对于博弈进行迄今的 历史是否清楚的一种刻划。
如果在博弈进行过程中的每一时刻,面 临决策或者行动的参与人,对于博弈进 行到这个时刻为止所有参与人曾经采取 的决策或者行动完全清楚,则称为完美 信息博弈;否则位不完美信息。
.
30
零和博弈与非零和博弈
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
.
4
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗?
对手和你一样聪明! 许多博弈相当复杂,博弈论并不
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。
北京大学博弈论课件第1章-博弈论概述
❖ 二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中去相约去博物馆博弈中,博弈参与者所能采取的博弈策
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
❖ 一、博弈参与者(Player)
博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人
❖ 博弈参与者可能是单个的个人,也可能是组织或集体
企业、社会团体、国家
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
❖ 参考教材 ❖ 博弈论教程
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
❖ 岳昌君主审;沈琪编PO著WERPOINT TEMPLATE
“坦白”或“不坦白”
❖ 三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
❖ 甲、乙二人独立决策
对甲而言,不管乙选择坦白还是不坦白,甲的最优策略都是坦白。 对乙而言,不管甲选择坦白还是不坦白,乙的最优策略都是坦白。
❖ 结果:甲、乙均选择坦白,分别被判处 5 年有期徒刑 ❖ 甲、乙如均不坦白,则分别被判处 2 年有期徒刑 ❖ 个体理性与集体理性的冲突 ❖ 囚徒困境
北京大学博弈论课件第1章-博弈论概述
两人在校门口集合,一起逛博物馆
❖ 博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
❖ 博弈双方策略相互依赖,不独立。
其他博弈实例
❖ 棋类比赛:象棋、围棋等。古人“对弈”。 ❖ 寡头市场:
❖ 2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。
❖ 3.讨价还价问题(The bargaining problem)。计量经济学杂志 (Econometrica)18: 155 – 162,1950年。
❖ 4.非合作博弈(Non-cooperative games)数学年报(Annals of Mathematics),54: 286 – 295,1951年。
❖ 5.两人合作博弈(Two-person cooperative games)。计量经 济学杂志(Econometrica),21: 128 – 140,1951年。
本章小结
❖ 本章给出了博弈的基本定义 ❖ 通过现实实例分析了博弈的基本内涵和主要思想 ❖ “囚徒困境”是博弈理论中的经典案例 ❖ 博弈的构成要素主要包括:
20 世纪 70 年代,约翰 ·海萨尼(John Harsanyi)和莱因 哈德 ·泽尔腾(Reinhard Selten)等将不完全信息理论融入 到博弈论的研究中。
20 世纪 90 年代之后,博弈论作为一种方法被普遍运用到经济 学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
博弈论概述 POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
博弈论第一章ppt课件
qj ( j k) 必须使(3)式极大化.于是,令
j 0 , j1,2,,n.
qj
n
于是有 a2bqj b qkc0
(4)
kj1
n
即 bjq acb qk, j1,2,,n (5)
k1 .
n
n
将这 n个式子相加得 b qj n(ac)nb qj
j1
j1
行业的总产量为
n j1
qj
n(ac) b(n1)
设市场需求为
n
pab(qj) a0,b0 j1
(2)
当然a >c(否则会有问题,后面可以看到),由
(1)与(2)两式易知企业 j 的利润为
.
n
j(q1,q2,qn)(ab qj)qjcqj (3) j1
所谓古诺均衡,便是存在一个产量:
q(q1 ,q2 ,,qn )使得每个企业的利润都达到
最大.即当所有别的企业的产量 qk 时q,k
.
1·2 应用举例 古诺(1838年)提出了纳什所定义的均衡(但 只是在特定的双头垄断模型中),但是他并没有 从理论上系统的定义均衡的意义.古诺的研究 被认为是最早的博弈论的经典文献之一. 此模型告诉我们; (1)如何对一个问题的非正式描述转化为一
个博弈的标准式表述; (2)如何通过计算解出博弈的纳什均衡; (3)重复剔除严格劣战略的步骤.
所选战略的函数,假定企业 的i 收益就是其利润
ui(si,sj)i(qi,qj)qi[a(qiqj)c]
i1 ,j2(i2,j1 )
.
一对战略 (s1, s如2)是纳什均衡,则对每个参与
者
i,s
i
应满足:
ui(si,sj)ui(si,sj) (NE)
经济博弈论第一讲
乙如果买经济舱,则其净效用(经 济学称为消费者剩余)为1000-1000=0, 但当乙买头等舱票时的消费者剩余为 1800-1500=300元,所以乙会买头等舱。 甲的支付能力只有1000元,所以甲只有 买经济舱。这时,航空公司的利润增大 为 (1000-800)+(1500-1200)=500 元 >400 元 。
开发
不开发
开发 波音
不开发
-10,10 0, 120
100,0 0,0
16
这时只有一个纳什均衡,即波音公 司不开发和空中客车公司开发的均衡 (不开发,开发),这有利于空中客车。
在这里,欧共体对空中客车的补贴 就是使空中客车一定要开发(无论波音 是否开发)的威胁变得可置信的一种 “承诺行动”。
17
五、不对称信息下的博弈
LMR U 1,1 4,2 1,3 甲 D 2,3 1,2 2,1
(问题2:甲和乙分别会选择什么战略?)
5
当甲选“U”时,乙会选“R”; 而当乙选“R”时,甲应该选“D”而 不是“U”;但当甲选“D”时,乙会 选“L”;给定乙选“L”,甲选“D” 是最好的选择,他不会改变选择 “D”;给定甲不改变选“D”,乙也 不会改变其选择“L”。所以,可以 预期(D,L)是甲乙最终完成的稳定 的选择。
通过机制设计增大了公司利润。
23
终于有一天,有一位女士问他:难 道你不知道两块钱比一块钱更多一些钱 吗?他如此回答道:如果我有一次选择 了两块钱,就不会有人来找我让我在一 块钱与两块钱之间选择了,我也讨不到 钱了。
这个故事告诉我们有时候“扮傻” 也许是有好处的。下面再来看一个例子, 这是一个动态博弈,局中人A有两次决 策机会,一次在局中人B决策之前,另 一次在B决策之后。
金融数学博弈论第一章1
他回到校园,在普林斯顿大学取得了博士学位。 毕业后, 1954年他回到兰德公司工作,直到 1981年,他成为加州大学洛杉矶分校的教授。 主要著作 罗伊德· 沙普利(Lloyd S. Shapley)的主要 著作包括:《n人博弈的价值》(1953)、《随 机博弈》(1953)、《评估委员会制度中权力分 配的一种方法》(1954)、《高校招生与婚姻稳 定性》(1962)、《简单博弈论》(1962)、 《市场博弈论》(1969)等。 获得诺奖 2012年诺贝尔经济学奖揭晓,两名美国经济 学家—哈佛大学教授埃尔文· 罗斯(Alvin E. Roth
博弈论和经济学诺贝尔奖
1994:非合作博弈:纳什(Nash)、 海萨尼(Harsanyi)、塞尔顿(Selten) 1996:不对称信息激励理论:莫里斯(Mirrlees)和 维克瑞(Vickrey) 2001: 不完全信息市场博弈:阿克罗夫(Akerlof) (商品市场)、斯潘塞(Spence)(教育市场)、 斯蒂格里兹(Stiglitze)(保险市场) 2002:实验经济学:史密斯(Smith),心理经济学: 卡尼曼(Kahneman)
2 人大经济论坛, 3 Game theory . net
1 [美]Roger B. Myerson——博弈可以被定义 为是智能的理性决策者之间冲突与合作的数学模 型. 2 [英]Adam Smith——博弈是个体参与人从 各自的动机出发,发生相互作用的一种状态. 3 是指代表不同利益主体的决策者,在一定 的环境条件和规则下,同时或先后、一次或多次 从各自允许选择的行动方案中加以选择并实施, 从而取得各自相应结果的活动. 博弈论是研究博弈数学模型的理论. 这种理论 的目的是 事先预知决策者的行为一博 弈 论 简 介
(Introduction to Game Theory)
《金融博弈论》课件
重复博弈模型
概念:重复博弈是指在多次博弈 中,参与者可以观察到对方的行 为,并根据对方的行为调整自己 的策略。
应用:重复博弈模型在金融市场 中的应用广泛,如股票市场、债 券市场、外汇市场等。
添加标题
添加标题
添加标题
添加标题
特点:重复博弈中,参与者的策 略选择受到对方策略的影响,因 此需要权衡短期利益和长期利益。
身收益
应用:广泛应 用于经济学、 社会学等领域
例子:囚徒困 境、智猪博弈
等
01
金融博弈论的主要模型
静态博弈模型
纳什均衡:在给定其他参与者的 策略下,每个参与者的策略都是 最优的
智猪博弈:两个参与者在资源有 限的情况下,选择等待或行动, 最终导致强者行动,弱者等待
添加标题
添加标题
添加标题
添加标题
囚徒困境:两个参与者在无法沟 通的情况下,选择合作或背叛, 最终导致双方都选择背叛
金融博弈论在金融监管中的运用
监管机构:运用博弈论分析市场 参与者的行为,制定有效的监管 政策
监管政策:运用博弈论分析监管 政策的效果,调整监管力度和方 向
添加标题
添加标题
添加标题
添加标题
市场参与者:运用博弈论分析市 场环境,制定合理的投资策略
金融市场:运用博弈论分析金融 市场的动态,预测市场风险和机 会
猎鹿博弈:两个参与者在资源有 限的情况下,选择合作或竞争, 最终导致双方都选择合作
动态博弈模型
添加项标题
纳什均衡:在动态博弈中,每个参与者的最优策略取决于其他参 与者的策略
添加项标题
子博弈完美均衡:在动态博弈中,每个参与者的最优策略取决于 其他参与者的策略,并且每个参与者的策略都是最优的
博弈论第一讲
A set of players (at least
two players) For each player, a set of strategies/actions Payoffs received by each player for the combinations of the strategies, or for each player, preferences over the combinations of the strategies
Static (or simultaneous-move) games of
complete information Normal-form or strategic-form representation
Fall, 2007, Fudan University Game Theory--Lecture 1 4
At the separate workplaces, Chris and Pat must choose to
attend either an opera or a prize fight in the evening. Both Chris and Pat know the following:
Fall, 2007, Fudan University Game Theory--Lecture 1 12
Sபைடு நூலகம்atic (or simultaneous-move) games of complete information
The players cooperate?
经济博弈论1详解
囚徒 2
坦白
不坦白
囚徒1:坦白 囚徒2:坦白
囚坦白 徒 1
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
引例:囚徒困境(Prisoners’ Dilemma)
警察抓住了两个罪犯,但是警察局却缺乏足
够的证据指证他们所犯的罪行。如果罪犯中至少
有一人供认犯罪,就能确认罪名成立。为了得到
1.2.2 赌胜博弈
赌博、竞技等构成的博弈问题,在经济 中也有许多应用,赌胜博弈也是一类重 要的博弈问题,对经济竞争和合作也有 很大启示
赌胜博弈的特点是一方得等于另一方失, 不可能双赢,属于“零和博弈”
这方面的例子不胜枚举:划拳、石头剪 子布等。
一、田忌赛马
田忌
上
上
中
中
中
下
上
下
下
中
下
上
上中下
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖
寡头市场厂商的产量决策;市场开发竞争中策略较量和策 略依存;投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 政治、军事和社会的决策较量 博弈论不能称作游戏理论,也不完全称作对策论
1.1.2 一个非技术性定义
生活中的例子
在荷兰召开了一次“合作及社会两难困境研讨会”, 与会的都是博弈论专家。当大会结束之后,有两个学者 麦息克和路特提议大家玩一个游戏。
他们将一个大信封拿出来,请在场的43位学者专家拿 出金钱装到这个信封里。如果到最后这信封里的钱超过 250元,麦息克和路特将自己捞腰包,退还每人10元。 不过,如果最后信封内的钱不足250元,就统统没收, 大家拿不到一分钱。
博弈论第一章
基本信息
课程名称 经济博弈论 课程名称:经济博弈论
Game Theory and its Economic Applications
Slide 10
教学方法 Strategy for Studying
案例教学使用现实生活中的例子(故事),使 得它背后的概念易懂易记。 Using examples/stories in real life, case study y approach pp offers a concrete and memorable vehicle for the underlying concepts. 读案例可以帮助你掌握如何进行某些特定的博 弈的秘方。 Reading cases can help you know the recipes for how to play some specific games games.
案例描述说明事情如何发生 Case Study (how) 理论分析说明事情为何发生 Theory y (why) ( y)
通过例子(案例)引入一般理论,然后用现实 来检验它,并用来解释现实。 Examples lead to general theories that are then tested against reality and used t interpret to i t t reality. lit
Slide 3
教学内容
第一部分:引论与一般性原理 Part I: Introduction and General Principles (1 class)
博弈论1 (2)全篇
6
四、古典博弈论的三个基本假设:参与人是理性的;他们有 这些理性的共同知识;他们知道博弈规则。
理性的三个基本内涵:理性的局中人具有关于博弈的完全知 识;可以确切知道整个状态空间;具有相对无限的逻辑能力。
五、博弈的典型例子
1 .囚徒困境 坦白
坦白
不坦白
-6,-6 -1,-8
3
2、博弈与一般决策的区别
二、博弈模型要素
1、参与人:博弈中的决策主体。他的目的是通过选择策 略以最大化自己的支付(效用)水平。
虚拟参与人(自然):指决定外生的随机变量的概率分布 的机制。自然作为虚拟参与人没有自己的支付与目标函数, 即所有的结果对它都是无差异的。
2、策略:参与人在给定信息集(信息集包含了一个参与人有关 其他参与人之前行动的知识,可理解为参与人在特定时刻有关 变量值的知识。一个参与人无法准确知道的变量全体属于一个 信息集)的情况下的行动规则。它规定参与人在什么时候选择 什么行动。[策略是可供局中人选择对付其它局中人的完整行动 方案。]
21
例 某个地方的居民均匀地环绕一个圆形湖居 住。两小贩来此地推销商品。1)若居民都选 择离自己较近的小贩购买商品,问小贩选择推 销地点博弈的NE是什么?2)若有三个小贩同 时到此地推销商品,则推销地点博弈的NE又是 什么?3)若圆形湖的周长是1(千米),居民 的购买量是Q=1-D,D为居民与小贩推销点距 离,则两个和三个小贩博弈的NE各是什么?
14
例6 设 s1 [10,0] s2 [3,0]
u1 (s) 10s1 7s1s2 s12
u2 s 15s2 5s1s2 s22
求NE。
15
例7 设 s1 [10,0] s2 [3,0]
博弈论第一章总结
博弈论第一章总结那咱就开始唠唠博弈论第一章的那些事儿哈。
博弈论啊,这可是个超级有趣的东西呢。
第一章就像是打开博弈论大门的一把小钥匙,虽然小,但可重要啦。
这第一章啊,主要就是给咱介绍啥是博弈论的基本概念。
就好比是你要去一个新地方,先得知道这个地方是干啥的,大概啥样对吧。
博弈论呢,简单来说就是研究在不同的决策情况下,人们或者各方之间是怎么互相影响的。
比如说啊,下象棋的时候,你走一步,对方走一步,你每一步的决策都要考虑到对方可能会干啥,对方也是一样,这就是一种博弈呀。
这里面有个很重要的点就是参与者。
这些参与者就像一场大戏里的演员,每个参与者都有自己的目标,就像演员都有自己的角色任务一样。
比如说在商业竞争里,那些公司就是参与者,每个公司都想赚更多的钱,扩大自己的市场份额,这就是他们的目标啦。
而且这些参与者的决策可不是瞎做的哦,都是为了达到自己的目标去想办法的。
再说说策略这个事儿。
策略就像是每个参与者手里的武器或者魔法棒。
不同的参与者有不同的策略可以选择。
还拿商业竞争举例哈,如果一家公司想要增加市场份额,它可以选择降低价格,提高产品质量,或者做很多广告这些策略。
而且每个策略都会对其他参与者产生影响呢。
比如说你降价了,别的公司可能就会受到影响,也跟着降价或者想出其他办法来应对。
信息也是博弈论第一章里不能少的部分。
信息就像是在黑暗里的灯光,有多少信息就决定了你能多清楚地看清局势。
要是你知道很多关于其他参与者的信息,比如他们的策略啦,他们的目标啦,那你做决策的时候就更有把握。
但是要是你啥都不知道,就像在黑夜里瞎摸,那可就危险啦。
比如说在谈判的时候,如果一方知道另一方的底线,那这一方就有更大的优势,能更好地争取自己的利益。
这第一章的博弈论啊,其实就是把这些基本的东西一股脑儿地摆在我们面前,让我们对博弈论有个初步的认识。
它告诉我们在各种情况下,人与人、公司与公司、国家与国家之间的互动都是有规律可循的。
就像我们解开一个谜题一样,每一个概念都是一块小拼图,当我们把这些小拼图都搞清楚了,就能慢慢看到整个博弈论这个大拼图的全貌啦。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
混合战略 (1, 0) 表示参与者的一个纯战略,即选择正 面. 而混合战略 (1 3 , 2 3)表示以概率1/3选择正面,以 概率2/3选择反面. 一般地,假设参与者i有K个纯战略:Si {si1 ,, siK }, 则参与者i 的一个混合战略是一个概率分布 ( pi1 , piK ), 其中 pik 表示对所有k 1, 2, K , 参与者i 选择战略sik的概 率,且 pi1 piK 1, 0 pik 1, i 1, 2, K . 我们用 其中包含了参 pi 表示基于Si 的任意一个混合战略组合, 与者选择的每一个纯战略. 正如我们用si 表示Si 内任意 一个纯战略. 定义 对标准式博弈 G S1,, Sn ; u1,, un , 假设 Si {si1 ,, si K }, 那么参与者i 的一个混合战略为概率分 布 pi ( pi1 , piK ). 其中对所有 i 1, 2,, K , 0 pik 1,
vi ( i , i ) ( j ( s j ))ui ( s)
sS j 1
n
其中 s (s1 , s2 ,, sn ), S 表示参与者i 的纯战略组合空 间, j ( s j ) 是参与者j 选择纯战略 s j 的概率. 定义:在n个参与者博弈的战略式表述
中,混和战略组合 ( 1 ,, i , n ) 是一个纳什均 衡. 如果对于所有的i =1, 2, …, n ,下式 vi ( i , i ) vi ( i , i ), i i 成立. i表示参与者i 的混合战略空间. 等价地, ( 1 ,, i , n ) 是下列最优化问题的解
因为这时参与者的最优行为是不确定的, 而博弈的结 果必然包含这种不确定性. 混合战略可以解释为 一个参与者对其他参与者行 为的不确定性. 规范的表述,参与者i 的一个混合战略是在其战略 空间Si 上的一些或全部战略的概率分布. 以后我们称Si 中的战略为参与者i 的纯战略. 对完全信息静态同时行动博弈来说, 一个参与者 的纯战略就是他可以选择的不同行动. 例如, 在猜硬币 分别为正面和反面,这时 博弈中Si 内含有两个纯战略, 参与者i 的一个混合战略为概率分布 (q , 1 q), 其中q为 出现正面的概率, 1-q为出现反面的概率,而且 例如, 0 q 1. 另外,混合战略也可以表示纯战略,
1· 3 理论发展:混合战略和均衡的存在性 1· 3· A 混合战略 纳什均衡不存在的例子 正面 反面
正面 反面
-1 ,1 1 ,-1
1 ,-1 -1 , 1
“猜硬币”博弈不存在纳什均衡. 猜硬币博弈一个非常突出的特点是 每个参与者都 试图能先猜中对方的战略. 在博弈中, 一旦每个参与者 都竭力猜测其他参与者的战略选择, 就不存在纳什均衡 (至少不存在第 1· 1· C 节所定义的所定义的纳什均衡),
证明: 不妨假设参与者1有m个概率大于0 的纯战略 s1i1 , s1i 2 ,, s1im , m K 是对P2 的最优反应,且它们对应 的概率 p1il 0, l 1, 2,, m. 其它纯战略对应的概率为0, 则纯战略 s1i1 , s1i 2 , , s1im 形成的混合战略 (0,, p1i1 , p1i 2 ,, p1im ,,0) 一定是对P2 的最优反应.
k 1
j 1
p1 j p2 k u2 ( s1 j , s2 k )
k 1 j 1
k
J
类似于纯战略意义下纳什均衡, 定义:在两个参与者博弈 G S1 ,, Sn ; u1,, un 中,混和战略组合 P ( P 是一个纳什均衡的充 , P 1 2 ) 要条件为:每一个参与者的混合战略是另一个参与者 混合战略的最优反应. 即在参与者期望收益的意义下, v1 ( P , P ) v ( P , P (1. 3. 4) 1 2 1 1 2 ) 对S1中战略所有可能的概率分布P1 都成立. 并且 P2 必 须满足 v2 ( P (1. 3. 5) 1 , P 2 ) v2 ( P 1 , P 2 ) 对S2中战略所有可能的概率分布P2 都成立.
且 pi1 piK 1. 混合战略的一个应用 前面讲到,如果战略si 为严格劣战略,那么参与者 i 的最优反应战略不会是 si . 如果引入混合战略,就可 以证明其逆命题:如果(针对其他参与者的战略选择)参 与者i 都不可能作出这样的推断,即其战略 s i 会成为最 优反应战略,则一定存在另一个战略严格优于 si . 参与者2 (证明的说明参见课本 25页脚注) T 3,— 0,—
事实上, p2 k u1 ( s1i , s2 k ) p2 k u1 ( s1 il , s2 k ) l
k 1 k 1
K
K
对于 l 1, 2,, m 都成立,所以,
K
p1i
k 1
K
il , s2 k ) p1il p2 k u1 ( s1il , s2 k ) p1il p2 k u1 ( s1
p1 j p2 k u1 ( s1 j , s2 k )
j 1 k 1 j 1 J K
k 1
J
K
(1. 3. 3)
如果参与者1的混合战略 P ( p , , p 1 11 1J ) 是对参与 者2的混合战略P2 的最优反应,则
p
j 1 k 1
J
K
参与者2
T 3,— 0,—
参与者1 M 0,— 3,—
B 2,— 2,—
图 1.3.2
类似于对图 1.3.1的分析,对图 1.3.2分析可以得出 一个给定的纯战略可能会严格优于一个混合战略, 即使 这个纯战略并不严格劣于其他任何一个纯战略. 1· 3· B 纳什均衡的存在性 参与者混合战略的使用,使得参与者的战略选择带 有不确定性, 因此参与者的收益必然也不确定. 纯战略情况下,参与者i 的收益ui 是纯战略组合的函
k 1
l
K
il , s2 k ) p2 k u1 ( s1il , s2 k ) p1il p2 k u1 ( s1
k 1
K
k 1
由于除了l 1, 2,, m, 其它纯战略对应的概率 p1 j 0,
j il , l 1, 2,, m, 所以,
u ( s , s2 k ) p p p p 1 1 i u ( s , s ) 1 i 2 k 1 i 2 k l l 1 1i 2k
K k 1 k 1
K
j 都成立. (因为当参与者1选择 s1 j时, 对S1中每一个 s1 )这表明,一个混合战略P1要成为P2 的最优反 p1 j 1 应,混合战略P1中每一个概率大于0的纯战略本身也必 须是对P2 的最优反应. Conversely, if player 1 has several pure stratregies that are best responses to P2 , then any mixed strategy that puts all its probability on some or all of pure stratregies best response(and zero probability on all other pure stratregies ) is also a best response player 1 to P2 . 反之,如果参与者1有一些纯战略都是P2 的最优应,那 么对于赋予这些或部分是最优反应的纯战略正的概率 (其它的纯战略0 概率)的混合战略一定也是参与者1 对P2的最优反应.(补证)
1j
p u1 ( s1 j , s2 k )
2k
j 1 k 1
J
K
p1 j p2 k u1 ( s1 j , s2 k )
对p1中每一个 p1 j 都成立. 特别地,对其中任何大于0 的 p1 j 相对应的纯战略 s1 j 必须满足:
u ( s , s ) p u ( s , s ) p 1 1 j 2 k 2 k 2k 1 1 j 2k
参与者1 M 0,— 3,—
B 1,— 1,—
图 1.3.1
图1.3.1显示出,一个给定的纯战略可能会严格劣 于一个混合战略, 即使这个纯战略并不严格劣于其他 任何一个纯战略. 对于参与者2的任何一个混合战略 ( , 1 ), 参与 者2选择L的概率为 , 选择R 的概率为1 . 可以断言: 参与者1的最优反应要么是T,要么是M,但不会 是B. 注意:此时参与者关心的是期望收益. 参与者1选 择T 的期望收益为 3 0 (1 ), 选择M 的期望收益为 0 3(1 ). 容易得出当 1 2 时,参与者1选择T ;当 1 2 时,参与者1选择M . 当 1 2时, 选择T,M无差异. 由此说明T 和M 的混合战略 严格优于纯战略 B.
l 1 k 1
l
l
m
K
m
K
l 1 k 1
所以,
p1 j p2 k u1 (s1 j , s2k ) p1 j p2 k u1 (s1 j , s2k )
j 1 k 1 j 1 k 1合战略 (0,, p1i1 , p1i 2 ,, p1im ,,0)是对P2 的最 优反应. 可以证明: 对于n个参与者的情形,以上结论也成立. 类似地可以得出参与者2在混合战略P1和P2下的期 K J 望收益. v2 ( P 1, P 2 ) p2 k [ p1 j u 2 ( s1 j , s2 k ) ]
数,混合战略情况下, 参与者i 的收益ui 是混合战略 组合的函数,也就是纯战略情况下期望收益. 假设博弈是有限的. 参与者i 在纯战略组合 s (s1 , s2 ,, sn ),i 1, 2, n, 其中 s j是参与者j 的纯战略, j 1, 2,n 下的收益函数为ui ,即 ui ui (s1 , s2 ,, sn ), 参与者i 在混合战略情况下的期望收益用 vi ( ) v( i , i ) 表示. 其中 (1,, 2 ,, n )表示 混合战略组合, k 是参与者k 的混合战略,k 1, 2,n i ( 1 ,, i 1 , i 1 , n ) 表示除i 之外的混合战略组 合,参与者i 期望收益可以定义为: