博弈论(11级 郭俊聪)11172434

合集下载

博弈论完整版PPT课件

博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。

博弈论及经典案例简介PPT课件

博弈论及经典案例简介PPT课件
⑶ 上策均衡是纳什均衡的一种特殊情况,但纳什均 衡却不一定是上策均衡。
-
纳什均衡的意义
21
纳什均衡是指在对手策略既定的情况下,各自对局者所选择 的策略都是最好的。 合作是有利的“利己策略”。但它必须符合以下黄金律: 按照你愿意别人对你的方式来对别人,但只有他们也按同 样方式行事才行。也就是中国人说的“己所不欲勿施于 人”。但前提是人所不欲勿施于我。
– 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的 行为都必须考虑到对方可能作出的反映。
-
博弈论研究对象 10
博弈论是研究理性的决策主体在其行为发生直接的相 互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大收益的策略)。
论和经济行为”,推动了博弈论在经济管理中的应 用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔 经济学奖(1994),进一步推动了博弈论的研究。
-
博弈论的产生和发展 12
1. 博弈在中国
-
《学弈》(《孟子•告 子》) :弈秋,通国之善 弈也。使弈秋侮二人弈, 其一人专心致志,惟弈秋 之为听;一人虽听之,一 心以为有鸿鹄将至,思援 弓缴而射之。虽与之俱学, 弗若之矣。为是其智弗若 与?吾曰:非然也。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中 非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作 博弈理论的重大发展,甚至可以说是一场革命。
-
故事模型
A、B、C三人决斗,每人有2颗子弹,每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射,两轮后对决结束。
13
博弈又称博戏,是一门古老的游戏。《世 本》说,“乌曹作博”,乌曹乃是夏代著 名之能工巧匠。千百年来,博弈更是与人 们的生活紧紧相连,从博棋到牌戏,从斗 戏到彩票,中华民族的历史长河中就这样 形成了别具风情的博弈文化

第八章博弈论简要课件

第八章博弈论简要课件

11
第八章 博弈论
四、重复博弈和序列博弈
➢静态博弈是指局中人同时决策或虽非同时 决策,但后决策者不知道先决策者采取什么 策略的博弈。 ➢动态博弈是指局中人决策有先有后,后决 策者能观察到先决策者决策情况下的博弈。
12
第八章 博弈论
动态博弈的例子
进入
在位者甲
合作 斗争
进入者乙
(400 ,500) ( -100 ,100)
6
第八章 博弈论
3、策略集合: 是指所有局中人可能采取 的行动方案总和。例如:都坦白,都抵赖, 坦白与抵赖,抵赖与坦白 4、收益: 是指在每种组合情况下,局中 人采取特定策略得到的结果。例如:判3年, 6年,释放等
7
第八章 博弈论
三、上策均衡和纳什均衡
1、上策: 是指不管其他局中人采取什么策 略,某一局中人都采取自认为对自己最有 利的策略。 2、均衡: 是指博弈中所有局中人都不想改 变自己策略的一种相对静止状态。
1
第八章 博弈论
博弈论字面的意思是游戏策略,及用类 似游戏中解决问题的方法,揭示解决社会、 经济及其他领域问题的策略、对策,因此有 的还把博弈论译成对策论。准确的说博弈论 是在给定的条件下寻求最优策略,这里给定 的条件包含其他人的策略以及本人的决策对 其他决策主体的影响。
2
第八章 博弈论
策略性活动在社会、经济、政治生活中 大量存在,也可以说,整个社会、经济、政 治生活都是博弈行为。因此,博弈论作为一 种方法,广泛的应用在经济、政治、军事、 外交中,只是博弈论在经济学中应用的最广 泛、最成功。如前面介绍过的古诺均衡,就 属于经济学中的博弈过程。
8
第八章 博弈论
3、上策均衡: 不管其他局众人采取什么策 略,每个局中人都选择了对自己最有利的策 略所构成的一个策略组合。 4、纳什均衡: 是指参与博弈的每一局中人 在给定其他局中人策略的条件下选择上策所 构成的一种策略组合。 注:所有上策均衡都是纳什均衡,但不能反 过来说所有纳什均衡都是上策均衡。

博弈论最全完整-讲解课件

博弈论最全完整-讲解课件
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。

混合的策略纳什均衡

混合的策略纳什均衡

流浪汉 寻找工作 流浪
救济 政府
不救济
2 3,
1 -1,
3 -1,
0 0,
虽这模型没有PNE,却有下述的MNE:参与人以一定的概率选择某种 策略,然后计算相应于不同概率的期望效用。
2020/6/17
9
设:政府救济的概率θ=1/2 ; 不救济的概率1-θ=1/2。 流浪汉寻找工作的期望效用: 1/2×2+1/2 ×1=1.5 流浪的期望效用: 1/2×3+1/2 ×0=1.5
✓ 每个参与人都想猜透对方的策略,而每个 参与人又不愿意让对方猜透自己的策略。
这种博弈的类型是什么?如何找到均衡?
2020/6/17
3
2. 混合策略、混合策略博弈和混合策略纳什均衡
• 策略:
– 参与人在给定信息集的情况下选择行动的规则,它规定参与人在 什么情况下选择什么行动,是参与人的“相机行动方案”。
E1(正面)=(-1)×r+1×(1-r)=1-2r 参与人1选取反面的期望效用为
E1(反面)=1×r+(-1)×(1-r)=2r-1
2020/6/17
15
参与人1的期望效用为 E1= E1(正面)×q + E1(反面)×(1- q ) =(1-2r)(2q-1)
类似地,得到参与人2的期望效用为
E2= E2(正面)×r + E2(反面)×(1- r ) =(1-2q)(2r-1)
参与人2
正面
反面
参与人1
正面 反面
-1, 1 1,-1
1,-1 -1, 1
由划线法可知,该博弈不存在纳什均衡。 所以采取纯策略不存在稳定的纳什均衡解。
2020/6/17
2

博弈论

博弈论

Day 1
Day 2
Day 3
分析
如果是情况(2),2红1黑

那么在第一天,红头发的人会看到1红1黑,他会考虑如果自己头发颜色是黑的, 那么为情况(1),他所见的红发人会在第一天黄昏自杀,如果他头发为红, 为情况(2),他所见的红发人不会自杀。黑头发人看到2红,那么可排除情况 (1),如果他头发为黑,则为情况(2),否则为情况(3)。到了第二天, 没有人自杀。那么两个红发人都认定此为情况(2),知道自己头发为红,于 第二天晚自杀。黑发人第三天发现这是情况(2),知道自己头发为黑,于当 晚自杀。
分析
我们从1个海盗的情况开始讨论。 (1)如果只有1个海盗,那么他显然会把 10个金币都分给自己。此时最佳方案为{10}。
分析

(2)如果有2个海盗,那么2号来制定方案。 但是他无论怎么制定,1号海盗都投反对票, 根据规则2号海盗会被丢入大海,并且金币 被1号海盗独享。最佳方案为{死,10}。
2 1
分析

(3)如果有3个海盗,那么3号无论怎么制定方 案,2号必同意(因为如果只剩2人了那么2号必 死,他保命要紧),而1号必反对(因为如果只剩 2人,他将独享10金币并搞死2号)。所以3号可 以给自己分10个,依然能通过。最佳方案为{10, 0,0}。 3 2 1
分析

(4)如果有4个海盗,那么4号除自己需要2票,此时3号必反 对提议(因为如果到3海盗情况他将得10金币,就算现在给他 10金币他也反对因为他还想搞死4号),那么此时需要1、2号 各一票。如果到3海盗情况,那么1、2号会颗粒无收。若不给 他们金币让他们同样颗粒无收,他们将反对(同样都一无所获 那为什么不让你死),但若给他们1人1金币,他们就会同意。 所以最佳方案为{8,0,1,1}。

博弈论与竞争策略ppt课件

博弈论与竞争策略ppt课件
结局(outcome):对参与人的不同行动,这场博弈 的结果或结局是什么
报酬(payoff)(支付)与报酬函数(payoff function):博弈的结果给参与人带来的好处。可 以用报酬矩阵(支付矩阵、得益矩阵、赢得矩阵)
3
2、博弈均衡的基本概念
(1)占优策略均衡 占优策略:无论其他参与者采取什么策略,
博弈论就是用数学方法研究决策相互影响的理性人是 如何进行决策以获取最大收益的。
博奕:多人决策过程 引例:田忌赛马
2
1、博奕论的基本要素
参与者(player)(博奕方、局中人、对局者):即 有哪些人参与博弈。一般至少有两个参与者。
策略(strategy)与策略空间(strategy set):什么人 在什么时候行动;当他行动时,他具有什么样的信 息;他能做什么,不能做什么。
-1 -12
不坦白
-12 -1
-2 -2
5
• 如果两个疑犯都能够选择不坦白的话,他们 将明显地得到一个更大的收益,但由于两人 的信息无法沟通,选择不坦白并不是两人的 理性选择。对于两人而言,不管对方坦白或 是不坦白,自己选择坦白都是更优的选择, 因而,{坦白,坦白}就是均衡战略。
6
占优策略均衡
犯人招供与黑社会制裁
嫌犯B
坦白
嫌犯A
坦白
-∞ -∞
不坦白
-12 -∞
不坦白 -∞ -12 -2 -2
7
(2)纳什均衡
纳什均衡:在一个纳什均衡里,任何一个 参与者都不会改变自己的策略,如果其他 参与者均不改变各自的策略。
博弈中双方都没有绝对的最优策略,一方 的最优策略取决于对方的选择。
占优策略均衡一定是纳什均衡,但纳什均 衡不一定是占优策略均衡。

博弈论理和对策行为

博弈论理和对策行为
略数也是有限的)往往用矩阵形式表示。
博弈论和对策行为
策略型博弈的实例和解(囚徒困境)
例1. 囚徒困境(prisoner’s dilemma) 在对博奕局势进行描述后,博奕论分析就是要求
出局中人进行策略选择的理性结局,或者说找出博奕 问题的解。在非合作博奕中,有两种解的技术:一种 是纳什均衡,一种是优超解。
概论
博弈论和对策行为
博奕论是一门内容广泛且复杂的学科,不仅是经 济学,政治学、军事、外交、国际关系、公共选择, 还有犯罪学等,都涉及到博奕论。
实际上,很多人把博奕论看成数学的一个分支, 博奕论的一个重要代表人物---纳什(Nash,曾获1994 年诺贝尔经济学奖,该年度的诺贝尔经济学奖授与了 三位博奕论专家),在1951年的一篇奠基性的文章就 是发表在数学杂志上,而非在经济学杂志上。
对囚徒B作同样分析:如果囚徒A的策略是“坦白”,则 他采取“坦白”策略为好;如果囚徒A的策略是“抵赖”,他 还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也 是“坦白”。
两个最优反应形成了一个策略组合(坦白,坦白),这就是 一个纳什均衡。
博弈论和对策行为
囚徒困境在经济学上的应用
两个寡头企业选择产量的博奕就是一个囚徒困 境问题。
博弈论和对策行为
囚徒困境在经济学上的应用
以上的分析告诉我们,用经济学的观点来看,只有由满足 个人理性选择的策略组成的集合才是均衡的,或者说只有纳 什均衡才是稳定的。
博弈论和对策行为
囚徒困境在经济学上的应用
看两个寡头合谋与价格卡特尔的情形,它也存在 个人理性与集体理性的冲突。
在两个寡头合谋条件下的产量与价格决定,是基 于两个寡头利润总和的最大化目标,而不是每个企业 自己的利润最大化。因此这种最大化目标下的产量分 配符合两家企业的共同利益,却不是使每家企业自己 的利润最大化的产量,换言之,并不是每家企业自己 的“最优反应”。所以,卡特尔产量分配不是一个纳 什均衡。正因为此,卡特尔下一定会有违约冲动,卡 特尔具有不稳定性。

第11章博奕论

第11章博奕论
齐王 田忌
3 1 1 3 1 − 1 A= −1 1 1 1 1 1
1 1 3 1
1 1 3
1 1 1 3 1
1 −1
−1 1 1 −1
−1 −1 1 1 1 1 3
第二节 矩阵对策 二人有限零和对策也称矩阵对策, 二人有限零和对策也称矩阵对策,在众多对策 模型中占有主要的地位, 模型中占有主要的地位,矩阵对策是到目前为止在 理论研究和求解方法方面都比较完善的一类对策。 理论研究和求解方法方面都比较完善的一类对策。
每一个局中人 i , i = 1,2,..., n ,都有自己的策略集 S i , 一般地,每一局中人的策略集中至少包含两个策略。 一般地,每一局中人的策略集中至少包含两个策略。 参与方的收益(payoffs) (3)参与方的收益(payoffs) 每一局中人 i , i = 1,2,..., n ,各自选定自己的策略 si ∈ S i 后,就形成一个局势。全体局势的集合S可用各局中人 就形成一个局势。全体局势的集合S 的策略集的迪卡尔集表示,即:S = S1 × S 2 × L × S n 的策略集的迪卡尔集表示, 对应于每一局势,局中人 对应于每一局势,
给他们同样的选择机会:如果他们两人都拒不 给他们同样的选择机会: 认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑; 认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑; 则坦白者从轻处理, 如果两人中有一人坦白认 罪,则坦白者从轻处理, 立即释放,而另一人则将重判10年徒刑;如果两人 立即释放,而另一人则将重判10年徒刑; 10年徒刑 同时认罪,则他们将被各判6年监禁. 同时认罪,则他们将被各判6年监禁.问题是两名 罪犯如何选择他的行为(坦白或不坦白) 罪犯如何选择他的行为(坦白或不坦白)使结果对 自己最有利。 自己最有利。 用一个矩阵表表示两囚徒的得益,如表11.2 11.2, 用一个矩阵表表示两囚徒的得益,如表11.2, 这种矩阵是表示对策问题的一种常用方法, 这种矩阵是表示对策问题的一种常用方法,我们 称这种矩阵为一个对策的 得益矩阵” “得益矩阵” Matrix)。 (Payoff Matrix)。

清华大学博弈论

清华大学博弈论
Slide 10
教学方法 Strategy for Studying
案例教学使用现实生活中的例子(故事),使 得它背后的概念易懂易记。 Using examples/stories in real life, case study approach offers a concrete and y pp memorable vehicle for the underlying concepts. 读案例可以帮助你掌握如何进行某些特定的博 弈的秘方。 Reading cases can help you know the recipes for how to play some specific games. games
第四部分:应用 Part IV: Applications to Specific Strategic Situations (1 ) classes)

第17章:讨价还价 Ch17: Bargaining (1)
期末测验 Final Exam (Week 16) ( )
Slide 5
教 材
Dixit, Avinash, and Susan Skeath, Games of St t G f Strategy, 2nd edition, W. diti W W. Norton & Company, 2004.

案例描述说明事情如何发生 Case Study (how) 理论分析说明事情为何发生 Theory (why) y( y)
通过例子(案例)引入一般理论,然后用现实 来检验它,并用来解释现实。 Examples lead to general theories that are then tested against reality and used to i t t interpret reality. t lit

博弈论第一、二章

博弈论第一、二章

2021/4/8
15
第二节 博弈论革命(了解)
在经济学领域的“革命” 在其他学科领域的运用
2021/4/8
16
第三节 博弈论要点
一、博弈的要素 (1)参与者:参与博弈的决策主体
单人博弈、两人博弈、多人博弈 (2)博弈的规则:对博弈作出具体规定的集
合 (3)结果:对所有的参与者每一个可能的行
动组合,会出现什么样的结果 (4)收益:在可能的每一个结果上,参与者
的所得和所失。 零和博弈、常和博弈、变和博弈
2021/4/8
17
二、博弈的基本式
用参与者、策略和收益函数来表述一个博弈,就称 为博弈表达基本式。
2021/4/8
18
2021/4/8
19
三、博弈论的扩展式Leabharlann 2021/4/820
四、信息和顺序 (一)信息: 1.如果所有参与者在给定任意策略组合下,
2021/4/8
4
从这个游戏我们可以看出,孙悟空采取什么策略, 关键取决于猪八戒的策略;而猪八戒采取什么策略 反过来又取决于孙悟空的策略。
对这种情况的正规表述是:孙悟空和猪八戒的策略 具有相互依存性。
2021/4/8
5
引入策略函数的概念,设fs孙悟空的策略函数,fz为 猪八戒的策略函数。
a11表示孙悟空的策略——石头; a12表示孙悟空的策略——剪刀; a13表示孙悟空的策略——布; a21表示猪八戒的策略——石头; a21表示猪八戒的策略——剪刀; a21表示猪八戒的策略——布; (这里默认a的第一个下标表示第几个参与者,1表
2021/4/8
24
第二章 完全信息静态博弈
完全信息静态博弈即各博弈方同时决策,且 所有博弈方对各方得益都了解的博弈。

博弈论在生态学中的应用

博弈论在生态学中的应用

▪ 生物学家使用博弈理论来理解和预测进化(论 )的某些结果。例如,John Maynard Smith和 George R. Price在1973年发表于《自然》杂志 上的论文中提出的“evolutionarily stable strategy”的这个概念就是使用了博弈理论。还 可以参见进化博弈理论(evolutionary game theory)和行为生态学(behavioral ecology) 。
度是相等的。W1=W2据此我们可以求出鹰对策者 的比例为P=V/C
现在我们赋值来看看
▪ 规则:胜者得50分 ,失败者得0分
▪Leabharlann 双鹰对策重伤得-100分,

双鸽对策浪费时间得-100分
▪ 全部都是鸽子对策者 ▪ 鸽子与鸽子对峙,各得 -10分. ▪ 赢者可得 50分,扣除 10分,净得 40分 ▪ 退却者得 0分,扣除 10分,净得 -10分 ▪ 假设每只鸽子可望输赢各半, ▪ 平均每只鸽子可得 (40-10)/2 =15分
w1w2据此我们可以求出鹰对策者胜者得胜者得5050分分失败者得失败者得00分双鹰对策重伤得双鹰对策重伤得100100分双鸽对策浪费时间得双鸽对策浪费时间得100100分分平均每只鸽子可得4010215分平均每只鹰可得501002因此鸽对策者会增加
数学建模:博弈论在生物学中的应用
西北师范大学 郭熙川
▪ 虽然纯鸽种群个体平均适合度大于ESS种群内 个体的平均适合度,但它是一个不稳定的种群 ,随时都可能受到其他对策(鹰对策)的侵蚀 。
▪ 人们普遍相信,自然选择所选择的结果应该是 稳定的,不会受到很和其他对策侵蚀的ESS种 群。
问题与讨论
▪ 我们当然不能期望这个高度简化的模型能够完 全解释动物个体之间斗阵很少产生严重伤害的 后果。但这个模型至少可以帮助我们解释为什 么在自然界中导致严重伤害的激烈斗争非常罕 见。

博弈论(整理过名词解释和简答)

博弈论(整理过名词解释和简答)

1、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。

2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。

3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。

4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。

在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。

7、均衡:所有参与人的最优战略组合。

8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。

9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。

10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。

11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。

12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。

13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。

博弈论名词解释

博弈论名词解释

博弈论名词解释(总2页) -CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除博弈名词解释1.博弈论: 根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论。

2.参与人(局中人)(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

3.策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

4.信息(information):参与人有关博弈的知识,特别是有关自然的选择,其他参与人的特征和行动的知识。

5.支付(payoff)函数:,参与人从博弈中获得的效用水平,它是所有参与人取定的一组策略的函数。

6.结果(outcome):博弈者感兴趣的要素的集合。

7.静态博弈:在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动。

8.动态博弈:在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

9.零和游戏(零和博弈):属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。

双方不存在合作的可能。

零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。

两个人下棋、或是打乒乓球。

10.常和博弈:又叫非零和博弈,是指各博弈方的得益之和是一个非零的常数。

自己的所得并不与他人的所失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在“双赢”的可能,进而合作。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
站长素材
认识博弈论
by郭俊聪
互动测试
• 规则:在纸上写下1—100之间的任 意数,最接近平均数2/3的人获胜。
LOGO
• 奖励:胜者为一人,请看电影一场 或35元现金;胜者多于一人,均分 20元钱。
博弈论的发展
• 1928年,冯·诺依曼证 明了博弈论的基本原理,从 而宣告了博弈论的正式诞生。 • 1944年,冯·诺依曼和 摩根斯坦共著的划时代巨著 《博弈论与经济行为》将二 人博弈推广到n人博弈结构并 将博弈论系统的应用于经济 领域,从而奠定了这一学科 的基础和理论体系。 • 1950~1951年,ห้องสมุดไป่ตู้ 翰·福布斯·纳什(John Forbes Nash Jr)利用不动 点定理证明了均衡点的存在, 为博弈论的一般化奠定了坚 实的基础。——纳什均衡 (Nash equilibrium )
如果其中一人是你,你如何抉择? 绝对优势策略
到底什么是博弈?
LOGO
• 博弈(game playing):在多决策主体 之间行为具有相互作用时,各主 体根据所掌握信息及对自身能力 的认知,做出有利于自己的决策 的一种行为。 • 满足博弈的三个条件:参与者, 策略,收益
基本分析方法
• 情景假设:假设你现在是钟会要去攻打蜀国,你有 两队人马。蜀国守将姜维有两队人马 • 你有两种路线方案: • 1、入剑阁经大道步步为营攻下成都; • 2、偷渡阴平,直取蜀汉。同样姜维也有对应的防守 策略。 • 注意: • 1、走阴平因路途坎坷你会直接损失一队人马; • 2、相同兵力遭遇以双方都全军覆没算,2v1,2方剩 1,1方无。 • 3、双方都只能选择一条路线 • 请问,为了取得胜利,你会如何安排进攻?
LOGO
2012诺贝尔奖获得者夏普利 夏普利值——n人博弈
经典案例
囚徒困境(博弈论的非零和博弈中具代表性的例子,反
映个人最佳选择并非团体最佳选择。虽然困境本身只属模 型性质,但现实中的价格竞争、环境保护等方面,也会频 繁出现类似情况。)
LOGO
两个嫌疑犯作案后被警察抓住,分别关在不同 的屋子里接受审讯。警察知道两人有罪,但缺 乏足够的证据。警察告诉每个人:如果两人都 抵赖,各判刑一年;如果两人都坦白,各判八 年;如果两人中一个坦白而另一个抵赖,坦白 的放出去,抵赖的判十年。
LOGO
基本分析方法
• • 收益假设:你所剩余的人马为你的收益 ,姜维消灭的你的人马为姜维的收益。 问题分析——二维表
LOGO
姜维 剑阁 钟 会 ( 你 ) 剑 阁 阴平
(0,2) (2,0) (1,1) (0,2)
阴 平
Thank you
相关文档
最新文档