博弈论第讲

合集下载

博弈论 蒋文华 浙江大学

博弈论 蒋文华 浙江大学

第一讲、博弈论概述献给诸位知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。

第一章何为“博弈”博:博览全局弈:对弈棋局→谋定而动是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。

第一节从一个简单的故事说起博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。

特别提示:博弈既可以是竞争,也可以是合作!特别提示:博弈,必须学会换位思考!特别提示:博弈,只需领先一步,高人一筹!博弈就是你中有我,我中有你。

由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。

博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。

特别提示:站在别人的立场上想一想,就是为自己未来的遭遇着想。

——米兰·昆德拉特别提示:如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示:请不要在一个充分竞争的市场去追求成功!特别提示:选对市场(对手)比选对策略更重要!特别提示:在博弈之前,博弈就已经开始了!第二节博弈的渊源一、中国的理解博+弈=下围棋略观围棋,法于用兵,怯者无功,贪者先亡。

----汉代刘向,《围棋赋》二、西方的理解game(规则)费厄泼赖(fair play)第三节学习博弈论的收益一、当局者清更有利的选择更快速的反应二、旁观者更清理解历史与现实预测未来的发展三、提出完善游戏规则(制度)的建议第二章发展简史第一节最初的探索和应用一、古诺模型参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。

二、伯川德模型该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。

大学mooc博弈论(首师大)满分章节测验答案

大学mooc博弈论(首师大)满分章节测验答案

第一讲认识博弈论1单选(10分)博弈论的基本要素以下内容,除了()。

A.策略与策略集B.均衡C.支付与支付函数D.局中人正确答案:B你选对了2单选(10分)博弈论的基本假设是强调()。

A.均衡状态B.利益最大化C.个人理性D.集体理性正确答案:C你选对了3单选(10分)哪种表述模型更适合表示二人博弈()。

A.特征函数式B.标准式C.扩展式D.以上都不适合正确答案:B你选对了4单选(10分)根据人们行动为相互作用时,参与人能否达成一个具有约束力的协议,可将博弈分为( )。

A.静态博弈与动态博弈B.常和博弈与非常和博弈C.完全信息博弈与不完全信息博弈D.合作博弈与非合作博弈正确答案:D你选对了5单选(10分)“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”出自哪位诺贝尔经济学奖获得者的名言( )。

A.1994年诺贝尔经济学奖获得者John·NashB.2012年诺贝尔经济学奖获得者Lloyd S. ShapleyC.2005年诺贝尔经济学奖获得者Robert·AumannD.1970年诺贝尔经济学奖获得者Paul A. Samuelson正确答案:D你选对了6多选(15分)博弈论的研究特点包括()。

A.博弈论存在信息的对称性B.博弈论涉及的决策者至少为两人C.博弈论存在信息的不对称性D.博弈论需要考虑其他决策者的决策对自身利益的影响正确答案:B、C、D你选对了7多选(15分)“囚徒困境”反映了()。

A.“看不见的手”是有力的,但不是万能的B.个人理性通过市场机制导致社会福利最优的结论并不总是成立的C.个体理性与集体理性的冲突D.以自我利益为目标的“理性”行为,最终导致了两个囚徒得到相对较劣的收益正确答案:A、B、C、D你选对了8判断(5分)博弈论是一种以数学为基础、研究发生对抗与冲突时如何选择最优策略的一门学问。

正确答案:√你选对了9判断(5分)博弈论是单向的理性决策。

博弈论期中复习大纲知识讲解

博弈论期中复习大纲知识讲解

博弈论期中复习大纲博弈论第一讲——第五讲复习大纲第一讲博弈的基本规则1、博弈论的假定是:人是理性的。

2、博弈论关注的是:意识到其行动将相互影响的决策者们的行为。

3、一个博弈可以根据参与人行动的先后顺序划分为静态博弈(一次性博弈)和动态博弈(序贯博弈)。

4、博弈论可分为合作博弈和非合作博弈:若参与人之间能达成有约束力的协议,则该博弈称为合作博弈,否则为非合作博弈。

合作博弈强调的是团体理性和效率、公正、公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。

5、博弈论的基本概念包括(1)参与人:是指作决策的个体(可能是个人也可能是团体,如国家、企业)。

每个参与人的目标都是通过选择行动来最大化自身的效用。

(虚拟参与人:自然是一个虚拟参与人,它在博弈的特定时点上以特定的概率随机选择行动。

)(2)信息:参与人在特定的时点对不同变量取值的了解。

(3)信息集:参与人的信息集还包括对已发生的行动的了解,因此,信息集随着博弈进程的变化而变化。

(4)策略:策略是参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。

【注意:参与人想采取的行动取决于自然和其他参与人过去的行动,所以策略的概念不可或缺。

参与人的策略是一个关于其行动程序的完备集合,它告诉参与人在每种可预见的情况下选择什么行动,即使参与人并不预期那种情况真的会出现。

策略与行动的不同之处在于策略是不可观测的。

】(5)行动:行动是参与人的行动变量。

(6)支付函数:支付函数是参与人从博弈中获得的(期望)效用水平,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。

(7)结果:是指博弈论分析者感兴趣的要素的集合。

(8)均衡:是所有参与人与人的最有策略或行动的组合。

参与人、行动、结果统称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。

(9)均衡策略:(Equilibrium strategies )是指由博弈中的n 个参与人在最大化各自支付时所选取的策略。

《产业经济学》第五章--(博弈1)讲解

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。

博弈论讲义-概述1

博弈论讲义-概述1

第一章 概述-人生处处皆博弈
注意两点: 注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 概述-人生处处皆博弈
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
参与人
ห้องสมุดไป่ตู้
第一章 概述-人生处处皆博弈-基本概念
博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动: 行动:参与人的决策变量 战略: 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和 行动的知识 支付函数: 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡: 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈 规则决定均衡。
完全信息静态博弈 纳什均衡
第一章 概述-人生处处皆博弈
纳什(1950,1951)
分析:上述博弈属于何种类型的博弈?
囚徒困境 坦白
囚徒 B 囚徒A
抵赖
坦白 抵赖 行动
-8,-8 -10,0
0,-10 -1,-1
支付函数
完全信息静态博弈 纳什均衡
纳什(1950,1951)
第一章 概述-人生处处皆博弈-智猪博弈
第一章 概述-人生处处皆博弈-囚徒困境 亚当斯密在1776年发表的经典之作《原富》中认为: 亚当斯密在1776年发表的经典之作《原富》中认为: 1776年发表的经典之作

管理经济学10博弈论详解

管理经济学10博弈论详解

定义1: 给定其它局中人的策略s,局中人i的最优反应 记为s,是指能给他带来最大收益的策略,即
ui (s , si ) ui (s , si ) s s
* i ' i ' i
* i
当每个局中人都选择了自己的最优反应策略,并 且这些最优反应形成一个策略组合,便形成了纳什均 衡。
博弈论和对策行为
设局中人a使用混合策略x局中人b使用最优混合策略y这时局中人b的期望支付若局中人b使用某种混合策略而局中人a使用最优混合策略这时局中人a的收益的期望值为博弈论和对策行为混合策略和重复性博弈这说明当局中人a使用最优策略时不管局中人b使用何种策略他的收入的期望值不变从而保持有利的竞争地位
10 讲
博奕论和对策行为
博弈论和对策行为
策略型博弈的实例和解(性别战)
例2. 性别战(battle of the sexes)
一男一女恋爱,有些业余活动要安排,或者去看 足球比赛,或者去看芭蕾舞演出。男的偏好足球,女 的则更喜欢芭蕾舞,但他们都宁愿在一起,不愿分开 。下表给出收益矩阵: 女 足球 芭蕾 足球 2,1 0,0 男 芭蕾 0,0 1,2
纳什均衡
定义2: 一个策略组合s*=(s1*,s2*,…,sn*)被称为纳什均 衡是指,对于所有 的 i,
ui (s , s ) ui (s , s ) s Si
* i * i ' i * i ' i
纳什均衡的思想就是,博奕的理性结局是这样一 种策略组合,其中每个局中人选择的策略都已是对其 它局中人所选策略的最优反应,所以,谁也没有积极 性去选择其它策略。因为每一个局中人均不能因为单 方面改变自己的策略而获利,于是谁也没有兴趣主动 打破这种均衡。

《博弈论》精品讲义

《博弈论》精品讲义
指定n个局中人,以及他们各自的纯策略空间
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009

博弈论讲义

博弈论讲义
L(A)=2rc+1(1-r)(1-c) dL(A)/dr =3c-1=0 L(B)=rc+2(1-r)(1-c) dL(B)/dc =3r-2=0 r=2/3 c=1/3
A:(2/3,1/3),B:(1/3,2/3)是本博弈的 混合策略纳什均衡
完全信息动态博弈
参与人先后行动 每个参与人对每个参与人的得益具有完全信 息 博弈树 参与人的行动顺序(when to move,谁在 什么时候行动) 参与人的信息集(what known,每次行动 时参与人知道些什么)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
如果A 选U,其期望收益为
1 L 0 (1 L ) L .
策略组合
策略组合:(s1,…,si,…,sn) ui=ui(s1,…,si,…sn) 一个参与人的支付不仅取决于自己的策略选择, 而且取决于其他参与人的策略选择 Max ui=ui(s1,…,si,…sn)
囚徒困境博弈的标准式表述
B
抵赖 坦白
抵赖
-1,-1 0,-10
-10,0 -8,-8
ui ( s ,...,s ) 0 si
* 1 * n
囚徒困境的纳什均衡
(坦白,坦白)构成本博弈的纳什均衡
抵赖
B
坦白
抵赖
-1,-1 0,-10
-10,0 -8 -8
A

博弈论(第一章)

博弈论(第一章)

博弈的表述方法的例题
例:囚徒困境博弈的集合表示:G=((坦白,不坦白), (坦 白,不坦白);(-5,-5),(0,-8),(-8, 0),(-1,-1)) 例:在两个公司竞争出售同一产品的博弈中,两个公司是两 个博弈方,两个公司的各自销售量q1,q2是策略空间,
两个公司的所获利润u1(q1,q2),u2(q1,q2)是得
①用损益矩阵表示 例1:故事齐威王与大将田忌赛马,赛马的规则是这样的,每次 双方各出三匹马,一对一比赛三场,每一场的输方要赔1000斤 铜给赢方,齐威王的三匹马和田忌的三匹马按实力都可以分为 上,中,下三等,但齐威王的上,中,下三匹马分别比田忌的 上,中,下三匹马略胜一筹,由于总是同等次的马进行比赛, 因此田忌都是连输三场。实际上,田忌的上马尽管不如齐威王 的上马,却比齐威王的中马和下马要好,而田忌的中马比齐威 王的下马要好一些。因此,田忌的谋士孙膑为田忌出了个主意, 用自己的下马对齐威王的上马,上马对齐威王的中马,中马对 齐威王的下马。这样,二胜一负,田忌反而能赢齐威王1000斤 铜,试写出其标准式表述。
你能否写出上述问题的矩阵形式?
(3)囚徒困境的应用
③ 假定你是一个公司的采购人员,考虑向两家供应商采 购100万只零件,每只零件的成本为6元。如果你分别 向两家供应商各订购50万只,则每个供应商就会把价 格定在10元。你可以设计一个采购策略,以便在两家 供应商之间制造出囚徒困境的情形,从而给自己带来 好处。如何取定这样的采购政策,并写出其矩阵的表 达形式。同时,考虑你的采购策略的使用条件是什么?
低价
80, 80 100, 20
20, 100 50, 50
(3)囚徒困境的应用
② 公共产品的供给也可以看作是一个囚徒困境问题,如 果大家都出钱兴办公用事业,所有的人福利都会增加。 问题是,如果我出钱你不出钱,我得不偿失,而如果 你出钱我不出钱,我可以占你的便宜。所以每个人的 最优选择都是“不出钱”,但是这种状态使得所有人 的福利得不到提高。

博弈论最全完整-讲解

博弈论最全完整-讲解
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的
逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
例3:为什么教授如此苛刻?
问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺?
他必须找到某种使拒绝变得强硬和可信 的方法。
拿行政程序或者学校政策来做挡箭牌 在课程开始时做出明确和严格的宣布 通过几次严打来获得“冷面杀手”的声

导论
博弈均衡与一般均衡 博弈论与诺贝尔经济学奖获得者
博弈论的基本概念与类型 主要参考文献
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
按照大家是否清楚对局情况下每个 局中人的得益。
“各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识 (common knowledge)。
据“共同知识”的掌握分为完全信 息与不完全信息博弈。
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。

第一讲 走近博弈论

第一讲 走近博弈论

囚徒困境


囚徒困境是阿尔伯特· 塔克(Albert Tucker) 1950年提出的。 囚徒困境是博弈论最经典、最著名的博弈模型。 囚徒困境本身讲的是一个法律刑侦或犯罪学方面的 问题,但可以扩展到许多经济问题,以及各种社会 问题。
两个人因盗窃被捕,警方怀疑其有抢劫 行为但未获得确凿证据可以判他们犯了抢劫 罪,除非有一个人供认或两个人都供认。即 使两个人都不供认,也可以判他们犯盗窃物 品的轻罪。
上 下 中
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
中 上 下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
下 上 中
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
下 中 上 1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
猜硬币
两个参与者甲、乙各出示一枚硬币,在 不让对方看见的情况下,将硬币放在桌上。 若两个硬币都呈正面或反面,则甲得1分, 乙付出1分;若两个硬币一正一反,则乙得1 分,甲付出1分。 这是一个典型的两人有限零和博弈。
收益矩阵
乙 正 面

反 面
-1, 1 1, -1
正 面
反 面
1, -1 -1, 1
立场1劣于立场2?
基于对称性,可知立场10严格劣于立场
9。
立场2劣于立场3?
同样基于对称性,可知立场9严格劣于 立场8。
立场5劣于立场6?
候选人会挤在10个立场的中间地带。 在政治学中这被称为中间选民定理。


候选人可能不止两位; 现实中选民并非均匀分布; 选民常根据候选人的外貌、性格、才干等个 人魅力而非口头上的政治立场来进行投票; 存在弃权票。

博弈论最全完整-讲解

博弈论最全完整-讲解

问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
正因为这样的博弈对所有参与者存在着或大 或小的潜在成本,如何达成和维护互利的合 作就成为一个值得探究的重要问题。
存在双赢的博弈吗?实用文档
6
例2:焦点博弈 “We Can’t Take the Exam,
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
实用文档
17
约翰·纳什 1928年生于美国
莱因哈 德·泽 尔腾, 1930 年生于 德国
实用文档
约翰· 海萨尼 1920年 生于美 国
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
实用文档
19
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英 国
实用文档
20
2001年诺贝尔经济学奖获得者
实用文档
35
第一章 完全信息静态博弈
博弈论的基本概念及战略式表述 纳什均衡
纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
实用文档
36
第一节 博弈论的基本概念
与战略式表述
Байду номын сангаас
实用文档
37
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行 为发生直接相互作用时候的决策以及这种 决策的均衡问题。

博弈理论知识讲义

博弈理论知识讲义

第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。

本章讨论这个问题,建立复杂环境下的决策理论。

开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。

最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。

大局部经济行为都可视作博弈的特殊情况,比方把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。

博弈论的思想精髓与方法,已成为经济分析根底的必要组成局部。

第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。

一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。

当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。

博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。

博弈论推广了标准的一人决策理论。

在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。

下面来举例说明。

例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。

局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。

对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。

当甲和乙都作出选择时,博弈的局势就确定了。

显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。

第一讲博弈论简介

第一讲博弈论简介

博弈的分类和均衡
行动次序
信息
静态
动态 子博弈精练 纳什均衡 泽尔腾 精炼贝叶斯均衡 泽尔腾等
完全信息
纳什均衡 纳什 贝叶斯均衡 海萨尼
不完全信息
五、博弈的组成要素 一个博弈一般由以下几个要素组成,包括:参与人、行动、信 息、策略、得益、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主 体(可以是个人,也可以是团体); 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个 具体决策; 3、策略是指参与人选择行动的规则,即在博弈进程中,什么 情况下选择什么行动的预先安排; 4、信息指的是参与人在博弈中所知道的关于自己以及其他参 与人的行动、策略及其得益函数等知识; 5、得益是参与人在博弈结束后从博弈中获得的效用,一般是 所有参与人的策略或行动的函数,这是每个参与人最关心的 东西; 6、均衡是所有参与人的最优策略或行动的组合;均衡结果是 指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各 参与人的均衡策略作用下,各参与人最终的行动或效用集合。
三、博弈论的理论体系 在博弈论中,基本的出发点是理性经济人的 假设,体现为数学模型也就是效用最大化的 模型,或者在存在风险或不确定性的形式中, 则为期望效用最大化模型。 在此基础假设之上,博弈局势中每个决策主 体都选择能使自己的期望效用最大的策略。 由于利益之间存在相互关联,因此策略选择 上也存在相互关联,每个人的最佳策略选择 都要考虑到其他人的策略选择行为,而博弈 论研究的就是这种策略之间的相互影响。
博弈论简介
第一讲、博弈论基本知识
一、博弈论的研究对象 博弈论研究的是人与人之间利益相互制约下策略选 择时的理性行为及相应结局。 所谓相互制约,通常是指博弈中的任何一个局中人 受到其它局中人行为的影响。反过来,它的行为也 影响到其他局中人,由于这种相互依存性,游戏或 博弈的结果依赖于每一个局中人的决策,没有一个 人能完全控制所要发生的事情,也没有一个局中人 处于孤独的状态。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档