博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.据得益特征:零和博弈;常和博弈;变和博弈
6
四、古典博弈论的三个基本假设:参与人是理性的;他们有 这些理性的共同知识;他们知道博弈规则。 理性的三个基本内涵:理性的局中人具有关于博弈的完全知 识;可以确切知道整个状态空间;具有相对无限的逻辑能力。
五、博弈的典型例子
1 .囚徒困境
坦白
坦白
不坦白
-6,-6
求NE。
u2 s 15s2 5s1 s2 s
16
K-T定理: 设
f x g i x i 1,, m 为可微函数,
T
x x1 ,, xn 为该问题的局部解,且下面的约束 规格之一成立:1) g i x 均为线性函数;
0 代表第i个农民饲养的数量,i 1,, n
G代表总量,用V=V(G)代表每只羊的平均价值。设购买一只 羊的价格为c,且 V ' G 0 , V ''
G 0
。
13
例5 豪特林(Hotelling)价格竞争模型 设有一个长度为1单位的线性城市,消费者均 匀地分布在[0,1]区间里。有两个商店位于城 市两端,店1在x=0,店2在x=1,出售物质性能 相同的产品。每个店提供单位产品的成本为c, 消费者购买商品的旅行成本与商店的距离成比 例,单位距离的成本为t,设消费者具有单位需 求。两店同时确定价格,各自应如何定价?
i 1,, m
18
例8 公共物品的私人供给问题
设有n个居民组成的社团在建一种防洪大堤,每个居民自 愿提供沙袋,沙袋的总供给等于所有居民个人供给之和。 设第i个居民的供给为 g i ,总供给为G,居民i的效用函
堤上走的次数),假定 ui xi 0 用 数为 ui xi , G ,x i 为居民i对私人物品的消费量(如在
10
2、反应函数法(无限策略博弈) 例1 古诺(Cournot)寡头竞争模型
两企业生产完全可替代的同质产品,他们在市场上进行产量竞争, 即相互独立地提出自己的产量,以使其利润达到最大。已知市场 的逆需求函数P(Q)=a-bQ,Q为市场上产品总量,P为产品价格,
a max(c1 , c2 )
c1 c2 c
E 2) i gi ( x) 0, i 1,, m i1 ,, ik 且向量
g i1x x ,, g ik x x 线性无关。
17
则存在广义L乘子 u u1 ,, u m 使 x
22
四、混合策略与混合策略纳什均衡
例 上 中 下 左 中 右
0,2 1,0 -2,2
-1,0 0,3 1,2 2,1 -1,2 0,1
23
1、混合策略定义:在博弈
局中人i的策略空间为 Si
分布 P
i
pi1 ,, pimi
si1 ,, simi
“策
i
G S1 ,, Sn ; u1 ,, un 中,
b 0 用 q i 表示企业 i (i 1,2)的产量,
为企业的边际成本。试讨论企业的策略行为。
例2 伯川德(Bertrand)模型
11
例3 要价仲裁博弈
两参与人为企业与工会,各自的策略空间为 S企 w企 w企 0
S工 w工 w工 0
一般
w工 w企 。 仲裁机制为:仲
例1、囚徒困境;性别战;智猪博弈
例2、三人博弈
三个博弈方1、2、3要在三个项目A、B、C中投票选 择一个,规则是同时投票且不允许弃权,得票数多的 项目当选。若得票数相同,则项目A当选。设不同项 目当选时三个博弈方的得益分别为 u1(A)=u2(B)=u3(C)=2 , u1(B)=u2(C)=u3(A)=1 , u1(C)=u2(A)=u3(B)=0。试找出此博弈的所有纳什均衡。
3,2
0,0
0,0
2,3
定理:若 P *是一个混合策略纳什均衡,则对于具有正概率的 每一个纯策略,都有Vi Pi* , P*i Vi sij , P*i
sij S i pij 0
27
例 求NE
1,-1 -4,4 2,-2 -3,3 2,-2 0,0 0,0 0,0 4,-4
随机在其 m 个可选策略中选择的
pij 1
,则局中人i以概率
j 1,, mi
0 略”,称为一个混合策略。其中
pi1 pimi 1
2、混合策略组合(混合局势)及期望支付 用
P P ,, Pi ,, Pn 1
表示混合策略组合,其中 Pi
表示第i个参与者的混合策略。
3)线性规划方法
28
五、纳什均衡的存在性 定理:每一个有限策略博弈(局中人的人数有限,每个局 中人的策略集都是有限集)至少存在一个纳什均衡(纯策 略的或混合策略的)。 定理:几乎所有有限同时博弈的纳什均衡的数目都有限,并且 这个有限数目是一个奇数。(奇数定理)
例1 求博弈的NE策略组合
2
第一章 绪论
一、基本概念
1、博弈论(game theory)定义
•研究决策主体的行为发生直接相互作用时的决策及这种决策的均 衡问题。 •一些个人或组织,面对一定的环境条件,在一定的规则下,同时 或先后,一次或多次,从各自允许选择的行为或策略中进行选择 并加以实施,各自取得相应结果的过程。本质为存在策略依存性 的决策问题。
14
例6 设 1
s [10,0] s2 [3,0]
2 1
2 2
u1 (s) 10s1 7s1s2 s
求NE。
u2 s 15s2 5s1 s2 s
15
例7 设 1
s [10,0] s2 [3,0]
2 1
2 2
u1 (s) 10s1 7s1s2 s
是一个纳什均衡,若对于每一个i,si* 是给定其他参与人选择
* * * si s1 ,, si*1 , si*1,, sn
的情况下第i个参与人的最优策略
即
* * ui si* , si ui si , si
si S i , i
9
三、纳什均衡应用举例(解法) 1、划线法(相对优势策略划线法)(有限策略博弈)
自己要求的数额(
x1 为第一人要求的数额 ),否则,两
人一分钱都得不到。求NE。
20
例2 考虑一个有N个人参加的游戏:每人可 任意放最多100元钱到一部可以生钱的机器 里,机器把所有人放进去的钱的总和增加到 原来的三倍,然后再平分给这N个人。求N 人博弈的NE。
21
例 某个地方的居民均匀地环绕一个圆形湖居 住。两小贩来此地推销商品。1)若居民都选 择离自己较近的小贩购买商品,问小贩选择推 销地点博弈的NE是什么?2)若有三个小贩同 时到此地推销商品,则推销地点博弈的NE又是 什么?3)若圆形湖的周长是1(千米),居民 的购买量是Q=1-D,D为居民与小贩推销点距 离,则两个和三个小贩博弈的NE各是什么?
ui G 0
px
表示私人物品的价格, pG 为沙袋(公共物品)
的价格, M i 为居民i的预算收入。每个居民面临的问
题是:选择 xi , g i 在预算约束下使自己的效用最大?
19
3、观察验证法 例1 两个人分100元钱,每人独立地提出自己要求的数额,
x 并将其写于纸上,分配规则为: 1 x2 100 ,每人得到
m1 m2
mn
此处s表示博弈的任一个纯策略组合(局势),S表示纯策略 组合集合,P(s)表示纯策略组合的联合分布。
25
3、混合策略纳什均衡 在博弈
G S1 ,, Sn ; u1 ,, un 中,设 P* P* ,, Pn* 1
* 为一混合策略组合。若Vi P , Pi Vi P* i
4
各参与人的策略选择范围称为策略空间(策略集)。每个博弈 方各选一个策略构成一个策略组合(局势)。
3、博弈过程:各博弈方行为的顺序及博弈的规则等。关键是自 己选择时能否知道其它博弈方的选择。
4、支付(得益)函数:各策略组合下各博弈方获得的数值结果 (常为效用)。Ui=Ui(s1,…,si,…,sn)。不仅取决于自己的策略, 还取决于其它人的策略。 5、信息结构:博弈方对得益和博弈过程信息的掌握情况或程度。 6、理性基础:博弈方的行为选择是以个体理性还是集体理性为基 础,有完美理性还是有限理性。 若设定博弈时不专门设定后两个方面,就隐含假定是完全、完美 信息、完全理性的非合作博弈。
24
左 上 中
中
右
0,2 1,0 -2,2 -1,0 0,3 1,2 2,1 -1,2 0,1
下
参与者i的期望支付可表示为:
Vi P Vi Pi , Pi Ps ui s ui s1i1 ,, snin p1i1 pnin
sS i1 1 i2 Байду номын сангаас1 in 1
课程主要内容
•绪论 •完全信息静态博弈 •完全信息动态博弈 •不完全信息静态博弈 •不完全信息动态博弈
1
主要参考文献: 1、张维迎.博弈论与信息经济学,上海三联书店,上海人民出版 社,1996 . 2、谢识予.经济博弈论(第二版),复旦大学出版社,2002 . 3、于维生,朴正爱.博弈论及其在经济管理中的应用,清华大学 出版社,2005 . 4、王则柯,李杰.博弈论教程,中国人民大学出版社,2004 .
T
u
满足条件:
f x m g i x u 0 i x x j i 1 j
j 1,, n
i 1,, m
gi x 0
ui 0
ui g i x 0
-1,-8 -2,-2
7
不坦白 -8,-1
妻子 2.性别战 足球 丈夫 时装
足球
时装
3,2 0,0
0,0 2,3
3.两寡头削价竞争 4.智猪博弈
8
第二章 完全信息静态博弈
一、表示形式:策略式(标准式) 二、纳什均衡:NE(Nash Equilibrium)
* * * * 博弈G= S1,, Sn ; u1 ,, un 中,策略组合 s s1 ,, si ,, sn
3
2、博弈与一般决策的区别
二、博弈模型要素
1、参与人:博弈中的决策主体。他的目的是通过选择策 略以最大化自己的支付(效用)水平。
虚拟参与人(自然):指决定外生的随机变量的概率分布 的机制。自然作为虚拟参与人没有自己的支付与目标函数, 即所有的结果对它都是无差异的。 2、策略:参与人在给定信息集(信息集包含了一个参与人有关 其他参与人之前行动的知识,可理解为参与人在特定时刻有关 变量值的知识。一个参与人无法准确知道的变量全体属于一个 信息集)的情况下的行动规则。它规定参与人在什么时候选择 什么行动。[策略是可供局中人选择对付其它局中人的完整行动 方案。]
裁者认为合理工资为 x ,仲裁者知道 x 的大小,而工会与企业 不知道 x 的大小,认为是个随机变量,企业与工会知道它的分 1 布函数(概率密度函数): x ~ N m, 2 ;若 x w工 w企 2
则
w w企 ,否则 w w工 。企业与工会各自应如何
决策?
12
例4 公共地悲剧 设n个农民共同拥有一片草地,每年春天,每个农民要决定自 己养多少只羊。用 g i
5
三、博弈的分类(类型) 1.据是否具有有约束力的协议:非合作博弈;合作博弈 2.据理性程度:完全理性博弈;有限理性博弈 3.据博弈过程不同:静态博弈;动态博弈 4.据博弈方对得益信息的掌握情况:完全信息博弈;不完 全信息博弈 完全信息:指每个参与人的特征(类型)、策略空间、支 付函数在所有参与人中是共同知识。 5 .据策略数量:有限博弈(参与人数有限且策略集均为有 限集);无限博弈
Pi i
i 1,, n
成立,则称 P * 是一个混合策略纳什均衡。
4、求解混合策略纳什均衡的方法
1)期望支付值的极大化算法 左 上 中 下 中 右
例
0,2 1,0 -2,2 -1,0 0,3 1,2 2,1 -1,2 0,1
26
2)等支付值方法(使用前一定要用严格下策消去法化简) 例 足球 足球 丈夫 时装 妻子 时装