初级博弈论ppt

合集下载

博弈论基础PPT精品课程课件全册课件汇总

博弈论基础PPT精品课程课件全册课件汇总

自己处于c还是d。即K缺乏信息。 P
c
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
参与人对于结果的偏好性。K是否更希望博弈
终止点f而不是h上结束?
我们必须知道参与人关心什么,才能将终止
点根据每个参与人的偏好排列。通常用数字
表述参与人的偏好排序最为简便。这也称为
1 概述
这个理论在许多方面都是有用的。 首先,它提供了一种语言。 其次,它提供了应该框架,能够指导我们建立策略环 境模型。 其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。
在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
支付(payoff),或者效用(utilities)。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
我们引入一些数学符号来考察博弈。
我们来看看一个市场博弈,两个厂商通过选择高价或者低价进行 竞争。
我们用参与人i表示任何一个参与人的数字代码。即在一个有n个 参与人的博弈中,i=1,2,…,n。 在某些博弈中,一个参与人可以在无限多个行动中进行选择。

博弈论完整版PPT课件

博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。

博弈论入门(课堂PPT)

博弈论入门(课堂PPT)

共同价值和赢者的诅咒
• 两家代理:1个积极估价,1个消极估价
prob(v/s)11//22
vs2 vs2
• v均匀分布
• 出价b=?(一家和两家出价时有不同吗)
• 考察b=s-1这样一个对称策略
• 德士古公司的例子
15
几种常见的拍卖形式
• 英式公开叫价拍卖 • 荷式公开叫价拍卖 • 一价密封拍卖 • 二价密封拍卖
• 通过改革,陪审团制度在美国得到了比英国更 好的发展。
22
投票程序
23
• 每个陪审员在陪审之前已经有一个大体 的判断
• 他们的类型 • 非专业性——从众行为
– 如果评判有罪的人数多于无罪,则投有罪 – 如果评判无罪的人数多于有罪,则投无罪 – 如果双方人数相等,则依照自己的评判结果
投票
24
• 陪1:假设投有罪 • 陪2:若评判有罪,则投有罪;若评判无
• 在被问及对最终的价格是否感到意外时 ,Frija抛下一个“不”字,随即离开了
11
简化的暗标拍卖
密封递交标书 统一时间公正开标 标价最高者以所报标价中标 中标博弈方的得益不仅取决于标价,还取决于他对拍
卖标的物的带有很大主观性的估计 每个博弈方的估价通常是自己的私人信息
12
0.6
0.4
• 考虑这样一个对称策略:给定其他两个 委员采取相同策略,以及对于其他成员 拥有哪个政策更好的知识的信念,不论 这个参与者什么类型,采取这个策略都 使他收益最大。
19
• 自然决定四项:哪个政策更好,以及三 个委员的类型。
• 当一个委员了解新政策时:投票给自己 认为更好的策略是一个弱占优策略。
– 当另外两位投票相同时 – 当另外两位投票分歧时

第十章 博弈论初步PPT课件

第十章 博弈论初步PPT课件

2020年3月2日星期一
12
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第一,把整个的支付矩阵分解为甲厂商的支付矩阵和 乙厂商的支付矩阵
2020年3月2日星期一
13
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2020年3月2日星期一
11
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
1.基本方法 先用下划线法分别表示甲厂商和乙厂商的条件策
略,最后确定博弈的均衡(就是找到在两个数字之下 都划线的单元格即可,与这些单元格相对应的策略组 合就是所要求的均衡策略组合)。
1
第十章 博弈论初步 第一节 博弈论和策略行为
2.博弈的三个基本要素 三个基本要素,即参与人、参与人的策略和参与
人的支付。 所谓参与人(或称局中人),就是在博弈中进行
决策的个体;所谓参与人的策略,指的是一项规则, 根据该规则,参与人在博弈的每一时点上选择如何行 动;所谓参与人的支付则是指,在所有参与人都选择 了各自的策略且博弈已经完成之后,参与人获得的效 用(或期望效用)。
2020年3月2日星期一
2
第十章 博弈论初步 第一节 博弈论和策略行为
3.博弈的简单分类 根据参与人的数量,可以分为二人博弈和多人博
弈;根据参与人的支付情况,可分为零和博弈和非零 和博弈;根据参与人拥有的策略的数量多少,可分为 有限博弈和无限博弈;根据参与人在实施策略上是否 有时间的先后,可分为同时博弈和序贯博弈。
二、支付矩阵
1.支付矩阵 使用支付矩阵来描述和分析只有两人参加且两人

博弈论第一章ppt课件

博弈论第一章ppt课件

qj ( j k) 必须使(3)式极大化.于是,令
j 0 , j1,2,,n.
qj
n
于是有 a2bqj b qkc0
(4)
kj1
n
即 bjq acb qk, j1,2,,n (5)
k1 .
n
n
将这 n个式子相加得 b qj n(ac)nb qj
j1
j1
行业的总产量为
n j1
qj
n(ac) b(n1)
设市场需求为
n
pab(qj) a0,b0 j1
(2)
当然a >c(否则会有问题,后面可以看到),由
(1)与(2)两式易知企业 j 的利润为
.
n
j(q1,q2,qn)(ab qj)qjcqj (3) j1
所谓古诺均衡,便是存在一个产量:
q(q1 ,q2 ,,qn )使得每个企业的利润都达到
最大.即当所有别的企业的产量 qk 时q,k
.
1·2 应用举例 古诺(1838年)提出了纳什所定义的均衡(但 只是在特定的双头垄断模型中),但是他并没有 从理论上系统的定义均衡的意义.古诺的研究 被认为是最早的博弈论的经典文献之一. 此模型告诉我们; (1)如何对一个问题的非正式描述转化为一
个博弈的标准式表述; (2)如何通过计算解出博弈的纳什均衡; (3)重复剔除严格劣战略的步骤.
所选战略的函数,假定企业 的i 收益就是其利润
ui(si,sj)i(qi,qj)qi[a(qiqj)c]
i1 ,j2(i2,j1 )
.
一对战略 (s1, s如2)是纳什均衡,则对每个参与

i,s
i
应满足:
ui(si,sj)ui(si,sj) (NE)

博弈论基础知识.ppt

博弈论基础知识.ppt

The theory of rational choice

The action chosen by a decision-maker is at least as good, according to her preferences, as every other available action.
第一讲( 第一讲(续) 博弈论基础知识
The theory of rational choice
Actions Preferences and payoff functions
epresents a decision-maker’s preferences if, for any actions a in A and b in A, u(a)>u(b) if and only if the decision-maker prefers a to b. – A decision-maker’s preferences convey only ordinal information.
Conditional probability and Bayes’s rule
– –
Conditional probability and Bayes’s rule
条件概率: P ( B | A) = P ( AB ) P ( A)
全概率公式:设试验 E的样本空间为 S, A为 E的事件, B1, B2, Bn为 S的一个划分, P ( Bi ) > ( i = 1, 2,⋯ , n), 0 则: P ( A) = P ( A | B1 ) P ( B1 ) + P ( A | B2 ) P ( B2 ) + ⋯ + P ( A | Bn ) P ( Bn ) 贝叶斯公式: P ( Bi | A) = P ( A | Bi ) P ( Bi )

《博弈论初步》课件

《博弈论初步》课件

THANKS
感谢观看
02
纳什均衡是一种非合作博弈均衡 ,其中每个参与者都认为当前策 略是最好的,不会受到其他参与 者的欺骗或影响。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的策略,逐步逼近纳什均衡。这 种方法适用于较简单的博弈模型,但对于复杂的博弈模型 可能收敛速度较慢。
线性规划法
将纳什均衡问题转化为线性规划问题,通过求解线性规划 来找到纳什均衡。这种方法适用于具有线性特征的博弈模 型,但计算复杂度较高。
价格战与非价格战
博弈论分析了价格战和非价格战的利弊,为企业制定营销策略提供 博弈论可以用来分析选民的投票行为和政治立场,预测选举结果。
02
候选人策略
博弈论为候选人提供了制定最优竞选策略的方法,帮助他们在选举中获
胜。
03
政治联盟与利益交换
博弈论中的合作博弈理论可以用来分析政治联盟的形成和利益交换机制
特征值法
利用特征值和特征向量的性质来求解纳什均衡。这种方法 适用于具有矩阵特征的博弈模型,但需要一定的数学基础 。
纳什均衡的应用实例
1 2
价格竞争
在寡头市场中,企业之间通过价格策略进行竞争 ,最终形成价格均衡,即纳什均衡。
劳资谈判
劳资双方在谈判中会提出自己的工资要求,最终 达成工资协议,这也是一种纳什均衡。
博弈类型
合作博弈
定义
01
参与者通过合作达成共赢的博弈。
特点
02
存在合作协议,强调集体行动和收益分配。
应用场景
03
国际关系、商业合作、团队协作等。
非合作博弈
定义
应用场景
参与者追求各自利益最大化的博弈。
市场竞争、个人决策、资源分配等。

第四篇博弈论PPT课件

第四篇博弈论PPT课件
• 此情况下由于博弈没有可预测的明确的博弈结果,所以就不能 确定博弈方的策略。但是是否在这样的博弈中,各博弈方选择 任何策略都是一样的,因此可以随意选择吗?
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈

硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式

《博弈论教程》课件

《博弈论教程》课件

博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。

博弈论战略分析入门.ppt

博弈论战略分析入门.ppt
EV(雇主)=1/3*1/2*1+1/3*1/2*4+2/3*1/2*2+2/3*1/2*3 =5/2
EV(UTG)= 1/3*1/2*1+1/3*1/2*(-1)+2/3*1/2*0+2/3*1/2*1 =1/3
4,2,0
E 2.5,2.5,0.33
图:简化的加入协会的罢工博弈
第16章 重复博弈
表:努力困境博弈的战略规则和收益(δ =0.9)
注:当社会两难博弈以确定概率重复,而且没有可断定的终点时, 合作性结果优可能成为均衡。
17.2 折现因子
• 折现因子δ:人们为得到一年后的1美 元愿意现在支付的数额。
• v=p*1/(1+r)*Y+(1p)*1/(1+r)*0 =p*1/(1+r)*Y
第17章 无限重复博弈
17.1 重复的努力困境
比尔
工作 推卸
工作 10,10 2,15 安迪 推卸 15,2 5,5
表:一个努力困境博弈
比尔
工作
推卸 针锋相对
工作 100,100 20,150 100,100
安迪
推卸 150,20 50,50 60,47
针锋相对 100,100 47,60 100,100
图:两轮熨衬衫博弈 A

B
2,2

B
A -1,3
熨 A
B 0,0
4,4 1,5 1,5 -2,6
2,2 -1,3
16.3 连锁店悖论
2 1
-2,3
图 :单轮的进入博弈
-2,3 5,5
16.4 恐怖活动
2 1
0,0
2 1
0,0

《博弈论基础》课件

《博弈论基础》课件
●由 VL(σG,σL)=-γ[2θ-1]+3θ 得到流浪汉的反应 对应:γ=1,当θ<0.5;γ∈[0,1],当θ=0.5;γ =0,当θ>0.5
● NE:(σ*G,σL*) σ*G=(0.5,0.5) σL*=(0.2,0.8)
01-3-2
23
● 另解(支付最大法): 一阶条件(FOC): dVG/dθ=0;dVL/dγ=0 γ*=0.2;θ*=0.5
8
2、博弈规则(续)
● “兵来将挡、水来土掩”
● “以不变应万变”、“以静制动”
● 毛主席语录:“人不犯我,我不犯人;人若犯我,我
必犯人”—这里,
人的行动集:{犯;不犯};
人的战略集:{犯;不犯}
我的行动集: {犯;不犯}
01-3-2
9
2、博弈规则(续)
而我的战略集合:{s1,s2,s3,s4} 其中,s1=(犯,犯);s2=(犯,不犯)
若 S1=D,则п1=1/2×0+1/2×2=2
所以,给定 S2*,S1*=U 为参与人 1 的最优战略
01-3-2
33
反之,给定 S1*,S(t21)=L;S(t22)=R 分别是 t21 与 t22 类 型的参与人 2 的最优战略
2.Static B.G 的定义:
{I;{Si};{ui(·)};Θ;F(·)}
(5,4,4) (0,-1,7)
L 1○
R
(-1,5,6) (5,4,4)
01-3-2
29
●SPNE(s1,s2,s3):s1={R};s2:a If 1 Plays R; s3:=r,If 1 Plays L; =r,If L Plays R and 2 Plays a; =l,If L Plays R and2 Plays b
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档