第六章 不完全信息静态博弈与动态博弈的基本理论
不完全信息动态博弈
创立目的就是和波音这样已成规模的公司竞争。
波音早于空客成立,所以当欧洲各国抢占市场时,波音早
已在欧洲站稳脚跟。波音公司先进入市场,就可能出现两种情
况——波音公司是一个“无先发优势”的企业,也可能是一个
“有先发优势”的企业。
第5页
2
波音与空客之战
第五章
不完全信息动态博弈
主要内容
第一节
不完全信息动态博弈
第二节
精炼贝叶斯纳什均衡
第三节
信号博弈
第四节
先验信念、策略互动、后验概率
第 2 页
第一节
不完全信息动态博弈
不完全信息动态博弈特点
波音与空客之战
第3页
1
不完全信息动态博弈特点
不完全信息动态博弈:指至少有一方参与者对于博弈的信息不是
完全了解,并且参与者的行动存在先后顺序。和不完全信息静态
由方程 2q1 q2 8 和 q1 2q2 8 可得:
q1=8/3,q2=8/3
在“无先发优势”条件下波音公司利润π(q1)=64/3,空客
公司利润为π(q2)=10/3。
也就是说,在波音公司是“无先发优势”条件下,空客
公司会选择生产,与波音公司竞争。
第 13 页
第二节
精炼贝叶斯纳什均衡
自己肯定选择策略R,所以对这个动态博弈来说,博弈路径必
定是甲选择策略T,乙选择策略R。
第 22 页
3
不可置信的威胁与可置信的威胁
不可置信威胁又称空洞威胁,是完全没有任何威胁作用的威
胁。比如在上述博弈中,乙为了让甲选择策略N,就对甲说,
如果不选择N,乙会选择策略L,局中人甲得益就是0,但甲选
博弈论——不完全信息静态博弈
3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中。
信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。
不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。
但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。
在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。
3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。
N 首先行动,决定每个局中人的特征。
每个局中人知道自己的特征,但不知道其他局中人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。
这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。
讲义6不完全信息动态博弈
不完全信息动态博弈的模型假设可能受到现实世界的限制。例如,玩家可能不完全了解其他玩家的类型 或策略,而这些类型和策略可能随着时间的推移而改变。这需要进一步研究和改进模型假设。
应用挑战
01 02 03
实际应用中的信息不对称
在不完全信息动态博弈中,信息不对称是一个常见的问题 。例如,在金融市场中,投资者可能不完全了解公司的财 务状况或未来的市场趋势。这使得应用不完全信息动态博 弈更加困难,需要更多的数据和信息来建立准确的模型。
不完全信息博弈的未来研究方向
目前,不完全信息博弈的研究已经涉及许多复杂的问题和挑战,未来的研究需要进一步 拓展和完善该领域的基础理论和方法,以更好地解释和解决现实世界中的问题。
02
不完全信息动态博弈模型
静态博弈与动态博弈的区别
静态博弈
参与人在同时进行决策,且决策 前都不知道其他参与人的类型和 策略。
政策制定
公共资源分配
政策制定者可以利用不完全信息动态 博弈来分析公共资源的分配问题,如 教育、医疗、环保等领域的资源分配 。
税收政策
反垄断政策
不完全信息动态博弈可以用于分析企 业的垄断行为,为政策制定者提供制 定反垄断政策的依据。
政策制定者可以通过分析企业和个人 的博弈行为,来制定合理的税收政策 ,以达到社会福利最大化的目的。
讲义6不完全信息动态博弈
汇报人: 2023-12-15
目录
• 不完全信息博弈概述 • 不完全信息动态博弈模型 • 不完全信息动态博弈的求解方
法 • 不完全信息动态博弈的应用 • 不完全信息动态博弈的挑战与
未来发展 • 不完全信息动态博弈案例研究
01
不完全信息博弈概述
定义与特点
不完全信息博弈
(0.6)
不建厂
2,1
3 ,0
不完全信息静态下市场进入的博弈树
进入E 高建厂成本 [0.4] 建 (0,-1)
不进入D (2,0) E (2,1)
N○
[0.6]
1
低建厂成本
不建
建 不建
2
D
E
(3,0) (1,-1) (4,0) (1)
D E
D
(3,0)
不完全信息静态市场进入模型 --求解思路
不妨假设:
企业1的单位成本c1是共同信息,企业2的单位成本
c2 是其私人信息,它有高成本 c2H 和低成本 c2L两种情 形,设低成本的概率为p,它是双方的共同知识。
• 给定企业 2 知道企业 1 的成本时,企业 2 将最大化其利
润函数:
π2=q2(a-c2-q1-q2),
其中c2=c2H或c2L依赖于企业2的实际成本。 由此可得企业2的反应函数为: q2*(q1, c2)=(a-c2-q1)/2 它不但依赖于企业1的产量q1,而且依赖于自己的成本 c2。分别记q2L、q2H为企业2在低成本和高成本下的最 优反应产量,分别为:
不完全信息静态市场进入模型 --期望收益
• 在位者有两个信息集:高成本类型和低成本类型, 因而有4种纯策略;潜在进入者只有进入不进入两 种纯策略。 • 海萨尼转换后,支付矩阵变为: 潜在进入者 进入 不进入 0.6,-1 3.2,0 1.2,0.2 2.6,0 1.4,-0.2 3.6,0 2,1 3,0
图示——完全信息情形
q2
q1*(q2) 1/2 1/6 1/4 5/12
在完全信息情形下,满足以上条件时, 若企业2为低成本时,纳什均衡产量为 q1*=1/4,q2L*=1/2。 若企业2为高成本时,则企业1和2的纳 什均衡产量分别为5/12和1/6。 完全信息时的纳什均衡
博弈论第六章不完全信息静态博弈题库
博弈论第六章不完全信息静态博弈题库【原创版】目录一、引言二、不完全信息静态博弈的概述1.不完全信息的定义2.静态博弈的定义三、不完全信息静态博弈的解题方法1.严格优势策略2.纳什讨价还价解3.轴向讨价还价解四、应用案例分析五、总结正文一、引言在博弈论中,不完全信息静态博弈是一个重要的研究领域。
由于参与者在博弈过程中所拥有的信息不完全,这使得博弈过程变得更加复杂和有趣。
本文将介绍不完全信息静态博弈的概述,以及探讨如何解决这类问题。
二、不完全信息静态博弈的概述1.不完全信息的定义不完全信息指的是参与者在博弈过程中,无法完全了解其他参与者的策略或支付函数。
这种情况下,参与者需要根据自己所掌握的信息,来猜测其他参与者可能采取的策略。
2.静态博弈的定义静态博弈是指参与者在一定时间内,一次性地选择策略并完成博弈的过程。
静态博弈中,参与者不需要考虑时间顺序,只需关注当前状态下的最优策略。
三、不完全信息静态博弈的解题方法1.严格优势策略在完全信息静态博弈中,如果一个策略对某个参与者来说是严格优势的,那么他会选择这个策略。
在不完全信息静态博弈中,同样可以利用严格优势策略来求解。
即通过分析其他参与者可能采取的策略,找到一个对某个参与者来说严格优势的策略。
2.纳什讨价还价解纳什讨价还价解是解决不完全信息静态博弈问题的一种方法。
通过设计一种讨价还价机制,使得参与者可以在不完全信息的情况下,达成一种合作解。
纳什讨价还价解的关键是让参与者在博弈过程中,有动力去揭示自己的真实支付函数。
3.轴向讨价还价解轴向讨价还价解是另一种解决不完全信息静态博弈问题的方法。
它通过让参与者在博弈过程中,根据其他参与者的策略选择,来调整自己的策略,从而实现一种合作解。
轴向讨价还价解的优势在于,它可以在不完全信息的情况下,使得参与者的收益达到最大。
四、应用案例分析以寡头垄断市场为例,市场中有两个寡头企业,它们需要决定是否进行价格战。
在这个过程中,每个企业都需要考虑对方的策略选择。
不完全信息博弈
不完全信息博弈博弈论在20世纪70年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出一种特别的魅力。
我们主要介绍不完全信息静态博弈与不完全信息动态博弈的一些基本知识,目的是给读者对不完全信息博弈理论及其应有一个初步的了解。
在不完全信息博弈里,参与人并不完全清楚有关博弈的一些信息。
大多数纸牌游戏是不完全信息博弈。
在桥牌里,你并不知道你伙伴手中的牌,也并不知道坐在左右两位对手手里的牌。
你在作决策时,必须对其他三位手中的牌作一个估计,而没有确切的信息。
在拍卖商品或工程招投标中,参加拍卖的潜在买主愿意为拍卖品所支付的最高价格或参加工程招投标的投标者愿意为工程开出的最低价格只能是各个潜在买主或投标者心中的秘密,其他人是不清楚的,即使潜在买主或投标者告诉其他人他们愿支付的最高价格或最低价格,其他人也不会相信他们说的是真的。
当你与一个陌生人打交道时,你并不知道他的特征,如喜欢什么,不喜欢什么。
事实上,即使与你长期共事的人,也很难说你对他有完全的了解;当你想买一件古董或名画时,你并不知道卖主愿意脱手的最低价格是多少,或买主愿意出的最高价格是多少;当一个企业想进入某个市场时,它并不清楚已在市场上的企业的成本函数。
如此等等,这样的例子举不胜举。
类似上述这些不满足完全信息假设的博弈称为不完全信息博弈。
当然,如果对博弈对手一无所知,那么,也就无从博弈。
现实生活中,大多数情况下,虽然对于对手的一些特征不完全了解,但总不至于一无所知。
例如,打牌时,虽然不知道对手具体拿什么牌,但根据自己的牌,还是可以对手的牌有一个估计的,而且,随着牌局的展开,人们会不断改变这些估计。
这些估计,可以用数学上的“概率分布”来表示。
在博弈论中,贝叶斯博弈所指的是:博弈参与者对于对手的收益函数没有完全信息(incomplete information);因此贝叶斯博弈也被称为不完全信息博弈。
在约翰·海萨尼的研究框架下,我们可以将自然(Nature)作为一个参与者引入到贝叶斯博弈中。
博弈论_不完全信息静态博弈
贝叶斯纳什均衡的存在性
贝叶斯纳什均衡的存在性定理 定理3.1.2,见书上第62页,不讲定理的证明 它与第24页的定理2.2.3的比较。定理3.1.2所
要用到的前提条件更强,其原因在于: 在贝叶斯博弈中,局中人i的收益是纯策略下
的期望收益。或,局中人i的收益函数ui(s-i, si, ti)可以随着类型的变化而变化;当ui是si的凹函 数时,其凸组合“∑pi(t-i|ti)×ui(s-i(t-i), si, ti), t-i∈T-I”也是si的凹函数;若拟凹则不成立
义3.1.2做比较 此定义是对纯策略下贝叶斯纳什均衡定义的一
个直接扩展,其中E(ui)是局中人i在混合策略 组合下,对其收益函数ui的数学期望 定理3.1.3:混合策略组合是贝叶斯纳什均衡 的充分必要条件 定理3.1.4:贝叶斯纳什均衡的存在性定理
求解行业博弈的贝叶斯纳什均衡
条件概率 标记混合策略的符号 标记期望收益的符号 计算不同类型下的期望收益 书上的方法:由混合策略下贝叶斯纳什均衡的
对局中人2的计算
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 , -4/3 , 0 建厂 , -4/3 , 0
不建厂 , 1 , 0 不建厂 , 1 , 0
合成后的支付矩阵
局中人 1建厂 高成本
进入
不进入
局中人 1建厂 低成本
进入
不进入
建厂 0, -4/3 2, 0 建厂 1.5, -4/3 3.5, 0
混合策略
在贝叶斯博弈G=[N, {Ti}, P, {Si(ti)}, {ui}]中,局中人i 在类型ti∈Ti下,为每一个纯策略以概率进行选择,则 xi(ti) =(x1(i)(ti), x2(i)(ti), ···, xm_i(i)(ti))称为局中人i在类型 ti下的一个混合策略。有时简写为xi。
第六章 不完全信息静态博弈与动态博弈的基本理论教材
第六章不完全信息静态博弈与动态博弈的基本理论第一节不完全信息静态博弈的基本理论一.不完全信息博弈1.回顾:本课2-4章介绍的均为完全信息博弈。
如何区分完全信息与不完全信息?如何区分完美信息与不完美信息?2.不完全信息博弈又称之为贝叶斯博弈(B ayesian game),在这里,博弈参与人的支付函数不再是博弈的公共知识,至少有一个参与人对另一个参与人的支付函数的了解是不确定的,即该参与人不了解另一个参与人究竟属于何种类型的参与人。
例举生活中不完全信息博弈的情形。
不完全信息博弈包括两种类型:不完全信息静态博弈(又称静态贝叶斯博弈,static B ayesian game)与不完全信息动态博弈(又称动态贝叶斯博弈,dynamic B ayesian game)。
激励机制设计中大量地涉及不完全信息博弈,通过巧妙的机制设计让私人信息拥有者报告自己的真实信息是机制设计的核心任务之一。
二.不完全信息静态博弈的刻画1.例子例一:不完全信息饮酒博弈一个南方人和一个北方大汉在宴会相遇,这个北方大汉酒量大是众所周知的,而这个南方人是否酒量大,只有南方人自己清楚;北方大汉只知道这个南方人有p的概率酒量大,1-p的概率酒量小,这一点也是博弈的公共知识。
具体情形如下:图1:南方人酒量大南方人喝不喝北方人喝不喝图2:南方人酒量小南方人喝不喝北方人喝不喝问题:(1)南方人是否喝?(2)北方大汉是否喝?如果北方人喝,期望支付为多少?北方人不喝,期望支付是多少?例二:不完全信息古诺竞争模型(1)假设该市场上只有两家生产同一产品的企业1和2;市场均衡价格由下式决定: ()P Q a Q =-,其中12Q q q =+,1q 、2q 分别代表企业1和2提供的产量;企业1的生产成本为:111()C q cq =,这一点是博弈双方的公共知识;企业1对企业2的成本函数是不确定的,即企业2的成本函数是企业2的私人信息,企业1只知道企业2的成本函数有θ的概率为:222()h C q c q =,有1-θ的概率为222()l C q c q =,其中h l c c >,这一点也是博弈的公共知识。
博弈论基础
博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
参见:行为生态学(behavioral ecology)。
约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
不完全信息静态博弈Harsanyi(1967-68)提出了一个不完全信息博弈的
β (x)F (x) + (N − 1)β(x) = (N − 1)x
– Typeset by FoilTEX –
4
我们以下定义均以纯策略为例:
不完全信息博弈 要求:虽然每个博弈者并不知道对手 的类型,但是所有类型出现的联合概率分布 F : Θ → [0, 1] 需为共同认识, 其中 Θ = Θ1 × Θ2... × ΘN。 博弈者 i 观察到私人类型 θi 后的效用可以表示为 Ui[s1(θ1), ..., sN(θN)|θi], Ui(·|θi) 是 在给定 θi 下的 von Neumann-Morgenstern 期望效用函 数, 因为其自变量均为随机变量。于是,
– Typeset by FoilTEX –
7
拍卖理论
现代拍卖理论是从 Vickery(1961) 开始的,80 年代以来 快速衍生出大量文献,其中以静态博弈为分析框架 的 拍卖问题主要是围绕收入相等法则(Revenue Equivalence Principle)和联系法则 (Linkage Principle) 两个基本原理展开。
方案 3? A 省在修路的情况下, 其支付额应在 50 万元 的修路费基础上,减去它给 B 省的外部性 30 万元,
– Typeset by FoilTEX –
20
方案 3 为: 如果 A 省上报值与 B 省收益和大于 100 万元,修路,但 A 省只支付 20 万元,B 省支付 50 万 元。
– Typeset by FoilTEX –
第六章 不完全信息静态博弈与动态博弈的基本理论
第六章不完全信息静态博弈与动态博弈的基本理论第一节不完全信息静态博弈的基本理论一.不完全信息博弈1.回顾:本课2-4章介绍的均为完全信息博弈。
如何区分完全信息与不完全信息?如何区分完美信息与不完美信息?2.不完全信息博弈又称之为贝叶斯博弈(B ayesian game),在这里,博弈参与人的支付函数不再是博弈的公共知识,至少有一个参与人对另一个参与人的支付函数的了解是不确定的,即该参与人不了解另一个参与人究竟属于何种类型的参与人。
例举生活中不完全信息博弈的情形。
不完全信息博弈包括两种类型:不完全信息静态博弈(又称静态贝叶斯博弈,static B ayesian game)与不完全信息动态博弈(又称动态贝叶斯博弈,dynamic B ayesian game)。
激励机制设计中大量地涉及不完全信息博弈,通过巧妙的机制设计让私人信息拥有者报告自己的真实信息是机制设计的核心任务之一。
二.不完全信息静态博弈的刻画1.例子例一:不完全信息饮酒博弈一个南方人和一个北方大汉在宴会相遇,这个北方大汉酒量大是众所周知的,而这个南方人是否酒量大,只有南方人自己清楚;北方大汉只知道这个南方人有p的概率酒量大,1-p的概率酒量小,这一点也是博弈的公共知识。
具体情形如下:图1:南方人酒量大南方人喝不喝北方人喝3114不喝4223图2:南方人酒量小南方人喝不喝北方人喝1324不喝4132问题:(1)南方人是否喝?(2)北方大汉是否喝?如果北方人喝,期望支付为多少?北方人不喝,期望支付是多少?例二:不完全信息古诺竞争模型(1)假设该市场上只有两家生产同一产品的企业1和2;市场均衡价格由下式决定:,其中,、分别代表企业1和2提供的产量;企业1的生产成本为:,这一点是博弈双方的公共知识;企业1对企业2的成本函数是不确定的,即企业2的成本函数是企业2的私人信息,企业1只知道企业2的成本函数有的概率为:,有1-的概率为,其中,这一点也是博弈的公共知识。
不完全信息博弈分析
指参与者在同一时间内做出选择的博弈。
静态博弈的策略分析
纯策略
01
指参与者在博弈中采取的单一策略,每个参与者都有若干个纯
策略可供选择。
混合策略
02
指参与者以一定的概率分布随机选择不同的策略,以最大化预
期收益。
优势策略
03
指不论其他参与者选择何种策略,该参与者选择的策略总是最
优的策略。
静态博弈的均衡分析
要点二
详细描述
在囚徒困境中,两个囚犯因为被隔离审讯而无法沟通,每 个囚犯都有坦白和不坦白两种选择。如果双方都不坦白, 则都无罪释放;如果一方坦白而另一方不坦白,则坦白的 一方会被释放而另一方会被判刑;如果双方都坦白,则都 会被判刑。因为无法信任对方,所以每个囚犯都选择了坦 白,最终导致双方都不利的结果。
纳什均衡
指在给定其他参与者策略的情况 下,每个参与者都选择最优策略, 此时所有参与者的策略组合构成 纳什均衡。
优势策略均衡
指在给定其他参与者策略的情况 下,每个参与者都有优势策略可 供选择,此时所有参与者的策略 组合构成优势策略均衡。
风险优势均衡
指在给定其他参与者策略的情况 下,每个参与者选择风险优势最 大的策略,此时所有参与者的策 略组合构成风险优势均衡。
序贯均衡
在给定自己类型和他人的类型概率分布的情况下,每个参 与人在每个决策节点上选择最优策略,使得期望效用最大 化。
PART 03
不完全信息静态博弈
静态博弈的基本概念
博弈
指参与者在给定信息的情况下,根据各自的策略 进行选择,并最终获得收益的过程。
不完全信息
指参与者在博弈中无法完全掌握其他参与者的信 息,如其他参与者的类型、偏好等。
讲义6不完全信息动态博弈
不完全信息动态博弈的特点
信息不完全
每个参与者在博弈过程中只能观 察到部分信息,无法完全掌握其 他参与者的类型、偏好、策略等 信息。
动态性
不完全信息动态博弈是一个动态 的过程,每个参与者需要根据其 他参与者的行为和反馈来不断调 整自己的策略和信念。
重复性
不完全信息动态博弈往往是一个 重复博弈的过程,参与者在每次 博弈中都需要考虑长期利益和短 期利益的平衡。
不完全信息动态博弈的应用场景
商业竞争
在商业竞争中,企业之间往往存在着信息不对称的情况,不完全信息动态博弈可以用来分析企业之间的竞争策略和合 作模式。
政治选举
在政治选举中,候选人和选民之间存在着信息不对称的情况,不完全信息动态博弈可以用来分析选举结果和选民的行 为模式。
讲义6不完全信息动态博弈
汇报人:文小库 2024-01-06
目录
• 不完全信息动态博弈概述 • 不完全信息动态博弈的基本理
论 • 不完全信息动态博弈的策略与
实例
目录
• 不完全信息动态博弈的扩展与全信息动态博弈概述
不完全信息动态博弈的定义
不完全信息动态博弈是指在博弈过程 中,参与人对其他参与人的类型、偏 好、策略等信息不完全了解,需要不 断通过观察和推断来更新自己的信念 。
金融投资
在金融投资中,投资者和被投资对象之间存在着信息不对称的情况,不完全信息动态博弈可以用来分析 投资者的投资策略和风险控制。
02
不完全信息动态博弈的基本理 论
博弈的四种基本类型
博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。
例如,囚徒困境。
2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争。
3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈。
4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。
例如,信号传递博弈。
每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。
例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。
完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。
不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。
不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。
例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。
博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。
举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。
你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。
二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。
举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。
不完全信息静态博弈案例
不完全信息静态博弈案例不完全信息静态博弈是博弈论中的一个重要概念,它描述了参与者在博弈过程中并不了解对手的全部信息,从而导致决策的不确定性和复杂性。
本文将通过一个简单的案例来解释不完全信息静态博弈的基本概念和特点。
假设有两位商人A和B,他们分别经营着两家竞争性的商店。
他们需要在某一天决定是否要举行促销活动。
如果A决定举行促销活动而B不举行,A将会获得10个单位的利润,而B将会获得0个单位的利润;如果A和B都不举行促销活动,他们各自将会获得5个单位的利润;如果A不举行促销活动而B举行,A将会获得0个单位的利润,而B将会获得10个单位的利润。
在这个案例中,A和B在做出决策的时候并不了解对方的决策,这就构成了不完全信息静态博弈的情形。
在这个案例中,A和B都面临着不确定性和风险。
他们需要在不了解对方决策的情况下做出自己的决策,这就需要他们根据自己的利益和对方可能的行为来进行推断和决策。
在这种情况下,他们可能会采取不同的策略来应对对方的行为,比如采取保守策略或者冒险策略。
不完全信息静态博弈的特点在于参与者并不了解对手的全部信息,这就需要他们根据自己的判断和推断来做出决策。
在这个案例中,A和B都需要考虑到对方可能的行为,并根据自己的利益来选择最优的策略。
这就需要他们运用博弈论中的相关概念和方法,比如纳什均衡和最优反应等。
在不完全信息静态博弈中,参与者需要根据自己的利益和对手可能的行为来做出决策。
他们需要在不确定性和风险的情况下做出最优的选择,这就需要他们具备一定的推断能力和决策技巧。
同时,他们也需要考虑到对手的可能行为,并根据对手的行为来调整自己的策略。
总之,不完全信息静态博弈是博弈论中的重要概念,它描述了参与者在博弈过程中并不了解对手的全部信息,从而导致决策的不确定性和复杂性。
在这种情况下,参与者需要根据自己的利益和对手可能的行为来做出最优的选择,这就需要他们具备一定的推断能力和决策技巧。
不完全信息静态博弈的研究不仅有助于我们更好地理解博弈过程中的决策行为,也对实际生活中的决策问题具有一定的启发作用。
不完全信息静态博弈a
逆向归纳法的求解步骤
首先确定博弈的最后一个阶段,分析参与人在该阶段的最优策略;然后逐步向前推导,将每个阶 段的最优策略组合起来,形成整个博弈的最优策略。
线性规划法
01
线性规划法的基本思 想
将博弈问题转化为一个线性规划问题 ,通过求解线性规划的最优解来得到 博弈问题的解。
02
线性规划法的适用条 件
适用于具有线性目标函数和线性约束 条件的博弈问题。
03
线性规划法的求解步 骤
首先构建博弈问题的线性规划模型, 包括目标函数和约束条件;然后使用 线性规划算法求解该模型,得到最优 解;最后将最优解转化为博弈问题的 解。
启发式搜索算法
启发式搜索算法的基 本思想
利用启发信息来指导搜索过程, 提高搜索效率。
随着计算机技术的发展,博弈论在人工智能、机 03 器学习等领域也得到了广泛应用。
完全信息与不完全信息
01 完全信息是指参与方在博弈过程中拥有所有相关 信息,能够做出最优决策。
02 不完全信息是指参与方在博弈过程中只能获取部 分信息,无法做出最优决策。
02 在现实世界中,由于信息不对称和不确定性等因 素的存在,不完全信息博弈更为常见。
不完全信息静态博弈 a
目录
• 博弈论基本概念 • 不完全信息静态博弈原理 • 经典案例分析 • 现实应用举例 • 求解方法与算法设计 • 未来发展趋势及挑战
01
博弈论基本概念
博弈论定义与发展
博弈论是研究决策过程中各参与方相互作用和影 01 响的理论。
博弈论起源于数学领域,后逐渐应用于经济学、 02 政治学、社会学等多个领域。
博弈论——不完全信息静态博弈讲义
3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中。
信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。
不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。
但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”()。
在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。
3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
(1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。
N 首先行动,决定每个局中人的特征。
每个局中人知道自己的特征,但不知道其他局中人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。
这种转换被称为“转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1Λ=。
不完全信息静态博弈中,局中人的类型存在多种可能,因而与局中人相关的各种概念都随其类型的不同而不同。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章不完全信息静态博弈与动态博弈的基本理论第一节不完全信息静态博弈的基本理论一.不完全信息博弈1.回顾:本课2-4章介绍的均为完全信息博弈。
如何区分完全信息与不完全信息?如何区分完美信息与不完美信息?2.不完全信息博弈又称之为贝叶斯博弈(B ayesian game),在这里,博弈参与人的支付函数不再是博弈的公共知识,至少有一个参与人对另一个参与人的支付函数的了解是不确定的,即该参与人不了解另一个参与人究竟属于何种类型的参与人。
例举生活中不完全信息博弈的情形。
不完全信息博弈包括两种类型:不完全信息静态博弈(又称静态贝叶斯博弈,static B ayesian game)与不完全信息动态博弈(又称动态贝叶斯博弈,dynamic B ayesian game)。
激励机制设计中大量地涉及不完全信息博弈,通过巧妙的机制设计让私人信息拥有者报告自己的真实信息是机制设计的核心任务之一。
二.不完全信息静态博弈的刻画1.例子例一:不完全信息饮酒博弈一个南方人和一个北方大汉在宴会相遇,这个北方大汉酒量大是众所周知的,而这个南方人是否酒量大,只有南方人自己清楚;北方大汉只知道这个南方人有p的概率酒量大,1-p的概率酒量小,这一点也是博弈的公共知识。
具体情形如下:图1:南方人酒量大南方人喝不喝北方人喝不喝图2:南方人酒量小南方人喝不喝北方人喝不喝问题:(1)南方人是否喝?(2)北方大汉是否喝?如果北方人喝,期望支付为多少?北方人不喝,期望支付是多少?例二:不完全信息古诺竞争模型(1)假设该市场上只有两家生产同一产品的企业1和2;市场均衡价格由下式决定: ()P Q a Q =-,其中12Q q q =+,1q 、2q 分别代表企业1和2提供的产量;企业1的生产成本为:111()C q cq =,这一点是博弈双方的公共知识;企业1对企业2的成本函数是不确定的,即企业2的成本函数是企业2的私人信息,企业1只知道企业2的成本函数有θ的概率为:222()h C q c q =,有1-θ的概率为222()l C q c q =,其中h l c c >,这一点也是博弈的公共知识。
两家企业同时选择自己的产量以最大化自己的利润。
问题:请问两家企业应该如何确定自己的利润最大化产量。
(2)模型分析A .求解企业2的产量选择显然,不同成本类型的企业会选择不同的产量水平,即企业的产量选择是与成本挂钩的,于是企业2的产量选择有两种情形:2()h q c 与2()l q c 。
当企业2属于h c 类型时,2*212max ()q h q a q q c π=---当企业2属于l c 类型时,2*212max ()q l q a q q c π=---由上述两个规划问题的一阶条件,有:*2()h q c =*12h a q c --;*2()l q c =*12l a q c --B .求解企业1的产量选择1*121max (())q h a q q c q θ--+(1-θ)*1211(())l a q q c q cq ---(思考:为什么这么写?)由上式的一阶条件,有:***221(())(1)(())2h l a q c c a q c c q θθ--+---=C .联立三个一阶条件生成的方程组,可以得*221()()36h h h l a c c q c c c θ-+-=+-; *22()()36l l h l a c c q c c c θ-+=-- *12(1)3h l a c c c q θθ-++-=(3)将上述结果与完全信息条件下的结果进行比较,h c 与l c 型企业在哪一种情形生产得更多?为什么?(导致这一局面的根本原因不仅在于企业的产量要受自己成本水平的影响,更在于双方的信息不对称)这个例子有意思的地方在于:如果企业2是一家低成本企业,其信息优势地位反而会使自己吃亏。
所以,在博弈时并不见得知道得越多、掌握的信息越多就一定越好(生活中还有大量的这种情形,为什么会这样?根源恰好在于信息劣势方追求期望支付最大化)。
(4)不完全信息静态博弈的其他经典案例:密封第一价格拍卖;密封双边拍卖。
(5)来自不完全信息古诺竞争模型的启示尽管在不完全信息静态博弈中,参与人的行动集与完全信息静态博弈时相同,但是与完全信息静态博弈相比,现在有了两个明显的变化:一是企业2的类型可能是两者之一,从而使得它的支付函数也可能是两者之一;二是企业1必须对企业属于何种类型进行推断。
2. 类型(type )、信念(blief )(1)类型:博弈论用“类型”表示每个参与人在博弈中可能具有的支付函数情形。
以i T 表示i 的类型集,记i i t T ∈表示i 的一个可能的类型,所以,i t 对应着参与人i 可能具有的一种支付函数,记1(i t t -=…1i t -,1i t +…)n t 为其他参与人的类型组合。
思考:写出上述不完全信息古诺竞争中两个参与人的类型集以及支付函数。
由上可知,参与人知道自己的支付函数就等价于他知道自己的类型。
(2)信念: 即概率分布,以(i i p t -∣)i t 表示i 在已知i t 的其他条件下对其他参与人的类型i t -的信念,即对其他参与人属于何种类型进行推断。
一般来说,参与人之间的类型是相互独立的,所以,i 对i t -的信念可以记为()i i p t -(中国的文化大革命期间就曾认为人与人之间的类型不独立,如:老子英雄儿好汉,老子狗熊儿混蛋;中国传统文化也认为“龙生龙,凤生凤”)。
附:B ayes’ rule(贝叶斯法则):即条件概率的计算公示,(,)()()P A B p A B P B =3.不完全信息静态博弈的标准型表示(1)回顾:如何用标准型表示完全信息静态博弈?G ={1S …i S …n S ;1U …i U …n U }。
其中,i S 可能是有限的,也可能是无限的,记i i s S ∈为i 的一个具体策略;i U 的一般形式为:1(i U s …2s …)n s 。
由于在完全信息静态博弈中策略集与行动集是相同的,所以完全信息静态博弈又可以表示为如下:G ={1A …i A …n A ;1U …i U …n U },其中,i A 为i 的行动集,记i i a A ∈为i 的一个具体行动;i U 的一般形式为:1(i U a …2a …)n a 。
由上述刻画可以看出完全信息静态博弈的时间路径(或扩展路径)为:首先,所有参与人同时从自己的行动集中选择自己的行动;然后,所有参与人的行动选择共同决定了每个参与人的支付1(i U a …2a …)n a 。
(2)不完全信息静态博弈的标准型表示n 人不完全信息静态博弈可以用标准型表示为G ={1A …i A …n A ;1T …i T …n T ;1p …i p …n p ;1U …i U …n U },其中,i A 为i 的行动集,i T 为i 的类型集,i p =(i i p t -∣)i t 表示i 给定自己的类型为i t 的条件下对其他所有参与人的类型的信念,i U =1(i U a …i a …;)n i a t 表示参与人i 的类型是私人信息情形下的支付函数。
思考:为什么这里的标准型表示没有写出参与人的策略集?与第一章讲的标准型表示相比,这里真正的差异在哪里?注:(1)“类型”这个概念的实际表达作用其实非常大,大到同一个参与人在不同情形下有不同的行动集也可以用类型集来表示,只要略作数学技巧上的处理即可。
(2)参与人的支付函数可能也依赖于其他参与人的类型,如果出现这种情况,这意味着什么?(3)不完全信息静态博弈的扩展型表示与Harsanyi (1967)转换首先,自然按照某一先验概率分布选择参与人的类型;然后,参与人只能观测到自然对自己类型的选择,而不能观测到自然对其他参与人的类型选择,他只知道其他参与人的类型是以某个概率分布被选择的;再次,参与人同时选择自己的行动;最后,所有参与人的行动选择连同自然的选择共同决定了参与人的支付。
注:这个定义主要是针对每个参与人的类型均是自己的私人信息这种情形的。
参与人对其他参与人属于何种类型的推断是利用贝叶斯法则从先验概率分布中推断出来的。
例子:假设企业的产量选择只有两种情形:高产量与低产量,请画出例二(不完全信息古诺竞争模型)的扩展型简图。
从简图可以看出:Harsanyi 转换的核心就是将不完全信息静态博弈转换为完全但不完美信息动态博弈(Harsanyi 转换中的信息不完美是如何体现出来的?Harsanyi 将不完全信息静态博弈转换为完全但不完美信息动态博弈的关键步骤是什么?在这里,完全信息又是如何体现出来的?)。
Harsanyi 转换使得不完全信息静态博弈变得可以求解。
三.不完全信息静态博弈的求解1. 策略(1)回顾什么是策略?(2)依据对策略的理解,在不完全信息静态博弈中,参与人i 的策略被定义为函数:i i i s t a →,记为()i i s t (思考:这是什么意思?)。
所以,集合i T 与i A 之间所有可能的函数形式被构成了参与人i 的策略集i S 。
特别注意:一个策略就是一个函数形式,不要以为策略是某函数的一个取值。
思考:写出不完全信息古诺竞争模型中企业1和企业2的策略形式。
(3)分离策略(separating strategy )与混同策略(pooling strategy ):前者是指每种不同的类型选择不同的行动;后者是指所有类型或某些类型选择相同的行动。
这两个概念在不完全信息动态博弈中更加重要。
一旦均衡时参与人选择了分离策略,人们就能够从策略的使用区分参与人的类型。
(4)一个进一步的疑问:我明明已经知道了我的类型,为什么我在制定策略时还要考虑一旦其他类型出现时我将采取的行动?或者说,为什么我还要针对其他明明不会出现的类型规定好自己的行动选择?之所以需要这样,关键是因为对手们并不知道参与人i 究竟属于何种类型,而在博弈时参与人i 必须考虑对手们将会如何行动,而对手们将如何行动又取决于这些对手们认为参与人i 在每种类型下将如何行动。
由此,参与人i 即便已经知道了自己的类型,他依然需要考虑在其他情形下如何行动。
这一点从不完全信息古诺竞争模型的反应函数中看得非常清楚:企业1的反应函数告诉我们,企业1的产量选择必须考虑企业2在不同类型下的产量选择。
而企业1的产量选择又影响企业2的产量选择,于是,企业2即便已经知道自己属于何种类型,他也必须考虑在不同类型下的产量选择,这就意味着企业2的产量选择计划必须考虑所有的可能类型,否则,企业2无法确定自己的最优反应产量。
即企业2之所以要考虑自己所有可能的类型,根源在于对手并不清楚企业2属于何种类型以及双方的决策必须考虑对手的反应。