第七讲(多人博弈)
博弈论完整版PPT课件
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
第七讲 信息与博弈
从博弈论的角度,博物馆通过收费的形 式,把真正的科学爱好者、艺术爱好者与所 谓的“闲杂人员”甄别开来,以更好地保证 优质服务。
指鹿为马
赵高想要叛乱(篡夺秦朝的政权),恐怕各位 大臣不听从他,就先设下圈套设法试探。于是带来 一只鹿献给秦二世,说:“这是一匹马。”二世笑 着说:“丞相错了吧?您把鹿说成是马。”问身边 的大臣,左右大臣有的沉默,有的故意迎合赵高说 是马,有的说是鹿,赵高就在暗中假借法律中伤 (或陷害)那些说是鹿的人。以后,大臣们都畏惧 赵高。
赵高所采用的方法其实就是信息甄别的 一个典型选择。
保险公司通常要求潜在的投保人从各种具有不 同的免责条款和共同保险条款的方案中进行选择, 风险较小的投保人就会偏好于保险费较低但要求其 本人承担大部分风险的方案,而那些知道自己有较 高风险的投保人则会选择保险费较高而本人承担风 险较少的方案。这样,方案选择便反映出投保人的 风险类型。
上市公司的过度分红
在很多国家,政府对红利征税的税率比资本增 值的税率要高,通常政府对红利征税两次:一次对 公司,一次对个人,而对资本增值只对个人征税一 次。 因此,利润再投资自然比分红更符合股东利益, 但很多公司仍然热衷于分红。
公司的管理层与股民之间信息是不对称,他们 比股民更清楚地知道公司的真实业绩。在这种情况 下,业绩好的公司就采取多发红利的办法来向股民 发出信号,以区别于业绩不好的公司,而后者发不 出红利。 证券市场对分红这一信号的回应是股价上升, 从而补偿了股民因为分红交纳较高的税而蒙受的损 失。
在博弈中,往往会出现某些参与者所知 道的信息而另一些参与者并不知道的情况, 这种信息就是拥有信息一方的私有信息。正 是因为私有信息的存在,才导致了“信息不 对称”。
罗斯柴尔德家族的“凯旋门”
浙大《博弈论基础》蒋文华 第七讲 最后通牒和讨价还价
眼光的高度
请问:您最大的人 视野的宽度
生目标是什么? 5年后,10年后,
思维的深度
目标
20年后,30年后?
与时俱进
子
问
目 标
题
方法
踩空
现实
时间
抬头看山、低头走路
浙江大学校训
诸位来到这里,有两个问题需 要好好回答:一个是你到这里来 干什么?另一个是将来你将到哪 里去?
——竺可桢
特别提示:
“磨刀不误砍柴功”,误与不误, 取决于你想要砍多少柴!
三个道理:
第一,人们在决定其行动时,并不会仅仅 考虑到其经济利益,虽然这可能是最主 要的一个考量,他们也会考虑一些道德 和社会规范,比如公平原则,“己所不 欲,勿施于人”。
三个道理:
第二,一个社会如果在制度安排上能够 给人民更多可以拒绝(可以说“不”) 的权利,那么这个社会就会产生更多的 公平性,甚至会带来更多的效率改善。
提出分配方案
出价 X%
接受
(1-X,X) 拒绝 (0,0)
如果总金额是10万元,你的分配方案是多少?
第二节 最后通牒的实验结果
实验表明,大多数A分配给B的钱在40-50 元之间,给50元以上的情况极少见,如果 分配数量小于20元,方案被拒绝的概率很 高(约40%-50%),拒绝的可能性随着钱 数的减少而不断增大。
第三节 独裁者博弈
一、独裁博弈的设计
两人一组分100元,提议者提出分配方案,分 给响应者X元,留给自己100-X元;而无论响应 者同意与否,提议者都将得到自己的100-X元。 显然,此时提议者不会遭遇响应者的任何威胁。 基于纯粹利己的标准的博弈理论所得到的结果 将是提议者分给响应者0元(X=0)。
第二节 贴现因子
博弈论经典多人博弈
博弈论经典多人博弈艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。
也就是说,个人可以完全按照自己利益最大化的企图进行决策。
在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。
社会实践中有很多合作的问题。
比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。
在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。
对策论以著名的囚犯困境来描述这个问题。
A和B各表示一个人,他们的选择是完全无差异的。
选择C代表合作,选择D代表不合作。
如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。
显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。
如果一方选C,一方选D,总体得5分。
如果两人都选D,总体得2分。
对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。
在矩阵中,对于A来说,当对方选C,他选D得5分,选C只得3分;当对方选D,他选D得1分,选C得零分。
因此,无论对方选C或D,对A来说,选D都得分最多。
这是A单方面的优超策略。
而当两个优超策略相遇,即A,B都选D时,结果是各得1分。
这个结果在矩阵中并非最优。
困境就在于,每个人采取各自的优超策略时,得出的解是稳定的,但不是帕累托最优的,这个结果体现了个体理性与群体理性的矛盾。
在数学上,这个一次性决策的矩阵没有最优解。
如果博弈进行多次,只要对策者知道博弈次数,他们在最后一次肯定采取互相背叛的策略。
既然如此,前面的每一次也就没有合作的必要,因此,在次数已知的多次博弈中,对策者没有一次会合作。
多群体演化博弈均衡的渐近稳定性分析及其应用
多群体演化博弈均衡的渐近稳定性分析及其应用毕业论文标题1:群体演化博弈的基本理论和方法群体演化博弈是博弈论中的一种经典模型,其理论和方法已被广泛应用于社会、经济、生物学等领域。
本文首先介绍了群体演化博弈的基本理论,包括博弈矩阵、策略演化规则、博弈过程等关键概念。
随后,对利用演化博弈解决各类艰难问题的方法进行了详细描述。
最后以经典的“囚徒博弈”为例,说明了群体演化博弈所能提供的分析和预测能力。
群体演化博弈的理论和方法,是理解和应用群体行为的关键。
运用群体演化博弈模型可以模拟和预测自然和社会群体的行为变化,有助于研究决策制定的规律,以优化价值最大化的效果。
毕业论文标题2:多群体演化博弈的模型构建与分析本文主要研究在多个群体互相作用的情况下,多群体演化博弈的模型。
首先,通过对博弈矩阵和策略演化规则进行修正,构建了一个新的博弈模型。
然后,对该博弈模型中的各种策略演化规则进行了分析、比较,得出了策略演化路径的影响因素,并研究了不同演化路径所对应的群体策略和演化动态。
多群体演化博弈模型的研究和构建,有助于更好地理解多群体群体行为并进行预测。
此外,多群体演化博弈模型可以帮助制定群体调控方案,以更好地引导群体行为。
毕业论文标题3:博弈背景下的社会网络研究本文首先介绍了社交网络的基本理论,包括社交网络结构、社交网络度量、社交网络模型等基础知识。
然后,通过建立社交网络与博弈之间的关系,探讨了社交网络研究在博弈背景下所发挥的作用,并解释了社交网络对博弈演化和均衡的影响。
最后,结合聚类分析和仿真实验等方法,探讨了社交网络中不同因素对博弈策略的影响。
社交网络与博弈理论的结合,可以帮助更好地了解人类行为的规律。
在特定的博弈规则下,不同的社交网络结构和属性可以促进/阻碍策略的演化和均衡的保持。
社交网络与博弈的研究,对于了解社会现象的本质、制定公共政策等方面有着重要的指导意义。
毕业论文标题4:演化博弈模型在市场竞争中的应用本文主要研究了群体演化博弈模型在市场竞争中的应用。
基于神经网络的多人博弈智能决策模型
基于神经网络的多人博弈智能决策模型引言:多人博弈一直是人工智能领域中的一个重要研究方向。
博弈中的每个参与者都追求自己的利益,并考虑其他参与者的策略。
为了使智能体在多人博弈中做出最佳决策,神经网络成为一种非常有潜力的工具。
本文将介绍一种基于神经网络的多人博弈智能决策模型,并探讨其在实际应用中的潜力。
1. 引言多人博弈是指涉及多个决策者的决策过程。
决策者需要权衡自己的行动以及其他参与者的行动,以达到最佳结果。
传统的多人博弈理论主要依赖于数学模型和博弈论的方法来解决这个问题。
然而,随着神经网络的兴起,开发基于神经网络的决策模型已经成为一个热点研究领域。
2. 神经网络与多人博弈神经网络是一种模拟人脑神经元网络的计算模型。
它由多个节点(神经元)和连接节点之间的权重(突触)组成。
神经网络通过学习数据的模式和规律,能够预测未知数据的结果,并做出相应的决策。
在多人博弈领域,神经网络被用来建立参与者的决策模型。
3. 多人博弈智能决策模型基于神经网络的多人博弈智能决策模型包括以下步骤:3.1 数据收集与处理首先,需要收集多人博弈中的相关数据。
这些数据可以包括参与者的历史决策,游戏规则,以及其他相关信息。
然后对这些数据进行预处理,包括特征提取和归一化等方法。
3.2 模型训练接下来,使用收集到的数据训练神经网络模型。
训练过程可以通过监督学习、强化学习或生成对抗网络等方法进行。
在训练过程中,模型会通过调整网络参数来最小化预测结果与真实结果之间的差异。
3.3 决策预测与优化一旦模型训练完成,可以使用该模型来预测每个参与者的决策。
神经网络能够通过学习和总结历史数据中的模式来做出决策。
同时,模型还可以通过优化方法对决策进行调整,以达到更好的结果。
4. 实际应用与潜力基于神经网络的多人博弈智能决策模型在实际应用中具有广泛的潜力:4.1 社交网络分析社交网络中存在大量的多人博弈场景,例如社交媒体上的舆论引导、政治选举等。
基于神经网络的决策模型可以帮助分析参与者的策略,并预测结果。
第七讲 当前大国关系调整的新态势新特点新趋势
第七讲当前大国关系调整的新态势新特点新趋势北京国际问题学者洪成程教学目的: 2008年国际金融危机以来,美国、俄罗斯等大国对外政策酝酿新的调整,大国关系进入了一个深度调整期。
大国力量对比发生重要变化,越来越多的新兴大国在大国关系中发挥日益重要的作用,以欧美为中心的大国关系地缘重心面临调整,尤其是近期,美、俄、欧围绕乌克兰危机进行了多轮博弈,地缘战略博弈进一步加剧。
当前大国是合作多于角力,还是碰撞多于握手?大国关系调整过程中呈现什么新态势,对世界格局有哪些趋势性影响?通过教学,要让大学生认清大国关系的复杂性,调整、碰撞、依存是大国相处之道。
课程内容: 1.世界主要大国调整新态势2.当前大国关系调整的新特点3.当前大国关系调整的趋势性影响大国关系历来是牵动世界和平与发展的重要因素。
冷战结束以来,尤其是2008年国际金融危机以来,经济全球化、社会信息化、世界多极化深入发展,大国关系经历新一轮深刻调整。
各主要大国因应全球战略环境深刻变化,着眼增强综合国力和国际竞争力,纷纷推进对外战略调整,在政治上分化重组、经济上融合竞争、文化上交流交锋,形成既竞争制约又合作协调的大国关系态势,对今后一个时期国际和地区格局产生深远影响。
一、世界主要大国关系调整新态势1.美俄关系在起伏跌宕中重新走向较量冷战时期,苏美关系是影响重大国际地区事务走向的主要因素。
冷战结束后的俄美关系,其重要性、特殊性虽有所下降,但仍是当代国际关系中最重要的双边关系之一,其走势始终牵动国际战略全局。
苏联解体后,美俄两国对发展相互关系曾寄予期望,采取了一系列相关政策和措施,两国关系出现了短暂的“和谐”。
但从1994年开始,美囤通过北约东扩压缩俄罗斯的地缘战略空间,策动“颜色革命”推动原苏联国家的“民主化进程”,鼓励有关国家对俄罗斯的“离心倾向”,在欧洲分阶段部署导弹防御系统。
这些举动一再打击俄罗斯的西靠热情,导致美俄关系逐步趋冷。
2001年“9.11”事件发生后,美国反恐战争得到了俄罗斯积极支持,美俄关系迅速回暖。
第7讲不确定性与博弈论
• 大自然的变化无常等。
2020/11/22
三、减少风险和降低不确定性的方法
(一)投机(Speculation) • 定义——指从市场价格波动中获取利益
的行为。基本做法是:低价买进,高价 卖出;对买进和卖出的商品本身不直接 感兴趣。
• 原理:利用商品在空间上和时间上的价 格和数量差异实现转移,以促进市场功 能更加有效的发挥作用。
定对方 ✓ 监管/不被监管 ✓ 金融信用受到保护(保证金与盯市制度)/无保证
金制度 2020/11/2✓2 很容易被中止(对冲平仓)/通常不可能中止
• 功能(原理): 转移价格风险;(两面下注,相反操作) 形成权威性价格; 调控价格水平; 提高效率、稳定收益。
• 实例:农产品期货交易(玉米商品) (此例的前提是——未来玉米价格看跌)
➢参与人(players) 行动(actions) 信息(information)
➢策略(strategies) ➢支付(payoffs)
结果(outcome) 均衡(equilibria)
行动规则 (Rules of the game)
建模者的目的:在于运用博弈的规则来确定均衡。
2020/11/22
效率(efficiency)、公正(fairness)、
公平(equality)。
区别的实质:建模的途径不同。
2020/(11/合22 作博弈理论是公理性的,非合作博弈更具有经济上的特点)
非合作博弈类型
行动顺序 信息
静态
动态
完全信息
完全信息静态博弈; 纳什均衡; 纳什(1950,1951)
完全信息动态博弈; 子博弈精炼纳什均衡; 泽尔腾(1965)
团队合作中的博弈问题解决
团队合作中的博弈问题随着社会的进步,组织之间的竞争日益加剧, 为了支持和满足组织持续创新的要求, 由不同技能的人员构成团队一起工作已成为明显的趋势。
团队正成为企业中关键的组织单位。
人们越来越清晰的认识到,很多复杂的任务都不是一个人可以完成的。
它往往是同时需要几个人相互帮助,分享信息,共同合作才能达到的目标。
而团队的优势就在于通过团队成员的密切合作和努力产生工作上的协同效应, 从而提高组织创新和完成复杂任务的工作效率, 同时使团队收益大于成员独立工作时的收益之和。
但是对于团队中的收益分配和个人激励问题一直都是组织的一大困扰。
因为很多时候团队中的成员都会从自身收益来考虑,导致了合作的失败。
团队合作问题其实就是一系列的博弈问题,那么,我们试着用博弈的观点来解决这个问题。
一、团队合作中的搭便车现象——智猪博弈模型在一个团队中,总是有能力强者和能力相对较弱的一方。
而涉及到团队合作的时候,能力强的总是不愿与较差者合作。
这在现实生活中是很普遍的。
那么,为什么出现这样的情况呢?现在,我们利用智猪博弈来讨论一下这个问题。
博弈双方在合作中都有两种策略空间:“行动”和“等待”。
当小组完成任务总分为20分,完成质量不好总分减半,整个工作是两个人的分量。
无论工作完成质量好坏,由于是共同合作模型,所获得的收益应该均分。
但是因为团队合作中,能力强者承担的任务自然重些,所付出的时间和精力也比弱者多一些,故设强者支出3,而能力弱者承担的任务相对小一些,付出的时间和精力也相对较少,故弱者支出为1。
而对于每一个人都有两种选择:行动和等待。
若两者都选择行动,那么,强者支出3,弱者支出1,完成任务后两人的收益为7:9,:若较强者选择行动,而弱者等待,迫于无奈较强者做两个人的份额才可以完成任务,则强者支出为6,而较弱者不需要支出,由于强者能力高,完成任务的质量自然较高,故团队获得满分20。
那么最终两人的收益为4:10;若弱者选择行动,而强者选择等待,那么弱者就付出双倍精力才可以完成任务,则弱者支出为2,强者支出为0,但是由于弱者能力不够,导致任务完成质量下降,则任务总收益减少一半,获得10分,则最终两人的收益比为5:3:当然,如果两人都选择等待,那么最终收益为0:0。
身边的管理学02-多人决策中的博弈思维
博弈论
• 又称为游戏论 • 是研究决策主体的行为在直接
相互作用时,人们如何进行决 策、以及这种决策如何达到均 衡的问题
约翰·冯·诺依曼(1903-1957)
博弈实例:旅行者博弈
航空公司丢失了两位互相不认识乘客的旅行包。两个旅行包正 好都是一样的,并且里面有相同价值的古董,两位乘客都向航 空公司索赔100美元。为了评估出古董的真实价值,公司经理 将 两位乘客分开以避免两人合谋,分别让他们写下古董的价值, 其金额要不低于2美元,并且不高于100美元。同时还告诉两人: 如果两个数字是一样的,那么会被认为是其真实价值,他们能 获得相应金额的赔偿。如果数字不一样,较小的会被认为是真 实价值,而两人在获得这个金额的同时有相应的奖赏/惩罚: 写下较小金额的会获得2美元额外的奖励,较大的会有2美元的 惩罚。
问:旅行者如何决策
博弈的基本构成要素
1 参与人或局中人 2 策略集:它是局中人指可选择的策略和行动空间
3 效用:指参与人的利益,也是所有参与人真正关心的东
西 ,又称得益或得益函数
4 信息:指的是参与人在博弈过程中能够了解和观察到的知
识,特别是有关其他参与人(对手)的特征和行动的知识
旅行者博弈收益矩阵
博弈均衡
博弈均衡的意思就是参与人的这 样一种策略组合,在该策略组合 上,任何参与人单独改变策略都 不会得到好处。
因博弈论获得诺贝尔经济学奖的学者
John Nash RobeJratmJ.eAnhard Selten
John Harsanyi
WilTlihaommVaisckCr.eSychelling
关于博弈论
• “要想在现代社会做一个有文化的 人,你必须对博弈论有一个大致了 解。”
第七讲集体行动、利益集团与制度
集体行动与制度选择
分利集团理论的观点可概括为这样几个 方面
第一,在不同的制度环境下,分利集团 的影响是不一样的。
第二,分利集团通过再分配等使一国制 度僵化。
第三,假使其它情况均保持不变,一个 国家的经济增长率与利益集团的活动水 平呈反向变化。
(4)“总的来说,社会中的特殊利益组织或集团会降 低社会效率和总收入,并使政治社会中的分歧加 剧”;
集体行动与制度选择
(5) 广泛性组织一般都倾向于促使其所在的社 会更加繁荣昌盛,并力图在为其成员增加收 入份额的同时,尽可能地减轻其额外负担, 从而只有当国民收入在分配中所产生的利益 与由此引起的全社会损失相比增大时, 才支 持这种再分配行动”;
集体行动与利益集团的问题
在政治组织和行政组织中,委托—代理问题 存在于集体行动的每一个层面。因为,代理 人(官僚、政治家),作为内部人,比他们 的委托人,外部公民,更了解情况。
然而,与代理人-经理要受竞争约束的企业 不同,在政府里,对委托-代理问题缺乏自 动监察,这就造成了更大的信息不对称,并 最终为代理人机会主义造成了更多的机会。
现在的焦点问题是,制度与个体经济行为、 集体行为的关系是什么样的?用个人行动能 否解释一切制度现象?
集体行动与利益集团的问题
什么制度是一个“好”制度?“好”的 标准是什么?
制度超越个体的存在。 制度与集体行动有着内在的联系。 在处理集体选择过程,尤其是处理牵涉
到政治派别、选票交易以及有组织的压 力集团等内容的复杂过程时,不难发现, 最后的结果来自众多不同个人和群体的 意图和目标的相互作用。
集体行动与利益集团的问题
07 非合作博弈模型及分析
6) 参与人的能力和理性
完全理性和有限理性
完全理性:有完美的分析判断能力和不会犯选择行为的错误 有限理性:博弈方的判断选择能力有缺陷 个体理性:一个体利益最大为目标 集体理性:追求集体利益最大化 合作博弈:允许存在有约束力协议的博弈 非合作博弈:不允许存在有约束力协议的博弈
个体理性和集体理性
问题:甲、乙如何选择?
乙
招 招 甲 不招
不招
-3,-3
-5,0
0,-5
-1,-1
它的纳什均衡是(坦白,坦白)。
纳什均衡:通俗的讲是指参与人(局中人)单独改变策略不 会得到好处的对局(策略组合),就叫做纳什均衡。
完全信息静态博弈纳什均衡分析方法
针对矩阵表达的形式一般采用相对优势策略划线法 连续策略的情况下各自最优化自己的收益函数
2
运用逆向归纳法,先分析企业2的最优产量,是企业1产量的函数
2 max u2 max( 6q2 q1q2 q2 ) q2
q2 R2 (q1 ) 1 (6 q1 ) 2
代入企业1的收益函数
企业1预测到企业2将根据
q2 R2 (q1 ) 1 (6 q1 ) 2
来选择产量,则
混合策略博弈下各自最优化自己的期望收益函数
完全信息动态博弈子博弈精炼纳什均衡分析方法
逆向归纳法(倒推法)
(2) 智猪博弈
猪圈中有一头大猪和一头小猪,在猪圈的一 端设有一个按钮,每按一下,位于猪圈另一端的食 槽中就会有10单位的猪食进槽,但每按一下按钮会 耗去相当于2单位猪食的成本。如果大猪先到食槽, 则大猪吃到9单位食物,小猪仅能吃到1单位食物; 如果两猪同时到食槽,则大猪吃7单位,小猪吃3单 位食物;如果小猪先到,大猪吃6单位而小猪吃4单 位食物。请问:大猪和小猪如何选择?
第七讲讨价还价博弈
2.假设谈判可以进行两轮。即第一轮谈判 假设谈判可以进行两轮。 假设谈判可以进行两轮 A的出价被 拒绝,此时接着进行第二轮谈判, 的出价被B拒绝 的出价被 拒绝,此时接着进行第二轮谈判, 出价, 选择接受还是拒绝 选择接受还是拒绝, 由B出价,A选择接受还是拒绝,但蛋糕只剩 出价 下原来的一半。此时A处于不利位置,因为B 下原来的一半。此时 处于不利位置,因为 处于不利位置 的任何方案A只能接受 即使B提出几乎独吞 只能接受。 的任何方案 只能接受。即使 提出几乎独吞 剩下的一半蛋糕, 也不会反对 也不会反对。 剩下的一半蛋糕,A也不会反对。 那么, 就要反思第一轮的出价 就要反思第一轮的出价, 那么,A就要反思第一轮的出价,他不能 太过贪婪,因为B拒绝将有近一半蛋糕的收 太过贪婪,因为 拒绝将有近一半蛋糕的收 几乎没有收益, 益,而A几乎没有收益,所以,A第一轮就应 几乎没有收益 所以, 第一轮就应 该提出两人各一半的分配方案, 会投赞成 该提出两人各一半的分配方案,B会投赞成 因为拒绝的收益会小于一半蛋糕。 票。因为拒绝的收益会小于一半蛋糕。
现在的博弈变为,如果甲乙双方的讨价还价 现在的博弈变为, 进行到第三阶段,双方的得益一定是S, 进行到第三阶段,双方的得益一定是 , 10000-S,这就形成了一个三阶段讨价还价博 , 根据三阶段博弈的逆推归纳法, 弈。根据三阶段博弈的逆推归纳法,该博弈 的解是甲在第一阶段出价S 的解是甲在第一阶段出价 1=1000010000p+p2S,乙接受。甲的得益是 1,乙的 ,乙接受。甲的得益是S 得益是10000-S1.由于这个三阶段博弈就等于 得益是 由于这个三阶段博弈就等于 从第一阶段开始的无限期博弈, 从第一阶段开始的无限期博弈,所以 甲的得益:S=S1= S1=10000-10000p+p2S 甲的得益: 乙的得益: 10000-S=10000p-p2S 乙的得益: 都可以解得 S=10000/(1+p) (
结构化多人博弈的分析框架_刘国翰
之间的结构化博弈,寡头厂商和行业管理部门之间的
博弈,婆、媳、儿子 (丈夫) 之间的关系也都是结构
化博弈的具体例子。
二、三人结构化博弈的分析框架
结构化博弈采取的是从具体问题到具体结论的分
析路径,即针对具体的问题建立相应的结构化博弈模
型,然后求具体的均衡解。结构化博弈的解对于
为了处理社会博弈中的复杂性,当前的研究主要 集中在以下三方面:
第一方面是合作博弈(Cooperative Game Theory)的 发展,合作博弈假定多个博弈方能够形成有约束力的 同盟,用比较简洁的方式解决了大群体中人与人之间 能 否 形 成 稳 定 联 盟 的 问 题 (Shapley,1953; Aumann, Dreze,1974)。但是,在合作博弈中,博弈方之间的关 系只有“合作”和“非合作”两种,它很难全面描述 社会博弈博弈方之间的多样化关系。此外,在合作博 弈中,博弈方之间一般是对称关系,非对称关系下的 合作很难用合作博弈的框架进行解释。
解。但是对于同一类结构的问题,结构化博弈的均衡
解可以给出一致的规律。3 人博弈是多人博弈的基
础,通过对 3 人结构化博弈的分析,可以获得一般的
多人结构化博弈的分析框
架。因此,下面以一个 3
1
人博弈为基础来分析结构
化博弈的求解方法。
G12
G13
图 1 是一个一般的三
人结构博弈的示意图,在 这个图中,每一个博弈方 都和另外两个博弈方进行
具备的很多优势,其获得的均衡解也更符合社会实际。
关键词:结构化博弈;多人博弈;合作博弈;同盟博弈
中图分类号:F221
文献标识码:A
文章编号:1004-292X(2014)02-0003-05
合作博弈ppt课件
联盟与特征函数
设局中人集合 N{1,2,,n},称 N的任一子集为一个联盟。为方便, 把 N 的空子集 也视为一个联盟。记所有联盟构成的集类为 B。
对 SB ,用 v ( S ) 表示联盟 S中的局中人通过合作所能获得的最大
分配的优超关系
为了比较哪个分配好些,给出以下定义。
定义7.4 设有分配 x, yI(v),及联盟 SB ,如果
(1) 对 iS,xi yi ,
(2) x i v ( S )
i s
则称联盟
S 为分配
x优于分配
y,记作 x s
y。如果对于,I(v),存
在一个联盟
TB,使
T
,则称 优于
,记为
v({1,2,3})=10,v () 显然满足超可加性,于是我们建立了联盟博弈 N , v 。
特征函数是研究联盟博弈的基础,确定特征函数过程实际就是一个建立 合作博弈模型的过程。有的问题,特征函数可以容易地得到,有的问题 需要仔细分析,甚至需要一些专业知识。
若对 S,TB, ST,都有 v(ST)v(S)v(T),则称 v满
(1) 每个工厂每天必须因每个直接向湖中排放污水的工厂(包括自身)花 费 c 美元净化它所用的水。
(2)每个工厂可以安装一个过滤器,在污水排回湖中之前就将水净化。 每个工厂每天的净水费用为 b 美元。
为使问题有意义,假设 0cbnc。
(3) s(1,2,,n)个局中人可以组成一个联盟 S,共同决定是否采用过
任何人结盟,余下1与3各持己见。(1,0,1) 不构成分配。同样,如果
{2 ,3} 结盟,y (0,1,1)是合理的分配 ;{1,3} 结盟,z (1,0,1) 是
合作n人博弈
合作n 人博弈引言在一个非合作n 人博中,两个或两个以上的局中人不许可事先商定如何选择策略,不许可把他们的策略结合起来。
局中人之间不允许对等到的支付进行任何重新分配,一个局中人不能分享另一局中人得到的支付。
而在合作n 人博中,则对上述两个方面的问题都不加限制。
局中人可以进行充分的合作:可以在事先商定,把他们的策略协调结合起来;可以在终局后重新分配若干个局中人所得的支付的总和。
因此,我们要考虑的有以下几个因素:首先,由于两个或两个以上的局中人要在某些方面进行合作,他们需要结成一个联盟或合伙(coalition)。
这是合作n 人博弈的一个重要因素;在非合作n 人博弈中,每个局中人都为自己的最大利益而奋斗,不存在结成联盟的问题。
其次,若干个局中人结成一个联盟后,这个联盟作为一个整体当然希望能够得到尽可能多的收入,即支付。
这个最大的支付是联盟的函数。
另外,每个联盟要把得到的总的收入分配给联盟的每一个成员。
这就需要用数量来表示这种分配。
在合作n 人博弈中,各个局中人如何选择策略已浊主要需要考虑的问题。
应当强调的乃是联盟的形成。
我们假设,在一个非合作n 人博弈[,{},{}]i i I X P 中,局中人的集是{1,,}I n = 。
S 是I 的任意子集,称为一个联盟。
把I 中除去S 中元素后余下的集\I S 看成另外一个联盟。
以S 和\I S 作为一个零和二人博弈的两个局中人,以S 中全部成员的一切联合混合策略作为第一个局中人S 的策略集,\I S 中一切的一切联合混合策略作为第二个局中人\I S 的策略集,这个零和二人博弈必有一个值。
我们以()v S 表示这个值。
()v S 对于I 的一切子集S 有定义,并定义()0v ∅=。
我们称()v S 为特征函数(chatacteristic function)。
特征函数是描述合作n 人博弈的一个重要因素。
定义 设{1,,}I n = ,()v S 是定义在I 的一切子集(即联盟)的集上的实值函数,并满足条件()0v ∅=,1()({})ni v I v i =≥∑,则称[,]I v Γ≡为合作n 人博弈,()v S 为博弈的特征函数。
第七讲(多人博弈)
– 状态变量(stable variable):该变量用以描述博弈 的状态,参与者只需要知道这些变量就可以选出最 佳战略。
• 排队博弈中,状态变量为列队的长度。而谁是第一,谁 是第二并不需要去了解。
1 PDF 文件使用 "pdfFactory Pro" 试用版本创建
净收益 第一个人排队 第二个人排队 第三个人排队 第四个人排队 第五个人排队 第六个人排队 18 15 12 9 6 3 预期收益 是否排队? 1/5)+5(1/5)=11 12.5 Yes 11 9.5 8 6.5 5 Yes Yes Yes No No
8(1/2)+5(1/2)=6.5 14(1/4)+11(1/4)+8(1/4)+5(1 /4)=9.5 17(1/5)+14(1/5)+11(1/5)+8(
– 代表性经济人(representative agent)模型:假设所 有的参与者都是一致的,都具有相同的战略集,并 存在对称收益。
• 然而就像排队博弈中所看到的,虽然这些乘客有相同的 战略选择,但在均衡状态下,他们的处境完全不同。
多人博弈的简化假设
• 追逐博弈:
– 追逐者要在最短的时间抓住被追逐者。 – 追逐者的最佳反映是拉近他和被追逐者的距离。 – 而被追逐者的最佳反映是扩大他和追逐者的距 离。 – 在该博弈中,状态变量是什么? – 追逐者和被追逐者之间的距离。
鹰鸽博弈
• 在群体生物中,假设一种动物每次遇到另一种动 物都会为某种资源展开争斗,其间采取进攻或者 逃跑的战略。
– 如果两只鹰相遇,它们会进行争斗导致两败俱伤。 – 如果两只鸽子相遇,它们的行为模式是佯攻后逃跑。 – 如果一只鹰和一只鸽子相遇,鸽子会逃跑,而鹰占有 资源。 – 该博弈的收益矩阵如下。
多人巴神博弈定律
多人巴神博弈定律
巴什博弈定律:
只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个,最后取光者得胜。
n = (m+1)r+s,(r为任意自然数,s≤m),即n%(m+1) != 0,则先取者肯定获胜。
巴什博弈还是很好理解滴,以你是先手的角度考虑。
你想把对手给弄垮,那么每一局,你都必须构建一个局势,这个局势就是每次都留给对手m+1的倍数个物品。
所以不只是取物品中的博弈可以用到巴什定理,还可以是报数之类的,看谁先报到100,并且每次报的数必须是1~10(包括1跟10),那么你每次都应该留给对手剩下的报数个数为11的倍数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 根据凯恩斯主义的学说,认为市场中除了存在协 调失败的问题外;同时,预期可能会影响经济的 潜在发展方向。
4 PDF 文件使用 "pdfFactory Pro" 试用版本创建
比例博弈
• 案例:上班的人对交通工具的选择 – 开车或坐公 交车。开车上班的人越多,越会增加交通堵塞, 路上花费的时间也就越长。
– 代表性经济人:上班的人。 – 状态变量:开车的人与坐公交的人的比例。
开车的收益始终高于 坐巴士的收益。因 此,开车在此博弈中 为占优战略。 然而如果所有人都开 车,他们的收益为1.5。这个战略会使 每个人的状况变得更 糟 – 社会两难。
协调博弈
• 还存在“协调失败”的情况:
– 在上面这个博会很糟糕。 – 消费者选择储蓄,而生产者选择简单生产的方式。 – 或是消费者选择消费,而生产者选择迂回生产的方式。
• 那么最终会产生哪一个均衡呢?
– – – – 寻找谢林点。 均衡1会形成经济中最大的潜在产出。 但是谢林点也可能基于以往的经验和预期。 如果生产者预期消费者花的比储蓄的多,消费者预期 生产者会选择产出小的简单生产方式,则也会形成一 个谢林点导致均衡2成为最终的结果。
净收益 第一个人排队 第二个人排队 第三个人排队 第四个人排队 第五个人排队 第六个人排队 18 15 12 9 6 3 预期收益 是否排队? 1/5)+5(1/5)=11 12.5 Yes 11 9.5 8 6.5 5 Yes Yes Yes No No
8(1/2)+5(1/2)=6.5 14(1/4)+11(1/4)+8(1/4)+5(1 /4)=9.5 17(1/5)+14(1/5)+11(1/5)+8(
的次序是随机的。那么每个 人接受如无的系会平等为 1/6。 每个人的期望收益都为: 20(1/6)+17(1/6)+14(1/6)+1 1(1/6)+8(1/6)+5(1/6)=12.5 总收益为75(=12.5×6)。
排队博弈
• “每个人都坐着”不是一个纳什均衡,因为个人可以通过排 队来提高他的收益。 • 然而通过下表我们可以看到,前四个人选择排队是因为其 排队的净收益大于其预期收益。而之后的人将不选择排 队,因为排队的净收益将小于其预期收益。
• 在2/3的左边,坐公交处于不利地 位,会有人转为开车。 • 在2/3的右边,开车处于不利地位, 在上述博弈中,如果交通堵塞使得开车者的收益 会有人转为做公交。 下降速度超过了乘坐巴士者的收益下降的速度。 • 在2/3的点上,没有人可以通过改变 • 那么占优均衡就不存在了,它会有一个纳什均衡。 战略而获利。
– 代表性经济人(representative agent)模型:假设所 有的参与者都是一致的,都具有相同的战略集,并 存在对称收益。
• 然而就像排队博弈中所看到的,虽然这些乘客有相同的 战略选择,但在均衡状态下,他们的处境完全不同。
多人博弈的简化假设
• 追逐博弈:
– 追逐者要在最短的时间抓住被追逐者。 – 追逐者的最佳反映是拉近他和被追逐者的距离。 – 而被追逐者的最佳反映是扩大他和追逐者的距 离。 – 在该博弈中,状态变量是什么? – 追逐者和被追逐者之间的距离。
比例博弈
在下图中,即开车者所占的比例为2/3处。
公共悲剧 (tragedy of the commons)
• 公共悲剧:
– 是指由于人们对公共资源的国度使用,造成了对资源 的破坏,使得所有人的整体收益降低。 – E.g.高速公路对于开车者和坐公交车者是公共资源,然 而开车者对它的使用更为频繁,很容易造成了资源的 “退化”,即交通堵塞。 – E.g.公共牧场
供给、需求和试算法
• 代表性经济人:买方和卖方。 • 状态变量:市场价格。 • 博弈规则:试算法 – 指一个反复试验来决定货物 或服务价格的过程。
– 拍卖商随机喊出一个价格,买方和卖方给出这个价位 上他们愿意购买和卖出的商品数量。如果需求量大于 供给量,拍卖商则再喊一个略高的价格。如果需求量 低于供给量,则拍卖商再给出一个略低的价格。这样 反复调整价格,知道买入的数量等于要卖出的数量。 此时,人们在最终达到的价位上买入和卖出事先声明 的量。这个价位称为均衡价格。 – 在拍卖商找到供需平衡的价位之前,没有人真正的买 入或卖出。
排队博弈
• 该博弈的纳什均衡为:
– 四个人排队,而两个人坐着。 – 除此之外,没有其他的纳什均衡。
• 该均衡是否是有效的?
– 我们可以通过计算它的总收益来判断。 – 该均衡的总收益为:18+15+12+9+5+5=67 – 这比不排队的总收益75要低,因此排队反而是 缺乏效率的。
多人博弈的简化假设
• 为了简化多人博弈,需要设定两个基本的假设:
鹰鸽博弈
• 在群体生物中,假设一种动物每次遇到另一种动 物都会为某种资源展开争斗,其间采取进攻或者 逃跑的战略。
– 如果两只鹰相遇,它们会进行争斗导致两败俱伤。 – 如果两只鸽子相遇,它们的行为模式是佯攻后逃跑。 – 如果一只鹰和一只鸽子相遇,鸽子会逃跑,而鹰占有 资源。 – 该博弈的收益矩阵如下。
• 在公共草地上,每增加一只羊会有两种结果:一是获得 增加一只羊的收入;二是加重草地的负担,并有可能使 草地过度放牧。经过思考,牧羊者决定不顾草地的承受 能力而增加羊群数量。于是他便会因羊只的增加而收益 增多。看到有利可图。许多牧羊者也纷纷加入这一行列。 由于羊群的进入不受限制,所以牧场被过度使用,草地 状况迅速恶化
• 在群体生物中,类似于鹰鸽博弈的情况最大的特点是:
– 它拥有两个以上的参与者,但在特定时间只能有两个参与者进行 组合。
知识补充~~
• 需求函数:Qd = α-βP
– Qd:(quantity of demand) 需求数量 – P:(price) 价格 – 一种商品的需求是消费者在一定时期内在各种可能的 价格水平愿意而且能够购买的该商品的数量。 – 商品价格和需求量之间是负相关关系。
公共悲剧
• 公共资源有许多拥有者,他们中的每一个都有使 用权,但没有权利阻止其他人使用,从而造成资 源过度使用和枯竭。
– 过度砍伐的森林、过度捕捞的渔业资源及污染严重的 河流和空气,都是“公地悲剧”的典型例子。
• 之所以叫悲剧,是因为每个当事人都知道资源将 由于过度使用而枯竭,但每个人对阻止事态的继 续恶化都感到无能为力。而且都抱着“及时捞一把” 的心态加剧事态的恶化。 • 这种集体频繁地使用公共资源的行为需要法规、 惯例的制约,或者由公益机构将其控制在一定范 围内,否则公共悲剧问题将无法解决。
收益的期望值 -25p+14(1-p)=0,p=0.36 -9p+5(1-p)=0, p=0.36
事实上,鹰和鸽子组成 的概率取决于两种鸟在 整个种群中所占的比例。 假设遇到鹰的概率是p。
鹰 鸽子
2 PDF 文件使用 "pdfFactory Pro" 试用版本创建
鹰鸽博弈
供应过剩和需求过盛
• 供应函数:Qs = δ+γP – Qs:(quantity of supply) 供应数量 – P:(price) 价格
– 一种商品的供给是指生产者在一定时期内在各种可能 的价格下愿意而且能够提供出售的该种商品的数量。 – 商品价格和供给量是正相关关系。
供需博弈
• 买卖双方都面临两种可能:
鸟B 鸟A 鹰 鸽子 鹰 -25,-25 -9, 14 鸽子 14,-9 5, 5
鹰鸽博弈
• 鸟A和鸟B的收益是对称的,这取决于与鹰组合的 概率p。 • 鹰的比例在该博弈中为状态变量。 • 鹰和鸽子最终会达到一定比例的共存。
– 如果鹰的比例小于36%,那么两种鸟的种群都会扩大。 – 如果鹰的比例大于36%,嘛呢两种鸟的种群都会缩小。 – 因为鹰群增加一只鹰的边际收益趋零时(鹰群发生内 斗),均衡将到来。
– 该博弈的收益矩阵如右表。
消费者 生产者 简单 迂回 储蓄 5, 5 10,10 消费 8, 8 6, 6
3 PDF 文件使用 "pdfFactory Pro" 试用版本创建
协调博弈
• 该博弈有两个纳什均衡:
– 均衡1:消费者选择储蓄,而生产者选择迂回;那么消 费者会为生产者提供需要的资金,而生产者可以为消 费者支付投资较高的回报。这对双方都是最好的选择。 – 均衡2:消费者选择消费,而生产者选择简单的生产方 式。
– 状态变量(stable variable):该变量用以描述博弈 的状态,参与者只需要知道这些变量就可以选出最 佳战略。
• 排队博弈中,状态变量为列队的长度。而谁是第一,谁 是第二并不需要去了解。
1 PDF 文件使用 "pdfFactory Pro" 试用版本创建
– 货物在声明的价位被卖出(或买入),没有盈余或短缺。 – 当价格不能平衡供需数量时,没有交易。
协调博弈
• “生产者”和“消费者”的协调博弈。
– 生产者的战略有:“简单”和“迂回”两种生产方式。
• “迂回” – 指机械化、培训、研发等高效的生产方式。然 而这需要通过销售债券和股票,从消费者那里筹集资金。
排队博弈 第七讲 多人博弈
• 假使有六个乘客在登机口等待检票。乘客可以选 择站起来去排队,也可以选择坐着。每位乘客所 获得的收益取决于他接受服务的次序,且站起来 排队将会减少乘客2单位的收益。该博弈的收益表 如下: 如果乘客不排队,接受服务
服务次序 第一 第二 第三 第四 第五 第六 总收益 20 17 14 11 8 5 净收益 18 15 12 9 6 3
• 买卖双方的战略选择:
– 宣布需求/供给函数上的数量。 – 宣布其他的数量。
– 消费者的战略有:储蓄和消费。
• 储蓄的资金可以用以购买公司债券和股票以获得将来预 期较高的收益。