第五讲博弈论.ppt
经济学原理十六讲(高辉)5第五讲 博弈与经济行为-PPT课件

经济学原理十六讲 College of Business : Chengdu University of Technology
第一节 博弈论
还能举出生 活中的博弈的例 子吗
至少两个参与者
• 博弈论的参与者又被成为决策主体。没有参与者就不 会有博弈,而且参与者至少为两人。
利益
• 博弈的最终目的都是为了自己争取最大利益。 • 必须是决策主体在意的东西才能称之为利益。
案 例 引 入
2019年1月,瓦鲁法斯基在就任财长的第一次 演讲中便向国际债权人发出了咄咄逼人的“退欧 战书”开始,希腊债务危机便逐步在希腊政府面 对紧缩政策的决不妥协和国际债权人的没有紧缩 就没有贷款的博弈中被逼入了“囚笼”。 从6月1日,希腊政府拒绝按期归还IMF贷款, 并称债权人给出的贷款条件“荒谬”,到6月9日 作为债权人代表之一的欧盟委员会主席容克拒绝 接听希腊总理齐普拉斯的电话,关闭对话渠道为 止,欧洲市场在大部分时间里都被裹挟在了绝望 的情绪之中。在这期间的7个交易日中,欧洲股市 均以下跌收盘,创下2019年以来最长时间的连跌。4
有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两位 犯罪嫌疑人,张三和李四,并从他们的住处搜出被害人家中丢失的财物。但是,他矢 口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警 方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。 检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,我 可以和你做个交易。如果你单独坦白杀人的罪行,我就放你出去,但你的同伙要判十 年刑。如果你拒不坦白,而被同伙检举,那么你就将判十年刑,他被放掉。但是,如 果你们两人都坦白交代,那么,你们都要被判6年刑。”
博弈论PPT课件

这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
《博弈论》课程课件

(五)博弈模型的分类
博弈中最重要的两个因素是信息与顺序。
信息上可以分为完全信息和非完全信息。
在博弈的顺序上则可以分为静态与动态。
21
完全信息和非完全信息,完全和非完全判 断的标准就是如果有些信息只有一部分参 与者知道,并不是所有的信息都是公共信 息,那么博弈就是非完全信息博弈。 静态博弈和动态博弈,静态和动态的区别 并不在于时间上是否同时,而是在行动上 是否同时。如果参与者1在行动时,不知道 参与者2的行动,反之也一样,即为同时行 动。
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼底设防 成功,失败
失败,成功
失败,成功
3
例3 鸽派和鹰派
美 国 鸽派政策 苏联 鹰派政策
鸽派政策
鹰派政策
0,0
+1,–1
–1,+1
– ∞,– ∞
4
从上面的三个例子中,我们可以概括出一个博弈 所具有的共同特征:利益相冲突的参与者、参与 者总是根据对手可能采取的策略来采取相应的行 动----相互依存的策略和行动、参与者总是追求自 身利益最大化。根据这些共同特征我们就能给出 一个博弈的定义,只要符合这个定义,就可以将 其纳入到博弈论的研究范畴之中。
( 五 ) 博 弈 模 型 的 分 类
( 四 ) 博 弈 论 的 两 个 前 提 假 设
( 三 ) 纳 什 均 衡
( 二 ) 博 弈 表 达 的 科 学 式
( 一 ) 什 么 是 博 弈 论
一 、 理 论 准 备
1
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
博弈论完整版PPT课件

2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
博弈论ppt课件

15
➢ 扩展术语:
信息:信息集; 完全信息(complete); 完美信息(perfect)。
共同知识:双方可能获取的相同信息; 彼此都能算清楚。
博弈结果:均衡策略组合;均衡行动组合。 均衡:所有局中人最优策略的组合。
博弈论2009
精选ppt课件
16
3. 博弈描述
➢博弈的策略型(标准型、正则型)表述:
33
博弈论2009Leabharlann 精选ppt课件34
毕业后先后在兰德研究所、普林斯顿大 学、MIT工作。
1957年他与MIT学生爱莉西娅结婚。
在而立之年患上了妄想型精神分裂症,九 十年代逐渐恢复了正常。
1994年纳什博士获诺贝尔经济学奖。
2002年来北京参加 “国际数学家大会”
博弈论2009
精选ppt课件
35
博弈论2009
则,不开发。(?)
博弈论2009
精选ppt课件
22
关键问题: 对自然状态的概率估计; 不同时间决策(决策顺序); 对对方先验信息的估计(即估计对方对信
息的掌握程度)。
现实困难: 对市场了解程度不同; 对对方了解程度不同; 如何向对方暗示自己的行动。
博弈论2009
精选ppt课件
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
乙 甲
理性的人是自私自利的; 理性选择不是全局最优。
博弈论2009
精选ppt课件
6
➢经济合作:
乙 甲
诚信的价值; 一报还一报策略; 人类生存环境启示。
博弈论2009
精选ppt课件
7
➢长街上的超市 (海滩占位模型)
*********************
博弈论课件

博弈论强调参与者之间的互动关系,通过数学模型和理论分析来研究 策略选择和均衡结果。
博弈论的发展历程
博弈论的起源可以追溯到20世纪初,当时数学家和经 济学家开始研究游戏中的策略和均衡。
1944年,冯·诺依曼和摩根斯坦合著的《博弈论与经济 行为》标志着博弈论的诞生。
随后,纳什、泽尔腾和哈萨尼等学者进一步发展了博弈 论,形成了现代博弈论的基础。
商业竞争与合作
商业竞争
博弈论可以用于分析商业竞争中的策略和行为,例如价格战、广告战等。通过 博弈论,企业可以更好地理解竞争对手的策略,制定出更有效的竞争策略。
商业合作
博弈论也可以用于分析商业合作中的策略和行为,例如供应链管理、合资企业 等。通过博弈论,企业可以更好地理解合作伙伴的需求和期望,制定出更有效 的合作策略。
贝叶斯纳什均衡
在不完全信息博弈中,如果所有参与 者都根据自己掌握的信息选择最优策 略,则所有参与者都能获得最大收益 。
静态博弈与动态博弈
01
静态博弈
02
动态博弈
所有参与者在同一时间点选择策略并获得收益。
参与者的选择有先后顺序,后选择的参与者可以观察到先选择的参与 者的策略和收益。
03
纳什均衡
纳什均衡的定义
博弈优化方法
线性规划
线性规划是一种数学优化方法, 用于找到在满足一组约束条件下 最大化或最小化目标函数的最优
解。
非线性规划
非线性规划是数学优化的一种方 法,用于找到一组变量的最优值 ,使得一个或多个目标函数达到
最优。
动态规划
动态规划是一种通过将问题分解 为相互重叠的子问题来解决问题 的方法,每个子问题的解被保存
博弈论课件
汇报人:
汇报时间:202X-01-04
博弈论ppt课件

非合作博弈的基本分类
完全信息 不完全信息
贝氏纳什均衡 (BNE) 完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
静态
动态
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
静态博弈与动态博弈
(static games and dynamic games)
• 同时决策或者同时行动的博弈属于静态 博弈;先后或序贯决策或者行动的博弈, 属于动态博弈 • 即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
如何在“博弈”中获胜?
• 日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球 • How can you win such games? • 许多博弈都包含着运气、技术和策略。 • 策略是为了获胜所需要的一种智力的技巧。 它是对于如何最好地利用身体(物质)的技 巧的一种算计。
导论
二、博弈论与诺贝尔经济学奖获得者
导论
三、博弈论的基本类型
合作博弈与非合作博弈
• 合作博弈(cooperative game) 达成有约束力的协议(binding agreement),强调团体理性,强调效 率、公正、公平 • 非合作博弈(non-cooperative game) 强调个人理性,其结果可能有效率, 也可能无效率。
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
• “乘客侧前轮”看起来是一个合乎逻辑的选择。 • 但真正起作用的是你的朋友是否使用同样的 逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。 • 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
精品课程《博弈论》PPT课件(全)

能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
博弈论ppt课件

精选课件ppt
7
囚徒B 坦白
不坦白
囚徒A
坦白 -8,-8 0,-10
不坦白 -10,0 -1,-1
精选课件ppt
8
博弈的分类
ห้องสมุดไป่ตู้
1、从行动的先后次序来分,博弈可以分为 静态博弈 和 动态博弈。 静态博弈指在博弈中,参与人同时选择行动,或虽非同 时但后行动者并不知道前行动者采取了什么具体行动;
动态博弈指的是参与人的行动有先后顺序,且后行 动者能够观察到先行动者所选择的行动的博弈。
21世纪,应站在博弈论的前沿。尽管博弈经济学家很少,但其获诺贝尔
奖的比例最高。最能震动人类情感的是博弈,对未来最有影响力的还是
博弈。
精选课件ppt
6
著名的“囚徒困境”的例子
警察抓住了两个罪犯,但是警察局却缺乏足够的证据 指证他们所犯的罪行。如果罪犯中至少有一人供认犯 罪,就能确认罪名成立。为了得到所需的口供,警察 将这两名罪犯分别关押防止他们串供或结成攻守同盟, 并分别跟他们讲清了他们的处境和面临的选择:如果 他们两人都拒不认罪,则他们会被以较轻的妨碍公务 罪各判一年徒刑;如果两人中有一人坦白认罪,则坦 白者立即释放而另一人将重判10年徒刑;果两人都坦 白认罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放 弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说 比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分 配。这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0) 或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时 给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号) 来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己 的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号 能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分 给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2, 0)或(97,0,1,0,2)。
《博弈论教程》课件

博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
博弈论完整课件(浙江大学)5

博弈论完整课件(浙江⼤学)5 GameTheory(5)DynamicGamesofIncompleteInformationPERFECT BAYESIANEQUILIBRIUM在完全信息静态博弈中,有PBE=BNE=SNE=NE⼀、Introduct iontoPBE例⼦GibbonsP139如果⼀个博弈没有⼦博弈,则⼦博弈精炼的要求(参与⼈的策略在每⼀个⼦博弈中君构成NE的要求)⾃然就得到满⾜,从⽽在任何没有⼦博弈的博弈中,SNE=NE。
?PBE信息动态博弈的⼦博弈前⽂中—“由⼀个动态博弈第⼀阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进⾏博弈所需要的全部信息,能够⾃成⼀个博弈的原博弈的⼀个部分”。
这个定义实际上隐含了三个⽅⾯的含义:A.因为原博弈本⾝不会成为原博弈的后续阶段,因此⼦博弈不能从原博弈的第⼀个节点开始,即原博弈不是⾃⼰的⼀个⼦博弈;B.包含所有在初始节点之后的选择节点和终点,但不包含不跟在此初始节点之后的节点;C.不分割任何的信息集。
即如果⼀选择节点包含在⼀个⼦博弈中,则包含该节点的信息集中的所有节点都必须包含在该⼦博弈中。
A和B两点针对所有类型的动态博弈,⽽C是专门针对不完美信息动态博弈的。
(⼆)PBE的要求(Requirement)要求1:在每⼀个信息集中,应该⾏动的参与者必须对博弈进⾏到该信息集中的每⼀个节点有⼀个推断(belief)。
对于⾮单节信息集,推断是在信息集中不同节点的⼀个概率分布;对于单节点的信息集,参与者的推断就是到达此单⼀节点的概率为1。
要求2:给定参与者的推断,参与者的策略必须满⾜序贯理性(sequentialrational)的要求。
即在每⼀信息集中应该⾏动的参与者(以及参与者随后的策略),对于给定的该参与者在此信息集中的推断,以及其他参与者随后的策略必须是最优反应。
(“随后策略”是在达到给定的信息集之后,包括了其后可能发⽣的每⼀种情况的完全的⾏动计划)对于前例,要求1和要求2的满⾜⾜以使我们排除不合理的均衡(R,R’)。