博弈论 ppt课件
合集下载
《管理学博弈论》课件

《管理学博弈论》PPT课 件
博弈论是一门研究决策者在互动中作出最优选择的学科。在管理学中,博弈 论被广泛应用于解决策略性决策问题。
一、简介
博弈论是一门研究决策者在互动中作出最优选择的学科。本课程将介绍博弈论的基本概念和在管理学中的应用。
二、博弈论基础
博弈论的基本概念
介绍博弈论的基本概念,如 玩家、策略和利益的分析。
七、总结
1 博弈论的优点与不足
总结博弈论的优点,如帮助决策者分析和优 化策略,以及其限制和假设。
2 博弈论的未来研究方向
展望博弈论的未来研究方向,如与人工智能 和大数据分析结合的应用。Biblioteka 四、双人合作博弈1
特征函数游戏
2
介绍特征函数游戏,用于分配值给合作
博弈中的不同决策组合。
3
战略性合作博弈
讲解战略性合作博弈中的合作策略,以 实现共同利益最大化。
估价博弈
探索估价博弈,用于确定合作博弈中参 与者的收益分配。
五、多人博弈
传统博弈 极端博弈 模糊博弈
介绍多个玩家参与的传统博弈模型,如囚徒困境 和霸权竞争。
博弈的分类
讨论博弈的分类,包括双人 非合作博弈、双人合作博弈 和多人博弈。
策略和利益的分析
探讨如何分析博弈中的策略 和利益,帮助决策者做出最 优选择。
三、双人非合作博弈
策略型博弈
介绍策略型博弈,包括两个玩家 相互竞争的决策模型。
矩阵博弈
解释矩阵博弈,以方便比较各种 决策选择的结果。
纳什均衡
探索纳什均衡的概念,即无法通 过改变策略获得更好结果的状态。
讲解多人参与的极端博弈,如零和游戏和多方冲 突博弈。
解释模糊博弈的概念,其中参与者的信息和目标 存在不确定性。
博弈论是一门研究决策者在互动中作出最优选择的学科。在管理学中,博弈 论被广泛应用于解决策略性决策问题。
一、简介
博弈论是一门研究决策者在互动中作出最优选择的学科。本课程将介绍博弈论的基本概念和在管理学中的应用。
二、博弈论基础
博弈论的基本概念
介绍博弈论的基本概念,如 玩家、策略和利益的分析。
七、总结
1 博弈论的优点与不足
总结博弈论的优点,如帮助决策者分析和优 化策略,以及其限制和假设。
2 博弈论的未来研究方向
展望博弈论的未来研究方向,如与人工智能 和大数据分析结合的应用。Biblioteka 四、双人合作博弈1
特征函数游戏
2
介绍特征函数游戏,用于分配值给合作
博弈中的不同决策组合。
3
战略性合作博弈
讲解战略性合作博弈中的合作策略,以 实现共同利益最大化。
估价博弈
探索估价博弈,用于确定合作博弈中参 与者的收益分配。
五、多人博弈
传统博弈 极端博弈 模糊博弈
介绍多个玩家参与的传统博弈模型,如囚徒困境 和霸权竞争。
博弈的分类
讨论博弈的分类,包括双人 非合作博弈、双人合作博弈 和多人博弈。
策略和利益的分析
探讨如何分析博弈中的策略 和利益,帮助决策者做出最 优选择。
三、双人非合作博弈
策略型博弈
介绍策略型博弈,包括两个玩家 相互竞争的决策模型。
矩阵博弈
解释矩阵博弈,以方便比较各种 决策选择的结果。
纳什均衡
探索纳什均衡的概念,即无法通 过改变策略获得更好结果的状态。
讲解多人参与的极端博弈,如零和游戏和多方冲 突博弈。
解释模糊博弈的概念,其中参与者的信息和目标 存在不确定性。
微观经济学-第十章-博弈论初步PPT课件

12
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
《博弈论的经典案例》课件

• 原理:囚徒之间的合作或背叛关系直接影响他们的判罚。 • 应用:虚拟囚徒困境可以帮助解释社会合作的动机和策略。
报童问题
报童问题是博弈论中的一个常见案例,涉及一个报童需要决定采购报纸的数量。 • 原理:报童必须在满足需求和最小化成本之间做出权衡。 • 应用:报童问题可应用于库存管理、供应链优化和市场需求预测。
博弈论提供了计算机科学领域中优化、决策 和人工智能算法的基础。
政治学
博弈论研究了政治家、政党和国家之间的互 动关系,探讨了选择、协商和合作的策略。
生物学
博弈论用于研究动物行为、进化和生态系统 中的竞争和合作策略。
虚拟囚徒困境
虚拟囚徒困境是博弈论的一个经典案例之一。它描述了两一个有趣而重要的领域,它研究人与人之间的互动以及决策制定的 艺术。
《博弈论的经典案例》PPT课 件
博弈论是一个研究人们在决策过程中如何选择的分支学科。
什么是博弈论
博弈论是通过数学模型和分析来研究人们在决策过程中如何选择的学科。它从战略的角度提供了准确的 分析和预测。
博弈论的应用
经济学
博弈论在经济学中被广泛应用,帮助解释市 场行为、竞争策略和合作行为等现象。
计算机科学
拍卖
拍卖是博弈论的一个重要领域,涉及多个竞标者在有限资源上的竞争。 • 原理:拍卖涉及竞标策略、价格设定和资源配置等问题。 • 应用:拍卖可见于艺术品、土地和网络广告等领域。
集体行动难题
集体行动难题是博弈论中探讨社会合作和公共利益的案例。 • 原理:集体行动需要协调个体的利益,以达到共同的目标。 • 应用:集体行动问题可应用于环境保护、公共资源管理和社会合作。
报童问题
报童问题是博弈论中的一个常见案例,涉及一个报童需要决定采购报纸的数量。 • 原理:报童必须在满足需求和最小化成本之间做出权衡。 • 应用:报童问题可应用于库存管理、供应链优化和市场需求预测。
博弈论提供了计算机科学领域中优化、决策 和人工智能算法的基础。
政治学
博弈论研究了政治家、政党和国家之间的互 动关系,探讨了选择、协商和合作的策略。
生物学
博弈论用于研究动物行为、进化和生态系统 中的竞争和合作策略。
虚拟囚徒困境
虚拟囚徒困境是博弈论的一个经典案例之一。它描述了两一个有趣而重要的领域,它研究人与人之间的互动以及决策制定的 艺术。
《博弈论的经典案例》PPT课 件
博弈论是一个研究人们在决策过程中如何选择的分支学科。
什么是博弈论
博弈论是通过数学模型和分析来研究人们在决策过程中如何选择的学科。它从战略的角度提供了准确的 分析和预测。
博弈论的应用
经济学
博弈论在经济学中被广泛应用,帮助解释市 场行为、竞争策略和合作行为等现象。
计算机科学
拍卖
拍卖是博弈论的一个重要领域,涉及多个竞标者在有限资源上的竞争。 • 原理:拍卖涉及竞标策略、价格设定和资源配置等问题。 • 应用:拍卖可见于艺术品、土地和网络广告等领域。
集体行动难题
集体行动难题是博弈论中探讨社会合作和公共利益的案例。 • 原理:集体行动需要协调个体的利益,以达到共同的目标。 • 应用:集体行动问题可应用于环境保护、公共资源管理和社会合作。
博弈论PPT课件

第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······
博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
第九章 运筹学博弈论 ppt课件

则。
1988年 法国人莫里斯-阿莱斯(Maurice Allais)
获奖理由:在市场理论及资源有效利用方面做出了
开创性贡献,并对一般均衡理论重新做了系统阐述。
1987年 美国人罗伯特-索洛(Robert M. Solow)
获奖理由:对增长理论做出贡献。提出长期的经济
增长主要依靠技术进步,而不是依靠资本和劳动力的
获奖理由:对不同汇率体制下的货币和财政政策以及最
优货币区域的分析做出了伟大贡ppt献课件。
8
1998年 印度籍经济学家阿马蒂亚-森(Amartya Sen) 获奖理由:对福利经济学以及发展经济学做出了突破
性贡献。 1997年 美国经济学家迈伦-斯科尔斯(Myron S.
Scholes)和罗伯特-默顿(Robert C. Merton) 获奖理由:前者给出了著名的布莱克-斯科尔斯期权
获奖理由:在动态宏观经济学方面做出了
巨大贡献。 2003年 美国经济学家罗伯特-恩格尔
(Robert F. Engle III)和英国经济学家克莱夫格兰杰(Clive W.J. Granger)
获奖理由:在经济时间数列中运用了统计
学的方法。
ppt课件
7
2002年 美国学者丹尼尔-卡尼曼(Daniel Kahneman)和弗农-
ppt课件
4
在国外,1912年E.Zermelo用集合论研究过下棋 问题,四十年代由于生产和战争的需要,博弈理 论得到了发展,系统博弈理论的形成则以1944 年V.Neumann,O.Morgensten合著的《博弈论 和经济行为》一书为标志.1994年瑞士皇家科 学院决定将诺贝尔经济学奖授予纳什(Nash),哈 萨尼(Harsanyi)和泽尔腾(Selten)三人,表彰他们 在博弈理论和应用研究方面作出的杰出贡献. 目前,博弈论在定价,招投标,拍卖,委托代理以及 很多重要的经营决策中得到应用,它已成为现代 经济学的重要基础.
西方经济学博弈论全解ppt课件.ppt

小猪的最优策略:等待 大猪无最优策略:即大猪的最优策略是依赖于 小猪的策略
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论全套课件

三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。
《博弈论教程》课件

博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
《运筹学》课件 第六章 博弈论

§1 基本概念
一、博弈论的定义 二、博弈理论的历史 三、博弈问题举例 四、博弈的分类
三、
1. 囚犯困境(Prisoners’ dilemma
囚犯困境是图克(Tucker)1950年提出的; 该博弈是博奕论最经典、著名的博弈; 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷。
所有局中人的策略组成的向量。)
s (s1,, si,, sn ) 表示n个局中人达成的
一个协议,当这个协议可以自动实施(Self-enforcing) 时,即没有任何局中人有积极性破坏这个协议,那么 这个协议就构成纳什均衡。
否则,若至少存在某些局中人有积极性偏离这个协 议,就构不成纳什均衡。
例:囚犯困境问题:
但是,尽管政府当时无力制止这种事情,公众也不 必担心彩电价格会上涨。这是因为,“彩电厂商自 律联盟”只不过是一种“囚徒困境”,彩电价格不 会上涨。在高峰会议之后不到二周,国内彩电价格 不是上涨而是一路下跌。这是因为厂商们都有这样 一种心态:无论其他厂商是否降价,我自己降价是 有利于自己的市场份额扩大的。
Ⅱ
坦白 抵赖
坦白
Ⅰ
-9,-9
0,-10
抵赖 -10,0 -1,-1
均衡解: 二人均坦白
相关概念介绍
➢博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
坦白 抵赖
➢ 博弈问题的基本要素 (1)局中人(Players)
现代博弈论主要指非合作博弈理论。非合作博弈 更受重视的原因:主导人们行为的主要还是个体理性, 而非集体理性;即,竞争是一切社会、经济关系的根 本基础,不合作是基本的,合作是有条件和暂时的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
占优均衡:一个博弈的某个策略组合中的所 有策略都是各个博弈方各自的占优,必然是 该博弈比较稳定的结果
占优均衡不是普遍存在的(性别之战)
严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去
左中
右
上 1,0 1,3 0,1
策略型(或标准型)博弈
三要素:名单、策略单和收益单。可用矩阵,或 函数形式表示的博弈收益情况。
猜硬币模型
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
三人古诺模型 i P q i [ 2 q 0 1 q 2 q 3 ] q i
几个经典博弈模型
得益矩阵
审计博弈
简单版(B<C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t
务 局 不审计
0,0B,-t来自性别之战是一种有两个以上纯策略均衡的博弈
看足球 何 佳 听音乐
张帅
看足球 听音乐
2,4
0,0
1,1
4,2
例子(石头、剪子、布)中的博弈方、策略和
收益
博弈方I(孩子A,孩子B)
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
中 上 下
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
下 上 中
-1,1√ 1,-1 1,-1 1,-1 3,-3 1,-1
下 中 上
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
ui(si*,s-i*)≥ui(si,s-i*), si∈Si
A
纳什均衡的求解——划线法
囚徒困境
-5, -5 -8, 0
猜硬币
-1, 1 1, -1
0, -8 -1, -1
1, -1 -1, 1
纳什均衡的求解——箭头法
审计博弈(B > C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t
下 0,4 0,2 2,0
1,3
左 1,0 0,4
中 1,3 0,2
左 1,0
中 1,3
纳什均衡
策略空间:S1,……Sn 博弈方i的第j个策略:sij∈Si 博弈方i的得益:ui 博弈:G={S1 ,…,Sn,u1,…,un} 纳由sn*什各)均个中衡博,:弈任在方一博的i博弈各弈G一方=个s{策i*S的略1 策,组略…成,,的都S某n,是个u对策1,其略…余组,博合u弈(n}方s中1策*,,略…如的,果组
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
赌胜博弈的特点是一方得等于另一方失,不 可能双赢,属于“零和博弈”
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
田忌赛马
取胜关键:不让对方猜到自己策略,尽可能 猜出对方策略
田忌
上中下
齐 上下中 威 中上下 王 中下上
下上中
下中上
上
上
中
下
下
中
3,-3√ 1,-1 1,-1 -1,1 1,-1 1,-1
务 局 不审计
0,0
B,-t
连续变量的纳什均衡
古诺的寡头模型
Qq1 q2 PP(Q) 8Q
c1 c2 2
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ 8 ( q 1 q 2 ) 2 ] q 1 6q1q1q2q12
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ 8 ( q 1 q 2 ) 2 ] q 2 6q2 q1q2 q22
选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限
多个
收益
收益:各博弈方从博弈中所获得的利益 收益对应博弈的结果,也就是各博弈方策略
的组合 收益是各博弈方追求的根本目标及行为和判
断的主要依据 根据收益的博弈分类:零和博弈、常和博弈、
变和博弈
策略集SA=SB={石头,剪刀,布} 收益就是这个矩阵
石头
石头
0, 0
孩
子
剪刀
-1, 1
A
布
1, -1
孩子B
剪刀 1, -1 0, 0 -1, 1
布
-1, 1 1, -1 0, 0
占优均衡
占优:不管其它博弈方选择什么策略,一博 弈方的某个策略给他带来的得益始终高于其 它的策略,至少不低于其他策略的策略 (囚徒的困境中的“坦白”)
连续变量的纳什均衡
解: 一阶最优条件为:
u1 q1
6
q2
2 q1
0
u2 q2
6 q1
2q2
0
得到:q1=q2=2
混合策略的引进
博弈论
博弈就是一些个人、队组或其他组织,面对一定的 环境条件,在一定的规则下,同时或先后,一次或 多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
囚徒的困境 赌胜博弈 审计博弈 性别之战 产量决策的古诺模型
囚徒的困境
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈
囚徒 2
坦白 不坦白
囚
坦白 -5, -5 0, -8
徒
1
不坦白 -8, 0 -1, -1
赌胜博弈
赌博、竞技等构成的博弈问题,在经济中也 有许多应用,赌胜博弈也是一类重要的博弈 问题,对经济竞争和合作也有很大启示
合( s1*,…,si-1*,si+1*,…,sn* )的最佳对策,即ui( ss为1i+*1G,*,的……一,,个sis-纳1n**,什)s均i*对,衡任si+1意*,sij…∈,Si都sn*成)立≥,u则i(称s(1*,s1…*,,…si,-1*,sn*si)j,
所有别的游戏者策略的简记法
s-i=(s1,…,si-1,si+1,…, sn) 纳什均衡简述为:
占优均衡不是普遍存在的(性别之战)
严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去
左中
右
上 1,0 1,3 0,1
策略型(或标准型)博弈
三要素:名单、策略单和收益单。可用矩阵,或 函数形式表示的博弈收益情况。
猜硬币模型
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
三人古诺模型 i P q i [ 2 q 0 1 q 2 q 3 ] q i
几个经典博弈模型
得益矩阵
审计博弈
简单版(B<C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t
务 局 不审计
0,0B,-t来自性别之战是一种有两个以上纯策略均衡的博弈
看足球 何 佳 听音乐
张帅
看足球 听音乐
2,4
0,0
1,1
4,2
例子(石头、剪子、布)中的博弈方、策略和
收益
博弈方I(孩子A,孩子B)
1,-1 3,-3 -1,1 1,-1, 1,-1 1,-1
中 上 下
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
中 下 上
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
下 上 中
-1,1√ 1,-1 1,-1 1,-1 3,-3 1,-1
下 中 上
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
ui(si*,s-i*)≥ui(si,s-i*), si∈Si
A
纳什均衡的求解——划线法
囚徒困境
-5, -5 -8, 0
猜硬币
-1, 1 1, -1
0, -8 -1, -1
1, -1 -1, 1
纳什均衡的求解——箭头法
审计博弈(B > C,F>t)
嫌疑人
偷税
不偷税
税 审计 B-C,-F B-C,-t
下 0,4 0,2 2,0
1,3
左 1,0 0,4
中 1,3 0,2
左 1,0
中 1,3
纳什均衡
策略空间:S1,……Sn 博弈方i的第j个策略:sij∈Si 博弈方i的得益:ui 博弈:G={S1 ,…,Sn,u1,…,un} 纳由sn*什各)均个中衡博,:弈任在方一博的i博弈各弈G一方=个s{策i*S的略1 策,组略…成,,的都S某n,是个u对策1,其略…余组,博合u弈(n}方s中1策*,,略…如的,果组
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
赌胜博弈的特点是一方得等于另一方失,不 可能双赢,属于“零和博弈”
猜硬币方
正面
反面
盖 正面 硬 币 反面 方
-1, 1 1, -1
1, -1 -1, 1
田忌赛马
取胜关键:不让对方猜到自己策略,尽可能 猜出对方策略
田忌
上中下
齐 上下中 威 中上下 王 中下上
下上中
下中上
上
上
中
下
下
中
3,-3√ 1,-1 1,-1 -1,1 1,-1 1,-1
务 局 不审计
0,0
B,-t
连续变量的纳什均衡
古诺的寡头模型
Qq1 q2 PP(Q) 8Q
c1 c2 2
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ 8 ( q 1 q 2 ) 2 ] q 1 6q1q1q2q12
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ 8 ( q 1 q 2 ) 2 ] q 2 6q2 q1q2 q22
选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限
多个
收益
收益:各博弈方从博弈中所获得的利益 收益对应博弈的结果,也就是各博弈方策略
的组合 收益是各博弈方追求的根本目标及行为和判
断的主要依据 根据收益的博弈分类:零和博弈、常和博弈、
变和博弈
策略集SA=SB={石头,剪刀,布} 收益就是这个矩阵
石头
石头
0, 0
孩
子
剪刀
-1, 1
A
布
1, -1
孩子B
剪刀 1, -1 0, 0 -1, 1
布
-1, 1 1, -1 0, 0
占优均衡
占优:不管其它博弈方选择什么策略,一博 弈方的某个策略给他带来的得益始终高于其 它的策略,至少不低于其他策略的策略 (囚徒的困境中的“坦白”)
连续变量的纳什均衡
解: 一阶最优条件为:
u1 q1
6
q2
2 q1
0
u2 q2
6 q1
2q2
0
得到:q1=q2=2
混合策略的引进
博弈论
博弈就是一些个人、队组或其他组织,面对一定的 环境条件,在一定的规则下,同时或先后,一次或 多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
囚徒的困境 赌胜博弈 审计博弈 性别之战 产量决策的古诺模型
囚徒的困境
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈
囚徒 2
坦白 不坦白
囚
坦白 -5, -5 0, -8
徒
1
不坦白 -8, 0 -1, -1
赌胜博弈
赌博、竞技等构成的博弈问题,在经济中也 有许多应用,赌胜博弈也是一类重要的博弈 问题,对经济竞争和合作也有很大启示
合( s1*,…,si-1*,si+1*,…,sn* )的最佳对策,即ui( ss为1i+*1G,*,的……一,,个sis-纳1n**,什)s均i*对,衡任si+1意*,sij…∈,Si都sn*成)立≥,u则i(称s(1*,s1…*,,…si,-1*,sn*si)j,
所有别的游戏者策略的简记法
s-i=(s1,…,si-1,si+1,…, sn) 纳什均衡简述为: