博弈论入门PPT课件
合集下载
第六讲博弈论课件
❖ 对于矩阵博弈,其主要的任务就是求出矩阵 博弈的Nash均衡解-----双方尽可能满意的结 果。
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪
踩
踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪
踩
踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。
博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
《博弈论》课程ppt课件
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
博弈论PPT课件
第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······
博弈论入门(课堂PPT)
共同价值和赢者的诅咒
• 两家代理:1个积极估价,1个消极估价
prob(v/s)11//22
vs2 vs2
• v均匀分布
• 出价b=?(一家和两家出价时有不同吗)
• 考察b=s-1这样一个对称策略
• 德士古公司的例子
15
几种常见的拍卖形式
• 英式公开叫价拍卖 • 荷式公开叫价拍卖 • 一价密封拍卖 • 二价密封拍卖
• 通过改革,陪审团制度在美国得到了比英国更 好的发展。
22
投票程序
23
• 每个陪审员在陪审之前已经有一个大体 的判断
• 他们的类型 • 非专业性——从众行为
– 如果评判有罪的人数多于无罪,则投有罪 – 如果评判无罪的人数多于有罪,则投无罪 – 如果双方人数相等,则依照自己的评判结果
投票
24
• 陪1:假设投有罪 • 陪2:若评判有罪,则投有罪;若评判无
• 在被问及对最终的价格是否感到意外时 ,Frija抛下一个“不”字,随即离开了
11
简化的暗标拍卖
密封递交标书 统一时间公正开标 标价最高者以所报标价中标 中标博弈方的得益不仅取决于标价,还取决于他对拍
卖标的物的带有很大主观性的估计 每个博弈方的估价通常是自己的私人信息
12
0.6
0.4
• 考虑这样一个对称策略:给定其他两个 委员采取相同策略,以及对于其他成员 拥有哪个政策更好的知识的信念,不论 这个参与者什么类型,采取这个策略都 使他收益最大。
19
• 自然决定四项:哪个政策更好,以及三 个委员的类型。
• 当一个委员了解新政策时:投票给自己 认为更好的策略是一个弱占优策略。
– 当另外两位投票相同时 – 当另外两位投票分歧时
第十章博弈论初步-PPT精品
▪ 1、纳什均衡的定义:
▪ 设 s(s1, .., .sn)是n人博弈G={ ; S1, .., . Sn u1,.., . un } 的一个策略组合。如果对于每个局中人 i , ui(s1 , ., .s .i 1 , si , si 1 , ., .s .n )≥ ui(s1 , ., .s .i 1 , si, si 1 , ., .s .n )
第十章 博弈论初步 Game Theory
博弈论概述 纳什均衡 序贯博弈与重复博弈 进入威慑
第一节 博弈论概述
▪ 什么是博弈? ▪ 拍卖金钱 ▪ 海盗博弈 ▪ 田忌赛马 ▪ 围棋和象棋
齐王
田忌
上
中
下
上 赢,输 赢,输 赢,输
中 输,赢 赢,输 赢,输
下 输,赢 输,赢 赢,输
一、博弈的基本要素
ui(si,si) ≥ ui(si,si) 对于所有si Si 都成立,则我们称策略组合
s(s1, .., .sn)
是该博弈的一个纳什均衡。
▪ 纳什简介: ▪ 约翰·纳什生于1928年6月13日。父亲是电子工程师
与教师,第一次世界大战的老兵。纳什小时孤独内 向。纳什的数学天分大约在14岁开始展现。他在普 林斯顿大学读博士时刚刚二十出头,但他的一篇关 于非合作博弈的博士论文和其他相关文章,确立了 他博弈论大师的地位。在20世纪50年代末,他已是 闻名世界的科学家了。 ▪ 然而,30岁的时候,纳什和他惟一儿子都罹患精神 分裂症。半个世纪之后,在他妻子(艾利西亚—— —麻省理工学院物理系毕业生)的精心照料下,和 她的儿子一样,纳什教授渐渐康复,并在1994年获 得诺贝尔经济学奖。 ▪ 影片《美丽心灵》是一部以纳什的生平经历为基础 而创作的人物传记片。该片荣获2019年奥斯卡金像 奖。
第十章 博弈论初步PPT课件
2020年3月2日星期一
12
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第一,把整个的支付矩阵分解为甲厂商的支付矩阵和 乙厂商的支付矩阵
2020年3月2日星期一
13
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2020年3月2日星期一
11
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
1.基本方法 先用下划线法分别表示甲厂商和乙厂商的条件策
略,最后确定博弈的均衡(就是找到在两个数字之下 都划线的单元格即可,与这些单元格相对应的策略组 合就是所要求的均衡策略组合)。
1
第十章 博弈论初步 第一节 博弈论和策略行为
2.博弈的三个基本要素 三个基本要素,即参与人、参与人的策略和参与
人的支付。 所谓参与人(或称局中人),就是在博弈中进行
决策的个体;所谓参与人的策略,指的是一项规则, 根据该规则,参与人在博弈的每一时点上选择如何行 动;所谓参与人的支付则是指,在所有参与人都选择 了各自的策略且博弈已经完成之后,参与人获得的效 用(或期望效用)。
2020年3月2日星期一
2
第十章 博弈论初步 第一节 博弈论和策略行为
3.博弈的简单分类 根据参与人的数量,可以分为二人博弈和多人博
弈;根据参与人的支付情况,可分为零和博弈和非零 和博弈;根据参与人拥有的策略的数量多少,可分为 有限博弈和无限博弈;根据参与人在实施策略上是否 有时间的先后,可分为同时博弈和序贯博弈。
二、支付矩阵
1.支付矩阵 使用支付矩阵来描述和分析只有两人参加且两人
博弈论基础知识.ppt
–
The theory of rational choice
–
The action chosen by a decision-maker is at least as good, according to her preferences, as every other available action.
第一讲( 第一讲(续) 博弈论基础知识
The theory of rational choice
Actions Preferences and payoff functions
epresents a decision-maker’s preferences if, for any actions a in A and b in A, u(a)>u(b) if and only if the decision-maker prefers a to b. – A decision-maker’s preferences convey only ordinal information.
Conditional probability and Bayes’s rule
– –
Conditional probability and Bayes’s rule
条件概率: P ( B | A) = P ( AB ) P ( A)
全概率公式:设试验 E的样本空间为 S, A为 E的事件, B1, B2, Bn为 S的一个划分, P ( Bi ) > ( i = 1, 2,⋯ , n), 0 则: P ( A) = P ( A | B1 ) P ( B1 ) + P ( A | B2 ) P ( B2 ) + ⋯ + P ( A | Bn ) P ( Bn ) 贝叶斯公式: P ( Bi | A) = P ( A | Bi ) P ( Bi )
The theory of rational choice
–
The action chosen by a decision-maker is at least as good, according to her preferences, as every other available action.
第一讲( 第一讲(续) 博弈论基础知识
The theory of rational choice
Actions Preferences and payoff functions
epresents a decision-maker’s preferences if, for any actions a in A and b in A, u(a)>u(b) if and only if the decision-maker prefers a to b. – A decision-maker’s preferences convey only ordinal information.
Conditional probability and Bayes’s rule
– –
Conditional probability and Bayes’s rule
条件概率: P ( B | A) = P ( AB ) P ( A)
全概率公式:设试验 E的样本空间为 S, A为 E的事件, B1, B2, Bn为 S的一个划分, P ( Bi ) > ( i = 1, 2,⋯ , n), 0 则: P ( A) = P ( A | B1 ) P ( B1 ) + P ( A | B2 ) P ( B2 ) + ⋯ + P ( A | Bn ) P ( Bn ) 贝叶斯公式: P ( Bi | A) = P ( A | Bi ) P ( Bi )
《博弈论初步》课件
THANKS
感谢观看
02
纳什均衡是一种非合作博弈均衡 ,其中每个参与者都认为当前策 略是最好的,不会受到其他参与 者的欺骗或影响。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的策略,逐步逼近纳什均衡。这 种方法适用于较简单的博弈模型,但对于复杂的博弈模型 可能收敛速度较慢。
线性规划法
将纳什均衡问题转化为线性规划问题,通过求解线性规划 来找到纳什均衡。这种方法适用于具有线性特征的博弈模 型,但计算复杂度较高。
价格战与非价格战
博弈论分析了价格战和非价格战的利弊,为企业制定营销策略提供 博弈论可以用来分析选民的投票行为和政治立场,预测选举结果。
02
候选人策略
博弈论为候选人提供了制定最优竞选策略的方法,帮助他们在选举中获
胜。
03
政治联盟与利益交换
博弈论中的合作博弈理论可以用来分析政治联盟的形成和利益交换机制
特征值法
利用特征值和特征向量的性质来求解纳什均衡。这种方法 适用于具有矩阵特征的博弈模型,但需要一定的数学基础 。
纳什均衡的应用实例
1 2
价格竞争
在寡头市场中,企业之间通过价格策略进行竞争 ,最终形成价格均衡,即纳什均衡。
劳资谈判
劳资双方在谈判中会提出自己的工资要求,最终 达成工资协议,这也是一种纳什均衡。
博弈类型
合作博弈
定义
01
参与者通过合作达成共赢的博弈。
特点
02
存在合作协议,强调集体行动和收益分配。
应用场景
03
国际关系、商业合作、团队协作等。
非合作博弈
定义
应用场景
参与者追求各自利益最大化的博弈。
市场竞争、个人决策、资源分配等。
博弈论最全完整-讲解课件
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
第四篇博弈论PPT课件
• 此情况下由于博弈没有可预测的明确的博弈结果,所以就不能 确定博弈方的策略。但是是否在这样的博弈中,各博弈方选择 任何策略都是一样的,因此可以随意选择吗?
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式
《博弈论的基本概念》课件
智猪博弈
• 总结词:描述大猪和小猪在食槽附近争夺食物的策略博弈。
• 详细描述:在智猪博弈中,一个大猪和一个小猪共同生活在一个猪圈里,食槽位于猪圈的一端。每次食物被放入食槽时 ,大猪和小猪都有两种选择:冲向食槽或继续等待。如果大猪选择冲向食槽,小猪的最佳策略是等待,因为大猪吃掉大 部分食物后,小猪可以享用剩余的食物。相反,如果小猪选择冲向食槽,大猪的最佳策略也是等待,因为小猪可能无法 抢到任何食物。因此,无论大猪如何选择,小猪的最佳策略都是等待;同样地,无论小猪如何选择,大猪的最佳策略也 是等待。
合作博弈
特征
强调合作、协议和联盟,目标是实现共同利益。
应用领域
国际关系、商业合作、团队协作等。
非合作博弈
特征
强调竞争、自利和策略互动,目标是实现个人利益。
应用领域
市场竞争、个人决策、政治选举等。
动态博弈
特征
强调行动的顺序和信息传递,策略和 行动需考虑时间因素。
应用领域
商业竞争、投资决策、谈判策略等。
《博弈论的基本概念》ppt课件
目录
• 博弈论简介 • 博弈论的基本类型 • 博弈论的基本概念 • 博弈论的经典案例 • 博弈论的未来发展
01
博弈论简介
博弈论的定义
01
博弈论:研究决策主体在相互影 响、相互作用的环境中如何进行 决策,以及这种决策的均衡结果 的学科。
02
博弈论强调参与者之间的互动关 系,通过数学模型和理论分析来 研究策略选择和均衡结果。
应用领域:拍卖机制设计、保险市场 分析、医疗资源分配等。
03
博弈论的基本概念
参与者
01
02
03
参与者
在博弈中,参与者是决策 的主体,可以是个人或组 织。
博弈论课件
扩展一:不完全信息博弈
不完全信息博弈的定义
01
在博弈中,参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度,可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略,研究候选人如何 制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调,分析政策 制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作,分析国家如何通过 外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡 。
特点
纳什均衡是一种稳定的状态,任何参 与者单方面改变自己的策略都不会获 得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略, 该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略,该 策略都能为参与者带来更低的收益 。
特点
在优势策略下,参与者没有理由改 变自己的策略;在劣势策略下,参 与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降,还可能引发市场恶性竞争,破坏市场秩序。此外,价格战还可能导致产品质量 下降,损害消费者利益。
案例二:国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中,各国之间往往存在着复杂的博弈关系。为了维护自身利益,各 国会采取不同的博弈策略,如通过外交手段、经济制裁、军事威胁等方式来达 到自己的目的。
西方经济学博弈论全解ppt课件.ppt
小猪的最优策略:等待 大猪无最优策略:即大猪的最优策略是依赖于 小猪的策略
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
此时用重复剔除严格劣策略的思路找出均衡:小 猪的严格劣策略为按,剔除“按”后,小猪只 有一种策略等待,大猪仍有两个策略,但此时, “等待”已成为大猪的劣策略,剔除,大猪的 最优策略——按
这是一个“多劳不多得,少劳不少得”的均衡
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论与主流经济学的发展
传统经济学的假设及其局限性
两个基本假设:完全竞争,完美信息 局限性:交易主体的数量其实很有限;信息是不对称的 一般均衡理论是整个经济学的理论基石和道义基础,市场机
博弈论与主流经济学的发展
博弈论研究的是:在策略性环境中如何进 行策略性决策和采取策略性行动的科学。 当成果无法由个体完全掌握,而结局须视 群体共同决策而定时,个人为了取胜,应 该采取什么策略
博弈论成为通用方法论,经济学、政治学、 管理、军事、外交、国际关系、公共选择、 犯罪学
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论:专门研究博弈如何出现均衡的规 律的学问
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
博弈论要点
博弈论的基本概念包括:参与人、参与人的策 略、参与人的支付(效用)
博弈有不同的种类:
从行动顺序角度:
篮球比赛是根据运动队在规定的比赛 时间里 得分多 少来决 定胜负 的,因 此,篮 球比赛 的计时 计分系 统是一 种得分 类型的 系统
《博弈论教程》课件
博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于对其他参与 者信息的了 解程度
完全信息博 弈
不完全信息 博弈
负和博弈
根据结果
零和博弈
正和博弈
特征 合作中如何分配利益,使大家都满意。 只考虑自己的利益,不考虑对方的利益。 做出策略虽然有先后,但每一方都不知
道对方的策略。 做出策略虽然有先后,但参与者对对方
做出的策略是知道。(例如下象棋) 博弈中对其他参与者的各方面信息、可
最理想的结局:双赢
一、正和博弈各方本着相互合作,公平公 正,互利互惠的原则分配利益,让每一 个人参与者都满意的博弈。
案例:鳄鱼鸟与鳄鱼和谐相处,生存搭档 的典型。凶恶的鳄鱼可以容忍鳄鱼鸟清 理它牙缝里的残肉,因为这样可以避免 滋生细菌,它的牙就不会生虫了。
二、博弈中发生冲突的时候,充公了解对 方、取长补短,各取所需,往往会使双 方走出负和博弈和零和博弈的误区,实 现合作共赢。
一年轻人在酒吧喝酒,中途去厕所。一美女尾随 他打劫,对他说:将钱和手机都交出来,否则 我说你非礼我。年轻人转念一想,计上心来, 用手指自己的嘴和耳朵。美女误以为他是聋哑 人,想放弃。年轻人掏出一支笔和一张纸在上 面写上:你说什么呀?
美女见状拿过笔来也在纸上写了:将钱和手机都 交出来,否则我说你非礼我。这时年轻人一把 抓住美女的手,大声喊道:我要送你去派出所 。
最坏的结果:两败俱伤
战争是典型的负和博弈:二战共有61个国 家卷入,涉及人口20亿以上。二战中军 民伤亡1.9亿,其中死亡6000万,受伤 1.3亿。其中死亡的平民有2730万。盟 军中苏联军队伤亡最为惨重,死亡890 万,中国军队死亡148万,英国与美国 各死亡38万。法西斯德国军队伤亡人数 1170万,军队死亡600万,日本军队伤 亡216万。
警察将他们两个分开审讯:分别对他们说:尽管 你们不承认,但是我知道人就是你们两个杀的, 事情早晚会水落石出的。现在我给你一个坦白 的机会,如果你坦白了,亚当拒不承认,那你 就是主动自首,同时协助警方破案,你将被立 即释放,亚当则要坐10年牢;如果你们都坦白 了,每人坐8年牢;都不坦白的话,可能以入 室盗窃罪判你们每人1年,如何选择你自己想 一想吧。
基于对其他参与者的信息的掌握程度、博 弈可以分为完全信息博弈和不完全信息 博弈。
完全信息博弈是指博弈中对其他参与者的 特征、利益、可能选择的策略等信息有 一个准确的了解。反之就是不完全信息 博弈。
按照结果来分博弈可分为:
1、零和博弈:一方赢,另一方输,双方 的得失总和永远为零。比如:赌博、炒 股。
两个好朋友合伙做生意,一个有资金但不 善于交际,另一个没有资金但能说会道 。两个人凑到一起,互相赏识,很快就 决定开一家公司,有资金的出资金,没 有资金的负责联络客户。
公司的业务动作得很好,看到公司开始赢 利,能说会道的那个人就想独自霸占公 司,他便将出资人的钱全部还给他,表 示公司不再欠他了。出资人肯定不同意 呀,就去法院起诉,可是到了法院才知 道营业执照上只写了能说会道的那个人 的名字。他一气之下放了一把火将公司 烧了。
能做出的策略全部了解。
局部了解对方的信息。
两败俱伤 一胜一负 双赢或多赢
双赢的案例:
一个有想了解天堂和地狱的差别,就去问 传教士,传教士将他带到一间二层楼的 房子。进入第一层,有张大餐桌,桌上 摆着各种美食,但是桌上每个人都满面 愁容。原来他们的手臂受到诅咒不能弯 曲,所以就不能享受桌上的美食。
又来到二楼,情况一样的,可是大家都吃 得很高兴,原来他们的手臂不能弯曲, 可是他们相互合作,互相喂食,这样各 人都可以得到自己想要的东西。
2、合作博弈是研究合作中如何分配利益 的问题,目的是使得协议框架内所有参 与者都满意。
(OPEC欧佩克:石油输出国的简称,为 了维护石油国的利益,统一调度石油的 出口和价格。也有行业寡头之间进行合 作博弈,垄断行业资源的负面博弈。)
3、非合作博弈:只争取对自己最大化的 利益,不考虑其他参与者的利益,与其 他参与者之间没有共同遵守的协议。
博弈论
-----------
一、什么是博弈论
博弈论,又称对策论;是研究冲突对抗条 件下最优决策问题的理论。
博弈论:指双方或多方在竞争、合作、冲突 等情况下,充分了解各方信息,并依此 选择一种能为本方争取最大利益的最优 决策的理论。
*博弈原指赌博、或警察局接到报案:一位富翁被杀死在家里,家中 财物也被洗劫一空,警方最终将嫌疑人锁定在 杰克和亚当的身上,因为当晚有人看见他们俩 慌张地从被害人家里跑出来,于是将俩人拘留。
三、博弈的四要素
1、至少有两个参与者 2、存在参与者在乎的利益 3、有策略;为获得最大利益而制定的方
法,策略必须要有选择性。也就是说至 少有两套以上的策略供选择的。 4、信息;是制定策略的依据,甄别信息 真假就显得格外重要。 诸葛亮空城记 美国西部淘金记
四、博弈的分类
1、根据参与者之间是否具有约束力的协 议,博弈分为:合作博弈和非合作博弈。
你猜他们会选择什么呀?
杰克 坦白 不坦白
亚当 坦白 (8,8) (10,0)
不坦白 (0,10) (1,1)
二、博弈论的历史发展
1、1944年,冯·诺依曼与摩根斯坦合 著的《博弈论与经济行为》发行出 版,将先前冯·诺依曼的主要只研究 二个博弈拓展为多人博弈;同时还 应用于经济领域,奠定了这门学科 的基础和理论体系。
2、负和博弈:参与者最后得到的收获都 小于付出。两败俱伤。
3、正和博弈:又称为双赢博弈或者合作 博弈,是指参与者都能获益,或者一方 的收益增加不影响其他参与者的利益。
判断生活中的博弈属于哪种?
图示博弈的分类
分类标准
博弈双方是否有 约束力的协 议
分类 合作博弈 非合作博弈
参与者做出策略 的先后顺序
静态博弈 动态博弈
非合作博弈是博弈的常态。
4、按照参与者选择策略、做出决定的先 后顺序,博弈可以分为静态博弈与动态 博弈。
静态博弈:参与者的策略有先后、但后做 出策略的参与者并不知道其他参与者的 策略。例:石头、剪刀、布。
动态博弈:后的参与者知道其他参与者提前选择 的策略。例如:下象棋、打扑克。
案例:年轻人智斗美女非礼劫财