博弈论及其应用教材
合集下载
博弈论初步及其应用
对未来的展望和期待
随着博弈论研究的不断深入和应用领域的不 断拓展,未来博弈论将进一步揭示人类行为 和社会现象的内在规律,为解决现实问题提 供更加有效的理论支持。
随着大数据和人工智能技术的发展,博弈论 将与这些领域进行更紧密的结合,为解决复 杂问题提供更加精准和高效的解决方案。
我们期待博弈论在未来能够发挥更大的作用 ,为人类社会的进步和发展做出更大的贡献 。
感谢您的观看
THANKS
扩展博弈论的理论框架
随着研究的深入,未来可以进一步扩展和完善博弈论的理 论框架,以更好地解释和预测各种复杂的博弈现象。
跨学科研究
未来可以进一步加强与其他学科的合作,通过跨学科的研 究来推动博弈论的发展和应用。
人工智能与机器学习
随着人工智能和机器学习技术的发展,未来可以探索如何 利用这些技术来改进博弈论的算法和计算能力,以更好地 解决大规模和复杂的博弈问题。
2
数据获取
在实际问题中,往往难以获取到全面和 准确的数据来支持博弈论分析。如何克 服数据限制,提高分析的可靠性和准确 性,是另一个挑战。
3
政策制定
将博弈论应用于政策制定需要充分考虑 政治、社会和经济等因素。如何平衡各 方利益,制定出有效的政策是博弈论在 实际应用中的重要挑战。
博弈论的未来研究方向与展望
06
结论
博弈论的重要性和应用价值
博弈论是研究决策过程中参与者之间相互影响、相互制约的学科,对于理解社会现象、解决实际问题 具有重要的理论价值和实际应用价值。
在经济学、政治学、社会学等领域,博弈论提供了深入分析参与者行为动机、预测行为结果的理论框架, 有助于更好地解释和预测现实世界中的各种现象。
博弈论在商业策略、国际关系、网络安全等领域也有广泛的应用,为相关问题的解决提供了新的思路和 方法。
博弈论讲义完整PPT课件
• 两个寡头企业选择产量的博弈:
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
大学课程《博弈论及其应用》PPT课件:第二章(1234节)
博弈方2
左
中
右
上 博弈方1
下
1,0 0,4
1,3 0,2
0,1 2,0
图 2-7 划线法
博弈的相对优势策略位置在图2-7标出,策略组合{上,中}格 子中的两个数字下面都划了短线,这个格子对应的策略组合 就是由划线法得到的纳什均衡。
第四节 箭头方法
还有一种寻找纳什均衡的方法,和划线法的分析理念的出发 点不同,这种方法的思路是对博弈中的每个策略组合进行分 析,判断各博弈方是否能够通过单独改变自己的策略而改善 自己的得益,如果可以,则从所考察的策略组合的得益引一 个箭头到改变策略后的策略组合对应的得益。这样对每个可 能的策略组合都分析考察过以后,根据箭头反映的情况来判 断博弈的结果。
博弈方2
Hale Waihona Puke 左中上 博弈方1
下
1,0 0,4
1,3 0,2
右
0,1 2,0
图 2-8 箭头法
观察图2-8,在策略组合{上,中}中只有指向的箭头,没有指 出的格子所代表的就是纳什均衡。
略“上”改变的倾向,用一个竖着的箭头表示这个倾向;横 着比较后面的得益,4比2大,4比0大,博弈方2没有改变的 动力。在策略组合{上,左}中,横着比较后面,分析博弈方2 的得益,3比0大,1比0大,所以博弈方2有从策略“左”向
策略“中”和策略“右”改变的倾向,用两个横向的箭头表 示这两个改变的倾向。
在策略组合{上,中}中,竖着比较前面的得益,还是横着比较后 面的得益,博弈方1和博弈方2都没有改变的倾向。在策略组合 {上,右}中,竖着比较前面,2比0大,博弈方1有从策略“上”
向策略“下”改变的倾向,用一个竖向的箭头表示这个倾向; 横着比较后面,3比1大,博弈方2有从策略“右”向策略“中” 改变的倾向,用一个横向的箭头表示这个倾向。
博弈论及其应用
19
无限重复博弈
• 令 ,并由博弈方收益对称性,不难得出, 有唯一的纯策略纳什均衡和均衡结果:
s (30,30,30,30,30)
cቤተ መጻሕፍቲ ባይዱ
u i 0 si
ui (sc ) 4500
i 1, 2,3, 4,5
s • 若5条游船达成合作,统一定价为 ,
s ( s ,s ,s ,s ,s ) 此时行动组合为
4
1
2
1 (3.3.2) 3
《博弈论及其应用》 (汪贤裕)
12
例3.3.1
结论:
价格战重复博弈(续)
• 当贴现率 1/3 时,局中人1不愿单独改变自己的策略; • 当贴现率 1/3 时,局中人2也不愿单独改变自己的策略;
• 因此,当 1/3 时,上述策略组成的策略组合是一个均衡点。由 于时期t是任意的,因此这个策略组合也是一个子博弈完美纳什
• 在例3.3.2中,若5位船主的协调策略选择 s 80,可以计算出
ui ( s ) 8000
i ( s ) 12500 9 /16
这样降低了对合作的限制,增加了合作的可能性。
《博弈论及其应用》 (汪贤裕)
22
有限重复博弈
例3.3.3 双寡头垄断定价博弈 • 现有两个厂商垄断生产某一产品,每一个厂商在定价上都有策略 集, Si {高价,中价,低价},
i 1, 2
• 其收益函数如右表。 • 假设博弈只进行一次,则有 两个纯策略纳什均衡(中价,中价)和(低价,低价),对应的 均衡结果分别是(3,3)和(1,1)
《博弈论及其应用》 (汪贤裕)
23
有限重复博弈
大学课程《博弈论及其应用》PPT课件:第一章
2021/11/19
• 博弈方:两个嫌疑犯A和 B。 • 策略: 每个嫌疑犯的行动集是(坦白,不坦白)。 • 收益:对应于每种策略组合,有相应的收益结果。 • 策略组合:嫌疑犯A和B从可以选择的策略中选择并实施,有四种
情况(括号中前面是A的策略,后面是B的策略)。 • 每个策略组合对应下的A的结果,从优到劣,依次为: • (坦白,不坦白),结果是A被释放; • (不坦白,不坦白),A被判刑1年; • (坦白,坦白),各被判5年; • (不坦白,坦白),A被判8年。 • 同理,每个策略组合对应下的B的结果,从优到劣,依次为: • (不坦白,坦白)、(不坦白,不坦白)、(坦白,坦白)、(坦白,不坦
第一章 博弈概述
2021/11/19
第一节 海滩占位问题
我们来到海滩。夏天很多游客喜欢在在海边晒太阳,游泳。海滩有 月牙形,弧形,绵延数公里。为了研究问题方便,我们姑且把海滩 的长度抽象定为1,[0,1]区间就表示海滩的长度。 A和B是两个小商 贩,出售无差异的补给品,同质同价,同一品牌的矿泉水,面包等 。“*”表示游客均匀的分布在海滩上,游客就近购买补给品。在 沙滩上应该如何分布两个小商贩的位置呢?
• A猎兔,B猎兔,鹿逃掉,A收益一只兔子,B收益一只兔子。
• 可见,每个猎人的期望,不能由自己决定,要看对方的策略选择 ,是能够捉得到鹿,依赖对方的选择,如果对方选择捉兔子,而 你选择猎鹿,这个策略组合,对你而言,是最差的选择,也是最 坏的策略。
2021/11/19
第三节 博弈论是什么
• 博弈论:就是关于包含相互依存情况中理性行为的研究。 • 博弈的三要素: • 博弈方----参与博弈但利益不完全一致者。有二人博弈与多人博弈
的故事,它的重要性在大量情形中体现,参与者面临着与故事中嫌 疑犯面临的同样的动机。
• 博弈方:两个嫌疑犯A和 B。 • 策略: 每个嫌疑犯的行动集是(坦白,不坦白)。 • 收益:对应于每种策略组合,有相应的收益结果。 • 策略组合:嫌疑犯A和B从可以选择的策略中选择并实施,有四种
情况(括号中前面是A的策略,后面是B的策略)。 • 每个策略组合对应下的A的结果,从优到劣,依次为: • (坦白,不坦白),结果是A被释放; • (不坦白,不坦白),A被判刑1年; • (坦白,坦白),各被判5年; • (不坦白,坦白),A被判8年。 • 同理,每个策略组合对应下的B的结果,从优到劣,依次为: • (不坦白,坦白)、(不坦白,不坦白)、(坦白,坦白)、(坦白,不坦
第一章 博弈概述
2021/11/19
第一节 海滩占位问题
我们来到海滩。夏天很多游客喜欢在在海边晒太阳,游泳。海滩有 月牙形,弧形,绵延数公里。为了研究问题方便,我们姑且把海滩 的长度抽象定为1,[0,1]区间就表示海滩的长度。 A和B是两个小商 贩,出售无差异的补给品,同质同价,同一品牌的矿泉水,面包等 。“*”表示游客均匀的分布在海滩上,游客就近购买补给品。在 沙滩上应该如何分布两个小商贩的位置呢?
• A猎兔,B猎兔,鹿逃掉,A收益一只兔子,B收益一只兔子。
• 可见,每个猎人的期望,不能由自己决定,要看对方的策略选择 ,是能够捉得到鹿,依赖对方的选择,如果对方选择捉兔子,而 你选择猎鹿,这个策略组合,对你而言,是最差的选择,也是最 坏的策略。
2021/11/19
第三节 博弈论是什么
• 博弈论:就是关于包含相互依存情况中理性行为的研究。 • 博弈的三要素: • 博弈方----参与博弈但利益不完全一致者。有二人博弈与多人博弈
的故事,它的重要性在大量情形中体现,参与者面临着与故事中嫌 疑犯面临的同样的动机。
博弈论及其应用绪论四川大学
• 局中人 i 的策略集 S i:
S A ,{承认,不承认 } SB {承认,不承认 }
• 局中人i 的支付函数 Pi
PA (承认,承认) 8, PA (承认,不承认) 0, PA (不承认,承认) 10, PA(不承认,不承认) 1, PB (承认,承认) 8, PB (承认,不承认) 10, PB (不承认,承认) 0, PB (不承认,不承认) 1.
2021/3/7
《博弈论及其应用》 (汪贤裕)
‹3#1›
二人取数游戏2(续)
树形图表示
2021/3/7
《博弈论及其应用》 (汪贤裕)
‹3#2›
什么是扩展式表示
扩展式表示博弈的6要素: • 局中人集合
• 局中人的行动顺序
• 局中人的行动空间(行动集)
• 局中人的信息集
• 局中人的损益函数
• “自然”的概率分布
‹#5›
§1.1.1 什么是博弈论
※ 博弈论的来源 ※ 博弈论研究的特点 ※ 博弈论的应用领域 ※ 博弈论解决的问题 ※ 学者对博弈论的定义 ※ 博弈论与决策论的区别
2021/3/7
《博弈论及其应用》 (汪贤裕)
‹#6›
博弈论的来源
博弈论来自英文Game Theory ,与游戏有着 密切的关系。它最早是从游戏开始的。
二章介绍)这时,博弈也称为规范式表示,并记
为 G [N ,{X。i},{Pi}]
2021/3/7
《博弈论及其应用》 (汪贤裕)
‹2#2›
囚犯困境
警察拘捕了两个犯罪嫌疑人进行隔离审讯,检察 官认为他们犯有某项罪行,但又缺乏足够的证据 指证他们的罪行。如果两个嫌疑犯中至少有一个 供认犯罪,就能确定罪名成立。为了获得所需的 口供,警察将两人分别关押以防止他们串供,并 分别向两个嫌疑人指出两条路:承认犯罪和不承 认。如果两人都承认,则两人都将被判刑,每人 各判8个月。如果两个人都不承认,由于检察官 没有足够的证据,他们将作为犯小案件处理,分 别判刑1个月。如果其中一个人承认,而另一个 人不承认,则承认罪行者,将得到立功宽大处理, 不判刑而释放,而不承认者将受到严惩,判刑10 个月。此时,犯罪嫌疑人将如何采用自己的行动 呢?
S A ,{承认,不承认 } SB {承认,不承认 }
• 局中人i 的支付函数 Pi
PA (承认,承认) 8, PA (承认,不承认) 0, PA (不承认,承认) 10, PA(不承认,不承认) 1, PB (承认,承认) 8, PB (承认,不承认) 10, PB (不承认,承认) 0, PB (不承认,不承认) 1.
2021/3/7
《博弈论及其应用》 (汪贤裕)
‹3#1›
二人取数游戏2(续)
树形图表示
2021/3/7
《博弈论及其应用》 (汪贤裕)
‹3#2›
什么是扩展式表示
扩展式表示博弈的6要素: • 局中人集合
• 局中人的行动顺序
• 局中人的行动空间(行动集)
• 局中人的信息集
• 局中人的损益函数
• “自然”的概率分布
‹#5›
§1.1.1 什么是博弈论
※ 博弈论的来源 ※ 博弈论研究的特点 ※ 博弈论的应用领域 ※ 博弈论解决的问题 ※ 学者对博弈论的定义 ※ 博弈论与决策论的区别
2021/3/7
《博弈论及其应用》 (汪贤裕)
‹#6›
博弈论的来源
博弈论来自英文Game Theory ,与游戏有着 密切的关系。它最早是从游戏开始的。
二章介绍)这时,博弈也称为规范式表示,并记
为 G [N ,{X。i},{Pi}]
2021/3/7
《博弈论及其应用》 (汪贤裕)
‹2#2›
囚犯困境
警察拘捕了两个犯罪嫌疑人进行隔离审讯,检察 官认为他们犯有某项罪行,但又缺乏足够的证据 指证他们的罪行。如果两个嫌疑犯中至少有一个 供认犯罪,就能确定罪名成立。为了获得所需的 口供,警察将两人分别关押以防止他们串供,并 分别向两个嫌疑人指出两条路:承认犯罪和不承 认。如果两人都承认,则两人都将被判刑,每人 各判8个月。如果两个人都不承认,由于检察官 没有足够的证据,他们将作为犯小案件处理,分 别判刑1个月。如果其中一个人承认,而另一个 人不承认,则承认罪行者,将得到立功宽大处理, 不判刑而释放,而不承认者将受到严惩,判刑10 个月。此时,犯罪嫌疑人将如何采用自己的行动 呢?
博弈论及其应用-第一章
本课程的目标Zhanghongxia@
授课方法基本内容PART1 导论试验1
试验2什么是博弈
什么是博弈什么情况下适宜用博弈模型
这两个企业是否与购买其商品的消费者进行博
弈?为什么?
什么情况下适宜用博弈模型什么情况下适宜用博弈模型
如何描述一个博弈如何描述一个博弈
中,所有同学
如何描述一个博弈如何描述一个博弈
NOTE:
所理解的均衡不同,例如在一般均衡理论中,均衡如何描述一个博弈信息
博弈的表述方式博弈的表述方式
博弈论的分类博弈的分类及对应的均衡概念博弈的分类及对应的均衡概念博弈的分类及对应的均衡概念
博弈论概述
博弈论概述博弈论概述
博弈论概述国民经济管理系
博弈论概述博弈论概述博弈论概述本章小结。
博弈论及其应用纯战略纳什均衡的应用课件
争等。
纯战略纳什均衡的求解方法
迭代法
通过不断迭代计算每个参与者的 最优策略,逐步逼近纯战略纳什
均衡。
代数法
利用代数方法求解纯战略纳什均衡 ,适用于某些特定类型的博弈。
线性规划法
通过线性规划方法求解纯战略纳什 均衡,适用于具有线性特征的博弈 。
纯战略纳什均衡的应用场景
商业竞争
纯战略纳什均衡可用于分析商业 竞争中的策略选择和竞争格局。
06
纯战略纳什均衡在其他领域的应用
军事战略中的纯战略纳什均衡
总结词
军事战略中,纯战略纳什均衡可以应用于分析敌我双方的策略互动,制定最优的军事行 动计划。
详细描述
在军事战略中,纯战略纳什均衡可以用来分析敌对双方在战争中的策略互动。通过理解 对手可能的反应和最优行动,可以制定出最优的军事行动计划,以最大化己方的利益。 例如,在战争中,了解敌人的兵力部署和行动模式,可以预测其可能的反击或进攻,从
通过反复迭代计算来逼近纳什均衡。
03
纯战略纳什均衡
纯战略纳什均衡的定义
纯战略纳什均衡是一种博弈策略 组合,其中每个参与者在给定其 他参与者策略的情况下,选择自
己的最优策略。
在纯战略纳什均衡中,每个参与 者的最优策略都是基于其他参与 者的策略选择的,从而形成一种
稳定的策略组合。
纯战略纳什均衡是一种非合作博 弈的解概念,适用于各种不同类 型的博弈,如囚徒困境、寡头竞
政治博弈
在政治博弈中,纯战略纳什均衡 可用于分析政治家、利益集团等 参与者的策略选择和利益分配。
经济合作
在经济合作博弈中,纯战略纳什 均衡可用于分析国家之间的贸易 合作、关税战等策略选择和利益
分配。
04
纯战略纳什均衡在经济学中的应用
纯战略纳什均衡的求解方法
迭代法
通过不断迭代计算每个参与者的 最优策略,逐步逼近纯战略纳什
均衡。
代数法
利用代数方法求解纯战略纳什均衡 ,适用于某些特定类型的博弈。
线性规划法
通过线性规划方法求解纯战略纳什 均衡,适用于具有线性特征的博弈 。
纯战略纳什均衡的应用场景
商业竞争
纯战略纳什均衡可用于分析商业 竞争中的策略选择和竞争格局。
06
纯战略纳什均衡在其他领域的应用
军事战略中的纯战略纳什均衡
总结词
军事战略中,纯战略纳什均衡可以应用于分析敌我双方的策略互动,制定最优的军事行 动计划。
详细描述
在军事战略中,纯战略纳什均衡可以用来分析敌对双方在战争中的策略互动。通过理解 对手可能的反应和最优行动,可以制定出最优的军事行动计划,以最大化己方的利益。 例如,在战争中,了解敌人的兵力部署和行动模式,可以预测其可能的反击或进攻,从
通过反复迭代计算来逼近纳什均衡。
03
纯战略纳什均衡
纯战略纳什均衡的定义
纯战略纳什均衡是一种博弈策略 组合,其中每个参与者在给定其 他参与者策略的情况下,选择自
己的最优策略。
在纯战略纳什均衡中,每个参与 者的最优策略都是基于其他参与 者的策略选择的,从而形成一种
稳定的策略组合。
纯战略纳什均衡是一种非合作博 弈的解概念,适用于各种不同类 型的博弈,如囚徒困境、寡头竞
政治博弈
在政治博弈中,纯战略纳什均衡 可用于分析政治家、利益集团等 参与者的策略选择和利益分配。
经济合作
在经济合作博弈中,纯战略纳什 均衡可用于分析国家之间的贸易 合作、关税战等策略选择和利益
分配。
04
纯战略纳什均衡在经济学中的应用
博弈论基础与应用概述
0,-5 , -1,-1 ,
囚徒困境( 囚徒困境( Prisoners’Dilemma ) 只达到效率很差的个体理性解, 只达到效率很差的个体理性解,没有实现团体 理性解。 理性解。 前者是稳定的,是自动实施的; 前者是稳定的,是自动实施的;尽管团体理性 解对大家都好,但它是不能自动实施的, 解对大家都好,但它是不能自动实施的,需要改变 条件。 条件。 提示: 提示:该博弈揭示了个体理性与团体理性之间的矛 盾。——从个体利益出发的行为往往不能实现团体的 最大利益,同时也揭示了个体理性本身的内在矛盾— —从个体利益出发的行为最终也不一定能真正实现个 体的最大利益,甚至得到相当差的结果。
博弈论基础与应用
“要想在现代社会做 一个有文化的人, 一个有文化的人,你 必须对博弈论有一个 大致了解。 大致了解。”
保罗. 保罗.萨缪尔森
教材
博弈论基础与应用》 《博弈论基础与应用》 吴广谋 吕周洋 东南大学出版社
考试成绩
平时----30%(出勤、作业、报告) (出勤、作业、报告) 平时 笔试----70% 笔试
效用函数和支付(Payoffs function) :参与人行动 效用函数和支付 及其他人行动组合实施时所产生结果的评价, 及其他人行动组合实施时所产生结果的评价,它反 映了参与人的偏好。各博弈方从博弈中所获得的利 映了参与人的偏好。 益。 参与人的支付函数不仅取决于自己的策略选择, 参与人的支付函数不仅取决于自己的策略选择,而 且取决于所有其他参与人的策略选择, 且取决于所有其他参与人的策略选择,即参与人的 利益是相互制约的。 利益是相互制约的。 支付对应博弈的结果, 支付对应博弈的结果,也就是各博弈方策略组合的 结果。 结果。 支付是各博弈方追求的根本目标及行为和判断的主
《博弈论教程》课件
博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
四川大学博弈论及其应用教案
四川大学教案
【首页】
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
四川大学教案
【理、工科】
第页
第页
备注:
各学院可根据参考格式,结合本学科课程的特点,另行规范教案的格式,但本学院所开各门课程的教案必须统一格式。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
原因?
– 由于旅行成本的上升,不同商店出售的产品之间 的替代性下降,每个商店对附近消费者的垄断力 加强,商店之间的竞争越来越弱,消费者对价格 的敏感度下降,从而每个商店的最优价格更接近 垄断价格
– 旅行成本为0时,不同商店的产品间具有完全的 替代性,没有任何一个商店可以把价格定的高于 成本
张红霞 国民经济管理系
张红霞 国民经济管理系
公共物品的私人自愿供给
富人A
修 不修
富人B 修
3,3
4,2
不修
2,4
1,1
张红霞 国民经济管理系
小结
纯战略纳什均衡的应用
– 投票博弈 – 产量竞争模型 – 价格竞争模型 – 公共地的悲剧 – 公共物品的私人自愿供给
张红霞 国民经济管理系
补充
伯川德寡头竞争模型 体会纳什均衡:“最后归宿”博弈 纳什均衡的观察与验证
根据一阶条件
v(G**) G**v' (G**) c
纳什均衡总饲养量满足
v(G*) G* v' (G*) c n
张红霞 国民经济管理系
纯战略纳什均衡的应用
投票博弈 Cournot 寡头竞争模型 Hotelling 价格竞争模型 公共地的悲剧
公共物品的私人自愿供给
基础设施建设:中央政府与地方政府之 间的博弈
请分析这个博弈的纳什均衡。
张红霞 国民经济管理系
投票博弈
分析方法
参与人3-A
参与人2
A
B
C
参与人1
A 2,0,1 2,0,1
B 2,0,1
1,2,0
2,0,1 2,0,1
张红霞 国民经济管理系
C 2,0,1 2,0,1
0,1,2
投票博弈
参与人3-B
参与人2
A
B
参与人1
A 2,0,1 1,2,0
公共地的悲剧
增加一只羊有正负两方面的效应,正效 应是这只羊本身的价值,负的效应是这 只羊使之前所有羊的价值下降
张红霞 国民经济管理系
公共地的悲剧
通过一阶条件可以得到n个反应函数,这n个反 应函数的交点就是此问题的纳什均衡。
某一个农民的最优饲养量随其他农民饲养量的 增加而减少, gi / g j 0 。
间的博弈
张红霞 国民经济管理系
投票博弈
三个参与人1,2,3,有三种方案A、B和C。 参与人通过投票的方式决定采用哪个方 案;不允许弃权。如果没有方案能获得 多数,则采用方案A。收益函数为
u1(A)= u2(B)= u3(C)=2 u1(B)= u2(C)= u3(A)=1 u1(C)= u2(A)= u3(B)=0
张红霞 国民经济管理系
伯川德寡头竞争模型
古诺模型是产量竞争模型 伯川德模型是价格竞争模型 描述
– 参与人:n个寡头厂商 – 行动:选择价格 – 支付函数:利润函数
如果厂商i是m个定价最低者之一,则利润
张红霞 国民经济管理系
piD( pi ) / m cD( pi ) / m
伯川德寡头竞争模型
Hotelling 价格竞争模型
当两个商店位于同一位置时,消费者关心的 只是价格问题,则均衡为
思考:请分析两个商店位于任何位置的情况
张红霞 国民经济管理系
纯战略纳什均衡的应用
投票博弈 Cournot 寡头竞争模型 Hotelling 价格竞争模型
公共地的悲剧
公共物品的私人自愿供给 基础设施建设:中央政府与地方政府之
投票博弈
Cournot 寡头竞争模型
Hotelling 价格竞争模型 公共地的悲剧 公共物品的私人自愿供给 基础设施建设:中央政府与地方政府之
间的博弈
张红霞 国民经济管理系
Cournot 寡头竞争模型
这是一个寡头竞争的产量选择模型。其 产品满足同质性假定。
产量是连续变量,因此参与者的策略有 无穷多个,无法使用矩阵表的方法求解
博弈论及其应用
——完全信息静态博弈: 纯战略纳什均衡的应用
纯战略纳什均衡的应用
投票博弈 Cournot 寡头竞争模型 Hotelling 价格竞争模型 公共地的悲剧 公共物品的私人自愿供给 基础设施建设:中央政府与地方政府之
间的博弈
张红霞 国民经济管理系
纯战略纳什均衡的应用
投票博弈
Cournot 寡头竞争模型 Hotelling 价格竞争模型 公共地的悲剧 公共物品的私人自愿供给 基础设施建设:中央政府与地方政府之
为1 – 两个商店提供单位产品的成本都为c – 消费者购买商品的单位
距离成本为t – 消费者具有单位需求,消费者剩余为s
张红霞 国民经济管理系
Hotelling 价格竞争模型
商店1 0 1的消费群
x
2的消费群
原来去两边花 的钱一样 呀、、、、
商店2 1
张红霞 国民经济管理系
Hotelling 价格竞争模型
对Cournot寡头竞争模型的分析
– 囚徒困境在企业竞争问题中的体现 – 对比两人有限博弈的企业产量确定模型
• 假设每个企业都有两种策略可以选择:高产量和 低产量
• 企业的收益表如下
– 同时高产量,则收益都为600; – A高产量,B低产量,则A收益800,B收益400 – A低产量,B高产量,则A收益400,B收益800 – 同时低产量,则同时收益700
张红霞 国民经济管理系
休息一下
游戏:分钱 规则:两个人分1000元钱,每个人独立
提出自己想要的钱数,写下来,都交给 第三方。如果两人提出的钱数之和小于 等于1000元,则每个人得到自己要求的 数额。否则,两人都一分钱都得不到, 所有钱归裁判。 做法:三人一组,所有同学分为若干组, 每组两个人分钱,另一个人做裁判。
– 从一方垄断开始
张红霞 国民经济管理系
Cournot 寡头竞争模型
q2 R1(q2)
NE
q2*
R2(q1)
张红霞
国民经济管理系
q1*
q1
Cournot 寡头竞争模型
假如没有竞争,在完全垄断的情况下
与垄断相比,寡头竞争的纳什均衡产量比较 大,而利润则相对较小
张红霞 国民经济管理系
Cournot 寡头竞争模型
否则利润为0。D(p)为需求函数,假设
D( p) a p
假设只有两个厂商,利润函数
( p1 c)(a p1) if p1 p2
1(
p1,
p2 )
1
2
(
p1
0 if p1 p2
张红霞 国民经济管理系
伯川德寡头竞争模型
假设消费者对价格非常敏感 请分析这个问题
公共物品的私人自愿供给
张红霞 国民经济管理系
公共物品的私人自愿供给
张红霞 国民经济管理系
公共物品的私人自愿供给
即在其他人选择给定的情况下,购买公 共物品的边际效用与购买私人物品的边 际效用之比,也就是边际替代率,等于 这两种产品的价格之比
张红霞 国民经济管理系
公共物品的私人自愿供给
考虑帕累托最优的情况
– 反应函数的含义就在于:每个企业的最优战 略都是其他企业战略的函数,是建立在相互 影响、相互博弈的基础上的。
– 反应函数的交点就是纳什均衡
张红霞 国民经济管理系
Cournot 寡头竞争模型
例如,在反应函数为线性的情况下:
q2 R1(q2)
NE
q2*
R2(q1)
张红霞
国民经济管理系
q1*
q1
Cournot 寡头竞争模型
假定有两个垄断者,即此博弈有两个参 与人
其支付是利润,支付函数是产量的函数
张红霞 国民经济管理系
Cournot 寡头竞争模型
张红霞 国民经济管理系
Cournot 寡头竞争模型
上述问题是一个简单的最优化求解,可 以通过一阶必要条件进行分析:
张红霞 国民经济管理系
Cournot 寡头竞争模型
一阶条件定义了反应 函数(reaction function)
企业要决定的是价格,因此,其策略空 间都由不同的价格组成,这里价格是连 续变量
要考虑消费者的成本和效用。
张红霞 国民经济管理系
Hotelling 价格竞争模型
为使问题简化,做如下假定
– 一个长度为1的线性城市 – 商店1和商店2分别位于城市的两端 – 消费者均匀的分布在[0,1]区间上,分布密度
具体来说,假定两个企业具有不变单位成本c, 逆需求函数P=a-(q1+q2)
纳什均衡q1*
q* 2
1 3
(a
c); 纳什均衡利润
1
(q1*
,
q* 2
)
2
(q1*
,
q* 2
)
1 9
(a
c)2
张红霞 国民经济管理系
Cournot 寡头竞争模型
Cournot模型的重复剔除求解方法
– 可以利用重复剔除的方法求解Cournot模型 的均衡点。
张红霞 国民经济管理系
Cournot 寡头竞争模型
企业A
• 用矩阵表分析这个问题,得到与产量是连续变量 的模型相同的结果,即选择高产量。
企业B
高产量
低产量
高产量 低产量
600,600 400,800
800,400 700,700
张红霞 国民经济管理系
Cournot 寡头竞争模型
讨论:在Cournot产量竞争模型中,如果 参与人的个数为n个,会出现什么情况? 每个企业有相同的不变单位生产成本c, 价格函数(逆需求函数)p=a-Q, Q为所 有参与人产量的合计。企业i的战略是选 择产量qi,最大化自己的利润qi(a-Q-c),给 定其他企业的产量向量q-i
张红霞 国民经济管理系
– 由于旅行成本的上升,不同商店出售的产品之间 的替代性下降,每个商店对附近消费者的垄断力 加强,商店之间的竞争越来越弱,消费者对价格 的敏感度下降,从而每个商店的最优价格更接近 垄断价格
– 旅行成本为0时,不同商店的产品间具有完全的 替代性,没有任何一个商店可以把价格定的高于 成本
张红霞 国民经济管理系
张红霞 国民经济管理系
公共物品的私人自愿供给
富人A
修 不修
富人B 修
3,3
4,2
不修
2,4
1,1
张红霞 国民经济管理系
小结
纯战略纳什均衡的应用
– 投票博弈 – 产量竞争模型 – 价格竞争模型 – 公共地的悲剧 – 公共物品的私人自愿供给
张红霞 国民经济管理系
补充
伯川德寡头竞争模型 体会纳什均衡:“最后归宿”博弈 纳什均衡的观察与验证
根据一阶条件
v(G**) G**v' (G**) c
纳什均衡总饲养量满足
v(G*) G* v' (G*) c n
张红霞 国民经济管理系
纯战略纳什均衡的应用
投票博弈 Cournot 寡头竞争模型 Hotelling 价格竞争模型 公共地的悲剧
公共物品的私人自愿供给
基础设施建设:中央政府与地方政府之 间的博弈
请分析这个博弈的纳什均衡。
张红霞 国民经济管理系
投票博弈
分析方法
参与人3-A
参与人2
A
B
C
参与人1
A 2,0,1 2,0,1
B 2,0,1
1,2,0
2,0,1 2,0,1
张红霞 国民经济管理系
C 2,0,1 2,0,1
0,1,2
投票博弈
参与人3-B
参与人2
A
B
参与人1
A 2,0,1 1,2,0
公共地的悲剧
增加一只羊有正负两方面的效应,正效 应是这只羊本身的价值,负的效应是这 只羊使之前所有羊的价值下降
张红霞 国民经济管理系
公共地的悲剧
通过一阶条件可以得到n个反应函数,这n个反 应函数的交点就是此问题的纳什均衡。
某一个农民的最优饲养量随其他农民饲养量的 增加而减少, gi / g j 0 。
间的博弈
张红霞 国民经济管理系
投票博弈
三个参与人1,2,3,有三种方案A、B和C。 参与人通过投票的方式决定采用哪个方 案;不允许弃权。如果没有方案能获得 多数,则采用方案A。收益函数为
u1(A)= u2(B)= u3(C)=2 u1(B)= u2(C)= u3(A)=1 u1(C)= u2(A)= u3(B)=0
张红霞 国民经济管理系
伯川德寡头竞争模型
古诺模型是产量竞争模型 伯川德模型是价格竞争模型 描述
– 参与人:n个寡头厂商 – 行动:选择价格 – 支付函数:利润函数
如果厂商i是m个定价最低者之一,则利润
张红霞 国民经济管理系
piD( pi ) / m cD( pi ) / m
伯川德寡头竞争模型
Hotelling 价格竞争模型
当两个商店位于同一位置时,消费者关心的 只是价格问题,则均衡为
思考:请分析两个商店位于任何位置的情况
张红霞 国民经济管理系
纯战略纳什均衡的应用
投票博弈 Cournot 寡头竞争模型 Hotelling 价格竞争模型
公共地的悲剧
公共物品的私人自愿供给 基础设施建设:中央政府与地方政府之
投票博弈
Cournot 寡头竞争模型
Hotelling 价格竞争模型 公共地的悲剧 公共物品的私人自愿供给 基础设施建设:中央政府与地方政府之
间的博弈
张红霞 国民经济管理系
Cournot 寡头竞争模型
这是一个寡头竞争的产量选择模型。其 产品满足同质性假定。
产量是连续变量,因此参与者的策略有 无穷多个,无法使用矩阵表的方法求解
博弈论及其应用
——完全信息静态博弈: 纯战略纳什均衡的应用
纯战略纳什均衡的应用
投票博弈 Cournot 寡头竞争模型 Hotelling 价格竞争模型 公共地的悲剧 公共物品的私人自愿供给 基础设施建设:中央政府与地方政府之
间的博弈
张红霞 国民经济管理系
纯战略纳什均衡的应用
投票博弈
Cournot 寡头竞争模型 Hotelling 价格竞争模型 公共地的悲剧 公共物品的私人自愿供给 基础设施建设:中央政府与地方政府之
为1 – 两个商店提供单位产品的成本都为c – 消费者购买商品的单位
距离成本为t – 消费者具有单位需求,消费者剩余为s
张红霞 国民经济管理系
Hotelling 价格竞争模型
商店1 0 1的消费群
x
2的消费群
原来去两边花 的钱一样 呀、、、、
商店2 1
张红霞 国民经济管理系
Hotelling 价格竞争模型
对Cournot寡头竞争模型的分析
– 囚徒困境在企业竞争问题中的体现 – 对比两人有限博弈的企业产量确定模型
• 假设每个企业都有两种策略可以选择:高产量和 低产量
• 企业的收益表如下
– 同时高产量,则收益都为600; – A高产量,B低产量,则A收益800,B收益400 – A低产量,B高产量,则A收益400,B收益800 – 同时低产量,则同时收益700
张红霞 国民经济管理系
休息一下
游戏:分钱 规则:两个人分1000元钱,每个人独立
提出自己想要的钱数,写下来,都交给 第三方。如果两人提出的钱数之和小于 等于1000元,则每个人得到自己要求的 数额。否则,两人都一分钱都得不到, 所有钱归裁判。 做法:三人一组,所有同学分为若干组, 每组两个人分钱,另一个人做裁判。
– 从一方垄断开始
张红霞 国民经济管理系
Cournot 寡头竞争模型
q2 R1(q2)
NE
q2*
R2(q1)
张红霞
国民经济管理系
q1*
q1
Cournot 寡头竞争模型
假如没有竞争,在完全垄断的情况下
与垄断相比,寡头竞争的纳什均衡产量比较 大,而利润则相对较小
张红霞 国民经济管理系
Cournot 寡头竞争模型
否则利润为0。D(p)为需求函数,假设
D( p) a p
假设只有两个厂商,利润函数
( p1 c)(a p1) if p1 p2
1(
p1,
p2 )
1
2
(
p1
0 if p1 p2
张红霞 国民经济管理系
伯川德寡头竞争模型
假设消费者对价格非常敏感 请分析这个问题
公共物品的私人自愿供给
张红霞 国民经济管理系
公共物品的私人自愿供给
张红霞 国民经济管理系
公共物品的私人自愿供给
即在其他人选择给定的情况下,购买公 共物品的边际效用与购买私人物品的边 际效用之比,也就是边际替代率,等于 这两种产品的价格之比
张红霞 国民经济管理系
公共物品的私人自愿供给
考虑帕累托最优的情况
– 反应函数的含义就在于:每个企业的最优战 略都是其他企业战略的函数,是建立在相互 影响、相互博弈的基础上的。
– 反应函数的交点就是纳什均衡
张红霞 国民经济管理系
Cournot 寡头竞争模型
例如,在反应函数为线性的情况下:
q2 R1(q2)
NE
q2*
R2(q1)
张红霞
国民经济管理系
q1*
q1
Cournot 寡头竞争模型
假定有两个垄断者,即此博弈有两个参 与人
其支付是利润,支付函数是产量的函数
张红霞 国民经济管理系
Cournot 寡头竞争模型
张红霞 国民经济管理系
Cournot 寡头竞争模型
上述问题是一个简单的最优化求解,可 以通过一阶必要条件进行分析:
张红霞 国民经济管理系
Cournot 寡头竞争模型
一阶条件定义了反应 函数(reaction function)
企业要决定的是价格,因此,其策略空 间都由不同的价格组成,这里价格是连 续变量
要考虑消费者的成本和效用。
张红霞 国民经济管理系
Hotelling 价格竞争模型
为使问题简化,做如下假定
– 一个长度为1的线性城市 – 商店1和商店2分别位于城市的两端 – 消费者均匀的分布在[0,1]区间上,分布密度
具体来说,假定两个企业具有不变单位成本c, 逆需求函数P=a-(q1+q2)
纳什均衡q1*
q* 2
1 3
(a
c); 纳什均衡利润
1
(q1*
,
q* 2
)
2
(q1*
,
q* 2
)
1 9
(a
c)2
张红霞 国民经济管理系
Cournot 寡头竞争模型
Cournot模型的重复剔除求解方法
– 可以利用重复剔除的方法求解Cournot模型 的均衡点。
张红霞 国民经济管理系
Cournot 寡头竞争模型
企业A
• 用矩阵表分析这个问题,得到与产量是连续变量 的模型相同的结果,即选择高产量。
企业B
高产量
低产量
高产量 低产量
600,600 400,800
800,400 700,700
张红霞 国民经济管理系
Cournot 寡头竞争模型
讨论:在Cournot产量竞争模型中,如果 参与人的个数为n个,会出现什么情况? 每个企业有相同的不变单位生产成本c, 价格函数(逆需求函数)p=a-Q, Q为所 有参与人产量的合计。企业i的战略是选 择产量qi,最大化自己的利润qi(a-Q-c),给 定其他企业的产量向量q-i
张红霞 国民经济管理系