博弈论教程

合集下载

第六讲博弈论课件

第六讲博弈论课件
❖ 对于矩阵博弈,其主要的任务就是求出矩阵 博弈的Nash均衡解-----双方尽可能满意的结 果。
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物,按者支付2个单位 成本,小踩,(1,5)大踩(4,2)同时 (2,4)
大猪
小猪

踩 2,4 等待 4,2
等待
1,5 0,0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来,纳什、泽尔腾、海萨尼 等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈 论的重要论文,彻底改变了人们对竞争和市 场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均 衡。从而揭示了博弈均衡与经济均衡的内在 联系。因为在现实世界中,非合作博弈要比 合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋(串 供)时,才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性,认为 时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中,参与者之间的信息传递决定 了其行动空间和最优战略的选择;
❖ 同时,博弈过程中始终存在一个先后问题 Sequence order,参与人的行动次序对博弈 最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与 人对其它参与人的特征、战略空间和支付的 知识、信息,是否了解两个角度进行。

博弈论原理模型与教程扩展式博弈

博弈论原理模型与教程扩展式博弈

《博弈论:原理、模型与教程》第二部分完全信息动态博弈第6章扩展式博弈(已精细订正!)对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。

前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。

但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。

本章将介绍一种新的博弈问题描述方式—扩展式博弈。

从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。

在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。

6.1 扩展式博弈(文字描述、博弈树描述)所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。

与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。

一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题:(1)每个参与人在什么时候行动(决策、选择);(2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。

[注:行文中频繁出现的“行动”一词,有两义:其一,动词的“行动”,指选择、决策。

其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。

]上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。

对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。

定义6 – 1 扩展式博弈包括以下要素: (1)参与人集合{1,2,...,}n Γ=;(2)参与人的行动顺序,即每个参与人在何时行动;(3)每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案及他所了解的信息(集); (4)参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。

经济博弈论 教程

经济博弈论  教程
指参加博弈的各方从中获得的利益,因此得益也是有正有负的。 1、零和博弈 这种博弈的特点是不管各博弈方如何决策,最后的社会得益,即各博 弈方得益之和总是为0。 ①零和博弈的特别是各博弈方之间的利益总是相对立的,是“你死我 活”的关系,因而相互之间很难和平共处。
②因为零和博弈即使重复进行多次也无法改变博弈方之间相互对立的 关系。 2、常和博弈 与上述零和博弈不同,在有些博弈中,每种结果之下各博弈方的得益 之和不等于0,但总是等于一个非零常数,这也是一类有特殊意义的 博弈,我们称之为“常和博弈”。当然零和博弈本身可被看作是常和 博弈的特例。 与零和博弈一样,常和博弈中各博弈方之间的利益关系也是对立的, 因此这些博弈方之间的基本变和博弈 零和博弈和常和博弈以外的所有博弈都可被称为“变和博弈”。变和 博弈即意味着不同策略组合(结果)下各博弈方的得益之和一般是不 相同的。变和博弈是最一般的博弈类型,而常和博弈和零和博弈则都 是它的特例。
严格下策反复消去法应用举例(1)
严格下策反复消去法应用举例(2)
严格下策反复消去法有时失效的原因在于有些博弈中的不 同策略往往不存在绝对的优劣关系,而是相对的优劣关系。 2.1.3 划线法 其思路是:先找出自己针对其他博弈方每种策略的最佳对 策,然后在此基础上,通过对其他博弈方策略选择的判断, 预测博弈可能的结果和确定自己的最优策略。
经济博弈论教程
1博弈导论
1.1博弈和博弈论 1.1.1概念 “博弈论”译自英文Game Theory。其实Game的基本意义是游戏, 因此Game Theory直译应该是“游戏理论”。 进一步观察还可以归纳出游戏的下列四个共同特征:第一,都有一定 的规则。 第二,有一个结果。而且结果常能用正或负的数值表示,至少能按照 一定的规则折算成数值。 第三,策略至关重要。 第四,策略有相互依存性。 因此博弈论在我国有时也常被称为“对策论”,具体的博弈问题则被 称为“对策”问题。

第七章 零和博弈(博弈论教程-石家庄经济学院,于振英)

第七章   零和博弈(博弈论教程-石家庄经济学院,于振英)
2014-1-9
第七章零和博弈 最小最大方法
20
第二节 零和博弈的研究方法
一、最小最大方法 (四)纳什均衡 Maximin=minimax=3 Maximin值与minimax值形成的策略 组合:(中,右)
2014-1-9
第七章零和博弈 最小最大方法
21
用最小最大方法寻找纳什均衡
甲的支付单矩阵 乙 不可行! 原因: 石头 剪刀 Maximin≠minimax 其他方法? 1 0 石头 -1 0 甲 剪刀 1 -1 布
2014-1-9
博弈论 第七章零和博弈
11
第一节
基本概念
四、零和博弈的表示方法:单矩阵 1.猜硬币者的支付单矩阵 抛硬币者 正面 反面 正面 1 -1 猜硬币者 -1 1 反面
2014-1-9
博弈论 第七章零和博弈
12
第一节
基本概念
四、零和博弈的表示方法:单矩阵 2.抛硬币者的支付单矩阵 抛硬币者 正面 反面 正面 -1 1 猜硬币者 1 -1 反面
2014-1-9
第七章零和博弈 最小最大方法
19
第二节 零和博弈的研究方法
一、最小最大方法 (三)乙(列参与人)的思想与行动 2.乙的行动:追求自身利益最大 从每列max值中寻找min值(甲的min 值,对乙有利)→ 从最大中寻找最小,minimax→ 结果:“右”列, minimax =3
2014-1-9
第七章零和博弈 最小最大方法
24
若John的期望支付相等?
p-(1-p) = -p+(1-p)→ p*=0.5 若p<0.5 John翻黑牌→预期Candy翻红牌 若p>0.5 John翻红牌→预期Candy翻黑牌

博弈论教程教学设计

博弈论教程教学设计

博弈论教程教学设计简介博弈论作为一种相对成熟的理论体系,已经在社会科学、经济学、数学等领域得到广泛的应用。

本次教学旨在通过博弈论教程,介绍博弈论的基本概念、博弈形式、博弈均衡等相关内容,提高学生对博弈论的理解和应用能力。

教学目标1.掌握博弈论的基本概念和博弈形式;2.熟悉博弈均衡的概念和计算方法;3.学会应用博弈论解决实际问题;4.建立对博弈论的兴趣和探究热情。

教学内容1.博弈论的基本概念;2.博弈形式的分类和应用;3.博弈均衡的计算方法;4.以实际案例为例,应用博弈论解决问题。

教学方式本教学采用“理论导入、案例分析、课堂讨论、实践应用”的教学方式,具体分为以下四个环节:理论导入通过教师讲解和PPT演示,向学生介绍博弈论的基本概念、博弈形式和博弈均衡等相关内容,强调博弈论的重要性和实际应用价值。

案例分析引入各种博弈实例,让学生通过实例了解各种博弈形式及形式下的博弈均衡。

教师可以通过PPT演示或直接写在黑板上等方式展示各种博弈形式和解法,让学生理解和记忆更为深入。

课堂讨论在学生对博弈的形式和解法有了一定的了解后,可以开展课堂讨论。

通过提问和回答等形式,让学生更深入地思考博弈论的相关问题,比如博弈形式的选择、策略的制定和博弈结果的预测等。

此环节也是检验学生对博弈论理解程度的重要环节。

实践应用在教学结束前,可以引入一些实际案例,让学生以小组为单位进行实践应用,并完成相应的论文或报告。

此环节既可以让学生巩固掌握博弈论理论知识,还能锻炼学生团队协作和论文撰写能力。

教学评估1.考核方式:闭卷考试+小组论文;2.考核内容:理论知识和实际应用;3.评估标准:理论知识掌握情况、案例分析能力、课堂表现和论文质量等。

结束语本次教学设计以博弈论为基本理论,注重学生的实际应用能力和思辨能力培养。

教学方式灵活多变,既注重理论知识的讲解,又有案例分析和课堂讨论等环节,让学生不仅理解博弈论的概念和计算方法,还能深入思考博弈论的实际应用问题。

第四章序贯决策博弈(博弈论教程-石家庄经济学院,于振英)

第四章序贯决策博弈(博弈论教程-石家庄经济学院,于振英)
第三节 序贯博弈多重纳什均 衡:子博弈精炼纳什均衡
2020年9月24日
博弈论第四章
26
第二讲子博弈精炼纳什均衡
第三节 子博弈精炼纳什均衡
➢一、子博弈:针对树型(展开型)博弈 ➢(一)定义 ➢给定n人展开型博弈T(tree),如果博弈S
(sub)满足以下三个条件: ➢1.S博弈树是T博弈树的一枝 ➢2.S不能分割T的信息集
2020年9月24日
博弈论第四章
44
第二讲子博弈精炼纳什均衡
第四节 延伸分析
➢三、子博弈精炼纳什均衡存在的问题
2020年9月24日
第四章序贯决策博弈
9
第一讲方法与解
第二节 分析方法与解
➢一、方法一:虚线排除确定法 ➢(三)策略组合 ➢(进入,{容忍,容忍}) ➢(进入,{容忍,阻挠}) ➢(进入,{阻挠,容忍}) ➢(进入,{阻挠,阻挠})
2020年9月24日
第四章序贯决策博弈
10
第一讲方法与解
第二节 分析方法与解
第四章序贯决策博弈
15
第一讲方法与解
第二节 分析方法与解
➢一、方法一:虚线排除确定法 ➢(五)案例分析 ➢4. (进入,{阻挠,阻挠}) ➢入侵者:进入→不进入,-2→0,存在
单独改变激励 ➢非纳什均衡
2020年9月24日
第四章序贯决策博弈
16
第一讲方法与解
第二节 分析方法与解
➢一、方法一:虚线排除确定法 ➢(五)案例分析 ➢5. (不进入,{容忍,容忍}) ➢进入者:不进入→进入,0→1,存在
➢三、纳什均衡的存在性:库恩定理 ➢完全信息的有限序贯博弈都存在纳 什均衡
2020年9月24日
博弈论第四章
38

第八章博弈论简要课件

第八章博弈论简要课件

11
第八章 博弈论
四、重复博弈和序列博弈
➢静态博弈是指局中人同时决策或虽非同时 决策,但后决策者不知道先决策者采取什么 策略的博弈。 ➢动态博弈是指局中人决策有先有后,后决 策者能观察到先决策者决策情况下的博弈。
12
第八章 博弈论
动态博弈的例子
进入
在位者甲
合作 斗争
进入者乙
(400 ,500) ( -100 ,100)
6
第八章 博弈论
3、策略集合: 是指所有局中人可能采取 的行动方案总和。例如:都坦白,都抵赖, 坦白与抵赖,抵赖与坦白 4、收益: 是指在每种组合情况下,局中 人采取特定策略得到的结果。例如:判3年, 6年,释放等
7
第八章 博弈论
三、上策均衡和纳什均衡
1、上策: 是指不管其他局中人采取什么策 略,某一局中人都采取自认为对自己最有 利的策略。 2、均衡: 是指博弈中所有局中人都不想改 变自己策略的一种相对静止状态。
1
第八章 博弈论
博弈论字面的意思是游戏策略,及用类 似游戏中解决问题的方法,揭示解决社会、 经济及其他领域问题的策略、对策,因此有 的还把博弈论译成对策论。准确的说博弈论 是在给定的条件下寻求最优策略,这里给定 的条件包含其他人的策略以及本人的决策对 其他决策主体的影响。
2
第八章 博弈论
策略性活动在社会、经济、政治生活中 大量存在,也可以说,整个社会、经济、政 治生活都是博弈行为。因此,博弈论作为一 种方法,广泛的应用在经济、政治、军事、 外交中,只是博弈论在经济学中应用的最广 泛、最成功。如前面介绍过的古诺均衡,就 属于经济学中的博弈过程。
8
第八章 博弈论
3、上策均衡: 不管其他局众人采取什么策 略,每个局中人都选择了对自己最有利的策 略所构成的一个策略组合。 4、纳什均衡: 是指参与博弈的每一局中人 在给定其他局中人策略的条件下选择上策所 构成的一种策略组合。 注:所有上策均衡都是纳什均衡,但不能反 过来说所有纳什均衡都是上策均衡。

《博弈论入门》课件

《博弈论入门》课件

博弈论的研究方法与工具
了解博弈论的研究方法和工具对于深入理解和应用博弈论至关重要。
博弈论中的常见概念与术语
学习博弈论需要了解一些常见的概念和术语,例如博弈矩阵、纳什均衡、最 优策略等。
博弈论的经典案例分析
通过分析博弈论的经典案例,我们可以更好地理解和应用博弈论的原理。
博弈论在实际决策中的应用
实际决策中经常涉及到多个参与者的利益博弈,博弈论可以帮助我们找到最优决策策略。
总结与展望
通用于实 际生活和决策中。
《博弈论入门》PPT课件
博弈论是一门研究决策和策略的学科,适用于各种领域,从经济学到政治学, 从生物学到计算机科学。
博弈论基础知识介绍
在这一部分中,我们将探讨博弈论的基本概念和原理,包括博弈模型、策略 和解的概念。
博弈论的应用领域
博弈论在现实生活中有许多应用,包括经济学、政治学、社会学、生物学、 医学等领域。

博弈论系列教程 (3)

博弈论系列教程 (3)

第一节 混合策略与期望支付
Ø二、期望支付 Ø(二)数学刻画
1( p, q) 2( p , q )

i 1 m n i 1
m
n
j 1
p i q j a ij p i q j b ij

j 1
第一节 混合策略与期望支付
Ø 三、混合策略纳什均衡 Ø 给定策略式博弈G= {S1,…,Sn;u1,…,un}以及混合策略组 合p*=(p1*,…,pi*,…pn*) Ø 对于所有i和pi∈∑i, ∑i——i的混合策 略空间 Ø 如果有:πi(pi*,p-i*)≥πi(pi’,p-i*) Ø 则:混合策略组合p*=(p1*,…,pi*,…pn*) 为G的混合策略纳什均衡
猎鹿博弈:何为抗共谋均衡?
Ø Ø Ø Ø Ø 乙 猎鹿 猎鹿 甲 打兔
10,10 4,0
人无 完人
Ø人总是要犯错误 的,所以要对别 人宽容
经得起考验的纳什均衡
Ø在其他参与人选择了错误策略的情况 他人不犯错误, 下,某参与人仍能实现纳什均衡
你能实现最优; 他人犯错误, 你仍能实现最 优
第一节 混合策略与期望支付
Ø二、期望支付 Ø(一)分析 Ø1.概率 Ø(偷,睡)的概率:pq Ø(偷,不睡)的概率:p(1-q) Ø(不偷,睡)的概率:(1-p)q Ø(不偷,不睡)的概率:(1-p)(1-q)
第一节 混合策略与期望支付
Ø二、期望支付 Ø(一)分析 Ø2.期望支付 ØU小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1p)(1-q)=2p(5q-1) ØU守卫= (-2) pq+0p(1-q)+8(1p)q+0(1-p)(1-q)=2q(4-5p)

博弈论系列教程 (6)

博弈论系列教程 (6)

第二节 优势策略与优势策略均衡
Ø二、寻找优势策略:定义法 Ø(三)分析:第二步,给定PEPSI的 策略(研究范围:列) Ø1.给定PEPSI选择低价,COCO比较 得益3与1(考察对象:第一列) ØCOCO选择:低价 Ø2.给定PEPSI选择高价,COCO比较 得益6与5(考察对象:第二列) ØCOCO选择:低价
等待
4,4 0,0
第二节 优势策略与优势策略均衡
Ø三、优势策略均衡 Ø(一)表述:优势策略组合 Ø一个博弈中,某策略组合的所有策略 都是各参与人各自的上策 Ø(低价,低价) Ø特征:博弈中的稳定结果
最优策略组合: s* (s1*,, si *,, sn *)
第二节 优势策略与优势策略均衡
第三节
纳什均衡
Ø二、情侣博弈的结论:纳什均衡 Ø(三)分类 Ø2.普通什均衡 Ø(1)均衡战略与非均衡战略无差异 Ø(2)参与人单独改变策略后,支付可 能不变
第三节
纳什均衡
Ø三、寻找纳什均衡的方法 Ø(一)劣势策略反复消去法 民主党 Ø 主动增税 被动增税 2,2 1,4 Ø 主动增税 Ø共和党 4,1 3,3 Ø 被动增税
第三节
纳什均衡
Ø一、案例:情侣博弈 Ø(二)分析 Ø3.给定Candy看足球(第一列) ØJohn 选择:足球(2>-1) Ø4.给定Candy看芭蕾(第二列) ØJohn 选择:芭蕾(1>0)
第三节
纳什均衡
Ø一、案例:情侣博弈 Ø(三)优势策略均衡 Ø(足球,足球),(芭蕾,芭蕾)
评价:合作、默契、协调
同时决策博弈:静态博弈
世界上最爱我的那个人发飙了
Ø Ø Ø Ø Ø 妻 进 进 夫 退
-3,-3 0,2
退

《博弈论教程》课件

《博弈论教程》课件

博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。

博弈论教程岳昌君答案

博弈论教程岳昌君答案

博弈论教程岳昌君答案
1、什么是博弈?博弈论的主要研究内容是什么?
参考答案:
博弈可以用下述方式定义:“博弈即一些个人、队组或其他组织,面对......定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程:一个博弈必须包含博弈方、策略空间、博弈的次序和得益(函数)这几个基本的方面。

信息结构、博弈方的行为逻辑和理性层次等其实也是博弈问题隐含或者需要明确的内容,
博弈论是系统研究可以用上述方法定义的各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法C
2、设定一个博弈模型必须确定哪几个方面?参考答案:
设定一个博弈必须确定的方面包括:
(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、镇略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和
理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等如果设定博弈模型时不专门设定后两个方面,就是隐含假定是完全、完美信息和完全理性的非合作博弈。

3、举烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

参考答案:
烟草厂商新产品开发、价格定位的效果,常常取决于其他厂商、竞争对手的相关竞争策略。

例如某卷烟厂准备推出一种高价。

博弈论1 (2)全篇

博弈论1 (2)全篇
6.据得益特征:零和博弈;常和博弈;变和博弈
6
四、古典博弈论的三个基本假设:参与人是理性的;他们有 这些理性的共同知识;他们知道博弈规则。
理性的三个基本内涵:理性的局中人具有关于博弈的完全知 识;可以确切知道整个状态空间;具有相对无限的逻辑能力。
五、博弈的典型例子
1 .囚徒困境 坦白
坦白
不坦白
-6,-6 -1,-8
3
2、博弈与一般决策的区别
二、博弈模型要素
1、参与人:博弈中的决策主体。他的目的是通过选择策 略以最大化自己的支付(效用)水平。
虚拟参与人(自然):指决定外生的随机变量的概率分布 的机制。自然作为虚拟参与人没有自己的支付与目标函数, 即所有的结果对它都是无差异的。
2、策略:参与人在给定信息集(信息集包含了一个参与人有关 其他参与人之前行动的知识,可理解为参与人在特定时刻有关 变量值的知识。一个参与人无法准确知道的变量全体属于一个 信息集)的情况下的行动规则。它规定参与人在什么时候选择 什么行动。[策略是可供局中人选择对付其它局中人的完整行动 方案。]
21
例 某个地方的居民均匀地环绕一个圆形湖居 住。两小贩来此地推销商品。1)若居民都选 择离自己较近的小贩购买商品,问小贩选择推 销地点博弈的NE是什么?2)若有三个小贩同 时到此地推销商品,则推销地点博弈的NE又是 什么?3)若圆形湖的周长是1(千米),居民 的购买量是Q=1-D,D为居民与小贩推销点距 离,则两个和三个小贩博弈的NE各是什么?
14
例6 设 s1 [10,0] s2 [3,0]
u1 (s) 10s1 7s1s2 s12
u2 s 15s2 5s1s2 s22
求NE。
15
例7 设 s1 [10,0] s2 [3,0]

《博弈论》课程课件

《博弈论》课程课件
无独有偶,在古今中外的战争中,破釜沉舟这 种策略经常被运用,例如阿兹台克帝国的征服 者科尔特斯就是采用这种策略征服美洲大陆的。
破釜沉舟这种策略实际上有很多的变种。
36
3、企业应该在什么时候诚实 这里我们考虑一个所谓的诚信企业的动态博 弈,
占便宜 到诚信公司 顾客 不到诚信公司 诚信公司赚1000元 顾客损失2000元
25
这个模型是这样的:
第一个模型 假设:地球是圆的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到远方驶来 船只的船桅,并逐渐看到船的下部(与现实 中观察到的事实相符)
26
第二个模型
假设:地球是平的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到的是整个 船身(与现实中观察到的事实相悖)
18
博弈论在研究的过程中有两个基本前提假设 一是,理性人假设。 二是,博弈结构对参与者是公共知识。特别
是,参与者满足完美回忆。
19
例6 旅行者困境 两个旅行者在旅游圣地买了两个花瓶,但在 回程途中被航空公司打碎。航空公司知道花 瓶大约值100元,但并不清楚花瓶的确切价 格。于是,航空公司要求两位旅客各自写下 花瓶的价格,并按照两个旅客中所写的最低 价格进行赔偿(航空公司认为写最低价格的 旅客讲的是真话),为了鼓励旅客讲真话, 规定对讲真话的旅客奖励2元,对讲假话的旅 客罚款2元。容易证明,在理性人的假设下, 这个游戏唯一的结果是两人都写0。
22
表 1 博弈的分类和均衡概念
完全信息 静态 非完全信息
完全信息静态博弈 非完全信息静态博弈 (纳什均衡) (贝叶斯均衡)
完全信息动态博弈 非完全信息动态博弈 动态 (子博弈精炼均衡) (序列均衡)

博弈论教程博弈论教程(四版)+课件说明及教学建议

博弈论教程博弈论教程(四版)+课件说明及教学建议

王则柯、李杰、欧瑞秋、李敏《博弈论教程(第四版)》课件说明和教学建议一、课件说明《博弈论教程(第四版)》课件(PPT)按照48学时的要求制作。

对于课件的制作和使用,有以下几点值得说明。

(1)PPT把部分内容较多的章节拆为1、2个部分,这些拆分在内容上也合理的,均具有独立性,便于教师进行教时的安排。

(2)《博弈论教程(第四版)》增加了不完全信息博弈的内容,使教材的结构更加完善。

但是由于知识点复杂性,对于本科教学来说,无论教师讲授还是学生理解中仍一定会存在困难,所以教师可以根据实际情况对讲授内容进行筛选。

二、教学建议除了教师讲授,建议在教学环节中加入博弈故事和小组展示环节。

1、博弈故事博弈故事在调动学生思考和兴趣,培养和训练博弈思维上有帮助。

(1)开展形式:抛出故事和问题,给予10分钟时间小组讨论,有答案或者阶段性答案的小组派出同学代表介绍思路。

(2)博弈故事内容举例:①逆向推导:海盗分金币;交换信封②博弈树:三人决斗;夺宝战;会融化的蛋糕③有限理性:最后通牒;选美博弈;卡尼曼的实验④混合策略:石头剪刀布;吉诺维斯谋杀案⑤不完全信息:100元拍卖;所罗门断案⑥共有知识:帽子的困惑;严格劣势策略逐次删去法的应用2、小组展示(1)小组分组随机分组或自由组队。

4-5人一组,组数为偶数。

(2)展示时间建议安排在课程的后半段。

每次安排20分钟,2个小组展示,1个小组10分钟。

展示顺序抽签决定。

(3)展示内容修课期间上网寻找一篇与博弈论有关的论文,或者博弈小故事,或者自己生活中遇到的问题,转化成博弈语言加以介绍和讨论,制作PPT。

(4)展示分数评定每次由2个小组进行展示,其他小组在展示后立即进行投票,具体方式是每组交一张写有组号的小纸条给教师,一组一票,高票组获胜。

《博弈论教程》第六章课后习题整理

《博弈论教程》第六章课后习题整理

《博弈论教程》第六章课后习题整理,仅供参考!6—1这句话不对,根据定理6.1可知,只要博弈重复的次数有限,重复本身并不改变囚徒困境原来的均衡结果。

具体的博弈可参见p229-p230的例子。

6—2若N>L ,则min{N,L}=L,到了第N 阶段,当对手在N-L-1到N 阶段的最近连续L 次博弈中采取合作的策略,则我方继续合作,当对手在N-1阶段的博弈中采取背叛策略,则我方在N 到N+K 的连续K 次博弈中采取背叛策略,K 可能大于,等于或小于L ,K 和L 没有必然的关系;若N=L ,则min{N,L}=N=L,到了第N 阶段,当对手在1到N 的连续N 次博弈中采取合作的策略,则我方继续合作,当对手在N-1阶段的博弈中采取背叛策略,则我方在N 到N+K 的连续K 次博弈中采取背叛策略,K 可能大于,等于或小于L ,K 和L 没有必然的关系; 若N<L ,则min{N,L}=N,到了第N 阶段,当对手在1到N 的连续N 次博弈中采取合作的策略,则我方继续合作,当对手在N-1阶段的博弈中采取背叛策略,则我方在N 到N+K 的连续K 次博弈中采取背叛策略,N+K 可能大于,等于或小于L ,K 和L 没有必然的关系; 综上,K 和L 没有必然的关系。

写min{N,L}而不是简单的L 是因为不清楚背叛是发生在第N 阶段之前还是之后,这样写有利于做一个简明的判断。

6—3从今年的100元在明年的价值角度来看,在通货紧缩的年份,实际利率大于0(实际利率=名义利率-通货膨胀率,名义利率为正,通货膨胀率在通货紧缩时为负,),今年的100元到明年的价值大于100元,所以今年的100元比明年的100元好。

从货币的购买力角度来看,今年的100元的购买力大于明年的100元的购买力,那明年的100元更好。

6—4两公司都不做广告的收益大于纳什均衡的收益,故该博弈是囚徒困境博弈。

该博弈的合作策略是不广告,背叛策略是广告。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
囚徒A 坦白 不坦白
-5,-5
-10,0
0,-10
-1,-1
2.1.2 严格下策反复消去法(逐步剔除严格劣战略) 例
L M R
U M 8,3 2,1 5,1 8,4 6,2 3,6
D
3,0
9,6
2,8
可以预测该博弈的合理结局为(U,L),即参与人A
选择策略U,而参与人B选择策略L。
2.2 Nash 均 衡 2.2.1 Nash 均 衡 的 定 义 Nash 均衡是指这样的策略组合(或剖面): 为 了 极大化自己的收益(或效用), 每一个参与 人所 采取的策略一定应该是关于其他参与人 所采 取的策略的最佳反应. 因此没有一个参 与人会 轻率地偏离这个策略组合而使自己蒙 受损失。



第一章 导论
1.1什么是博弈论(Game Theory) 1.1.1 从游戏到博弈
游戏都有一些共同的特点:
1.都具有一定的规则; 2.都有一个结果; 3.策略至关重要; 4.策略和利益有相互依存性
一、博弈论概述
1.1.1 博弈论的定义
博弈论研究的是人与人之间利益相互制约下策略选择时的 理性行为及相应结局。 豪尔绍尼(John C.Harsanyi)1994年诺贝尔经济学奖获 奖致词:博弈论是关于策略相互作用的理论。 博弈论研究人与人之间“斗智”的形式和后果,当人 们利益存在冲突时,每个人所获得的利益不仅取决于自己 所获取的行动,还依赖于其他人采取的行动,每个人都需 要针对对方的行为选择作出对自己最有利的反应。
定 义 在有n个参与人的博弈 G={S1,S2…Sn;u1,u2,…un)中,策略组合 s*=(s1 *,s2 *,…sn *)是一个Nash均衡,如果对于每一 个i, si*是给定其他参与人的选择: S-i*=(s1*,…si-1*,si+1*,…sn*)的情况下,第i个人的最 优策略,即 ui(si*,s-i*)≥ui(si,s-i*) ,对所有的i∈Γ 或者用另一种表示方式,si*是下述最大化问题的 解: si*∈arg ui(s1*,…si-1*,si,si+1*,…sn*),i=1,2,…n S *∈Si 因此,当且仅当没有一个参与人能从单方面背离 某个策略组合的预见中增加自己的得益时,这 个策略组合就是Nash均衡。
一、 零 和 博 弈 二、 常 和 博 弈 三、 变 和 博 弈 国内常见的博弈论参考书: 1.《经济博弈论》(第二版) 谢识予 编著 复旦大学出版社, 2002 2.《博弈论与信息经济学》 张维迎 著, 上海三联书店、上海人民出版社 3.《博弈论》施锡铨 著,上海财经大学出版社, 2002 4.《Game Theory》,1991,D.Fudenberg& J.Tirole 中译本,中国人民大学出版社
C1 R1 R2 R3 2,12 0,12 0,12 C2 1,10 0,10 0,12 C3 1,12 0,11 0,13
(R1,C1)和(R1,C3)
都是Nash均衡,但没有 一个强Nash均衡。
本质上说,Nash 均 衡的概念对社会计划者和理 论家施加了一个约束, 使他们不能建议或者 预测一种非均衡行为。 博弈论可预测到,在均衡集较小的局势中,文 化规范的重要性也小。 2.2.2 Nash 均衡的一致性预测性质 Nash 均衡是参与人将如何博弈的“一致 性”(consistent) 预测: 如果所有参与人预 测 到一个特定的Nash 均衡将出现, 那么, 没 有人 有兴趣作不同的选择。也只有Nash 均衡 具有这样的特征:参与人预测到均衡, 参与 人预测到其他参与人预到均衡… 等 等。
i
Nash 均衡的哲学含义:设想n个参与人在博弈 前规定每一个参与人选择一个特定的策略。 s*=(si*,s-i*) 代表这个协议,要问在没有外 力 强制的情况下,是否有参与人有积极性 不 遵守该协议?如没有,则说明该协议是可以 自动实施的。能够自动实施的协议就可以看作 一个Nash 均衡。 例 求下列博弈的Nash 均衡:
博弈的分类及对应的均衡
静态 完全 信息 完全信息静态博弈 纳什均衡; Nash(1950) 不完全信息静态博弈 贝叶斯纳什均衡; 海萨尼(1967-1968) 动态 完全信息动态博弈 子博弈精炼纳什均衡; 泽尔腾(1965) 不完全信息动态博弈 精炼贝叶斯纳什均衡; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991)
对比之下,预测一个非Nash 均衡的策略组合 意味着至少有一个参与人会犯错误,尽管这 样的错误确有可能出现。 说Nash 是一致性预测并不意味着Nash 均衡一 定是一个好的预测,但只有Nash 均衡才有: “一 致 性”预测的性质。 重要结论:一种制度安排要发生效力必须是一 种Nash均衡(Nash执行的,Nash Implementation), 否则, 这种制度便不能 “ 稳定”。
1.2 几类经典的博弈模型
1.2.1 囚徒的困境(prisoners’ dilemma)
囚徒B 坦白 坦白 不坦白 -5,-5 -10,0 不坦白 0,-10 -1,-1
囚徒A
这个例子本身就部分奠定了非合作博弈论的基础。
1.2.2 智猪博弈
猪圈里有两头猪:大猪和小猪,猪圈的一头有一个猪食槽,另- 头装有-个按纽,控制着猪食的供应,按一下就会有10单位的 猪食进槽,但谁按谁就要付出相当于2单位猪食的成本;当猪食 进槽时,若大猪先到,大猪可吃到9单位;小猪先到,则小猪可吃 到4单位,大猪吃6单位;若两者同时到,叫大猪可吃7单位,小猪 吃3单位。 小猪 等 按 大猪 按 等 5, 1 9,-1 4,4 0,0
1.3.2 博 弈 中 的 策 略 博弈中独立决策、独立承担博弈结果的个人或 组织 称为博弈方。 博弈中各博弈方的决策内容称为“策略“,但应注意 到并不是每个博弈方都有相同的可选略。 如果在一个博弈中每个博弈方的策略数都是有 限的, 则称该博弈为有限博弈;否则就称为 无限博弈。 1.3.3 博弈中的得益(支付,payoff) 得益指在一个特定的策略组合下参与人得到效用水平, 即各个博弈方从博弈中所获得的利益.
1.2.3 性别战
足球 男 足球 2 ,1 0,0
女 芭蕾
0,0
1, 3
芭蕾
1.2.4 斗鸡博弈
进 A
B 退 2,0 0 ,0

退
-3,-3 0 ,2
在位者
1.2.5 市场进入阻挠
进入
进入者
默许
斗争
40,50 0,300
-10,0 0,300
不进入
1.2.6 猜硬币博弈
猜硬币方 正 正 反 -1,1 1,-1 反 1,-1 -1,1
不完 全信 息
1.1.2一个非技本性的定义 规定或定义一个博弈需要以下几个方面: 1.参与人(Player)(局中人)指博弈中的决策主体,他的目的是通 过选择行动(或策略)以最大化自己的支付(效用)水平,参与 人可以是自然人、团体、自然(“上帝”作为虚拟的参与人)。 2.各个参与人各自可选择行动集(action set),Ai={ai},是其可以 采用的全部行动的集合。一个行动组合(action proile)是一个 由博弈中的n个参与人每个选取一个行动所组成的有序集 a=(a1,a2,…an)。 3. 参与人i的策略(strategy)是如下的一项规则:给定其信息集,该 策略决定在博弈的每一时点他选 择何种行动。
3、博弈论的分类
(1)合作博弈——研究人们达成合作时如何分配合作得 到的收益,即收益分配问题。 (2)非合作博弈——研究人们在利益相互影响的局势中 如何选决策使自己的收益最大,即策略选择问题。 (3)完全信息不完全信息博弈:参与者对所有参与者的 策略空间及策略组合下的支付有充了解称为完全信息; 反之,则称为不完全信息。 (4)静态博弈和动态博弈 静态博弈:指参与者同时采取行动,或者尽管有先 后顺序,但后行动者不知道先行动者的策略。 动态博弈:指双方的的行动有先后顺序并且后行动 者可以知道先行动者的策略。
L U M N
0,4 4,0 3,5
C
4,0 0,4 3,5
R
5,3 5,3 6,6
用划线法可求 得Nash均衡为:
(D,R).
Nash均衡有强弱之分.上述定义中给出的是弱Nash均衡,一个 Nash均衡是强的,如果给定其他参与人的策略,每一个参与人 的选择是唯一的。即,s*是一个强Nash均衡,当且仅当对每一 个i, si′≠si*总有:ui(si*,s-i*)>ui(si′,s-i*)。如果一个Nash 均衡是强的,则没有任何参与人在均衡策 略和其他策略之间 是无差异的。(弱Nash均 衡不是) 如在以下博弈中:
2.2.3Nash均衡与严格下策消去法 命题2.1在博弈G={S1,S2,…Sn;u1,u2,…un}中,如 果严格下策反复消去法排除了除( s1*,s2*… sn*)之外的所有策略组合,那么(s1*,s2*,…sn*) 一定是该博弈唯一的Nash均衡。 命题2.2 在博弈G={S1,S2,…Sn;u1,u2,…un}中,如 果(s1*,s2*,…sn*)是G的一个Nash均衡,那么严 格下策消去法一定不会将它消去。
1.2.7 石头· 剪子· 布
B
石头 石头 0,0
剪子
1,-1 0,0 -1,1

-1,1 1,-1 0,0
盖硬币方
A
剪子 -1,1
布 1,-1
1.3
博 弈 的 结 构 和 博 弈 的 分

1.3.1 博 弈 中 的 博 弈 方 一、单人博弈—— 实际上是最优化问题, 或 者是一个参与人与“自 然”的博弈。 二、 双人博弈——最常见、研究得最多的博 弈⑴ 双人博弈中的两个博弈方之间并不总是 相 互对抗的。(互补性问题) ⑵ 掌握信息较多的一方并不能保证获益大。 ⑶个人追自身的最大利益并不能保证所得最 优。 三、多人博弈——可能存在“破坏者” 与
相关文档
最新文档