东南大学博弈论课件
合集下载
博弈论PPT课件
有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
《博弈论》课程课件
20
(五)博弈模型的分类
博弈中最重要的两个因素是信息与顺序。
信息上可以分为完全信息和非完全信息。
在博弈的顺序上则可以分为静态与动态。
21
完全信息和非完全信息,完全和非完全判 断的标准就是如果有些信息只有一部分参 与者知道,并不是所有的信息都是公共信 息,那么博弈就是非完全信息博弈。 静态博弈和动态博弈,静态和动态的区别 并不在于时间上是否同时,而是在行动上 是否同时。如果参与者1在行动时,不知道 参与者2的行动,反之也一样,即为同时行 动。
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼底设防 成功,失败
失败,成功
失败,成功
3
例3 鸽派和鹰派
美 国 鸽派政策 苏联 鹰派政策
鸽派政策
鹰派政策
0,0
+1,–1
–1,+1
– ∞,– ∞
4
从上面的三个例子中,我们可以概括出一个博弈 所具有的共同特征:利益相冲突的参与者、参与 者总是根据对手可能采取的策略来采取相应的行 动----相互依存的策略和行动、参与者总是追求自 身利益最大化。根据这些共同特征我们就能给出 一个博弈的定义,只要符合这个定义,就可以将 其纳入到博弈论的研究范畴之中。
( 五 ) 博 弈 模 型 的 分 类
( 四 ) 博 弈 论 的 两 个 前 提 假 设
( 三 ) 纳 什 均 衡
( 二 ) 博 弈 表 达 的 科 学 式
( 一 ) 什 么 是 博 弈 论
一 、 理 论 准 备
1
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
(五)博弈模型的分类
博弈中最重要的两个因素是信息与顺序。
信息上可以分为完全信息和非完全信息。
在博弈的顺序上则可以分为静态与动态。
21
完全信息和非完全信息,完全和非完全判 断的标准就是如果有些信息只有一部分参 与者知道,并不是所有的信息都是公共信 息,那么博弈就是非完全信息博弈。 静态博弈和动态博弈,静态和动态的区别 并不在于时间上是否同时,而是在行动上 是否同时。如果参与者1在行动时,不知道 参与者2的行动,反之也一样,即为同时行 动。
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼底设防 成功,失败
失败,成功
失败,成功
3
例3 鸽派和鹰派
美 国 鸽派政策 苏联 鹰派政策
鸽派政策
鹰派政策
0,0
+1,–1
–1,+1
– ∞,– ∞
4
从上面的三个例子中,我们可以概括出一个博弈 所具有的共同特征:利益相冲突的参与者、参与 者总是根据对手可能采取的策略来采取相应的行 动----相互依存的策略和行动、参与者总是追求自 身利益最大化。根据这些共同特征我们就能给出 一个博弈的定义,只要符合这个定义,就可以将 其纳入到博弈论的研究范畴之中。
( 五 ) 博 弈 模 型 的 分 类
( 四 ) 博 弈 论 的 两 个 前 提 假 设
( 三 ) 纳 什 均 衡
( 二 ) 博 弈 表 达 的 科 学 式
( 一 ) 什 么 是 博 弈 论
一 、 理 论 准 备
1
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
博弈论完整版PPT课件
R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
《博弈论》课程ppt课件
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
大学课程《博弈论及其应用》PPT课件:第一章
2021/11/19
• 博弈方:两个嫌疑犯A和 B。 • 策略: 每个嫌疑犯的行动集是(坦白,不坦白)。 • 收益:对应于每种策略组合,有相应的收益结果。 • 策略组合:嫌疑犯A和B从可以选择的策略中选择并实施,有四种
情况(括号中前面是A的策略,后面是B的策略)。 • 每个策略组合对应下的A的结果,从优到劣,依次为: • (坦白,不坦白),结果是A被释放; • (不坦白,不坦白),A被判刑1年; • (坦白,坦白),各被判5年; • (不坦白,坦白),A被判8年。 • 同理,每个策略组合对应下的B的结果,从优到劣,依次为: • (不坦白,坦白)、(不坦白,不坦白)、(坦白,坦白)、(坦白,不坦
第一章 博弈概述
2021/11/19
第一节 海滩占位问题
我们来到海滩。夏天很多游客喜欢在在海边晒太阳,游泳。海滩有 月牙形,弧形,绵延数公里。为了研究问题方便,我们姑且把海滩 的长度抽象定为1,[0,1]区间就表示海滩的长度。 A和B是两个小商 贩,出售无差异的补给品,同质同价,同一品牌的矿泉水,面包等 。“*”表示游客均匀的分布在海滩上,游客就近购买补给品。在 沙滩上应该如何分布两个小商贩的位置呢?
• A猎兔,B猎兔,鹿逃掉,A收益一只兔子,B收益一只兔子。
• 可见,每个猎人的期望,不能由自己决定,要看对方的策略选择 ,是能够捉得到鹿,依赖对方的选择,如果对方选择捉兔子,而 你选择猎鹿,这个策略组合,对你而言,是最差的选择,也是最 坏的策略。
2021/11/19
第三节 博弈论是什么
• 博弈论:就是关于包含相互依存情况中理性行为的研究。 • 博弈的三要素: • 博弈方----参与博弈但利益不完全一致者。有二人博弈与多人博弈
的故事,它的重要性在大量情形中体现,参与者面临着与故事中嫌 疑犯面临的同样的动机。
• 博弈方:两个嫌疑犯A和 B。 • 策略: 每个嫌疑犯的行动集是(坦白,不坦白)。 • 收益:对应于每种策略组合,有相应的收益结果。 • 策略组合:嫌疑犯A和B从可以选择的策略中选择并实施,有四种
情况(括号中前面是A的策略,后面是B的策略)。 • 每个策略组合对应下的A的结果,从优到劣,依次为: • (坦白,不坦白),结果是A被释放; • (不坦白,不坦白),A被判刑1年; • (坦白,坦白),各被判5年; • (不坦白,坦白),A被判8年。 • 同理,每个策略组合对应下的B的结果,从优到劣,依次为: • (不坦白,坦白)、(不坦白,不坦白)、(坦白,坦白)、(坦白,不坦
第一章 博弈概述
2021/11/19
第一节 海滩占位问题
我们来到海滩。夏天很多游客喜欢在在海边晒太阳,游泳。海滩有 月牙形,弧形,绵延数公里。为了研究问题方便,我们姑且把海滩 的长度抽象定为1,[0,1]区间就表示海滩的长度。 A和B是两个小商 贩,出售无差异的补给品,同质同价,同一品牌的矿泉水,面包等 。“*”表示游客均匀的分布在海滩上,游客就近购买补给品。在 沙滩上应该如何分布两个小商贩的位置呢?
• A猎兔,B猎兔,鹿逃掉,A收益一只兔子,B收益一只兔子。
• 可见,每个猎人的期望,不能由自己决定,要看对方的策略选择 ,是能够捉得到鹿,依赖对方的选择,如果对方选择捉兔子,而 你选择猎鹿,这个策略组合,对你而言,是最差的选择,也是最 坏的策略。
2021/11/19
第三节 博弈论是什么
• 博弈论:就是关于包含相互依存情况中理性行为的研究。 • 博弈的三要素: • 博弈方----参与博弈但利益不完全一致者。有二人博弈与多人博弈
的故事,它的重要性在大量情形中体现,参与者面临着与故事中嫌 疑犯面临的同样的动机。
精品课程《博弈论》PPT课件(全)
人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
第十章 博弈论初步PPT课件
2020年3月2日星期一
12
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第一,把整个的支付矩阵分解为甲厂商的支付矩阵和 乙厂商的支付矩阵
2020年3月2日星期一
13
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2020年3月2日星期一
11
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
1.基本方法 先用下划线法分别表示甲厂商和乙厂商的条件策
略,最后确定博弈的均衡(就是找到在两个数字之下 都划线的单元格即可,与这些单元格相对应的策略组 合就是所要求的均衡策略组合)。
1
第十章 博弈论初步 第一节 博弈论和策略行为
2.博弈的三个基本要素 三个基本要素,即参与人、参与人的策略和参与
人的支付。 所谓参与人(或称局中人),就是在博弈中进行
决策的个体;所谓参与人的策略,指的是一项规则, 根据该规则,参与人在博弈的每一时点上选择如何行 动;所谓参与人的支付则是指,在所有参与人都选择 了各自的策略且博弈已经完成之后,参与人获得的效 用(或期望效用)。
2020年3月2日星期一
2
第十章 博弈论初步 第一节 博弈论和策略行为
3.博弈的简单分类 根据参与人的数量,可以分为二人博弈和多人博
弈;根据参与人的支付情况,可分为零和博弈和非零 和博弈;根据参与人拥有的策略的数量多少,可分为 有限博弈和无限博弈;根据参与人在实施策略上是否 有时间的先后,可分为同时博弈和序贯博弈。
二、支付矩阵
1.支付矩阵 使用支付矩阵来描述和分析只有两人参加且两人
第四篇博弈论PPT课件
• 此情况下由于博弈没有可预测的明确的博弈结果,所以就不能 确定博弈方的策略。但是是否在这样的博弈中,各博弈方选择 任何策略都是一样的,因此可以随意选择吗?
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式
《博弈论的基本概念》课件
智猪博弈
• 总结词:描述大猪和小猪在食槽附近争夺食物的策略博弈。
• 详细描述:在智猪博弈中,一个大猪和一个小猪共同生活在一个猪圈里,食槽位于猪圈的一端。每次食物被放入食槽时 ,大猪和小猪都有两种选择:冲向食槽或继续等待。如果大猪选择冲向食槽,小猪的最佳策略是等待,因为大猪吃掉大 部分食物后,小猪可以享用剩余的食物。相反,如果小猪选择冲向食槽,大猪的最佳策略也是等待,因为小猪可能无法 抢到任何食物。因此,无论大猪如何选择,小猪的最佳策略都是等待;同样地,无论小猪如何选择,大猪的最佳策略也 是等待。
合作博弈
特征
强调合作、协议和联盟,目标是实现共同利益。
应用领域
国际关系、商业合作、团队协作等。
非合作博弈
特征
强调竞争、自利和策略互动,目标是实现个人利益。
应用领域
市场竞争、个人决策、政治选举等。
动态博弈
特征
强调行动的顺序和信息传递,策略和 行动需考虑时间因素。
应用领域
商业竞争、投资决策、谈判策略等。
《博弈论的基本概念》ppt课件
目录
• 博弈论简介 • 博弈论的基本类型 • 博弈论的基本概念 • 博弈论的经典案例 • 博弈论的未来发展
01
博弈论简介
博弈论的定义
01
博弈论:研究决策主体在相互影 响、相互作用的环境中如何进行 决策,以及这种决策的均衡结果 的学科。
02
博弈论强调参与者之间的互动关 系,通过数学模型和理论分析来 研究策略选择和均衡结果。
应用领域:拍卖机制设计、保险市场 分析、医疗资源分配等。
03
博弈论的基本概念
参与者
01
02
03
参与者
在博弈中,参与者是决策 的主体,可以是个人或组 织。
《博弈论教程》课件
博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
《博弈论》课程课件
无独有偶,在古今中外的战争中,破釜沉舟这 种策略经常被运用,例如阿兹台克帝国的征服 者科尔特斯就是采用这种策略征服美洲大陆的。
破釜沉舟这种策略实际上有很多的变种。
36
3、企业应该在什么时候诚实 这里我们考虑一个所谓的诚信企业的动态博 弈,
占便宜 到诚信公司 顾客 不到诚信公司 诚信公司赚1000元 顾客损失2000元
25
这个模型是这样的:
第一个模型 假设:地球是圆的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到远方驶来 船只的船桅,并逐渐看到船的下部(与现实 中观察到的事实相符)
26
第二个模型
假设:地球是平的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到的是整个 船身(与现实中观察到的事实相悖)
18
博弈论在研究的过程中有两个基本前提假设 一是,理性人假设。 二是,博弈结构对参与者是公共知识。特别
是,参与者满足完美回忆。
19
例6 旅行者困境 两个旅行者在旅游圣地买了两个花瓶,但在 回程途中被航空公司打碎。航空公司知道花 瓶大约值100元,但并不清楚花瓶的确切价 格。于是,航空公司要求两位旅客各自写下 花瓶的价格,并按照两个旅客中所写的最低 价格进行赔偿(航空公司认为写最低价格的 旅客讲的是真话),为了鼓励旅客讲真话, 规定对讲真话的旅客奖励2元,对讲假话的旅 客罚款2元。容易证明,在理性人的假设下, 这个游戏唯一的结果是两人都写0。
22
表 1 博弈的分类和均衡概念
完全信息 静态 非完全信息
完全信息静态博弈 非完全信息静态博弈 (纳什均衡) (贝叶斯均衡)
完全信息动态博弈 非完全信息动态博弈 动态 (子博弈精炼均衡) (序列均衡)
破釜沉舟这种策略实际上有很多的变种。
36
3、企业应该在什么时候诚实 这里我们考虑一个所谓的诚信企业的动态博 弈,
占便宜 到诚信公司 顾客 不到诚信公司 诚信公司赚1000元 顾客损失2000元
25
这个模型是这样的:
第一个模型 假设:地球是圆的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到远方驶来 船只的船桅,并逐渐看到船的下部(与现实 中观察到的事实相符)
26
第二个模型
假设:地球是平的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到的是整个 船身(与现实中观察到的事实相悖)
18
博弈论在研究的过程中有两个基本前提假设 一是,理性人假设。 二是,博弈结构对参与者是公共知识。特别
是,参与者满足完美回忆。
19
例6 旅行者困境 两个旅行者在旅游圣地买了两个花瓶,但在 回程途中被航空公司打碎。航空公司知道花 瓶大约值100元,但并不清楚花瓶的确切价 格。于是,航空公司要求两位旅客各自写下 花瓶的价格,并按照两个旅客中所写的最低 价格进行赔偿(航空公司认为写最低价格的 旅客讲的是真话),为了鼓励旅客讲真话, 规定对讲真话的旅客奖励2元,对讲假话的旅 客罚款2元。容易证明,在理性人的假设下, 这个游戏唯一的结果是两人都写0。
22
表 1 博弈的分类和均衡概念
完全信息 静态 非完全信息
完全信息静态博弈 非完全信息静态博弈 (纳什均衡) (贝叶斯均衡)
完全信息动态博弈 非完全信息动态博弈 动态 (子博弈精炼均衡) (序列均衡)
东南大学博弈论课件.103页PPT
END
45、法律的制定是为了保证每一个人 自由发 挥自己 的才能 ,而不 是为了 束缚他 的才能 。—— 罗伯斯 庇尔
16、业余生活要有意义,不要越轨。——华盛顿 17、一个人即使已登上顶峰,也仍要自强不息。——罗素·贝克 18、最大的挑战和突破在于用人,而用人最大的突破在于信任人。——马云 19、自己活着,就是为了使别人过得更美好。——雷锋 20、要掌握书,莫被书掌握;要为生而读,莫为读而生。——布尔沃
东南学博弈论课件.
41、实际上,我们想要的不是针对犯 罪的法 律,而 是针对 疯狂的 法律。 ——马 克·吐温 42、法律的力量应当跟随着公民,就 像影子 跟随着 身体一 样。— —贝卡 利亚 43、法律和制度必须跟上人类思想进 步。— —杰弗 逊 44、人类受制于法律,法律受制于情 理。— —托·富 勒
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• • • • •
22
很可能与你的选择一样
•
根据经济学家的实验,投票结果是,只有少数人
情愿“花钱消灾”选择 甲。
•
相反,大部分人愿意和命运抗一抗,选择 乙。
23
“反射效应” :理性人的又一个挑战
当一个人在面对两种都损失的抉择时,会激 起他的冒险精神。在确定的坏处(损失)和“赌 一把”之间,做一个抉择,多数人会选择“赌一 把”,这叫“反射效应”。 面对两种损害,你是会选择躲避呢,还是勇 往直前呢?
2005年获奖者
罗伯特· 奥曼 (Robert J. Aumann) 1930 年6月出生于德国的法兰克福,拥有以色 列和美国双重国籍 。
通过博弈论分析,促进了 人们对冲突和合作的理解
2005年获奖者
托马斯· 谢林(Thomas C. Schelling) 1921年出生于美国加利福尼亚州的奥克 兰市。
26
实验结果令大跌眼镜:
甲常常会与乙对半分享这100元钱。 乙会拒绝甲提出的“抠门”方案。 现实的博弈表明 人并没有遵循“最大化”的人性假设,而是倾向 于“合作”和“互惠”! 人是有追求公平与正义的意愿!
27
对“理性”的深化感受
我们的晚餐不是来自屠夫、酿酒的商人或面包师傅 的仁慈之心,而是因为他们对自己的利益特别关注
博弈论的产生和发展
将博弈的思想明确地应用于经济领域,始于古诺(Cournot,1838) 、伯特兰德(伯川德)(Bertrand,1883)和艾奇沃斯(Edgeworth,1925
)等人关于两寡头的产量和价格垄断、产品交易行为的研究。
近半个多世纪以来,博弈论引起了众多经济学家的极大兴趣,使得
博弈论在经济学中的应用模型越来越多。大约从20世纪80年代开始
为不对称信息市场的一般理论奠定了基石。 他们的理论迅速得到了应用,从传统的农业 市场到现代的金融市场。他们的贡献来自于 现代信息经济学的核心部分......
2001年获奖者
阿克洛夫(George A. Akerlof )生于1940年, 美国加州大学伯克莱分校教授
2001年获奖者
斯蒂格利兹(Joseph E. Stiglitz )生于 1943年,美国纽约哥伦比亚大学教授
游戏——下棋、猜大小
经济——寡头产量决策、市场阻入、投标拍卖
政治、军事——美国和伊拉克、以色列和巴勒斯坦
1.1.2 一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定的环境 条件,在一定的规则下,同时或先后,一次或多次,从各自允
许选择的行为或策略中进行选择并加以实施,各自取得相应结
果的过程。
《经济博弈论》
课前思考
为什么要学习这门课?
2016/1/18
2
2016/1/18
3
2016/1/18
4
重要启示
看到什么,取决于注意什么和
希望看到什么
学到什么,取决于注意什么和 希望学到什么
2016/1/18 5
看到9张脸,智商为180,你呢?
2016/1/18
6
课程性质
什么是决策?
博弈定义
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
博弈定义
2、理性人假设 理性人是在面临既定的约束条件下最大化自己的偏好。
博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益和目的行事,而且要考虑到他的决策行 为对其他人可能的影响,通过选择最佳行动计划,来 寻求收益或效用的最大化。
1994年获奖者
泽尔藤(Selten):Subgame-Perfect Nash Equilibrium,1930年生于德国
1994年获奖者
海萨尼(Harsanyi) : Bayes-Nash Equilibrium ,1920年生于美国
1996年获奖者
莫里斯 1996年获奖
詹姆斯·莫里斯 1936年生于英国
2007年获奖者
马斯金1950年出生于美国纽约,现任美 国普林斯顿进修学院教授
2012年获奖者
劳埃德·沙普利(Lloyd S. Shapley)
1923年生于美国马萨诸塞州剑桥市 ,1953年在美国普林斯顿大学获得 博士学位,现为美国加利福尼亚大 学荣誉教授。
沙普利采用了所谓的合作博弈理论
博弈的次序(Order)
博弈方的得益(Payoffs)
博弈论方法的核心思想
研究决策主体的行为在发生直接的相互作用时,人们
如何进行决策以及这种决策的均衡问题.
每个“游戏”参与者希望极大化自己的利益,为此目 的,他们必须考虑并预测游戏的对手可能怎么做,从 而选定对自己有利的决策。
即:以对方的行动做为自己决策的依据。
2007年获奖者
赫维奇 1917年出生于俄罗斯莫斯科,后 加入美国国籍,目前为美国明尼苏达大 学经济学荣誉教授
创立和发展了“机制设计理论” 。 这一理论有助于经济学家、各国政府和企业识 别在哪些情况下市场机制有效,哪些情况下市 场机制无效。此外,借助“机制设计理论”, 人们还可以确定最佳和最有效的资源分配方式。
决策就是优化行为选择
迄今为止,你经历过的最重大的决策是什么? 当你做决策时,你最想拥有或者最想知道的 是什么?
在你做决策过程中,你会假设一些什么来约
束自己的行为?
2016/1/18 7
教材及参考书
主要参考书:
1. 张 维 迎 , 博 弈 论 与 信 息 经 济 学 , 上 海 三 联 书 店 , 上 海 人 民 出 版 社.1996. 2. Gibbons, Robert,Game Theory for Applied Economists, Princeton University Press, 1992. 3. 吉本斯,博弈论基础(中文版),中国社会科学出版社, 1999。 4. A.迪克西特和S.斯克斯,策略博弈,中国人民大学出版社,2009。 5. [美]朱•弗登博格,[法]让•梯若尔(Jean Tirole) ,博弈论,中国人民大 学出版社,2010。
。。—亚当-斯密
•
理性是人在作决策的时候,在他所能选择的范围内 作出他认为最好的选择。 ——林毅夫
•
需要注意的是:理性或自私并不等同于“损人利己 ”;很多时候,“利他”是为了更好地“利己”。
28
博弈定义
四个核心方面
博弈的参加者(Player)——博弈方
各博弈方的策略(Strategies)或行为(Actions)
我的联系方式 手机:
189 129 58203
E-mail:
fengweiseu@
办公地点:
九龙湖校区经管学院B304
第一章 导论
本章介绍博弈论的基本概念,包括 什么是博弈和博弈论,给出一些经典博 弈例子。对博弈分类和博弈理论的结构 作一些讨论。目标是让大家对博弈论的 内容和博弈模型有更直观的概念和印象。
学习博弈与决策的目的
学习一种谋略技巧,提高人生成功的可能性; 学习一种思维方式,加深对社会现象的认识程度;
学习一种交流语言,扩大交流圈子;
学习一种分析方法,提高知识水平。
2016/1/18 47
Hale Waihona Puke 博弈故事示例
为什么要1美元而不要10美元?
有一个乞丐小孩,面对他人施舍,他只要1
美元,而不会要10美元。由此因“傻”而出 名,结果不断有人闻讯前来试验,每次都发 现小孩真的很“傻”。
并比较了不同的匹配方法。
2012年获奖者
阿尔文·埃利奥特·罗思(Alvin Eliot
Roth,1951年12月19日-)是美国
经济学家,目前在哈佛商学院担任 乔治·冈德经济与工商管理学教授。 罗思在博弈论、市场设计和实验经 济学领域做出显著贡献。在2012年
,他与劳埃德·沙普利共同获得了诺
贝尔经济学奖。
本章分三节
1. 1什么是博弈论
1. 2几类经典博弈模型
1. 3博弈结构和博弈的分类
1.1 什么是博弈论
1.1.1 从游戏到博弈 1.1.2 一个非技术性定义
1.1.1 从游戏到博弈
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、 策略选择,策略和利益相互依存,策略的关键作用
24
现在,你还认为自己足够理性吗?
再来看看
你是不是一个完全自利的人?
25
“最后通牒”游戏
•
甲有100元钱,但必须与乙共同分配,分配额的决定权
在甲,若乙不接受甲的分配方案,这100元钱就会自动 消失,谁也不能得到任何好处。
• • •
问题: 如果你是甲,你将怎么分配?为什么? 如果你是乙,会答应甲的“抠门”的分配方案吗?
在信息经济学理论领域做出了重大贡献, 尤其是不对称信息条件下的经济激励理论
1996年获奖者
威廉·维克瑞,1914-1996,生于美国 ,1996年获奖
在信息经济学、激励理论、博弈论、拍卖 理论等方面都做出了重大贡献。
2001年获奖者
迈克尔·斯宾斯(Spence)2001年获奖
斯宾斯(A. Michael Spence )生于1943年, 美国加州斯坦福大学教授
再来一个小实验:你会如何选择