博弈论基础PPT精品课程课件全册课件汇总
合集下载
博弈论基础PPT精品课程课件全册课件汇总
自己处于c还是d。即K缺乏信息。 P
c
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
参与人对于结果的偏好性。K是否更希望博弈
终止点f而不是h上结束?
我们必须知道参与人关心什么,才能将终止
点根据每个参与人的偏好排列。通常用数字
表述参与人的偏好排序最为简便。这也称为
1 概述
这个理论在许多方面都是有用的。 首先,它提供了一种语言。 其次,它提供了应该框架,能够指导我们建立策略环 境模型。 其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。
在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
支付(payoff),或者效用(utilities)。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
我们引入一些数学符号来考察博弈。
我们来看看一个市场博弈,两个厂商通过选择高价或者低价进行 竞争。
我们用参与人i表示任何一个参与人的数字代码。即在一个有n个 参与人的博弈中,i=1,2,…,n。 在某些博弈中,一个参与人可以在无限多个行动中进行选择。
博弈论基础-A-xjh(共48张PPT)
行动所组成的有序集。
例如:
—— 出门:带伞 或 不带伞 —— 打牌:出牌
信息(information)指局中人在博弈中的知识,特别是有 关其他局中人(竞争者或对手)的特征和行动的知识。
一般地,信息是以信息集(information set)的概念来模型 化的。可以将局中人的信息集看成是其在特定时点对于不同变 量的取值的了解程度。
评论2:在重复博弈中,以往的经历或做法通常就确局定了中聚人点的B位置。
通零俗和地 博说弈,指博在弈博结弈果中总一和组为局零中的人博所弈得称到为的零支左和付博(弈或。收益)恰好是另右一组局中人的损失。
——对产品的了解
(三)划分博弈的主要概上念
2, 1
完 全 信 息——如“石头、剪刀、布”游戏
0, 0
局中人A 完 备 信 息——“石头、剪刀、布”游戏中,你知道对方40%出石头,30%出布,30%出剪刀
林自由大学、比勒菲尔特大学和波恩大学。其主要贡献 是在博弈论中引入了动态分析。
1920年Harsanyi出生于匈牙利,1947年获布达佩斯大学博士 学位,后到 ,1954年获斯坦福大学博士学位,曾先后任教于澳 大利亚国立大学、加州伯克利分校。于2000年去世。他的贡献是 将不完全信息引入了博弈论的研究。
S4=。可以选择的花的品种为3种。
不同的花在不同的气候条件下的收成为:
天气
S1
S2
S3
S4
品种
A1
12
10
9
0
A2
8
8
4
4
A3
161232概率0.2
例如:
出门 ——对天气的判断
打牌
——对其他人的判断 装修
——对产品的了解
例如:
—— 出门:带伞 或 不带伞 —— 打牌:出牌
信息(information)指局中人在博弈中的知识,特别是有 关其他局中人(竞争者或对手)的特征和行动的知识。
一般地,信息是以信息集(information set)的概念来模型 化的。可以将局中人的信息集看成是其在特定时点对于不同变 量的取值的了解程度。
评论2:在重复博弈中,以往的经历或做法通常就确局定了中聚人点的B位置。
通零俗和地 博说弈,指博在弈博结弈果中总一和组为局零中的人博所弈得称到为的零支左和付博(弈或。收益)恰好是另右一组局中人的损失。
——对产品的了解
(三)划分博弈的主要概上念
2, 1
完 全 信 息——如“石头、剪刀、布”游戏
0, 0
局中人A 完 备 信 息——“石头、剪刀、布”游戏中,你知道对方40%出石头,30%出布,30%出剪刀
林自由大学、比勒菲尔特大学和波恩大学。其主要贡献 是在博弈论中引入了动态分析。
1920年Harsanyi出生于匈牙利,1947年获布达佩斯大学博士 学位,后到 ,1954年获斯坦福大学博士学位,曾先后任教于澳 大利亚国立大学、加州伯克利分校。于2000年去世。他的贡献是 将不完全信息引入了博弈论的研究。
S4=。可以选择的花的品种为3种。
不同的花在不同的气候条件下的收成为:
天气
S1
S2
S3
S4
品种
A1
12
10
9
0
A2
8
8
4
4
A3
161232概率0.2
例如:
出门 ——对天气的判断
打牌
——对其他人的判断 装修
——对产品的了解
《博弈论》课程ppt课件
10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
第十章博弈论初步-PPT精品
▪ 1、纳什均衡的定义:
▪ 设 s(s1, .., .sn)是n人博弈G={ ; S1, .., . Sn u1,.., . un } 的一个策略组合。如果对于每个局中人 i , ui(s1 , ., .s .i 1 , si , si 1 , ., .s .n )≥ ui(s1 , ., .s .i 1 , si, si 1 , ., .s .n )
第十章 博弈论初步 Game Theory
博弈论概述 纳什均衡 序贯博弈与重复博弈 进入威慑
第一节 博弈论概述
▪ 什么是博弈? ▪ 拍卖金钱 ▪ 海盗博弈 ▪ 田忌赛马 ▪ 围棋和象棋
齐王
田忌
上
中
下
上 赢,输 赢,输 赢,输
中 输,赢 赢,输 赢,输
下 输,赢 输,赢 赢,输
一、博弈的基本要素
ui(si,si) ≥ ui(si,si) 对于所有si Si 都成立,则我们称策略组合
s(s1, .., .sn)
是该博弈的一个纳什均衡。
▪ 纳什简介: ▪ 约翰·纳什生于1928年6月13日。父亲是电子工程师
与教师,第一次世界大战的老兵。纳什小时孤独内 向。纳什的数学天分大约在14岁开始展现。他在普 林斯顿大学读博士时刚刚二十出头,但他的一篇关 于非合作博弈的博士论文和其他相关文章,确立了 他博弈论大师的地位。在20世纪50年代末,他已是 闻名世界的科学家了。 ▪ 然而,30岁的时候,纳什和他惟一儿子都罹患精神 分裂症。半个世纪之后,在他妻子(艾利西亚—— —麻省理工学院物理系毕业生)的精心照料下,和 她的儿子一样,纳什教授渐渐康复,并在1994年获 得诺贝尔经济学奖。 ▪ 影片《美丽心灵》是一部以纳什的生平经历为基础 而创作的人物传记片。该片荣获2019年奥斯卡金像 奖。
博弈论完整版PPT课件
ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
精品课程《博弈论》PPT课件(全)
人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
博弈论基础知识.ppt
–
The theory of rational choice
–
The action chosen by a decision-maker is at least as good, according to her preferences, as every other available action.
第一讲( 第一讲(续) 博弈论基础知识
The theory of rational choice
Actions Preferences and payoff functions
epresents a decision-maker’s preferences if, for any actions a in A and b in A, u(a)>u(b) if and only if the decision-maker prefers a to b. – A decision-maker’s preferences convey only ordinal information.
Conditional probability and Bayes’s rule
– –
Conditional probability and Bayes’s rule
条件概率: P ( B | A) = P ( AB ) P ( A)
全概率公式:设试验 E的样本空间为 S, A为 E的事件, B1, B2, Bn为 S的一个划分, P ( Bi ) > ( i = 1, 2,⋯ , n), 0 则: P ( A) = P ( A | B1 ) P ( B1 ) + P ( A | B2 ) P ( B2 ) + ⋯ + P ( A | Bn ) P ( Bn ) 贝叶斯公式: P ( Bi | A) = P ( A | Bi ) P ( Bi )
The theory of rational choice
–
The action chosen by a decision-maker is at least as good, according to her preferences, as every other available action.
第一讲( 第一讲(续) 博弈论基础知识
The theory of rational choice
Actions Preferences and payoff functions
epresents a decision-maker’s preferences if, for any actions a in A and b in A, u(a)>u(b) if and only if the decision-maker prefers a to b. – A decision-maker’s preferences convey only ordinal information.
Conditional probability and Bayes’s rule
– –
Conditional probability and Bayes’s rule
条件概率: P ( B | A) = P ( AB ) P ( A)
全概率公式:设试验 E的样本空间为 S, A为 E的事件, B1, B2, Bn为 S的一个划分, P ( Bi ) > ( i = 1, 2,⋯ , n), 0 则: P ( A) = P ( A | B1 ) P ( B1 ) + P ( A | B2 ) P ( B2 ) + ⋯ + P ( A | Bn ) P ( Bn ) 贝叶斯公式: P ( Bi | A) = P ( A | Bi ) P ( Bi )
博弈论最全完整ppt 讲解
完全信息
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
不完全信息
贝氏纳什均衡 (BNE)
完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态 博弈;先后或序贯决策或者行动的博弈, 属于动态博弈
如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为一个常数, 这个博弈就叫常和博弈;
相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为一 个常数,这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进 行分析”领域做出了重要贡献。
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
《博弈论的基本概念》课件
智猪博弈
• 总结词:描述大猪和小猪在食槽附近争夺食物的策略博弈。
• 详细描述:在智猪博弈中,一个大猪和一个小猪共同生活在一个猪圈里,食槽位于猪圈的一端。每次食物被放入食槽时 ,大猪和小猪都有两种选择:冲向食槽或继续等待。如果大猪选择冲向食槽,小猪的最佳策略是等待,因为大猪吃掉大 部分食物后,小猪可以享用剩余的食物。相反,如果小猪选择冲向食槽,大猪的最佳策略也是等待,因为小猪可能无法 抢到任何食物。因此,无论大猪如何选择,小猪的最佳策略都是等待;同样地,无论小猪如何选择,大猪的最佳策略也 是等待。
合作博弈
特征
强调合作、协议和联盟,目标是实现共同利益。
应用领域
国际关系、商业合作、团队协作等。
非合作博弈
特征
强调竞争、自利和策略互动,目标是实现个人利益。
应用领域
市场竞争、个人决策、政治选举等。
动态博弈
特征
强调行动的顺序和信息传递,策略和 行动需考虑时间因素。
应用领域
商业竞争、投资决策、谈判策略等。
《博弈论的基本概念》ppt课件
目录
• 博弈论简介 • 博弈论的基本类型 • 博弈论的基本概念 • 博弈论的经典案例 • 博弈论的未来发展
01
博弈论简介
博弈论的定义
01
博弈论:研究决策主体在相互影 响、相互作用的环境中如何进行 决策,以及这种决策的均衡结果 的学科。
02
博弈论强调参与者之间的互动关 系,通过数学模型和理论分析来 研究策略选择和均衡结果。
应用领域:拍卖机制设计、保险市场 分析、医疗资源分配等。
03
博弈论的基本概念
参与者
01
02
03
参与者
在博弈中,参与者是决策 的主体,可以是个人或组 织。
经济博弈论基础教材课件汇总完整版ppt全套课件最全教学教程整本书电子教案全书教案课件合集
1. 从经济学的研究对象来看 传统观点:经济学是研究有限资源的最优配置的 一门学科。物尽其用 现代观点:经济学是研究理性人行为的一门学科。 人尽其才 理性人 合作与冲突 博弈论 从“物尽其用” 到“人尽其才”
1. 重视微观基础 2. 重视人与人之间关系的研究 3. 重视信息在经济中的作用
二、博弈论对经济学发展的影响
1、Von Neumann体系 标准型 扩展型 合作型
第三节、经济博弈论内容体系
2、合作博弈与非合作博弈 局中人之间是否有具有约束力的协议,博弈可分为: 合作博弈:有。强调团体理性,效率、公平和公正 非合作博弈:没有。强调个人理性、个人最优选择,其结果可能是有效率的,也可能是无效率的。
非合作博弈可以从两个角度进行分类
.
四种不同类型的博弈
信息 行动顺序
完全信息
不完全信息
静态
完全信息静态博弈 纳什均衡 Nash (1950,1951)
不完全信息静态博弈 贝叶斯纳什均衡 Harsanyi (1967-1968)
动态
完全信息动态博弈 子博弈完美纳什均衡 Selten (1965)
第一节 博弈论与经济学 第二节 经济博弈论的产生与发展 第三节 经济博弈论内容体系
主要内容
一、博弈论的研究对象 博弈论是研究在利益相互影响的局势中,局中人如何选择自己的策略才能使自身的收益最大化的均衡问题,是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。
第一节、博弈论与经济学
2001年Nobel经济学奖
通过博弈论分析而增进我们对冲突和合作的理解 Robert J. Aumann 以色列耶路撒冷希伯来大学理性研究中心 Thomas C. Schelling 美国哈佛大学肯尼迪政府学院和马里兰大学经济学系暨公共政策学院
1. 重视微观基础 2. 重视人与人之间关系的研究 3. 重视信息在经济中的作用
二、博弈论对经济学发展的影响
1、Von Neumann体系 标准型 扩展型 合作型
第三节、经济博弈论内容体系
2、合作博弈与非合作博弈 局中人之间是否有具有约束力的协议,博弈可分为: 合作博弈:有。强调团体理性,效率、公平和公正 非合作博弈:没有。强调个人理性、个人最优选择,其结果可能是有效率的,也可能是无效率的。
非合作博弈可以从两个角度进行分类
.
四种不同类型的博弈
信息 行动顺序
完全信息
不完全信息
静态
完全信息静态博弈 纳什均衡 Nash (1950,1951)
不完全信息静态博弈 贝叶斯纳什均衡 Harsanyi (1967-1968)
动态
完全信息动态博弈 子博弈完美纳什均衡 Selten (1965)
第一节 博弈论与经济学 第二节 经济博弈论的产生与发展 第三节 经济博弈论内容体系
主要内容
一、博弈论的研究对象 博弈论是研究在利益相互影响的局势中,局中人如何选择自己的策略才能使自身的收益最大化的均衡问题,是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。
第一节、博弈论与经济学
2001年Nobel经济学奖
通过博弈论分析而增进我们对冲突和合作的理解 Robert J. Aumann 以色列耶路撒冷希伯来大学理性研究中心 Thomas C. Schelling 美国哈佛大学肯尼迪政府学院和马里兰大学经济学系暨公共政策学院
《博弈论教程》课件
博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
《博弈论入门》PPT课件
即规定每个博弈方在进行决策时,可以选择的方案, 做法或经济活动的水平,量值等。
在不同博弈中可供博弈方选择的策略或行为的数量 很不相同,在同一个博弈中,不同博弈方的可选策 略或行为的内容或数量也常不同,有时只有有限的 几种,甚至只有一种,而有时又可能有许多种,甚 至无限多种可选策略或行为。
精选PPT
男人无所谓忠诚,忠诚是因为背叛的砝码太低; 女人无所谓忠贞,忠贞是因为受到的引诱不够.
某个综艺节目现场,女主持人气势咄咄的问一个男嘉宾,你 为什么那么在乎钱,男嘉宾说:“钱能买到一切!” 现场的观 众哗然了。
男嘉宾微笑的说:“我们做个测试吧。”
一个很简单的主题,你的一个仇人爱上了你的女友,现在
局中人所选择的策略构成的组合(招,招)被称为 博弈均衡。
精选PPT
21
参与人(Players)
即在所定义的博弈中究竟有哪几个独立决策、独立 承担结果的个人或组织。
对我们来说,只要在一个博弈中统一决策,统一行 动、统一承担结果,不管一个组织有多大,哪怕是 一个国家,甚至是由许多国有组成的联合国,都可 以作为博弈中的一个参加方。并且,在博弈的规则 确定之后,各参加方都是平等的,大家都必须严格 按照规则办事。
人,也许是在权衡什么。一半的男人沉默了,另一半
的男人怯生生的说:“我要爱情。”身边的女友也有点
呆住了,一个女孩子站起来说:“如果一个男人肯出
五百万,我想我没有理由拒绝他。”沉默..................
精选PPT
26
男人选择了金钱,500万可以买一套房子,一部车子,全家 过上好曰子,甚至可以开始自己的事业。一个男人说:“他是 我的仇人,我有了这个500万,我可以含辛茹苦,我可以报仇 ,我可以计划我所有的未来,当个真正主宰自己的男人。”一 些女人看着身边的男人,若有所思。
在不同博弈中可供博弈方选择的策略或行为的数量 很不相同,在同一个博弈中,不同博弈方的可选策 略或行为的内容或数量也常不同,有时只有有限的 几种,甚至只有一种,而有时又可能有许多种,甚 至无限多种可选策略或行为。
精选PPT
男人无所谓忠诚,忠诚是因为背叛的砝码太低; 女人无所谓忠贞,忠贞是因为受到的引诱不够.
某个综艺节目现场,女主持人气势咄咄的问一个男嘉宾,你 为什么那么在乎钱,男嘉宾说:“钱能买到一切!” 现场的观 众哗然了。
男嘉宾微笑的说:“我们做个测试吧。”
一个很简单的主题,你的一个仇人爱上了你的女友,现在
局中人所选择的策略构成的组合(招,招)被称为 博弈均衡。
精选PPT
21
参与人(Players)
即在所定义的博弈中究竟有哪几个独立决策、独立 承担结果的个人或组织。
对我们来说,只要在一个博弈中统一决策,统一行 动、统一承担结果,不管一个组织有多大,哪怕是 一个国家,甚至是由许多国有组成的联合国,都可 以作为博弈中的一个参加方。并且,在博弈的规则 确定之后,各参加方都是平等的,大家都必须严格 按照规则办事。
人,也许是在权衡什么。一半的男人沉默了,另一半
的男人怯生生的说:“我要爱情。”身边的女友也有点
呆住了,一个女孩子站起来说:“如果一个男人肯出
五百万,我想我没有理由拒绝他。”沉默..................
精选PPT
26
男人选择了金钱,500万可以买一套房子,一部车子,全家 过上好曰子,甚至可以开始自己的事业。一个男人说:“他是 我的仇人,我有了这个500万,我可以含辛茹苦,我可以报仇 ,我可以计划我所有的未来,当个真正主宰自己的男人。”一 些女人看着身边的男人,若有所思。
《博弈论基础》课件
●由 VL(σG,σL)=-γ[2θ-1]+3θ 得到流浪汉的反应 对应:γ=1,当θ<0.5;γ∈[0,1],当θ=0.5;γ =0,当θ>0.5
● NE:(σ*G,σL*) σ*G=(0.5,0.5) σL*=(0.2,0.8)
01-3-2
23
● 另解(支付最大法): 一阶条件(FOC): dVG/dθ=0;dVL/dγ=0 γ*=0.2;θ*=0.5
8
2、博弈规则(续)
● “兵来将挡、水来土掩”
● “以不变应万变”、“以静制动”
● 毛主席语录:“人不犯我,我不犯人;人若犯我,我
必犯人”—这里,
人的行动集:{犯;不犯};
人的战略集:{犯;不犯}
我的行动集: {犯;不犯}
01-3-2
9
2、博弈规则(续)
而我的战略集合:{s1,s2,s3,s4} 其中,s1=(犯,犯);s2=(犯,不犯)
若 S1=D,则п1=1/2×0+1/2×2=2
所以,给定 S2*,S1*=U 为参与人 1 的最优战略
01-3-2
33
反之,给定 S1*,S(t21)=L;S(t22)=R 分别是 t21 与 t22 类 型的参与人 2 的最优战略
2.Static B.G 的定义:
{I;{Si};{ui(·)};Θ;F(·)}
(5,4,4) (0,-1,7)
L 1○
R
(-1,5,6) (5,4,4)
01-3-2
29
●SPNE(s1,s2,s3):s1={R};s2:a If 1 Plays R; s3:=r,If 1 Plays L; =r,If L Plays R and 2 Plays a; =l,If L Plays R and2 Plays b
● NE:(σ*G,σL*) σ*G=(0.5,0.5) σL*=(0.2,0.8)
01-3-2
23
● 另解(支付最大法): 一阶条件(FOC): dVG/dθ=0;dVL/dγ=0 γ*=0.2;θ*=0.5
8
2、博弈规则(续)
● “兵来将挡、水来土掩”
● “以不变应万变”、“以静制动”
● 毛主席语录:“人不犯我,我不犯人;人若犯我,我
必犯人”—这里,
人的行动集:{犯;不犯};
人的战略集:{犯;不犯}
我的行动集: {犯;不犯}
01-3-2
9
2、博弈规则(续)
而我的战略集合:{s1,s2,s3,s4} 其中,s1=(犯,犯);s2=(犯,不犯)
若 S1=D,则п1=1/2×0+1/2×2=2
所以,给定 S2*,S1*=U 为参与人 1 的最优战略
01-3-2
33
反之,给定 S1*,S(t21)=L;S(t22)=R 分别是 t21 与 t22 类 型的参与人 2 的最优战略
2.Static B.G 的定义:
{I;{Si};{ui(·)};Θ;F(·)}
(5,4,4) (0,-1,7)
L 1○
R
(-1,5,6) (5,4,4)
01-3-2
29
●SPNE(s1,s2,s3):s1={R};s2:a If 1 Plays R; s3:=r,If 1 Plays L; =r,If L Plays R and 2 Plays a; =l,If L Plays R and2 Plays b
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在数学上,有几种方法描述一个博弈:
1 博弈有一组参与人;
2 对于参与人可能采取的行动的完整描述(即它们的 可行行动集); 3 对于参与人采取行动时,所知信息的描述; 4 对于参与人的行为将如何导致博弈结果的规定;
5 对于参与人对结果偏好的定义。
2 扩展型
迪斯尼工作室的《虫子的一生》和梦工场的《蚂蚁》。
我们要学会了解在策略环境下,人们实际上是如何采 取行动的,以及他们应该怎样采取行动。
相互依赖的情形可称为策略环境。因为人们为了确定 所采取的最优行动,必须考虑他周围的其他人会怎样 选择行动。 这种系统的研究形成了应该策略互动的理论。
1 概述
这个理论在许多方面都是有用的。
首先,它提供了一种语言。
其次,它提供了应该框架,能够指导我们建立策略环 境模型。
1 概述
在所有社会,人们经常互动。
有时,互动是合作,其他的时候,互动是竞争。
在这两种情况下,都可以用一个术语,即相互依赖性 来表示一个人的行为对另外一个人的福利造成的影响 。 相互依赖的情形可称为策略环境。因为人们为了确定 所采取的最优行动,必须考虑他周围的其他人会怎样 选择行动。
1 概述
策略对于社会的运行来说,是非常基本的。
导言
1.1 什么是博弈论?
博弈论帮助我们理解,决策者互动的情形。
Creates a double record of bank transactions.
Bank reconciliation.
Movie Movie Cricket 2,1 0,0 Cricket 0,0 1,2
2 扩展型
2 扩展型
1 概述
还有2001年获奖的米歇尔 斯彭斯,约瑟夫斯蒂克利 茨和乔治阿克洛夫。
1 概述
目前,博弈论被许多来自不同领域的专业人士使用, 这些领域包括经济学、政治学、法律、生物、国际关 系哲学以及数学。 事实上,大多数情形即包含了冲突元素,也包含了合 作的元素。我们对博弈的组成要有一个广义的理解。 简而言之,博弈是策略环境的正式描述。因此,博弈 论是研究相互依赖情形的正式的方法论。这里,“正 式”是指一种以数学化的精确,以及逻辑上的一致见 长的结构。 利用正确的理论工具,我们可以研究各种情况下的行 为,从而更好地理解经济中的相互作用。
R’
f
K
P h l e N’ N P g
a称为初始点,a,b,c,d,e称为决策点。f,g,h,l,m c 称为终止点。表示博弈的结果。
P E K a S L N K d b
Nmຫໍສະໝຸດ 扩展型我们用信息集来定义参与人在博弈中的决策节点 所拥有的信息。有一些信息集只包括一个节点, 例如在节点a,b。节点c,d则包含在一个信息集中 。每个信息集只能做出一个决策。 而正如在故事中所说的,双方都不知道对方是否 制作影片之前,决定制作自己的影片。虚线表示 P K知道自己处于这两个节点之一,但是不能区分 c 自己处于c还是d。即K缺乏信息。 P
P E K a S L N K N m d b R’ f
K
P c N P h l e N’ g
2 扩展型
我们可以用一个树状结构表示两个公司之间 的互动。树状结构由节点和分支组成。节点 表示事件的发生点,分支表示可以选择的不 同的行为方案。我们用实心圆表示节点,用 连接节点的箭头表示分支。这个树状结构称 为扩展型表述。
精品课程
PPT内容可自行编辑
博弈论基础
授课人:XX XX
参考书
《策略博弈》2th,阿维纳什 迪克西特,苏珊 斯克丝 《策略:博弈论导论》。乔尔 沃森 《博弈论基础》罗伯特 吉本斯
《博弈入门》马丁 奥斯本
研究生: 《博弈论》D. 弗登博格,让 梯若尔 《博弈论》R. 迈尔森 《博弈论教程》M. 奥斯本,A. 鲁宾斯坦
其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
这个理论在许多方面都是有用的。
首先,它提供了一种语言。
其次,它提供了应该框架,能够指导我们建立策略环 境模型。
其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。 在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
卡曾伯格被迪斯尼的老板艾斯纳从派拉蒙招贤,以重 振迪斯尼动画部。
卡氏于1994年8月辞职。不久,艾斯纳接受了提议, 于是《虫子的一生》进入了制作阶段。 大概同时,卡氏与斯皮尔伯格等组建了梦工场。开始 制作《蚂蚁》。 两个工作室是在决定制作两部影片之后,才得知对方 的决定的。
2 扩展型
迪斯尼准备在1998年感恩节期间,发行《虫子的一生 》。而这正是梦工场原定《埃及艳后》的上映时间。 梦工场于是决定,把〉埃及艳后〉推迟到圣诞节。争 取在《虫子的一生》上映之前,让《蚂蚁》上映。
接下去的几十年中,数学 家和经济学家丰富了它的 基础,逐步打造了社会科 学最强大和最有影响力的 工具箱之一。
1 概述
1994年诺贝尔奖颁给了, 在20世纪50-70年代对博 弈论做出了重大贡献的3 位经济学家:约翰· 纳什, 约翰· 海萨尼和莱茵哈特· 泽尔腾。
1 概述
接着荣膺诺贝尔经济学奖 金桂冠的经济学家有,诸 如信息和合约方面的专家威廉维克里和詹姆斯米利 斯(1996年)。
1 概述
在19世纪的前10年,古诺 对寡头模型的均衡进行了 研究。 而埃奇沃思解决了交易经 济中的议价问题。
1 概述
1913年,关于博弈的第一 个定理(关于象棋游戏的 结论)被泽梅罗证明。 接着,博雷尔开创性地提 出了“策略”的概念。
1 概述
博弈论发展的关键事件是 1944年冯诺依曼和奥斯卡 摩根斯坦的著作《博弈论 和经济行为》的出版。此 书奠定了该领域的基石。
最后,《蚂蚁》为梦工场创造了超过0.9亿美元的利 润,而《虫子的一生》确保了超过1.6亿美元的利润。
2 扩展型
让我们用一个数学模型讲述这个故事。为了 把它转化成数学的抽象语言,我们必须对故 事进行适当的简化和程式化。我们的目标应 该是从中分析得出一两个策略要素。 这可以帮助我们从理论学者的角度,理解这 个决策环境。
1 博弈有一组参与人;
2 对于参与人可能采取的行动的完整描述(即它们的 可行行动集); 3 对于参与人采取行动时,所知信息的描述; 4 对于参与人的行为将如何导致博弈结果的规定;
5 对于参与人对结果偏好的定义。
2 扩展型
迪斯尼工作室的《虫子的一生》和梦工场的《蚂蚁》。
我们要学会了解在策略环境下,人们实际上是如何采 取行动的,以及他们应该怎样采取行动。
相互依赖的情形可称为策略环境。因为人们为了确定 所采取的最优行动,必须考虑他周围的其他人会怎样 选择行动。 这种系统的研究形成了应该策略互动的理论。
1 概述
这个理论在许多方面都是有用的。
首先,它提供了一种语言。
其次,它提供了应该框架,能够指导我们建立策略环 境模型。
1 概述
在所有社会,人们经常互动。
有时,互动是合作,其他的时候,互动是竞争。
在这两种情况下,都可以用一个术语,即相互依赖性 来表示一个人的行为对另外一个人的福利造成的影响 。 相互依赖的情形可称为策略环境。因为人们为了确定 所采取的最优行动,必须考虑他周围的其他人会怎样 选择行动。
1 概述
策略对于社会的运行来说,是非常基本的。
导言
1.1 什么是博弈论?
博弈论帮助我们理解,决策者互动的情形。
Creates a double record of bank transactions.
Bank reconciliation.
Movie Movie Cricket 2,1 0,0 Cricket 0,0 1,2
2 扩展型
2 扩展型
1 概述
还有2001年获奖的米歇尔 斯彭斯,约瑟夫斯蒂克利 茨和乔治阿克洛夫。
1 概述
目前,博弈论被许多来自不同领域的专业人士使用, 这些领域包括经济学、政治学、法律、生物、国际关 系哲学以及数学。 事实上,大多数情形即包含了冲突元素,也包含了合 作的元素。我们对博弈的组成要有一个广义的理解。 简而言之,博弈是策略环境的正式描述。因此,博弈 论是研究相互依赖情形的正式的方法论。这里,“正 式”是指一种以数学化的精确,以及逻辑上的一致见 长的结构。 利用正确的理论工具,我们可以研究各种情况下的行 为,从而更好地理解经济中的相互作用。
R’
f
K
P h l e N’ N P g
a称为初始点,a,b,c,d,e称为决策点。f,g,h,l,m c 称为终止点。表示博弈的结果。
P E K a S L N K d b
Nmຫໍສະໝຸດ 扩展型我们用信息集来定义参与人在博弈中的决策节点 所拥有的信息。有一些信息集只包括一个节点, 例如在节点a,b。节点c,d则包含在一个信息集中 。每个信息集只能做出一个决策。 而正如在故事中所说的,双方都不知道对方是否 制作影片之前,决定制作自己的影片。虚线表示 P K知道自己处于这两个节点之一,但是不能区分 c 自己处于c还是d。即K缺乏信息。 P
P E K a S L N K N m d b R’ f
K
P c N P h l e N’ g
2 扩展型
我们可以用一个树状结构表示两个公司之间 的互动。树状结构由节点和分支组成。节点 表示事件的发生点,分支表示可以选择的不 同的行为方案。我们用实心圆表示节点,用 连接节点的箭头表示分支。这个树状结构称 为扩展型表述。
精品课程
PPT内容可自行编辑
博弈论基础
授课人:XX XX
参考书
《策略博弈》2th,阿维纳什 迪克西特,苏珊 斯克丝 《策略:博弈论导论》。乔尔 沃森 《博弈论基础》罗伯特 吉本斯
《博弈入门》马丁 奥斯本
研究生: 《博弈论》D. 弗登博格,让 梯若尔 《博弈论》R. 迈尔森 《博弈论教程》M. 奥斯本,A. 鲁宾斯坦
其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
这个理论在许多方面都是有用的。
首先,它提供了一种语言。
其次,它提供了应该框架,能够指导我们建立策略环 境模型。
其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。 在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
卡曾伯格被迪斯尼的老板艾斯纳从派拉蒙招贤,以重 振迪斯尼动画部。
卡氏于1994年8月辞职。不久,艾斯纳接受了提议, 于是《虫子的一生》进入了制作阶段。 大概同时,卡氏与斯皮尔伯格等组建了梦工场。开始 制作《蚂蚁》。 两个工作室是在决定制作两部影片之后,才得知对方 的决定的。
2 扩展型
迪斯尼准备在1998年感恩节期间,发行《虫子的一生 》。而这正是梦工场原定《埃及艳后》的上映时间。 梦工场于是决定,把〉埃及艳后〉推迟到圣诞节。争 取在《虫子的一生》上映之前,让《蚂蚁》上映。
接下去的几十年中,数学 家和经济学家丰富了它的 基础,逐步打造了社会科 学最强大和最有影响力的 工具箱之一。
1 概述
1994年诺贝尔奖颁给了, 在20世纪50-70年代对博 弈论做出了重大贡献的3 位经济学家:约翰· 纳什, 约翰· 海萨尼和莱茵哈特· 泽尔腾。
1 概述
接着荣膺诺贝尔经济学奖 金桂冠的经济学家有,诸 如信息和合约方面的专家威廉维克里和詹姆斯米利 斯(1996年)。
1 概述
在19世纪的前10年,古诺 对寡头模型的均衡进行了 研究。 而埃奇沃思解决了交易经 济中的议价问题。
1 概述
1913年,关于博弈的第一 个定理(关于象棋游戏的 结论)被泽梅罗证明。 接着,博雷尔开创性地提 出了“策略”的概念。
1 概述
博弈论发展的关键事件是 1944年冯诺依曼和奥斯卡 摩根斯坦的著作《博弈论 和经济行为》的出版。此 书奠定了该领域的基石。
最后,《蚂蚁》为梦工场创造了超过0.9亿美元的利 润,而《虫子的一生》确保了超过1.6亿美元的利润。
2 扩展型
让我们用一个数学模型讲述这个故事。为了 把它转化成数学的抽象语言,我们必须对故 事进行适当的简化和程式化。我们的目标应 该是从中分析得出一两个策略要素。 这可以帮助我们从理论学者的角度,理解这 个决策环境。