博弈论02 无限策略2

合集下载

庄散博弈论

庄散博弈论

庄散博弈论庄散博弈论是一种对于两人或以上之间的博弈进行分析的方法,也是经济学和社会科学领域里非常流行的一种工具。

它用基本的数学模型来描述游戏的策略和规则,并考虑游戏各方之间互相的行为和反应,从而预测游戏最终结果。

一、博弈论的基本概念在应用博弈论分析问题时,我们需要了解的几个重要概念包括以下内容。

1. 参与者博弈论中最主要的概念就是参与者,也称为决策者。

他们是参与博弈的主体,能够影响游戏的走向和结果。

2. 博弈规则博弈规则描述了游戏的基本规则和条件,包括参与者能够采取哪些决策行为,游戏结束的条件和步骤等。

3. 支付支付指的是参与者根据游戏结果所得到的“利润”。

在博弈论中,我们通常假设所有决策者都是理性的,他们的行为决策是为了最大化自己的利益。

二、庄散博弈论的应用庄散博弈论是一种非零和博弈,也就是说在游戏结束后,所有参与者所得到的累计收益并不一定相等,也有可能相互受益。

以下是庄散博弈论的具体应用范围:1. 生产经济中的应用庄散博弈论可以用来分析企业之间的市场竞争、价格战争、生产合作和生产垄断等现象,预测和优化企业的策略。

2. 战争中的应用庄散博弈论也可以用来模拟和分析更复杂的现实场景,如战争、对抗等,可以帮助决策者预测敌人的行为并制定相应的计划。

3. 社会政治中的应用庄散博弈论可以用来分析选举、公共政策、公共财政等领域的决策,并预测这些政策对社会、人民和企业等的影响。

三、庄散博弈论的特点庄散博弈论具有以下几个主要特点。

1. 独立策略在庄散博弈论中,参与者策略是独立的,他们在不知道其他人选择的情况下,独立地进行自己的策略决策行为。

2. 有限策略庄散博弈论假设参与者都采取有限策略,即只有有限的可选择行动。

3. 最优策略在庄散博弈论中,参与者都是理性的,他们在自己有限的选择中,会采取最优化的策略来最大化自己的收益。

4. 不完全信息在庄散博弈论中,参与者对于对手的信息往往是不完全的,这也是博弈的难点之一。

综上所述,庄散博弈论是一种重要的工具,可以用来分析各个领域的决策问题,预测决策者的行为,并制定相应的策略和政策,以达到最优的收益和效果。

博弈论讲义2

博弈论讲义2
13
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,

博弈论术语

博弈论术语

博弈论术语1. 占优策略占优策略就像是考试时那种不管别人怎么选,自己肯定是最优的选择。

比如说,在一场考试中,有一道选择题,A选项明显比其他选项都正确,不管其他同学怎么蒙,我选A就是最靠谱的,这就是我的占优策略。

2. 纳什均衡这纳什均衡啊,就好比一群人在跳舞。

我向左迈一步,你也会相应地调整你的步伐,最后大家达成一种平衡的状态。

像在市场竞争里,两家公司都在调整价格,当双方都觉得再调整也不会得到更多好处的时候,就达到了纳什均衡。

3. 囚徒困境哎囚徒困境可太折磨人了!就像两个小偷被抓了,分开审讯。

他们都可以选择坦白或者不坦白。

如果都不坦白呢,可能就判得很轻,但他们互相猜忌啊。

其中一个想:“要是他坦白了,我不坦白就惨了。

”于是都坦白了,结果都判得很重。

这就像我们在合作项目中,有时候因为不信任对方,结果都做出了对大家都不利的选择。

4. 混合策略混合策略有点像做菜的时候放盐。

有时候多放点,有时候少放点,没有一个固定的量。

在玩猜拳游戏的时候,我不能老是出剪刀,我得随机出拳,这就是混合策略。

我出剪刀、石头、布的概率不一样,这样对手就很难猜到我要出什么。

5. 零和博弈零和博弈就像抢一块蛋糕,我多吃一口,你就少吃一口。

我们之间的利益总和是零。

比如说在一场赌博中,我赢的钱就是你输的钱,没有双赢的可能,这真让人觉得有点残酷呢。

6. 正和博弈正和博弈就完全不一样啦,它就像大家一起做蛋糕,然后再分蛋糕。

我们合作,把蛋糕做得越来越大,每个人分到的都比以前多。

就像一个创业团队,大家齐心协力,最后赚得盆满钵满,这多让人高兴啊。

7. 负和博弈负和博弈就很惨啦。

就像两个人打架,都受伤了,不仅没得到什么好处,还都有损失。

比如说两个国家打仗,消耗了大量的人力物力,最后两败俱伤,这真是一种愚蠢的行为啊。

8. 策略空间策略空间就像是我的魔法口袋,里面装着各种各样我能采取的行动。

在一场棋局里,我的策略空间就是我可以走的每一步棋,每一种走法都是这个空间里的一个元素,这就看我怎么选择来应对对手啦。

算法博弈论_2_策略式表述博弈

算法博弈论_2_策略式表述博弈

算法博弈论_2_策略式表述博弈博弈的策略式表述⽅法博弈的策略式表述博弈参与⼈(Players)N-参与⼈的集合i-参与⼈博弈参与⼈的策略集(Strategy sets)S i-参与⼈的策略集s i-参与⼈的策略集的⼀个元素所有参与⼈的策略放在⼀起,称之为博弈的策略组合,表⽰为s=(s1,s2,…s n)博弈参与⼈的⽀付函数u i-参与⼈i的⽀付函数i∈Nu i(s1,s2,s3,...,s i,...,s n)囚徒困境和公地悲剧——个⼈与集体囚徒困境坦⽩抵赖坦⽩-8,-80,-10抵赖-10,0-1,-1对于选择坦⽩,对⾯⽆论是坦⽩或者抵赖,选择坦⽩的结果均好于抵赖,可知,坦⽩属于占优策略指在博弈中参与⼈的某⼀个策略,不管对⽅使⽤什么策略,只要参与⼈使⽤这⼀策略,都可以给⾃⼰带来最⼤的⽀付,此时称为占优策略(-8,-8)称为占优策略均衡囚徒困境揭⽰了这样⼀个个⼈利益和集体利益的关系:个⼈正确理性的选择往往会造成最坏的结局,降低集体的福利,⽽集体的最优则必然侵害个⼈利益的最⼤化。

公地悲剧在没有监管的情况下,⼈们倾向于⽆节制地侵占共⽤资源以获得最⼤利益占优策略和劣策略占优策略:是指不论对⼿选择什么,⾃⼰的某个策略都不⽐其他策略差的策略。

如果⾃⼰的某个策略严格强于(收益⼤于)任何其他策略,那么该策略还被称为严格占优策略。

占优均衡:如果每个参与⼈都存在占优策略,那么这些占优策略放在⼀起,构成了博弈的占优均衡。

劣策略:是指不论对⼿选择什么,⾃⼰都不会选择的策略。

对于劣策略。

可以直接剔除以简化博弈,如果剔除到最后只留下唯⼀⼀个策略组合,那么这个策略组合就是我们说的重复剔除严格劣策略均衡。

如果存在重复剔除严格劣策略均衡,那么我们说这个博弈是重复剔除劣策略可解的。

理性共识零阶理性共识:每个⼈都是理性的,但不知道其他⼈是否理性;⼀阶理性共识:除了要求每个⼈都是理性的,还要求每个⼈都知道其他⼈是理性的⼆阶理性共识:每个⼈是理性的,同时每个⼈知道其他⼈是理性的,并且每个⼈知道其他⼈知道⾃⼰是理性的;最优反应对于博弈的策略式表述G=(N,Si,ui),i∈N对于参与⼈i,给定其他参与⼈策略组合s−i,i关于的最优反应集是满⾜如下条件参与⼈i的策略集B i(s−i)={s i∈S i|u i(s i,s−i>=u i(s′i,s−i),foralls i}最优反应是关于其他⼈策略的函数,只与其他⼈策略有关。

博弈论2n型矩阵

博弈论2n型矩阵

博弈论2n型矩阵
参与人一策略处于左边,参与人二策略处于上边,矩阵中的数字表示参与人1和参与人2的收益,其中同一个方框中,左边代表参与人1的收益,右边代表产于人二的收益。

博弈论标准型中两人策略有限博弈,通常采用博弈矩阵表示。

简介:
博弈论,又称为对策论、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

博弈论已经成为经济学的标准分析工具之一。

在金融学、证券学、生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论2纳什均衡及应用举例

博弈论2纳什均衡及应用举例




有限策略与无限策略同时存在一个博弈问题中
零和博弈
零和博弈: 社会总得益,即各博弈方得益之和总是为 0 猜硬币方
正面 正 面 反 面 反面
盖 硬 币 方
-1,1
1,-1
1,-1
-1,1
零和博弈

零和博弈的特点:


各博弈方之间的利益对立,“你死我活”的 关系,结果不能完全确定,不能让他们猜出 自己将选择的策略 用零和博弈构成的重复博弈与非零和博弈构 成的重复博弈会表现出很大的不同,零和博 弈重复进行多次不改变博弈方之间相互对立 的关系,其他博弈的重复博弈产生新的机会
Complete and Perfect ——完全信息与完美信息


如房地产开发博弈中,如果至少有一个 参与人不知道市场需求的大小,信息是 不完全的也是不完美的 如果两个参与人都知道市场需求是大的 还是小的,信息是完全的,但如果A不知 道B选择了什么行动,那么A的信息是不 完美的。
支付Payoff
ui=ui(s1,,…si,…sn),
房地产开发博弈


参与人的利润水平即是他们的支付,如果A,B 同时行动
UA(需求大,A开发, B开发)=UB(需求大,A开发, B开 发)=4000 UA(需求小,A开发, B开发)=UB(需求小,A开发, B开 发)=-3000 UA(需求大,A开发, B不开发)=8000 UB(需求小,A不开发, B开发)=1000。。。。。。 例如A认为高需求的概率是0.5 ,给定B选择开发,A选 择开发的期望效用为: EuA(开发,开发)=0.5*4000+0.5*(-3000)=500
Complete and Perfect ——完全信息与完美信息

经济博弈论 02 完全信息静态博弈(Park)

经济博弈论 02 完全信息静态博弈(Park)
ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?

无限策略博弈分析

无限策略博弈分析

一、无限策略博弈分析
参与者有无限个具体的策略可供选择的博弈,则称无限策略博弈分析
例如,有规范出价增额的拍卖会有个无限策略集合{$10, $20, $30, ...} 。

另外,在分蛋糕问题里则有个连续的策略集合{在蛋糕的百分之零至百分之百间的任一处切分} 。

二、混合策略纳什均衡
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。

混合策略纳什均衡的经典博弈——猜谜博弈
▪定义:在博弈G={s1,…,sn;u1,…un}中,博弈方i的策略空间为Si={si1,…,sik},则博弈方i以概率分布pi=(pi1,…,pik) 随机选择其k个可选策略称为一个“混合策略”,其中0≤pik≤1对k=1,…,k都成
立,且pi1+…+pik=1。

▪相对于这种以一定概率分布在一些策略中随机选择的混合策略,确定性的具体的策略我们称为“纯策略”。

所以我们得到混合策略的原则:
随机选择原则:自己的策略选择不能被另一方预知或猜到。

即在决策时利用随机性。

局中人这种随机化自己可选策略和行动的做法,就是“混合策略”的思想。

无差异原则:选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性的倾向某一策略而占上风。

选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性的倾向某一策略而占上风。

以此概率选择使得对方无论选择哪种策略都占不到便宜,即其期望收益是一样的。

博弈论第二章(4)

博弈论第二章(4)
这时,若3方选择B,显然对于1、2来说都是不利的,但 是,若3方选择A,1、2方选择(U,L)对三方都有好处,但是,
这时1、2方有合谋的动机,可能选择(D,R)使自己更好。
二、共谋和防共谋博弈均衡
2、防共谋均衡:如果一个博弈的策略组合满足(1)没有任何 单个博弈方的串通会改变博弈结果;(2)给定博弈方有再次偏 离的自由时,没有任何两个博弈方的忠勇串通会改变要;(3) 依此类推,直到所有博弈方的串通也不会改变博弈结果。满 足上述条件的博弈均衡为防共谋均衡。 上例博弈的防共谋均衡为(D,R,B)。这也是一个囚徒困境。 事实上,在排除了共谋的影响后,多人博弈与两人博弈就 没有实质上的区别了。所以我们的举例一般都 以二人博弈为 例。所得出的纳什均衡、风险上策、pareto上策等都适用于多 人博弈。
但是, 既然(和平,和平)是帕累托上策均衡,那为 什么历史上还会有那么多的战争呢?可能的原因是:
决策者缺乏理智或理性。
局部战争的收益比博弈分析中假设大的多。 战争的一方认为自己有绝对获胜的把握。
2、风险上策均衡 例三国鼎立的吴蜀联盟博弈。即两家联合进攻魏国,若获 胜则可瓜分魏国的国土,若一方背叛,则有亡国的危险;若
猎鹿博弈 猎鹿博弈也是一个风险上策均衡的例子。两个 猎人同时发现了一只鹿和两只兔子,若两人合作就 有可能得到一只鹿,否则各人可能获得一只兔子。
猎人B 鹿 猎人A 鹿 兔子 5, 5 3, 0 兔子 0,3 3,3
该博弈说明的问题是,若合作为10人,或更多 的人时,相信其它更多的人的合作意愿比相信另外 一人合作的意愿更难。此时,更多的博弈方选择风 险上策均衡策略组合。
1、帕累托上策均衡 帕累托(pareto)均衡:即所有纳什均衡中最优的一个均衡 策略组合。

博弈论中的三个经济学模型

博弈论中的三个经济学模型

q2≥0
q2≥0
= maxq2[a-q1- q2 -c],
q2≥0
which yields
R2(q1) =
a- q1 -c 2
,
Provided q1< a – c. The same equation for
R2(q1) appeared in our analysis of the simultaneous -move Cournot game in Chapter 1. The difference
“重复剔除严格劣策略(iterated elimination of strictly dominated strategies)”的思路:
首先,找出某个参与人的严格劣策略,并 把它从他的策略空间中剔除,重新构造一个已 不包含该严格劣策略的博弈;
其次,剔除新博弈中某个参与人的严格劣 策略;
重复上述过程,直到只剩下唯一的策略组 合。 ——我们认为这个唯一所剩的策略组合是稳定 的。
b﹤2
思考:在Bertrand的模型中,如果两厂商的 产品是同质的,那么NE会是什么?
将是: P1*= p2*= c
Bertrand paradox
子博弈完美NE应用举例
(一)Stackelberg Mondel of Duopoly
Stackelberg(1934)proposed a dynamic model of duopoly in which a dominant(leader) firm moves first and a subordinate(or follower) firm moves second(比如在美国汽车产业发展史中的 某些阶段,通用汽车就扮演过这种领导者的角色, 只不过跟随者不只一个,如福特、克莱斯勒等). Following Stackelberg,we will develop the model under the assumption that the firms’ choose quantities, as in the Cournot model(where the fires’ choices are simultaneous,father than sequential as here ). P86

博弈论02 无限策略2

博弈论02 无限策略2

平均份额。所以多个小贩的占位 博弈没有均衡结果。领跑者的竞 争策略是离开聚集点,跟风者的 竞争策略是追随领跑者。
创新与跟风的分析
领跑者离开聚集点时,并非 所有方向都是最佳选择。领跑者 离开聚集点能否使份额增加,一 是与聚集点的位置有关,二是与 离开的方向有关。因为当聚集点 位于沙滩某一侧时,两个方向上 的游客数量大不相同。当聚集点 在1/N点时,如果向右走,则可 以率先享有很大的市场空间;如
频道、省级卫视44个频道,城镇 居民家庭平均每户可以收看到 40.6个电视频道;全国电视观众 达到12.24亿。这说明在全国电 视收视市场上,电视供给方已十 分充裕、受众规模已接近饱和, 加上新媒体对受众市场的不断 蚕食,各级各类电视媒介必然会 身不由己地卷入受众争夺大战 之中、成为电视收视市场博弈的 一方。
商店A购买,住在x右边的将都 在商店B购买,需求型
以下讨论商店位于任何位置 的情况。假设商店A位于a处,a ≥0,商店B位于1−b处,b≥0。
不失一般性,假设1−a−b≥0。
霍特林模型
从而得到
霍特林模型
所以有
霍特林模型
两式相减得
霍特林模型
所以
霍特林模型
所以,同类产品的差异越大, 市场需求的价格弹性越小,企业 调节价格的余地越大。这种策略 可以形成市场壁垒、从而提高竞 争力,在满足消费者差异化需求 的同时,起到阻止竞争对手或潜 在竞争对手的作用。
消费者在地理或产品特征空
间中与卖方越远,其购买成本越 高。厂商或产品只与邻近他们的 厂商或产品展开直接竞争。
厂商各自都有一定的市场力 量。这种市场力量来自于消费者 总是在最邻近的厂商处购物的 偏好或购买他们最喜爱的产品 的偏好。
霍特林模型
假设有一个长度为1的线性 城市,消费者均匀地分布在[0, 1]区间上,分布密度为1。有两 个商店分别位于城市的两端,商 店A在x=0处,商店B在x=1处,

无限策略博弈分析和反应函数_西方经济学( 微课版 第2版)_[共6页]

无限策略博弈分析和反应函数_西方经济学( 微课版 第2版)_[共6页]

西方经济学(微课版第2版)预测他们的对手会预测它,还可以预测他们的对手会预测自己会预测它……;其次,预测任何非纳什均衡策略组合将是博弈的最终结果,意味着要么各博弈方的预测其实并不相同(预测不同的纳什均衡会出现等),要么预期至少一个博弈方要“犯错误”,包括对博弈结构理解的错误,对其他博弈方的策略预测错误,其理性和计算能力有问题,或者是实施策略时会出现差错等。

因此在假设各博弈方预测的策略组合相同,以及各博弈方都有完全的理性,也就是不会犯错误的情况下,不可能预测任何非纳什均衡是博弈的结果。

在存在预测不一致和允许博弈方犯错误时问题比较复杂,在多重纳什均衡选择和有限理性博弈研究中会有进一步讨论。

纳什均衡具有一致预测的本质属性是它在非合作博弈分析中具有不可替代重要地位的根本原因之一。

预测是博弈分析最基本的原因之一,之所以要进行博弈分析,最重要的原因就是预测特定博弈中的博弈方究竟会采取什么行动,博弈将有怎样的结果。

即使进行博弈分析的最终目的不是预测,而是通过博弈分析研究人类的行为规律,评价特定制度环境、政策措施的效率意义等,也需要以对博弈结果的预测判断为基础。

因此一个博弈分析概念的作用和价值,很大程度上是由其对博弈结果预测能力的大小决定的。

纳什均衡的一致预测性质正是其预测能力的基本保证。

其他的博弈分析概念要么不具备这种性质,从而不存在预测的稳定性,因此不可能成为具有普遍意义的博弈分析概念,要么本身也是纳什均衡,是纳什均衡的一部分。

如前面介绍的上策均衡就具有一致预测的性质,但事实上所有的上策均衡都是纳什均衡。

值得注意的是,虽然纳什均衡是博弈结果的一致预测,但纳什均衡分析却并不一定能对所有博弈的结果都做出准确的预测。

因为纳什均衡的一致预测性质本身并不保证各博弈方的预测是相同的,相同的预测是一致预测性质的前提而不是结果。

有许多博弈其实根本无法准确预测,因为有些博弈不存在纳什均衡,而另一些博弈又有多重纳什均衡且相互无显著的优劣或效率差别。

《博弈论》-课程教学大纲

《博弈论》-课程教学大纲

《经济博弈论》课程教学大纲一、课程基本信息课程代码:16046305课程名称:经济博弈论英文名称:Economy Game课程类型:专业基础课总学时:32学分:2适用对象:经管类专业大二、大三年级学生先修课程:微观经济学、微积分。

二、课程简介中文简介:本课程是经济学的标准分析工具之一,着重研究个体之间的相互依存性,是日常生活中一种极重要的思维方式,在经济学课程建设中占有核心地位。

产业组织理论中的新产业组织学派,信息经济学中的海萨尼转化,宏观经济学中的博弈方法,区域经济学中的空间博弈问题,制度变迁理论中的演化博弈分析、公共经济学中的委托代理问题和公共选择问题等都与本课程有关。

英文简介:This course is one of the standard analysis tools of economics. It focuses on the interdependence of individuals. It is an extremely important way of thinking in daily life and occupies a core position in the construction of economics courses. The new industrial organization school in the theory of industrial organization, the Hesanian transfo rmation in information economics, the game method in macroeconomics, the spatial game problem in regional economics, the evolutionary game analysis in the theory of institutional change, and the public economics The principal-agent issues and public choice issues are all related to this course.三、课程性质与目的在掌握微、宏观经济学的基础上,同学通过本课程的学习,掌握经济博弈论的主要理论知识,培养学生正确分析问题做出决策的能力,并能从博弈的角度理解消费者、企业、政府以及各个行为主体的决策,以及相应的社会福利结果。

博弈论第二章——博弈规则

博弈论第二章——博弈规则

U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈

博弈的战略式描述

博弈的战略式描述

博弈的战略式描述一、引言博弈论是研究人类决策行为的一门学科,它主要研究人们在不同情境下的决策行为以及这些决策行为所带来的结果。

博弈论被广泛应用于经济学、政治学、心理学等领域,成为了现代社会中不可或缺的一个重要工具。

在博弈论中,战略是一个非常重要的概念,本文将从战略的角度来探讨博弈论。

二、什么是战略战略是指在特定情境下所采取的一系列行动方案和方法。

在博弈论中,每个人都有自己的目标和利益,并且会根据自己所处的情境选择最优的行动方案。

这种选择就构成了一个人的战略。

三、纳什均衡纳什均衡是指在一个博弈中所有参与者都采取最优策略时所达到的状态。

也就是说,在纳什均衡状态下,每个参与者都不能通过改变自己的策略来获得更多利益。

四、博弈分类1. 零和博弈零和博弈是指在博弈中一个人的收益必然等于另一个人的损失,总收益为零。

这种博弈通常体现了一种竞争关系,例如赌博、棋类游戏等。

2. 非零和博弈非零和博弈是指在博弈中各方的收益不一定相等,总收益也不为零。

这种博弈通常体现了一种合作关系,例如合作生产、谈判等。

五、战略分类1. 纯策略纯策略是指在一个特定情境下所采取的唯一行动方案。

例如,在象棋中每个棋子只有固定的移动方式,这就是一种纯策略。

2. 混合策略混合策略是指在一个特定情境下所采取的多个行动方案,并且每个方案被选择的概率不同。

例如,在掷骰子游戏中每个数字都有相应的概率出现,这就是一种混合策略。

六、战略分析1. 最优反应原则最优反应原则是指在一个博弈中每个参与者都会根据对手的行动来选择自己的行动方案。

也就是说,每个参与者都会选择最优的反应来应对对手的行动。

2. 支配策略支配策略是指在一个博弈中某个参与者采取某种策略时,无论对手采取什么样的策略,该参与者都可以获得更多的收益。

因此,在博弈中该参与者只需要采取支配策略即可。

3. 固定点定理固定点定理是指在一个博弈中如果存在一个纳什均衡,则该纳什均衡一定是所有最优反应线的交点。

【精品】博弈论课程补充

【精品】博弈论课程补充

【关键字】精品博弈论课程补充无限策略博弈分析在无限策略、连续策略空间的博弈中,仍然可以以纳什均衡概念为基础进行博弈分析。

下面以“古诺双寡头垄断博弈”为例进行分析。

古诺(1838)的双寡头垄断模型被认为最早提出了纳什定义的均衡。

这里研究的是古诺模型最简单的情况,在完全信息动态博弈、不完全信息博弈静态博弈条件的研究将对这个模型进行不同的变形。

由于市场容量总是有限的,在一定的价格水平上一个市场能够销售出特定产品的数量肯定是有限的。

如果向该市场投放的商品超出该数量,则必须降低才能全部销售出去。

换言之,在任何一个市场上,能够将商品全部销售出去的价格,也称为市场出清价格,是投放到该市场上商品数量的函数。

设市场有1,2两家厂商生产同质产品,厂商1的产量为q1,厂商2的产品为q2,则市场总供给为Q=q1+q2,市场出清价格P(可以将产品全部卖出去的价格)是市场总供给的函数P=P(Q)=a-Q(更精确的表述为:Q<a时,P(Q)=a-Q;Q>a时,P(Q)=0).设两厂商生产qi的总成本c(qi)=cqi,即企业不存在固定成本,且生产每单位产品的边际成本为常数c,这里假定c<a。

根据古诺的假定,两厂商同时决定各自的产量,他们在决策之前都不知道另一方的产量。

在该博弈中,博弈参与人为厂商1和厂商2,两博弈的战略空间是他们可选择的产量,因为产量是连续可分的,因此两厂商都有无限多种可选策略。

该博弈中两博弈方的得益是两厂商各自的成本,即各自的销售收入减去各自的成本,即u1=q1P(Q)-c1q1=q1[a-(q1+q2)]-cq1u2=q2P(Q)-c2q2=q2[a-(q1+q2)]-cq2两博弈方的得益(成本)都取决于双方的产量水平。

利用纳什均衡的概念,如果两博弈方的一个策略组合()满足其中的和相互是对对方的最佳策略,就构成一个纳什均衡。

如果可以证实它是该博弈唯一的纳什均衡,则可以预言理性的博弈方(厂商)将分别选择这两个产量。

1-2博弈论(对策论)

1-2博弈论(对策论)

局势中赢得函数中参数设定




软件厂商进行检查未发现消费者违约,软件厂 商的支付记为-1;消费者的支付记为0 软件厂商进行检查并发现消费者违约,由于多 项环节的介入,软件厂商支付出软件销售额的4 倍的成本,记为-4;在此,消费者将被惩罚64倍 的软件价格的费用,记为-64 如果软件厂商不进行检查,消费者也没有违约, 那么软件厂商付出的成本记为0,消费者的付出 和收益记为0 如果软件厂商不进行检查,消费者不服从软件 协议(即将软件又加载到其它计算机上或借给 朋友),假定这种情况使得软件厂商损失为8倍 的软件价格,而消费者的收益也是八倍的软件 价格,分别记为-8和+8。
1 n 1 a11 a1n m a m1 a mn
0
1 0 -1
-1 1 0
A
我们称 A 为甲的赢得矩阵.
-1 1
例2、(齐王赛马)
战国时期,齐王要与大将田忌赛马,双方约 定:从自己的上、中、下三个等级的马中各 选出一匹进行比赛。每次比赛输者要付给赢 者千金。就同等级的马而言,齐王的马都比 田忌的强,他们俩人的策略集合都是,{(上、 中、下)、(上、下、中)、(中、上、 下)、(中、下、上)、(下、上、中)、 (下、中、上)}并且可以知道,在每一局比 赛结束时,齐王和田忌任何一方赢得的千金 数恰是对方输丢的千金数。可见这是两人有 限零和对策。即矩阵对策。
概 论
• 名称
Game Theory 博奕论,对策论

• 发展历史
• 对策论模型
• 分类
• 例子
发展简史
• 早期工作
1912年E.Zermelo ‘关于集合论在象棋对策中的应用’ 1921年E.Borel 引入最优策略 1928年J.V.Neumann证明了一些猜想

博弈论 第二节

博弈论 第二节
这一时间天文学家告诉我们比太阳推变成红巨星将地球吞噬进 去所需的时间还要长得多。 深蓝VS卡斯帕洛夫



中间评价函数
实验

实验者提供1美元,要求受试者根据一下规则进行分配:受试 者A提出分配比例,比如说自己75美分,B25美分,若B接受分 配,则按比例进行分配,若B拒绝,两人都分不到钱。 实验者在桌上放面值为10美分的硬币,参与人可选择要或放 弃。A先行动,若A选拿走这10美分,游戏结束,A将得到钱而 B一无所获;若A选择放弃,实验者将增加1枚10美分的硬币, 轮到B选择。游戏规则进行下去,硬币不断增加,直到某个限 度(100美分)。
莱娜
作贡献
作贡献
不作贡献 塔尼亚 不作贡献 作贡献 作贡献
艾米丽 不作贡献 莱娜
塔尼亚 不作贡献 作贡献 不作贡献 塔尼亚 不作贡献
2,2,2
更多的行动-井字棋

游戏参与人双方都试图在四格的“田”字里,先将自己的棋子 连成一行、一列或一条斜线而取得胜利。
X X X
上右
X
下左
O
下右 上左 上右
O
X
上左 上右
1 1
…..
75
……
100
…… 75
……
100
假设只有两个同学参与
乙同学 甲 同 学
1 1 ……
…..
75
……
100
75
……
100
假设只有两个同学参与
乙同学 甲 同 学
1
…..
56
……
75
1
…… 56
……
75
假设只有两个同学参与
乙同学 甲 同 学
1
…..
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
同时,产品差异化将减弱价
格竞争的强度。同类产品的差异 化程度越高,比如产品的销售区 域定位值相差越大,则买者承担 的移动成本越大,价格对消费者 需求的影响就越小,因此,企业 通过降低价格来吸引消费者的 意义就越小。
本次课小结
当策略集是实数区间且支付 函数都是可微的多元函数时,运 用微分方法,可以方便地找出纳 什均衡。
创新与跟风的分析
而研究表明,人们常看的电 视频道一般只有5~10个。这意
味着只有进入收视份额的前10 名,谈论提高收视率才有实际意 义。因此,面对这种市场态势, 竞争如同逆水行舟、不进则退, 各方的竞争策略相互作用、相互 制约,博弈的结果从各方来看必 定是此消彼长、有得有失,受众 的争夺战会更加激烈。
频道、省级卫视44个频道,城镇 居民家庭平均每户可以收看到 40.6个电视频道;全国电视观众 达到12.24亿。这说明在全国电 视收视市场上,电视供给方已十 分充裕、受众规模已接近饱和, 加上新媒体对受众市场的不断 蚕食,各级各类电视媒介必然会 身不由己地卷入受众争夺大战 之中、成为电视收视市场博弈的 一方。
果向左走,则空间很小,增加份 额的可能性小。所以,领跑者选 择离开聚集点时,应首先判断聚 集点所处位置,再选择离开的方 向,才能保证份额增加。
创新与跟风的分析
例如
创新与跟风的分析
根据统计,截至2007年底, 我国已设立电视台287座、广播 电视台1993座、教育电视台44 座,开办电视节目1283套;能够 覆盖全国的电视频道有61个,其 中中央台15个频道、教育台2个
比如,《超级女声》在2005 年创造了高收视率、高收视份 额、高广告收入等成功效应,引 起社会各界广泛关注,应该视为 一个创新节目。随后出现的大量 类似节目就是跟风的结果。
创新与跟风的分析
多个小贩的占位博弈模型
创新与跟风的分析
他们为了不断扩大自己的顾 客份额,会逐渐聚集到一起,大 家都获得平均份额。“扎堆”之 后,当某一小贩发现离开聚集点 向某一方向移动可以增加份额 时,他会率先离开聚集点,成为 “领跑者”,从而获得多于平均 份额的顾客。当其他小贩发现这 种差异后,便会模仿领跑者的做 法,向领跑者的方向移动,于是 跟风、追随等现象便出现了,直 到小贩们再次聚集在一起,共享
平均份额。所以多个小贩的占位 博弈没有均衡结果。领跑者的竞 争策略是离开聚集点,跟风者的 竞争策略是追随领跑者。
创新与跟风的分析
领跑者离开聚集点时,并非 所有方向都是最佳选择。领跑者 离开聚集点能否使份额增加,一 是与聚集点的位置有关,二是与 离开的方向有关。因为当聚集点 位于沙滩某一侧时,两个方向上 的游客数量大不相同。当聚集点 在1/N点时,如果向右走,则可 以率先享有很大的市场空间;如
在协调博弈中,成功的关键
就在于公开、诚实和信任。同时,先行动的一方具有先动优势。
无限策略博弈
当局中人多于三个或策略集 不是有限集时,就无法利用划线 法寻找纳什均衡。
当策略集是实数区间且支付 函数都是可微的多元函数时,运 用微分方法,可以方便地找出纳 什均衡。
前面已经了解了高价格和低 价格两种策略选择下的双寡头 价格竞争博弈模型。当价格取 值为一个区间上的所有数值时,
划线法是寻找纳什均衡的一 种简便方法,依据的是策略之间 的相对优劣关系 。
纳什均衡小结
囚徒困境有一个纳什均衡, 情侣博弈有两个纳什均衡。
情侣博弈的各个纳什均衡的 结果对局中人来说并无太大差 异。任意一个均衡出现都是可以 接受的。但当不是均衡的对局出 现时,结果就会很糟。所以要求 局中人之间协调行动,故又称为 协调博弈。
如果将所有牧民作为一个整 体来考察,总收益为
流动商贩占位博弈
如果有两个流动商贩:
流动商贩占位博弈
如果有三个流动商贩:
创新与跟风的分析
传媒在具有市场优势的文化 产品的感染和暗示下,自觉或不
自觉地仿效和追踪其他传媒的 成功产品,导致大众传媒生成一 种“模仿—趋同”的现象。很多 人形象地把这种现象称之为“跟 风”。人们推崇创新,鄙视跟风, 但我们也不得不承认现实中跟 风比创新更为常见。
消费者在地理或产品特征空
间中与卖方越远,其购买成本越 高。厂商或产品只与邻近他们的 厂商或产品展开直接竞争。
厂商各自都有一定的市场力 量。这种市场力量来自于消费者 总是在最邻近的厂商处购物的 偏好或购买他们最喜爱的产品 的偏好。
霍特林模型
假设有一个长度为1的线性 城市,消费者均匀地分布在[0, 1]区间上,分布密度为1。有两 个商店分别位于城市的两端,商 店A在x=0处,商店B在x=1处,
观众偏好会呈现两大特征: 一是观众的差异性。由于偏好是 个人的主观评价,因此,不同人 的偏好总是富有不同的特点。二 是观众群体的相似性。观众偏好 虽然存在个体差异性,但观众个 体之间的差异性也可能比较小, 这些人在偏好上存在某些相似 性,因此,观众偏好的相似性也
是一种普遍原则。
创新与跟风的分析
当然,受众偏好的分布不像 沙滩上游客的位置看起来那么 直观、确定。遵从惯常的研究方 式,可先从最简单的情况分析。 与假设沙滩上的游客是呈直线 均匀分布相同,也假设某类节目 受众的需求或者说偏好是均匀 分布的。比如,歌唱类节目的受 众,从非常喜欢美声唱法的、到 比较喜欢美声唱法的、再到比较 偏爱通俗唱法、直到极其偏爱通 俗唱法的,可以描述为歌唱类节
目受众的偏好是从美声唱法到 通俗唱法均匀分布的。
创新与跟风的分析
从目前我国电视媒介的竞争 格局来看,媒介占位博弈显然不 是两个电视媒介的博弈,所以很 少出现和平共处的情况,更常见 的是多家电视媒介激烈竞争的 局面。
创新节目出现后,跟风常常 随之而来,所以媒介占位博弈是 N≥3的多人占位博弈。在这类博 弈中,跟风会导致节目同质化, 相当于沙滩占位博弈中小贩们
根据两个反应函数,以q1、q2 为坐标轴作图得到下图:
反应函数
用反应函数法求解n个牧民 的公地悲剧问题。
设农户i的养羊数为qi,则在 公共草地上放牧的羊只总数为 Q=q1+…+qn ,每只羊的产出 V(Q)是Q的减函数,每只羊的成 本为常数c,则农户i养qi只羊的 收益函数为
反应函数
于是有
反应函数
聚集到了一起;创新相当于小贩 的离开策略;跟风相当于小贩的 追随策略。
创新与跟风的分析
我们推崇创新,也不能完全 否认跟风现象。其实跟风、模仿 也是一种参与市场竞争的选择。 当一部有创意的电视节目得到 普遍认同并被模仿时,说明它符 合了受众的需求,代表了大众欣 赏趋势的走向。模仿的过程也因 此被认为是创新扩散的过程,传 媒产业先进的经营策略、产品理 念往往是通过模仿的作用而成
如何在众多的竞争者中让观 众锁定自己的频道、自己的节 目,不但要准确理解受众的需 求,还要及时了解竞争对手的策 略。正所谓知己知彼,百战不殆。
创新与跟风的分析
受众在使用媒介过程中,会 形成特定的欣赏品味和偏好。偏 好是一种潜藏在人类内心的情 感,是人们对客观事物的主观评 价以及基于这种主观评价产生 的一种观赏行为。
博弈论
纳什均衡小结
如果一个策略组合中,每个 局中人的策略都是针对其他局 中人策略的最佳策略,则称这个 策略组合为纳什均衡。
在纳什均衡的策略组合下, 没有人对自己的策略感到后悔, 任何一个局中人都不会单独改 变自己的策略。在纳什均衡中, 你不一定满意其他人的策略,但 是,你的策略是应对对手策略的 最佳策略。
古诺寡头竞争模型存在唯一 的纳什均衡。
反应函数法:先求出每个局中 人对其他局中人策略的最佳反 应构成的函数即反应函数,然后 求出各个局中人反应函数的交 点就是纳什均衡。
本次课小结
霍特林提出的空间竞争理论, 把产品的差异划分为空间中直 线段上的不同点,给出了产品差 异化影响的结论。
企业差异化竞争策略:第一, 产品差别越大,企业调节价格的 余地就越大,因此企业可以采用 价格策略;第二,消费者对产品
商店A购买,住在x右边的将都 在商店B购买,需求量分别为
霍特林模型
利润函数为
霍特林模型
以下讨论商店位于任何位置 的情况。假设商店A位于a处,a ≥0,商店B位于1−b处,b≥0。
不失一般性,假设1−a−b≥0。
霍特林模型
从而得到
霍特林模型
所以有
霍特林模型
两式相减得
霍特林模型
所以
霍特林模型
所以,同类产品的差异越大, 市场需求的价格弹性越小,企业 调节价格的余地越大。这种策略 可以形成市场壁垒、从而提高竞 争力,在满足消费者差异化需求 的同时,起到阻止竞争对手或潜 在竞争对手的作用。
为行业的标准的。在这个过程 中,创新者为如何解决资源配置 问题提供了示范,模仿者通过模 仿使社会资源配置问题得以解 决,这有助于全面快速地建构起 传媒产业体系。
创新与跟风的分析
根据多人占位博弈的分析结 果,电视媒介在进行节目创新 时,要注意两点,一是必须明确 当前聚集点的位置,二是进行创 新时的突破方向。
假设两厂商同时决定各自的产 量,即他们在决策时都不知道另 一方的产量。
古诺模型
两个厂商的收益函数为
古诺模型
由必要条件,令
古诺模型
若从两厂商总体利益最大对 上述博弈进行效率评价,设总产 量为Q,则总收益为
反应函数
在古诺模型中,对厂商2的任
意产量,厂商1的最佳对策产量, 应是下列最大化问题的解:
反应函数
双寡头竞争问题变为无限策略 博弈。
古诺模型是双寡头产量竞争 博弈模型。
古诺模型
设市场中有两家厂商,厂商1 与厂商2,生产同样的产品,其 产量分别为q1、q2,其策略空间 都是[0,唴,都是连续取值的量, 则市场总产量为
Q=q1+q2
再设市场出清价格为 P=P(Q)=8−Q,两厂商都无固定 成本,边际成本相等,c1=c2=2。
出售完全相同的商品。每个商店 商品的单位成本为c,价格分别 为p1,p2。消费者购买商品的旅行 成本与离商店的距离成比例,单 位距离成本为t。
相关文档
最新文档