博弈论_完全信息静态博弈
第一章 完全信息静态博弈
一般地,用si表示第i个参与人的一个特定战略,Si={si} 表示第i个参与人的所有可选择的战略的集合 (strategy set)。如果n个参与人每人选择一个战略, n维向量s=(s1,…, si, …sn)称为一个战略组合 ( strategy profile)。
29
2.数学描述
令si’和si’’是参与人i可选择的两个战略 s S , s S
' i i '' i i
如果对于任意的其他参与人的战略组合s-i ,参与人i 从选择si’得到的支付严格小于从选择si’’得到的支付, 即
u (s , s ) u (s , s )si
' i i i '' i i i
囚徒 2 坦 白 坦 白 囚 坦 白 徒 1 抵赖 不坦白 -8, -8 -10, 0 抵赖 不坦白 0, -10 -1, -1
囚徒1:坦白 囚徒2:坦白
两个嫌疑犯的支付矩阵 两个罪犯的支付矩阵
22
1.2纳什均衡
2.占优战略
一般地, 如果对应所有的s-i ,si*是i的严格最优选 择,即:
u (s , s ) u (s , s )
11
6.结果(outcome)
结果是博弈分析者感兴趣的所有东西,如均衡战略组
合,均衡行动组合,均衡支付组合等。
7.均衡(equilibrium)
均衡是所有参与人的最优战略的组合,记为
s*=(s1*,…, si*, …sn*),其中, si*是第i个参与人在均 衡情况下的最优战略,它是i的所有可能的战略中使ui 或Eui最大化的战略。
33
关于智猪博弈的讨论
(1)现实中的例子 小股东搭大股东的便车、股市上的“跟庄”、小 企业对大企业的模仿,公共产品的供给,经济改 革当中存在的问题等都是智猪博弈。 (2)可否改变智猪博弈的结局?
应用博弈论第二讲完全信息静态博弈
•
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。
•
例2
为什么中小企业不会花钱去开发新产品 ?
•
完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。
•
生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。
•
例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
经济博弈论之完全信息静态博弈培训
2023
PART 04
完全信息静态博弈的策略 分析
REPORTING
优势策略
优势策略是指参与者在给定信息下, 选择对自己最有利的策略,而不考虑 其他参与者的反应。
优势策略是博弈分析中的重要概念, 它可以帮助参与者找到最优的策略选 择。
在完全信息静态博弈中,如果某个参 与者有一个优势策略,那么无论其他 参与者选择什么策略,该参与者都应 该坚持这个优势策略。
收益
每个参与者在博弈中获得的效用或收益,是衡量参与者利益的标准。
在完全信息静态博弈中,每个参与者的收益函数是共同知识,即所有参与者都知 道其他参与者的收益函数。
纳什均衡
纳什均衡是指在一个博弈中,每个参 与者的最优策略选择在其他参与者最 优策略选择给定的情况下是最优的。
在完全信息静态博弈中,纳什均衡是 所有参与者的最优策略组合,满足每 个参与者的最优策略选择在其他参与 者最优策略选择给定的情况下是最优 的。
2023
PART 02
完全信息静态博弈的基本 概念
REPORTING
参与者
博弈中的决策主体,通常称为局中人 或参与人。
在完全信息静态博弈中,每个参与者 都了解其他参与者的身份及其所有可 能的策略和收益。
策略
参与者在博弈中可以选择的行动方案,是参与者在给定信 息集下的决策变量。
在完全信息静态博弈中,每个参与者的策略空间是共同知 识,即所有参与者都知道其他参与者的所有可能策略。
2023
PART 03
完全信息静态博弈的经典 案例
REPORTING
囚徒困境
总结词
描述两个囚犯因被捕而面临供述与否的决策,揭示个 体理性与集体理性的矛盾。
详细描述
在囚徒困境中,两个囚犯因共同犯罪被捕,并分别被 关押在独立的房间。每个囚犯都有供述和保持沉默两 种选择。如果两个囚犯都保持沉默,则他们都不会受 到严重惩罚;但如果一个囚犯供述,另一个保持沉默 ,则供述者会得到较轻的惩罚,而沉默者会受到更严 厉的惩罚。由于囚犯之间无法进行沟通,他们往往会 基于自身利益而选择供述,从而导致双方都受到较重 的惩罚。
完全信息静态博弈教学课件
完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。
经济博弈论 02 完全信息静态博弈(Park)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
完全信息静态博弈论模型
完全信息静态博弈论模型引言:博弈论是研究决策制定者在不同利益冲突场景下的行为和策略选择的数学模型。
在博弈论中,静态博弈是指参与者在同一时间点做出决策的情况。
完全信息表示每个参与者对于其他参与者的行为和策略选择都有完全的了解。
本文将介绍完全信息静态博弈论模型的基本概念、解决方法以及应用领域。
一、基本概念1.1 参与者完全信息静态博弈中,有两个或多个参与者,每个参与者可以是个体、团体或国家等。
参与者通过制定决策来追求自身的利益。
1.2 策略每个参与者在博弈中可以选择的行动方案称为策略。
策略可以是纯策略,即只选择一个确定的行动;也可以是混合策略,即以一定概率选择不同的行动。
1.3 支付函数支付函数是衡量参与者在不同策略组合下所获得效用或利益的函数。
支付函数可以表示为参与者的收益、成本或效用。
1.4 纳什均衡纳什均衡是指在博弈中,每个参与者选择的策略组合使得没有参与者有动机改变自己的策略。
换言之,每个参与者都在给定其他参与者的策略下做出最优的决策。
二、解决方法2.1 支付矩阵为了描述参与者之间的策略选择和支付函数之间的关系,可以使用支付矩阵。
支付矩阵是一个二维矩阵,行表示一个参与者的策略选择,列表示其他参与者的策略选择,每个元素表示对应策略组合下的支付函数。
2.2 最优响应最优响应是指在其他参与者的策略下,参与者能够选择的最优策略。
通过计算每个参与者的最优响应,可以找到纳什均衡。
2.3 前瞻性在完全信息静态博弈中,参与者可以通过推断其他参与者的策略和支付函数来做出决策。
前瞻性是指参与者能够预测其他参与者的行为并做出相应的反应。
三、应用领域完全信息静态博弈论模型广泛应用于经济学、政治学、生物学等领域。
3.1 经济学博弈论在经济学中有广泛应用,如市场竞争、定价策略、拍卖等。
完全信息静态博弈模型可以帮助分析参与者的决策行为,预测市场的走势和结果。
3.2 政治学在政治学中,博弈论可以用于分析选举、政策制定和国际关系等问题。
博弈论与信息经济学-1完全信息静态博弈
完全信息 不完全信息
静态
动态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
完全信息动态博弈 子博弈精炼纳什均衡
泽尔腾(1965)
不完全信息动态博弈
不完全信息静态博弈
精炼贝叶斯纳什均衡
贝叶斯纳什均衡
泽尔腾(1975)
海萨尼(1967-1968) Kreps和Wilson(1982)
Fudenberg和Tirole (1991)
博弈论与信息经济学
第一章 完全信息静态博弈
博弈论概述:发展历程
1838年库诺特(Cournot)寡头竞争模型(数量战) 1883年伯川德(Bertrand)寡头竞争模型(价格战) 1944年冯诺依曼和摩根斯坦发表《博弈论和经济行为》 1950年纳什(Nash)提出了纳什均衡的概念。 1965年泽尔腾(Selten)提出了子博弈精炼纳什均衡的
共同知识指“所有参与人知道,所有参 与人知道所有参与人知道,所有参与人 知道所有参与人知道所有参与人知 道…”。
在博弈论中,一般假定参与人的行动空 间Ai和行动顺序是共同知识。
一个关于共同知识的小游戏
A还是B? 两个人的推理过程: 我看到你身上的A,如果我身上是B的话。
因为我们俩至少有一个人身上是A,因此 你因此判断自己身上的是A。但是由于你 没有说,因此我可以断定自己身上是A。
如果n个参与人每人从自己的Si中选择一个策略si, 则向量s=( s1,s2,…,si,…, sn)是一个策略组合 (strategy profile),参与人i之外的其他参与人的策略 组合可记为s-i=( s1,s2,…,si-1 ,si+1 ,…, sn)。
注意:
1. 策略与行动是两个不同的概念,策略是行 动的规则(告诉参与者在什么情况下应该做什 么)而不是行动本身。回顾上章提到的父亲和 女儿的博弈。
博弈论_完全信息静态博弈
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡(Nash Equilibrium) 纳什均衡
纳什均衡、占优均衡、重复剔除严劣策 略均衡的关系
定理a 每一个占优均衡、重复剔除严劣策 略均衡一定是纳什均衡,但反过来不一定 成立; 定理b 纳什均衡一定不能通过重复剔除严 劣策略方法剔除。
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡应用举例: 纳什均衡应用举例:古诺模型
(q1*, q2*)是均衡产量意味着:
q1*∈argmaxπ1(q1, q2*) q2*∈argmaxπ2(q1*, q2) 根据上面两个式子可以得出反应函数(reaction function): q1*=R1(q2) q2*=R2(q1) 两个反应函数的交叉点就是纳什均衡(q1*, q2*), 见图1-9
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
纳什均衡应用举例: 纳什均衡应用举例:古诺模型
1 q 1 = q = (a − c) 3
* * 2
进而可以得出每个企业的纳什均衡产量下 的利润,为
π
*
1
=π
* 2
1 = (a − c)2 9
可以同垄断企业的最优决策类比
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
博 弈 论 讲 义 —— 完 全 信 息 静 态 博 弈
豪泰林价格竞争模型
古诺模型中,产品是同质的(homogenous); 豪泰林模型中,引入了产品的差异性;
产品的差异性可以有很多体现形式:如品牌、外 观、功能、空间差别(如房地产) 豪泰林模型中,产品的差异通过空间差别来体现 豪泰林模型的主要假设是产品的差异完全是由空 间位置的不同而造成的
博弈论(完全信息静态博弈)
一致预测性是纳什均衡的本质属性,
纳什均衡是稳定的和自我强制的.
二、纯策略NE的求法
1.反复删除严格劣策略 (iterated
elimination of strictly dominated strategies)
严格占优策略 (Strictly Dominant Strategies)
ˆ 不管其他局中人选择怎样的策略, s i 始终是局中 人i 的最优反应。
严格劣策略
局中人2
L U 3,0 1,-1 2,4 M 0,-5 -3,3 4,1 R 0,-4 -2,4 -1,8
局中人1
C D
重复剔除严格劣策略均衡
局中人2
L M R
U
3,0
1,-1 2,4
0,-5
-3,3 4,1
0,-4
-2,4 -1,8
局中人1
C D
S10 S1 {U , C, D}
a11 ... a1n b11 ... b1n A ... ... ... ,B ... ... ... am1 ... amn bm1 ... bmn
可称为双矩阵博弈。 若 A=-B,则称为零和博弈,二人有限零和博弈 可用一个矩阵表示,也称为矩阵博弈。 矩阵博弈的均衡
二、若干例子
1. 俾斯麦海之战(1943)-(p14)
日军上将木村:将日军运送到新西兰 美军上将肯尼:轰炸日军运输船
木村 北线(短) 南线(长) 肯尼 北线 南线 2,-2 1, -1 2,-2 3, -3
例3:智猪博弈(p18)
猪圈有一头大猪、一头小猪,按一下按钮会有 10个单位的饲料,但按按钮要2个成本。
2经济博弈论-完全信息静态博弈
第二章 完全信息静态博弈完全信息:每一个参与者对其他所有参与者的策略空间及得益有准确的知识。
静态:所有参与者同时选择策略,每一个参与者事先并不知道其他参与者的具体策略选择第二章 完全信息静态博弈2.1严格优势策略均衡 2.2严格劣势策略消去法 2.3相对优势策略划线法 2.4多重纳什均衡的选择 2.5无限策略博弈反应函数法 2.6混合策略纳什均衡2.1 严格优势策略均衡引子:囚徒困境(Prisoner ’s Dilemma)参与者:囚徒1、囚徒2 策略空间:坦白、抵赖 得益:1、一个坦白并作证,另一个抵赖,抵赖者入狱五年,坦白者将得到宽大释放; 2、都坦白,每人入狱三年;3、都不坦白,每人以妨碍公务罪入狱一年。
得益矩阵 得益矩阵 得益矩阵 囚徒 2 坦白抵赖囚徒1 抵赖11 055 033坦白 坦白策略被称为囚徒1的全面的严格的优势策略。
简称严格优势策略全面的:不论对方采用何种策略,此策略总显示优势 严格的:此策略严格好于其他策略由严格优势策略组成的博弈均衡,称为 “严格优势策略均衡”囚徒困境的严格优势策略均衡为(坦白,坦白) 双方的得益为(-3,-3)启示:“个人理性”与“集体理性”的冲突例1:公共品供给的囚徒困境李四 修不修张 修 三不修不修 00 133111修路的成本为4,各自获得的好处为3例2:价格战百事可乐低价 高价可 低价口口可 高价 乐乐 55 611 633注:囚徒困境得益+6第二章 完全信息静态博弈2.1严格优势策略均衡 2.2严格劣势策略消去法 2.3相对优势策略划线法 2.4多重纳什均衡的选择 2.5无限策略博弈反应函数法 2.6混合策略纳什均衡2.2 严格劣势策略消去法引子:智猪博弈按钮食槽小猪大猪 按一下按钮会有10单位的猪食进槽,但按按钮然后 再跑到猪食槽需要付出2单位成本参与者:大猪、小猪策略空间:按按钮、坐等其食 得益:1、同时按按钮并跑过来,大猪吃到7个单位,小猪 吃到3个单位。
博弈论四种类型之完全信息静态博弈
博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。
完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。
⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。
最典型的例⼦是囚徒困境与智猪博弈。
下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。
⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。
离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。
对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。
【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。
所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。
但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。
个⼈的最优选择从社会⾓度看并不是最优的。
社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。
【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。
【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。
【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。
第2讲 完全信息静态博弈【博弈论经典】
第2讲 完全信息静态博弈
• 例2:公共产品的供给也是一个囚徒困境问题。 如果大家都出钱兴办公共事业,所有人的福利都会增加。问题是,如果我出钱你 不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以,每 个人的最优战略是“不出钱”,这种情况下,使得所有人的福利都得不到提高。
例3:“军备竞赛”。 例4:经济改革本身也可能是这样,在许多改革中,改革要付出成本(包括风险), 而改革的成果大家共享,结果是:尽管人人都认为改革好,却没有人真正去改革, 大家只好在都不满意的体
第们集中讨论完全信息静态博弈。 • “完全信息”指的是每个参与人对所有其他参与人的特征(包括战略空间、支付
函数等)有完全的了解。 • “静态”指的是所有参与人同时选择行动且只选择一次。“同时行动”是一个信
息概念而非日历上的时间概念:只要每个参与人在选择自己的行动时不知道其他 参与人的选择,我们就说他们在同时行动。
的组合。 定义:在博弈的战略式表述中,如果对于所有的i,si*是i的占优
战略,那么,战略组合s* = s1*,...,s*n 称为占优战略均衡(do min ant
strategy equilibrium)
第2讲 完全信息静态博弈
• 在一个博弈里,如果所有参与人都有占优战略存在,那么,占优战略均衡是可以 预测的到惟一的均衡,因为没有一个理性的参与人会选择劣战略。
• 纳什均衡是完全信息博弈解的一般概念,也是所有其他类型博弈解的基本要求。
第2讲 完全信息静态博弈
• 1.纳什均衡 纳什对博弈论的贡献有两个方面:一是合作博弈理论中的讨价还价模型,称为纳什 讨价还价解(Nash bargaining solution); 二是非合作博弈论方面,这是他的 主要贡献所在。 纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般意义 上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样就奠定了非合作 博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它如同瓦尔拉斯均衡一样, 已成为经济学中的专家术语。
博弈论-完全信息静态博弈
u2 u2 ( P1, P2 ) P2q2 - c2q2 ( P2 - c2 )q2 (P2 - c2 )(a2 - b2 P2 + d2 P1 )
1 P (a1 + b1c1 + d1 P* ) 2 2b1
* 1
1 P (a2 + b2 c2 + d 2 P* ) 1 2b2
在许多博弈中,博弈方的策略是有限且非连 续时,其得益函数不是连续可导函数,无法 求得反应函数,从而不能通过解方程组的方 法求得纳什均衡。 即使得益函数可以求导,也可能各博弈方的 得益函数比较复杂,因此各自的反应函数也 比较复杂,并不总能保证各博弈方的反应函 数有交点,特别不能保证有唯一的交点。
2.4 混合策略和混合策略纳什均衡
c1 c2 2
u1 q1P(Q) - c1q1 q1[8 - (q1 + q2 )] - 2q1
6q1 - q1q2 - q12
u2 q2 P(Q) - c2q2 q2[8 - (q1 + q2 )] - 2q2
6q2 - q1q2 - q22
两寡头间的囚徒困境博弈
策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6
寻找混合策略纳什均衡概率分布的思路: 令各个博弈方随机选择纯策略的概率分布,满足 使对方或其他博弈方采用不同策略的期望得益相 同。
求此博弈中的混合策略纳什均衡
博弈方2 左
博弈 方1
右
0, 2 3, 0
上 下
2, 1 1, 2
* * * q1 q2 q3 24
* * * u1 u2 u3 576
Q* 72
经济博弈论完全信息静态博弈
19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
完全信息静态博弈例题
完全信息静态博弈例题完全信息静态博弈是博弈论中的一个重要概念,指的是参与者在博弈开始前获得了所有相关信息,并且在博弈过程中没有隐私和未知因素的影响。
在完全信息静态博弈中,参与者同时作出决策,不考虑对方的反应。
下面我们来看一个完全信息静态博弈的例题:假设有两个玩家,分别为甲和乙,他们需要决定是否采取合作或者背叛的策略。
如果两人都选择合作,则每个人会获得3个单位的奖励;如果两人都选择背叛,则每个人都会获得1个单位的奖励;如果一人选择合作而另一人选择背叛,则合作的人将会遭受惩罚,只能获得0个单位的奖励,而背叛的人将获得5个单位的奖励。
在这个博弈中,甲和乙可以通过思考对方的可能策略来做出自己的决策。
从甲的角度来看,他可以考虑乙选择合作还是背叛,对于每种可能的情况,甲可以计算出自己的最佳策略。
如果乙选择合作,甲选择合作的话,他可以获得3个单位的奖励;如果甲选择背叛,他可以获得5个单位的奖励。
因此,对于甲来说,在乙选择合作的情况下,他的最佳策略是选择背叛。
同样地,从乙的角度来看,他可以考虑甲选择合作还是背叛,对于每种可能的情况,乙可以计算出自己的最佳策略。
如果甲选择合作,乙选择合作的话,他可以获得3个单位的奖励;如果乙选择背叛,他可以获得5个单位的奖励。
因此,对于乙来说,在甲选择合作的情况下,他的最佳策略是选择背叛。
综上所述,根据完全信息静态博弈的原理,在这个例题中,甲和乙的最佳策略都是选择背叛。
因此,根据这两个最佳策略,我们可以得出一个纳什均衡解,即双方都选择背叛。
完全信息静态博弈是博弈论中的一个重要分支,通过分析参与者的策略选择和预期收益,可以得出最佳策略和均衡解。
在实际生活中,完全信息静态博弈的思维模式可以帮助我们在竞争和合作的场景中做出更为理性和明智的决策。
经济博弈论02完全信息静态博弈(Park)
合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
——
本章主要介绍博弈的策略式表述
博弈的策略式表述
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
参与人集合
– N人博弈的参与人集合,往往也记为N。参与人 则记为i, i∈ N – 参与人i的策略集,记为Si ,其中的一个特定策 略,可记为si.有si ∈ Si.
——
v(a)=0, v(b)=100, v ©=101
In a word, any other function w for which w(a) < w(b) < w(c)
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
预备知识:理性选择理论 (Theory of Rational Choice)
——
博弈的策略式表述
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
– Si中的元素 si 表示参与人i的一个具体策略
– 一旦确定了所有参与人的策略,便形成了一个 博弈局势,表示为s=(s1, s2, … sN),s∈S。
——
博弈的策略式表述
博 弈 论 • 参与人i的支付函数 讲 – 参与人 i的支付函数,是从博弈局势集 义 S=S1×S2 …× SN 到实数集R的一个映射,记为 ui(s1, s2, … s N),表示参与人i对局势s = (s1, s2, … sn) 完 的偏好。 全 信 • 一个博弈可以表示为 息 G = {S1, … ,SN; u1, … ,uN, i ∈N} 静 态 • 这就是博弈的策略式表述 博 弈
偏好关系 (preference relation)
– 假定
• 决策者可以比较对任意一对行动的偏好(优于、等 价、劣于)。称满足上述条件的行动集的偏好关系 为完全的(complete) • 对于决策者来说,若行动a优于行动b,则可记为
——
ab
或者记为
ba
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
——
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
预备知识:理性选择理论 (Theory of Rational Choice)
Some topics of ordinal preferences. This means
In this sense, u (a) = 0, u(b) =1, u©=100 and
预备知识:理性选择理论 (Theory of Rational Choice)
——
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
预备知识:理性选择理论 (Theory of Rational Choice)
Instant exercise (payoff function for complementary goods)
预备知识:理性选择理论 (Theory of Rational Choice)
基于支付函数的偏好表示
– 支付函数的定义:函数u表示一个偏好关系, 如果,对于任何行动a, b∈A,下列事实成立。
——
u(a) u(b) iff
ab
这里的支付函数实质上与经济学的效用函 数没有本质的不同。
博 弈 论 • 一个简单的支付函数例子(1) 讲 – (Payoff function for equivalent goods) A person can 义 consume nonnegative amounts of two goods. She regards the goods as equivalent: she cares only about the total quantity of both goods that she 完 全 consumes. (Maybe the goods are red shirts and blue 信 shirts, and color does not concern her.) 息 – A payoff function that represents her preference 静 relation is u(x1; x2) = x1+x2, where x1 and x2 are the 态 博 quantities of the two goods she consumes. 弈
这里直接引入囚徒问题的双矩阵形式
囚徒2 坦 囚 徒 坦 白 1 不坦白 白 不坦白 (0, -8) (-5, -5)
——
(-8, 0)
(-1, -1)
——
图1-1
囚徒问题的支付矩阵
博弈的策略式表述
博 弈 论 讲 义 完 全 信 息 静 态 博 弈 – 实质上,图1-1已经完全表述了囚徒困境的策略式表述 信息 – 称图1-1为二人有限博弈的双矩阵 (bimatrix)表述
——
囚徒2 坦 囚 徒 坦 白 1 不坦白 白 不坦白 (0, -8) (-1, -1) (- 信 息 静 态 博 弈
预备知识:理性选择理论 (Theory of Rational Choice)
Discussion
– In some circumstances a person may be primarily influenced by other people‘s actions—perhaps her main motivation is to be similar to other people, or to be different from them.
Some topics of ordinal preferences. This means
– She prefers the action a to b to c,but – It does not tell us ‗how much‘ she prefers a to b, or – Whether she prefers a to b ‗more‘ than she prefers b to c.
– 虽然决策不是在绝对时间意义上的“同时”, – 但决策的时间先后差别跟博弈结果没有关系, 也可看成是“同时进行的博弈”。 – 如不同竞标单位作出的工程投标决策 – 需要说明的是,一些实验分析结果,有时与上 述分析不一致
——
博弈的策略式表述
博 弈 论• 讲 义• 完 全 信• 息 静 态 博 弈
常用G表示一个博弈 博弈模型的两种表示形式
——
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
预备知识:理性选择理论 (Theory of Rational Choice)
There are two types of preferences
– Ordinal preferences – Cardinal preferences – Here we explain some characters of cardinal preferences
——
博弈的策略式表述
博 弈 论 例 写出囚徒问题的策略式表述 讲 – 参与人集合N={囚徒1,囚徒2} 义 – 参与人的策略集S1=S2= {坦白,不坦白} – 各参与人的支付,可用图1-1表示。 完 全 囚徒2 信 息 坦 白 不坦白 静 囚 态 (-5, -5) (0, -8) 徒 坦 白 博 1 不坦白 (-8, 0) (-1, -1) 弈
注意实际问题中,可能存在
– Facing {a, b}, one chooses a, while – Facing {a, b, c}, he may choose b sometimes – 上述选择不满足传递性要求 – 因此,理性选择理论存在一定的适用性
——
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
——
博弈的策略式表述
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
– 对于给定的参与人i, i=1,2,…N, 卡氏积
S1×S2 … ×Si-1 × Si+1 …× Sn – 表示除了参与人i外所有参与人所有策略的可能 组合,通 常记为S-i; – 于是所有参与人不同策略组合构成的策略空间 可表示为 – S=(Si , S-i)
博 弈
——
占优均衡
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
占优均衡定义
– 一个博弈的某个策略组合中,如果对应的所有 策略都是各参与人的占优策略,则称该策略组 合为该博弈的一个占优均衡。 –下面以囚徒困境问题为例,说明占优均衡,并 对囚徒困境问题稍加扩展分析。
——
占优均衡
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
——
完全信息静态博弈概念
博 弈 论• 讲 义
概念各参与人对彼此的策略集、支付函数 有准确了解 • 博弈行为同时进行 完 • 一些实例 全
信 息 静 态 博 弈
——
– 石头、剪子、布游戏 – 彼此了解的两个厂商的价格战
完全信息静态博弈概念
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
有些实际博弈
预备知识:理性选择理论 (Theory of Rational Choice)
– 对于任意三个行动,如果满足
a b ,b c
就能推出
——
ac
则称偏好关系满足传递性(transitivity) 如果行动a与b对于决策者来说,偏好程度 一样,则可记为
a~b
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
预备知识:理性选择理论 (Theory of Rational Choice)
如果行动a与b对于决策者来说,偏好程度 为a不劣于b,则可记为
——
ab
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
预备知识:理性选择理论 (Theory of Rational Choice)