博弈中纯策略纳什均衡点

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大猪和小猪分别采取什么样的策略,且各自的收益分别为多少?
《博弈论及其应用》 (汪贤裕) 6
夫妻爱好问题
OR
《博弈论及其应用》 (汪贤裕) 7
猜钱币游戏
《博弈论及其应用》 (汪贤裕) 8
完全信息静态博弈三要素
• 局中人集合 N {1,2,, n}
局中人集合即博弈参加人的集合。若给定局中人 i,则记 i N \ {i}
剔除占优均衡。
对应{Pi (s) | i 1, 2, , n}称为G 的重复剔除占优均衡结果
。 《博弈论及其应用》 (汪贤裕) 15
定义2.1.3 重复剔除占优均衡(续)
《智猪博弈》中重复剔除占优均衡: (按,不按)
均衡 结果
《博弈论及其应用》 (汪贤裕) 16
§2.2 纳什均衡
§2.2.1 纯策略纳什均衡 §2.2.2 双矩阵博弈的划线法 §2.2.3 无限策略的纯策略纳什均衡
例2.1.1 智猪博弈 例2.1.2 夫妻爱好问题 例2.1.3 猜钱币游戏 ※完全信息静态博弈的三个基本要素
《博弈论及其应用》 (汪贤裕) 4
智猪博弈
猪圈里有两头猪,一头大猪,一头小猪。猪圈
的一边有一个食槽,另一边安装一个控制按钮
,它能控制食料的供应。按一下按钮有8个单
位的食料进入猪食槽,但需要支付2个单位的
《博弈论及其应用》 (汪贤裕) 9
完全信息静态博弈三要素
完全信息静态博弈就是在上述三要素的基础上,分 析各局中人为实现自身利益最大化的策略行为分析。
简记为: G [N ,{Si },{Pi }]
《博弈论及其应用》 (汪贤裕) 10
§2.1.2 占优均衡
定义2.1.1 严格占优策略 定义2.1.2 占优均衡 定义2.1.3 重复剔除占优均衡
• 策略集 S i
每个局中人 i(i N )有一个策略集Si ,策略集Si , 可以是有限集,也
可以是无限集,当策略集是有限集时,我们记:
Si

{isi
}

{s1(i
)
,
s(i) 2
,
,
s(i) mi
}
i 1, 2,
n
当每个局中人 s选定一个策略si 后,形成一个策略组合 ,并称为一
个局势,记为: s (s1, s2, , sn ) si Si ,i 1, 2, , n
《博弈论及其应用》 (汪贤裕) 11
定义2.1.1 严格占优策略
在博弈
G

[
N
,
{S
i
},
{Pi
}]
中,若
s (i) k

s (i) h
是局中人 i
的两个
策略,对任意策略组合 s 都有:
Pi
(s
||
s
(i k
)
)

Pi
(s
||
s
(i h
)
)
(2.1.1)
iபைடு நூலகம்则称,局中人
的策略
s (i) k
严格占优策略
Si \ {si' }
中任何策略,那么策略组合
s'

(s1'
,
s
' 2
, s n'
)
称为 G 的占优策略均衡,简称占优均衡。对应的
{Pi (s') | i N} 称为占优均衡结果。
《博弈论及其应用》 (汪贤裕) 13
定义2.1.2 占优均衡(续)
《囚徒困境》中严格占优均衡: (承认,承认)
均衡 结果
中,若有策略组合
s

(s1
,
s 2
,,
s
n
)
si S i
i 1, 2,
,n
,使得每一个 i ,N 对任意 t (i) Si 都有
Pi (s || t (i) ) Pi (s ) i 1,2,, n
(2.2.1)
G 则称
s

(
s1
,
s
2
,,
s
n
)
博弈论及其应用 第2章 纳什均衡
第2章 纳什均衡
• 主要内容:
§2.1 基本概念 §2.2 纳什均衡 §2.3 混合策略纳什均衡 §2.4 矩阵博弈
《博弈论及其应用》 (汪贤裕) 2
§2.1 基本概念
§2.1.1 基本概念 §2.1.2 占优均衡
《博弈论及其应用》 (汪贤裕) 3
§2.1.1 基本概念
sh(i),或称策略
sh(i )相
对于sk(i)是严格劣策略。
《囚徒困境》中、犯罪嫌疑人A和B策略(承认)就是一个严
格占优策略。
《博弈论及其应用》 (汪贤裕) 12
定义2.1.2 占优均衡
在博弈G [N,{Si},{Pi}]中,若每一个局中人 i
都存在一个策略 si' Si , (i N ) ,使得 si'占优于
《猜钱币游戏》中不存在纯策略纳什均衡点。
《博弈论及其应用》 (汪贤裕) 21
《博弈论及其应用》 (汪贤裕) 17
§2.2.1 纯策略纳什均衡
定义2.2.1 纯策略纳什均衡点和均衡结果 定理2.2.1 重复剔除占优均衡与纯策略纳什均衡 ※ 纳什均衡点与多目标规划求解比较
《博弈论及其应用》 (汪贤裕) 18
纯策略纳什均衡点和结果
定义2.2.1 在 n人非合作博弈 G [N,{Si},{Pi}] N {1, 2, , n}
我们也引入如下记号: s || ti (s1, , si1, ti , si1, , sn ) ti Si
显然, s || ti 也是一个局势,且 s || si s。 • 支付函数
每个局中人有一个支付函数。是局势 s 的函数,是局中人在局势下所
能得到的收益。当然,每个局中人都希望自己的尽可能大。
劳动成本。在吃食的过程中,若大猪先到,大
猪能吃7个单位的食料,小猪只能吃1个单位
。若小猪先到,小猪能吃到4个单位的食料,
大猪只能吃4个单位。若两只猪同时到,大猪
吃5个单位,小猪吃3个单位的食料。大猪和
小猪都有两个策略,按或等待。
《博弈论及其应用》 (汪贤裕) 5
智猪博弈(续)
两只猪在不同策略下的支付矩阵:
《博弈论及其应用》 (汪贤裕) 14
定义2.1.3 重复剔除占优均衡
在博弈 G [N,{Si},{Pi}] 中,经过重复剔出严格劣策略
后,每个局中人 i 只剩下一个唯一的策略:
si Si (i 1,2,, n)
那么,策略组合 s (s1, s2 , sn ) 称为博弈 G 的重复

的一个纯策略纳什均衡点,对应的
{Pi (s ) | i 1,2,, n}
称为对应的均衡结果。
《博弈论及其应用》 (汪贤裕) 19
纯策略纳什均衡点和结果
《夫妻爱好》博弈中纯策略纳什均衡点: (足球,看足球)&(看芭蕾,看芭蕾)
均衡 结果
均衡 结果
《博弈论及其应用》 (汪贤裕) 20
纯策略纳什均衡点和结果(续)
相关文档
最新文档