连续博弈论中的混合策略性质及均衡存在定理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数理 医药学杂志 文章编 号 :0 44 3 ( 0 0 0 —6 90 1 0 —3 72 1 ) 60 4 —3 中图分 类号 : 3 1 R 1 文献标识码 : A
21 0 0年 第 2 3卷第 6期 ・基础 医学研 究 ・
连 续博 弈论中 的混合策略性质及 均衡存在定理
张金旺

阎 岩
李 林 刘 红
华 琳 郑卫英
张 建 李冬果
( 首都 医科 大 学生 物医 学工 程学 院
北京 1 0 6 ) 0 0 9
要 : 在 F dn eg和 Ti l( 9 1 20 ) u eb r r e 1 9 ,0 2相应 的工作基础 ( o 技术性说 明)上 , 提出并证明连续博弈混合策略集上相似于有限
博弈中混合 策略中的一些 基本和重要性 质 , 同样利用预备知识中的方法说明了混合策略纳什均衡的存在性 。
关键词 : 连续博 弈 ; 混合 策略 ; 均衡
di1. 9 9 j i n 0 44 3 . 0 0 0 . 0 0:0 3 6 / .s .10 -3 7 2 1. 6 0 8 s
的是概率分布 的变化 。现在策 略集 S ( EN)是不 可数 的无 i
1 序 言
限集 , 中人 i 局 以概率选择策 略时 , 在维持 隐蔽性 下 , 这种随机 选 择可以看成是定义在概 率空间 一{ F , 上 的一个随 S , ,P ) 机 变量 专, 中 为 S 上的 代数 , 的元 素A = 其 ( S是 B rl = oe
博弈论可定义为是对有 理性 的局 中人 之间 冲突和合 作 的 数 学模 型的研究 。个人理性强调局 中人在 博弈 中会 自始 至终 以追求 个人( 期望 ) 支付 ( 效用 ) 或 最大化 为 目标 来决策 。博 弈 论 主要 研究 局中人相互影响对方 策略所形 成或 实现的策 略组 合, 是决策理论对两个 或两个以上局 中人情形 的推广 , 者是 或
决 策论 在本 质 上 的 逻 辑 完 备 。
可测子集 , 是 F 上 的概率测 度 。且根据 概率分 布与分 布函
数 的关 系 , 8的概率分布 函数 F ( ( 用 s)sER)来表示 。 定 义 1 概率 空间 一{ , , 任 意分布 函数 S , P )上 ( )组成 的集合 称为策略型博弈 G一{ } N s S , i 中局 中人 i E E N 的混合策略集 , 记为 △ ; 布函数 ∈△称 为局 中人 i的一 分 个混合 策略 。即对 V E△ , 当且仅 当 A∈ 时 F ( ) i A 一P ( ) 毒( EA 一 J d ( 1≥ 0, ( 一1且 对 的 A 一P ( ) ) ^ fS) S)

在 博弈论的形成 与发展 过程 中 , 混合 策 略或 随机 策 略概 念 的引进 和应用起到了重大 的作 用 。因为在不确定 环境 或具
有 风险的情 况下 , 所假 定 的理性局 中人 总会 追求 他 的支付 的
数学期望最 大 , 而数 学期 望 又完 全 由 随机 变量 分 布 所确 定 。
两两不 相交 的 子 集 族 { } , ) 都有 ( A ) ∑ U 一
( ) A 。
用混合策 略来分 析博 弈是 重要 的手 段 , 引入 混合 策 略可 以保
证纳什均衡 的存 在 。根 据 贝叶斯 决策 理论 , 策 略集 上 的概 用 率分布可定 量表 示局 中人 选择 策略 的信 念 , 映局 中人 的隐 反
密性 。
我们在 △上定义距离 p: ×△一R 为 △ p , ) I 一 f ( 一 1 l
— s p ( ) u I s 一 ( ) ,V , EA ,i s l EN


∈ t
在 实际经济 活动 中 , 中人 ( 局 经济人 ) 的策 略集 通 常是 无
限的, 在对无限博弈 中连续博弈 的均衡存 在性 的研究 中 , 早 最 的和注重理论 与实效的也是混合 策略均衡 存在性 。关于现 有 的连续博弈 的均衡存 在性 的研 究可 概括 为 : 在连 续博 弈 中有 关混合策略纳 什均衡 的存 在性 的纳 什均 衡存 在定 理 ( i s Glk — c g r,9 2 和连续博弈 中有关 纯策略纳什均衡存在定 理 ; 者 eg 1 5 ) 后 是前者 的特例 。在求解 连续博弈 的均 衡 中几乎 采用 的都是 反
用 C S)表示 S 上一切连续 函数 ( (i 这时的连续 函数是有界
的) 的集合 , 它是 t nc  ̄ ah空间, 范数 为 1—spI s l。 其 I u ( c )


t £
定义 2 设 { } 是 △ 中一个混 合策略序 列 , ∈△ , 器 如
果 对 Vc ( ) EC S
都 有
i m E (1 d (i 一 E ( d (i Sc s) s) Sc s) s) () 1
应 函数法 , 尽可能避 开用 局 中人 的反应 集去求 集 映 的不 动 点
即博弈 的均衡 。
因此 , 研 究 在 F d n eg和 T rl( 9 1 2 0 ) 应 的 本 u eb r i e 1 9 ,0 2 相 o
则称 { )-弱 收敛 于 , F 记为 由定义 1有 F ; 之 若 反
F 或l  ̄ i i mF — ( 训)。

} 。 。
F , 对 Vc 则 E C
工作基础 ( 技术性说 明)上 , 主要对 连续 博弈混合策略 的性质 ,
连续博弈 的混合 策略纳什均衡存在定理 的证 明进行 了讨论 。 2 连续博弈 的混合策略性质 、 混合策略纳什均衡存在定 理
( () S)有 1 式成立 , 即这两个条件是等价 的。 显然 , 中任 一序列必有 收敛子序 列 收敛到 △ 中的一个 △z
相关文档
最新文档