小世界网络上Cournot博弈模型的演化动力学-软件工程国(精)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
f
3、t 时刻在 d ( x ) 的所有邻居元胞公司中采用策
I ( s, t ; x ) 略 s 比例为: pt ( s ) 2 | Nx |
4、处于学习状态 0 和 1 的公司在 t 时刻采用 s,
t+1 时刻采用s ' 的概率分别为:
1 u ( s, s ' ) 0 ,t u1 x ( s , s ' ) pt ( s ' )
如果它们的收益不小于所有最近邻居元胞的平均收益, 就 不改变策略, 否则就在所有邻居元胞中随机选取某个公司 所采用的策略。 上述网络中的每个元胞可看作是一个具有 两个寡头相互竟争的市场, 也可以看作是地理空间上的一 个位置, 网络中的每个公司生产的都是同质的产品, 每个 元胞中的两个公司都在进行着相同的 Cournot 博弈, 即市 场出清价格为 p max{0,1 q1 q2 } ,每个公司的收益为
if
s s'
else
7、若在模型演化过程中考虑突变(mutation),则
pt ( s' ) 1,t u x ( s, s ' ) 1 S
with with
probabilit y 1 probabilit y
三、数据模拟的设计以及对模拟结果的 讨论
• 相互作用的复杂性使得用解析方法分析模型变得 十分困难。本文对模型演化动力学的分析主要依 赖于计算机模拟, 并重点研究因小世界网络的重连 概率p的不同而引起系统演化动力学的区别。考虑 到对于给定的p值,所生成的小世界网络的拓扑结 构可能不同,我们的结论都是在重复进行很多次 计算机实现后得到的(即让同一p值生成不同的小 世界网络)。在程序设计中我们排除了网络可能出 现孤立点的情况。
• 然而,正如 Watts 和 Strogatz 所言,现实中 的网络既不是完全有序的也不是完全无序 的,而应该是介于这两种极端情况之间。 Newman 认为,社会和经济网络最好是用一 种称之为“小世界”的网络来刻划。这种 网络既具有规则网络较高程度的局部特性, 又像随机网络一样,具有较小的平均路径 长度。本文试图在世界网络上研究 Cournot 博弈演化的动力学特征。
一、模型的引入
• 通过引入一维的小世界网络(具有周期边界),我们 扩展了Paolo Lupi关于元胞之间相互模仿作用方式 的相关模型,小世界网络的生成方法采用的是 Watts和Strogatz 给出的算法。在我们的演化模型 中,网络上的每个公司在作出决策时采用的是一种 简单的行为准则。在小世界网络的每个节点 ( 称之 为元胞)里都有两个公司,每个公司的初始策略(即 公司的产量)通过选取[0,1]上的随机数得到,每个 元胞上的两个公司都在不断地进行着 Cournot 双头 垄断博弈,并通过一种模仿准则来改变策略:
二、模型的解析分析
为便于解析分析,我们考虑策略集为离散的情形: 1、 元胞 d ( x ) 的所有邻居公司的平均收益为
1 x 2 | N x | f f xN
2、学习状态 0 学习状态 1
1 x
f
f L0 { f d ( x ) | x} x
L { f d ( x) | x }
• Axelrod和Hamilton还强调:如果在具 有模仿行为的模型中考虑各博弈方的 局部性和局部相互作用,系统进入合 作平衡的可能性会更大。在进化博弈 和学习理论方面,已有不少的文献很 清晰地阐明了,在博弈方具有有限理 性的情况下,局部相互作用的意义。
在博弈方具有有限理性的情况下,许多有关演化 博弈和学习理论的文献研究了局部相互作用的意 义,例如: • Blume(1993)研究了2*2阶的协调博弈(每个 agent 只与邻居发生作用),系统将演化到一种风险占优 均衡。 • Ellison(1993)发现Kandori 模型在局部作用的情 况下达到pareto效率均衡的速度明显比在全局作 用的情况要快。 • Anderlini(1996)研究了有限个agent在每一时间 段与其某个邻居进行纯协调博弈 ,系统将以1的 概率收敛到一种稳定状态。
i 1,2 , i =qi p , q2 为元胞中两个公司的产量, 在 其中q1 ,
此不考虑成本。
根据上述给出的Cournot博弈模型,我们有: • 每个元胞中的两个公司的Nash均衡产量为 1/3,每个公司相应的收益为1/9。 • 每个元胞中的两个公司的共同收益极大化 产量(The joint profit maximizing output (JPM),亦称合作产量)为1/4 ,每 个公司相应的收益为1/8 。
小世界网络上Cournot 博弈模型的演化动力学
贾 武
武汉大学系统工程研究所
引 言
• 合作行为在社会经济背景下是经常发生的, 然而传统的博弈论对此却无法作出合理的 解释。很多研究者都试图从各个方面解释 为什么演化过程的最终结果是合作的涌现 (至少在某种程度上)。Axelrod和 Hamilton指出:合作行为是具有有限理性 的 agent 在采用一种适应性行为准则的前 提下,不断地进行相互作用的可能结果。
0 ,twk.baidu.comx
if else
s s'
若在模型演化过程中考虑惯性(inertia),则: 5、元胞 d(x)中的公司 f 改变策略的概率为:
f t ( x , f ) max{0,1 } x s ' 的概率为 6、在 t 时刻采用 s,在 t+1 时刻采用
1 t pt ( s ' ) vt ( s, s ' ) t pt ( s ' )
• 在策略集为连续的情况下,对于不同的重连概率p,Fig.1
给出了所有公司最终收益的累积分布,其中小世界网络的 元胞数N=300,演化次数为10000,并重复进行了10次计
算机实现,且不考虑突变。我们发现, 对于不同的p,累积
分布几乎都集中在0.125附近(即共同收益最大策略JPM所 对应的收益水平),并且与p值的大小几乎无关。这是因为, 当元胞中两个公司所采用的策略在0.25(即JPM)附近时, 它们的收益一般比邻居元胞中的公司要高,改变策略的可 能性不大,因而将长时间在网络上存在;而当元胞中的两 个公司策略远离JPM时,由于其较低的收益,其策略将很 容易被取代,直到它们的策略接近JPM。这种演化过程将
相关文档
最新文档