多主体仿真实例(张发)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3. 警察(Cops)模型
观察范围V* 如果该范围内有反抗者,则随机选择一 个投入监狱
假设警察不参与反抗
4.主体的移动与服刑
移动
两类主体随机移动,在各自观察范围内随机 选择一个空位
服刑
被捕的反抗者监禁时间
J ~ U (0, J max )
5. 再现一些重要现象
(1)个体欺骗行为
能观察到当警察靠近时,某些反抗者变成沉 默者,当警察离开时又变成反抗者 原因分析: 警察的离去改变了局部C/A比例,改变了被 捕概率,导致状态变化
3. Agent的行为策略
假设个体不知道PD重复的次数 策略染色体(i,p,q)
i , 第一回合采用C的概率 p, 对方上个回合采用C,本人此回合采用C 的概率 q,对方上个回合采用D,本人此回合采用C 的概率
4.主体的学习
采用一种基于模仿学习,存在噪音干扰 和基因变异的进化算法 模仿学习的基本思想
2009全国研究生暑期学校(公共管理与复杂性科学)
多主体仿真实例
张 发
Richter2000@163.com
内容
理论研究
国内暴乱 合作演化
实际应用
ASPEN
一、国内暴乱模型
Epstein, Modeling civil violence: An agent-based computational approach, PNAS 描述民众与政府对抗的动态过程 模型非常简单,但具有丰富的宏观模式
房东
每天收房租 购买新房行为与房客一样
(2)企业
生产函数 企业决策:
y = cK a Lb
每天进行价格、雇用决策 年初决定是否购买机器
企业交税、缴纳社会保险 税后利润分配
价格决策GALCS渐进学习算法
状态16种:
近期产品价格上升还是下降了 近期销量上升还是下降了 近期利润上升还是下降了 本企业的价格高于还是低于行业均价
每种状态有一个涨价、降价、保持概率 向量 根据对利润的影响调整概率
5. 仿真结果
主体数量 家庭 1000 食品企业 3 其他非耐用品企业 2 汽车制造厂 2 房地产商 2 银行 2 政府、储备委员会、资本品生产商各1
紧缩/扩张货币政策对GNP的影响
对贷款利率的影响
ASPEN的发展
研究美国经济、过渡经济、电力市场 突发事件(恐怖袭击)对经济信心的影响
Defect S, T P, P
R, R T, S
T R P S常用数值5,3,1,0 Cooperate Cooperate Defect 3, 3 5, 0 Defect 0, 5 1, 1
Байду номын сангаас
(2)重复PD博弈
重复囚徒困境博弈( Iterated PD, IPD) IPD刻画了这样一个问题:
个人必须在潜在的长远利益与目前的短期利 益之间进行权衡
kp( f )
−q
按同样的方式购买其他非耐用消费品
汽车消费
每天汽车以给定的概率损坏,如果汽车 正常,没有汽车消费需求,否则购买新 车 按基本价格选择汽车厂商 如果储蓄较多,则购买一辆昂贵的汽 车,否则根据贷款利率选择一家银行申 请5年期汽车贷款
住房消费
区分房客或房东 房客
每天缴纳房租 以一定概率产生购买新房的愿望 如果决定购买,按价格选择开发商,选择银行申请 住房贷款
寻找具有最优(全局或局部)表现的个体, 并复制其策略。
此处采用的方法为:
寻找在当前周期中相遇的具有最高适应度的 主体并复制其策略。
适应度指标:
采用自0时刻至本周期T该个体所得支付之和 的规范化值,即X在T时的适应度为
fitness ( X , T ) = ( ∑ Payoffs ( X , t )) / 32T
G = H (1 − L) H ~ U (0,1), L ∈ (0,1)
平民对反抗风险的评估
个人风险(规避)态度 被捕概率
R ~ U (0,1)
取决于有限观察范围内警察与反抗者数量之比
P = 1 − exp[− k (C / A)]v
风险
N = RP
平民Agent的行为规则
如果G-N>k,则反抗;否则沉默
6.结果
运行中有合作周期的可能性较大。
出现合作周期的比例为90%
运行中有欺骗周期的可能性较大
出现欺骗周期的比例为73%
典型的特征
有合作的突现,但保持一段时间后崩溃,社会 在合作和不合作之间震荡。
AvgFitness
2.8 2.6 2.4 2.2 2.0 1.8 1.6 1.4 1 151 301 451 601 751 901 1201 1051 1501 1801 2101 2401 1351 1651 1951 2251
(2)自由集会催化反抗爆发
原因分析
允许随机移动时,会使积极分子局部集中, C/A比例下降,极大地降低被捕概率,导致 不满程度不高的人也会参与反抗
6. 宏观模式
(1)阵发均衡
(2)起义间隔时间分布
(3)政府威信下降模式的影响
a. 政府威信(L)缓慢下降,但总下降程 度较大
逮捕人数线性上升 反抗人数维持在低水平
Aspen的优缺点
优点:
模拟各类经济政策的影响 对单部门或多部门进行分析 明确放弃了一般均衡论 主体决策比较真实 能够模拟新概念
缺点:
参数设置困难 计算性能要求太高
2. Aspen基本模型
(1) 主体类型
家庭 企业,又分为四类:
食品生产商、其他非耐用品生产商、汽车制造商、房地产商
银行 政府 美联储 资本物品生产商 金融市场
总结
多主体仿真方法可应用于理论研究 也可对实际问题进行分析预测
谢谢!
谢谢!
t =1 T
噪音:
假设在观察对方的适应度时有噪音干扰
fitness _ observed ( X , T ) = fitness ( X , T ) + ε
变异:
假设在策略复制过程中有变异的可能 复制差错随机出现,其概率为a,p,q的复制差错独 立发生
p' = p + δ
q' = q + γ
然后令
3. 主体之间的交互
4.各类主体的行为
(1)
家庭主体 1~4个个人组成家庭 收入
在企业、银行、政府就业,获得工资收入 老年成员从政府领取社会保障金 户主失业时,从政府领取失业救济金 存款利息、债券利息、企业分红等
家庭支出
向政府交税 消费
食品消费 其他非耐用品 汽车 住房
食品消费
按家庭规模估计当日食品需求 根据价格选择企业购买食品 设企业f当日食品价格为p(f) 则从该企业购买的概率为
1. 模型基本框架
空间形式:
二维网格,torus
主体类型
平民,沉默或反抗 警察,搜索、逮捕反抗者,投入监狱
流动性:
两类主体在局部范围内随机移动
初始化,随机分布两类主体
2. 平民Agent
平民根据对政府的不满程度和反抗风险 决定是否反抗 不满水平G
取决于个人感知的困苦H(hardship)和政 府的合法性L(Legitimacy)
b. 政府威信突降,但总下降幅度较小
起义爆发 被捕人数突增
c. 政府威信不变,警察数量平缓下降
起义爆发
二、合作演化仿真
合作是一类常见的社会现象 合作是如何出现的? 如何促进与维持合作?
1. 基本模型
(1)囚徒困境博弈(PD) Cooperate Cooperate Defect
T>R>P>S 2R>T+S
i =p
'
'
5. 性能指标
主体适应度(fitness):
主体在一个周期中支付之和除以PD次数。
社会平均适应度(AvgFitness):
一个周期内所有主体适应度的算术平均。
社会类型划分
若社会平均适应度大于2.25,则可认为是一定程度 上的合作型社会 若社会平均适应度低于某阈值,则可认为是欺骗型 社会,此处欺骗阈值取1.7 。 中间型社会
PD博弈进行多次,只要满足一定条件, 就可能出现合作现象
2. 仿真模型
空间:
二维空间,16*16,环面
主体:
Agent具有各自的行为策略 根据回报,通过模仿学习实现进化
交互:
Agent与4个邻元分别进行4-IPD博弈
移动:
每个周期中随机选择少数Agent互换位置
仿真逻辑
Population(0)=GenerateRandomPopulation For each Period T For each individual A from Population(T) For 4-IPD Games X=GetOtherToPlay(Interactive Process) PlayPDGame(A,X,4Moves) UpdateCummulatePayoffs(A,X) Endfor Endfor NormalizePayoffs Population(T+1)=ApplyAdaptiveProcess(Population(T)) SwapPlaceProcess(Population(T)) Endfor
Cycle
三、实际应用举例
美国国民经济多主体模型Aspen 大流感干预策略微观仿真
1. Aspen简介
Agent-based Simulation Model of the U.S. economy
开发者: 美国Sandia National Lab.
Aspen的特点
针对美国经济特点抽象出多类主体,各 类主体具有比较坚实的微观基础 采用学习算法GALCS模拟企业定价,通 过学习过程模拟企业行为 运行在Paragon并行计算机上 主体分散决策,通过消息传递进行交互