12-基于演化博弈模型的矿区环境治理及监管策略分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( 3)
ED = yEy+ (1-y) E1-y = (1-x) [yR1+yα ( S1-S) +R ( y-1) ] -yC
联立上述 3 个方程可以求得地方政府监管机构
的演化博弈复制动态方程为:
D(y) =
dy dt
- = y(Ey - ED) = y(1 - y){(1 - x)[R1 + α(S1 - S) + R - C] - C}
[收稿日期] 2018-04-02
[DOI] 10. 13532 / j. cnki. cn11-3677 / td. 2018. 04. 016
[作者简介] 曾繁伟 ( 1964-) ,女,辽宁沈阳人,副教授,从事管理科学与工程学科教学与科研工作。
[通讯作者] 石夫磊 ( 1992-) ,男,山东临沂人,博士研究生。
假设 2: 博弈过程的参与者只有 2 个,一是地 方政府监管机构 D,二是煤炭企业 M,两者之间存 在博弈行为,并且博弈的双方都是有限理性的。
假设 3: 博弈主体 D 和 M 只有两种策略。地 方政府监管机构选择 “监管” 或 “不监管”,其策 略集合为 (监管D1,不监管D2),煤炭企业可供选 择的也有 2 种策略,一是 “合规排污”,即在规定 排放 标 准 允 许 的 范 围 内 合 理 排 放 污 染 物,二 是 “非法排污”,其策略集合为 ( 合规排污M1,非法 排污M2 ),此种情况下,煤炭企业在利益的驱使 下,将会忽略污染物排放的相关规定,从而造成污 染物的排放严重超标,进而影响矿区的生态环境。
- (1 - 2x)[V - αy(S1 - S)] αx(1 - x)(S1 - S)
- y(1 - y) ×
(1 - 2y){(1 - x)[R1 + α(S1 - S)
(6)
[R1 + α(S1 - S) + R - C] + R - C] - C}
67
总第 143 期
煤矿开采
① trJ | (0,0) = R1 + α( S1 - S) + R - 2C - V
( 11)
{detJ | (0,1) = [V - α(S1 - S)][R1 + α(S1 - S) + R - 2C]
[摘 要] 基于演化博弈理论,系统考察了煤炭矿区环境治理及监管的影响因素,对煤炭企业 与地方政府之间的博弈策略进行了深入分析,进而建立煤炭企业与地方政府系统双方的演化博弈模 型,对博弈双方的演化稳定性进行了深入研究,并对其进行了数值仿真分析,最后,探讨了在中心点 位置的不同参数调整下博弈双方的演化过程。
2018 年第 4 期
设该矩阵的行列式为 detJ,该矩阵的迹为 trJ,
为使公式描述更加简明,设
∑1 = - (1-2x) [V-αy ( S1 -S) ]
∑2 = αx (1-x) ( S1 -S)
∑3 = -y (1-y) [R1 +α ( S1 -S) +R-C]
(7)
∑4 = (1-2y) { (1-x) [R1 +α ( S1 -S) +R-C] -C}
演化博弈论的方法区别于传统的博弈论理论,
其以有限理性作为假设条件,最早由 Smith 和 Price 提出,以演化稳定策略 ( ESS) 及复制动态方程广 为应用[5-7]。将演化博弈论的方法应用于环境问题 已经成为近年来的热点,比如将演化博弈论方法应 用于大气污染、雾霾问题[8-10]; 环境规制下企业与 政府策略 之 间 的 博 弈 行 为 分 析[11- 15] 等, 现 有 的 研 究主要考察在博弈双方的演化过程中均衡点的稳定 性以及是否存在演化稳定策略等[9-15],而忽略了对 于中心点的深入探讨。
假设 8: 当地方政府采取监管策略时,可以及 时发现煤炭企业的 “非法排污” 行为。当地方政 府采取 “不监管” 策略时,不能发现煤炭企业的 “非法排污” 行为。
由上述假设条件,可以得到博弈双方的支付矩 阵如表 1 所示。
表 1 博弈双方的收益矩阵
博弈双方
地方政府 (D) 监管
不监管
煤炭企业 合规排污
本文在借鉴前人研究的基础上,贡献在于: 结 合矿区环境治理特点,将演化博弈论的方法应用于 矿区环境的治理问题中,构建煤炭企业与地方政府 之间的演化博弈模型,探讨煤炭企业与地方政府之 间的系统演化过程; 分析了博弈双方在均衡点的稳 定性,并重点对中心点的演化过程进行了探讨; 在 不同参数调整下对中心点状态的演化博弈过程进行 了仿真分析。 1 煤炭企业排污与地方政府监管行为演化博弈模型 构建与分析 1. 1 模型条件假设与符号说明
煤炭资源在我国的能源结构中占有相当大的比 重,是国民经济稳定发展的能源基础,但是,煤炭 资源的开采过程也伴随着十分严重的生态环境污染 问题,比如大气污染、固体废弃物污染、水污染以 及其他污染等。严重污染的背后,即与煤炭企业开 采过程有关,也与地方政府的治理力度息息相关。 近年来,政府高度重视矿区环境的保护,相继颁布 了与矿区环境保护直接相关的法律法规 13 项,加 快与促进了矿区环境保护的进程,但是,在矿区环 境治理的过程中,依然存在制度上的不完善、监管 不严等问题,矿区环境的治理与监管问题依然是一 个亟待解决的问题。
(0,-C)
( 0,0)
( M) 非法排污 ( V-α( S1 -S) ,R1 +α( S1 -S) -C) ( V,-R)
1. 2 博弈双方演化博弈模型建立
假设煤炭企业在地方政府监管机构分别采取
“监管” 与 “不监管” 行为策略情况下的期望收益
—
以及平均收益分别为 Ex,E1-x 以及 E M,计算公式
在煤炭矿区环境污染的治理过程中,煤炭企业 在选择贯彻地方政府的环境政策的同时,也在不断 地追求自己企业本身的利益最大化,煤炭企业与地 方政府之间的博弈行为表现为动态的重复博弈。
本文从演化博弈的角度来分析煤炭企业的排污 行为与地方政府的监管策略在利益冲突下如何做出 最优的行为决策,在构建煤炭企业与地方政府博弈 双方的演化博弈模型之前,提出如下假设:
[引用格式] 曾繁伟 ,石夫磊 . 基于演化博弈模型的矿区环境治理及监管策略分析 [J]. 煤矿开采,2018,23 ( 4) : 66-71.
66
曾繁伟等: 基于演化博弈模型的矿区环境治理及监管策略分析
2018 年第 4 期
假设 1: 矿区环境污染问题存在很多影响因 素,比如大气污染、固体废弃物污染、水污染以及 其他污染等,为使问题描述方便,在此合理假设矿 区环境质量的高低皆由煤炭企业的 “排污” 行为 所致,且将其分为 “合规排污” 与 “非 法 排 污” 两种情况。
[关键词] 演化博弈; 矿区环境; 监管策略; 数值仿真 [中图分类号] TD167 [文献标识码] B [文章编号] 1006-6225 (2018) 04-0066-06
Analysis of Mine Area Environment Treatment and Monitoring Strategies
第 23 卷 第 4 期 ( 总第 143 期) 2018 年 8 月
煤矿开采 COAL MINING TECHNOLOGY
Vol. 23No. 4 ( Series No. 143) August 2018
基于演化博弈模型的矿区环境治理及监管策略分析
曾繁伟1 ,石夫磊2
(1. 山东工商学院 工程学院,山东 烟台 264005; 2. 首都经济贸易大学 信息学院,北京 丰台 100070)
假设 6: 当企业进行非法排污时,其会获得额 外收益 V ( V>0)。当煤炭企业合规排污时,如果 地方政府采取不监管的策略,则其收益为 0,同 时,不需要支付监管成本。
假设 7: 当煤炭企业非法排污时,如果地方政 府采取不监管的策略,此时,上级政府对地方政府 的不作为处罚为-R, (R≥0),当煤炭企业进行非 法排污,同时地方政府采取监管策略时,上级政府 对地方政府会有一个正面评价R1 ( R1 >0),同时, 当地方政府采取监管策略时,其需要付出的监管成 本为 C (C>0)。
1. 3 博弈双方演化博弈稳定性分析
根据雅可比矩阵局部渐进稳定性的分析方法,
可以求得复制动态系统在均衡点的演化稳定性,对
复制动态系统的偏微分方程分别求偏导,设该系统
雅可比矩阵为 J,可以计算出该系统的雅可比矩阵
如下所示:
[ ] J = M(x) / x M(x) / y = D(y) / x D(y) / y
为:
{Ex = 0×y+0× (1-y) = 0 E1-x = y [V-α ( S1 -S) ] +V (1-y) = V-αy ( S1 -S) -
(1)
EM = xEx + (1-x) E1-x = (1-x) [V-αy ( S1 -S) ]
联立上述 3 个方程可以求得煤炭企业的演化博 弈复制动态方程[16-17]为:
假设 4: 煤炭企业选择 “合规排污” 策略的概 率为 x (0≤x≤1) ,则其选择 “非法排污” 策略的 概率为 1-x; 地方政府监管机构选择 “积极监管” 策略的概率为 y ( 0 ≤y ≤1) ,则其选择 “消极监 管”行为策略的概率为 1-y。
假设 5: 政府会给煤炭企业制定一个排污标准 S ( S≥0) ,当煤炭企业的排污量小于 S,即煤炭企 业合规排污时,煤炭企业与地方政府监管机构收益 皆为 0,设煤炭企业 “非法排污量” 为S1 ( S1 >S) , 政府会对煤炭企业超标的排污量进行处罚,设 α (α>0) 表示每单位的超标量进行的处罚金额,当 煤炭企业进行非法排污时,其需要支付 α (S1 -S)。
近年来,已有部分学者采用不同的方法对矿区 环境问 题 进 行 了 深 入 研 究,比 如 王 志 宏、何 志 强[1]对矿区 环 境 的 可 持 续 发 展 结 构 模 式 进 行 了 探 讨,进而剖析了实现该结构模式的历史演变过程, 并对该模式下的存续性以及稳定性进行了分析; 孙 玉峰[2]将矿 区 环 境 视 为 一 个 大 的 系 统, 并 将 其 分 为固体废物、水以及大气 3 个子系统,构建了基于 矿区环境的系统动力学模型,并以某矿区为例进行 了历史模拟与动态仿真; 李宝旭、卢国斌[3]采用 模糊数学的方法,构建了矿区环境质量综合评价的 模糊数学模型; 周玉民、卢国斌[4]对矿区环境系 统的结构以及模型进行了深入探讨,并构建了包含 环境污染模型以及环境保护模型的矿区环境系统模 型,并应用环境质量分析方法对矿区环境的质量问 题作了深入分析。
x*
= R1+α (S1-S) R1 +α (S1 -S)
+R-2C +R-C
y*
= α
V ( S1 -S)
( 10)
根据公式 (8),(9),带入均衡点的数值,可
以得到矩阵行列式以及矩阵的迹的表达式如下所
示:
{detJ | (0,0) = - V[R1 + α( S1 - S) + R - 2C]
则
detJ = ∑1 ∑4 -∑2 ∑3
(8)
trJ = ∑1 +∑4
(9)
在复制动态系统 (5) 中,令 M ( x) = 0,D
(y) = 0,可以求得可能存在的均衡点为 E1 ( 0, 0),E2 ( 0,1 ), E3 ( 1,0 ), E4 ( 1,1 ), E5 (x* ,y* ),其中:
(4)
则由博弈双方 (2)、 (4) 组成的演化动态系
统的复制动态方程如式 (5) 所示:
M
( x)
=
dx =x
dt
-
(Ex -EM)
= 百度文库x
( 1 -x)
[V-αy
( S1 -S)
]
D
( y)
=
dy = y dt
-
(Ey -ED)
=
(5)
y (1-y) {(1-x) [R1 +α ( S1 -S) +R-C] -C}
M
(x)
=
dx =x dt
-
(Ex -EM )
= -x
(1-x)
[V-αy
(S1 -S)
]
(2)
同理,假设 地 方 政 府 监 督 管 理 机 构 分 别 采 取
“监管” 与 “不监管” 行为策略情况下的期望收益
—
以及平均收益分别为Ey,E1-y 以及E D,其计算公式
如下:
{Ey = x ( -C) + (1-x) [R1+α (S1-S) -C] = (1-x) [R1+α (S1-S) ] -C E1-y = x×0+ (1-x) ( -R) = -R (1-x) -