死亡率预测模型的新进展
我国妇幼死亡率GM(1,1)与线性回归预测模型研究
e ‘ +b /a
,ห้องสมุดไป่ตู้
模型要 经过可 行 性 检验 、 差 检 验 和后 验 差检 验 残
以确定 适用 性 :
级比
∈( - (+  ̄Zn 1) e 2 n1 e/ +) / ) (
G ( , ) 对 随机扰 动 原 始数 据 累 加 为规 律 性 M 11是
较 强 的生成数 据 , 离散序 列近 似建立 微分方 程 , 用 拟合 系统规律 并 外 推 应 用 的单 变 量 一 阶 灰 色 指数 函 数模
・
3 6・ 6
中 国卫 生 统 计 2 1 0 0年 8月 第 2 7卷第 4期
・
应用研究 ・
我 国妇 幼 死亡 率 G 1 1 与线 性 回归预 测模 型 研 究 M( , )
李望晨 张利平 孔雨佳 王春平。
【 提 要】 目的 提出妇幼死亡率预测的 G 1I 与线性回归模型, M( ,) 探讨资料处理、 模型检验方法, 以及适用性。
且 a∈(一 2 , 建模 可行 ; 2,)则
设 平均 残差 ;=
—
J
l 6 - 9 一
X
f )
I其 '
中羔 ’2 , 。 n 为模型预测值 , ∞ ( ) …,‘ ( ) 平均精度 P ‘=
( )X10 , P 1一 0 % 则 越 大 越 好 , 般 ( )<1 % , 一 k 0 P’> 0 ; 9 % 设后 验差 比 C= / 其 中 S,
我国死亡率预测与长寿风险
我国死亡率预测与长寿风险作者:苏华赵文来源:《经营管理者·下旬刊》2016年第02期摘要:本文分析了长寿风险形成的原因及其影响;介绍了预测死亡率的常用模型Lee-Carter模型的形式,估计方法及预测原理;并选用Lee-Carter模型对我国未来人口死亡率进行了预测,结果显示未来人口死亡率将持续降低,我国确实存在长寿风险;最后本文从养老保险制度及保险公司两中角度提出了我国长寿风险的管理的对策建议。
关键词:长寿风险死亡率 Lee-Carter模型一、引言随着人们对长寿风险的认知,国内外学者对长寿风险的研究越来越深入。
国外对长寿风险的研究起步较早,自Lee和Carter于1992年提出Lee-Carter模型后就进入了人口死亡率进行研究的新阶段。
Patricia Berry,Lawrence Tsui ,Gavin Jones(2010)以澳大利亚的长寿风险为例分别运用了Lee-Carter 模型、APC模型、CBD模型拟合了死亡率数据,指出各种模型都存在其局限性,应该具体问题具体分析。
诸多国内学者也对于人口死亡率预测进行研究,如卢仿先、尹莎(2005),杜鹃(2008),祝伟,陈秉正(2009)等也分别在Lee-Carter模型的基础上进行改进,基于我国死亡率历史数据,对我国人口死亡率进行了预测。
二、长寿风险介绍1.长寿风险产生的原因。
长寿风险是多方面因素共同作用的结果,人口预期寿命延长,社会老龄化以及社会保障制度的滞后性是长寿风险产生的主要原因。
1.1社会经济因素。
社会的进步和经济的发展为人类提供了一个更加良好的生存环境,抵御灾害和疾病的能力提升,人口平均寿命延长,这使得人们领取养老金的时间延长,养老金计划的支付期大大延长,长寿风险由此产生。
1.2社会保障制度因素。
人们预期寿命延长、人口老龄化虽是造成长寿风险的最直接最表象的原因,但长寿风险的根本成因却是社会保障体系相对人口老龄化的滞后性。
我国男女两性老龄人口死亡率联合建模与预测
Joint Modeling and Prediction of the Mortality of Male and Female Aged Population in China
作者: 王晓军[1,2];陈惠民[2];赵晓月[2]
作者机构: [1]中国人民大学应用统计科学研究中心;[2]中国人民大学统计学院
出版物刊名: 统计研究
页码: 151-160页
年卷期: 2021年 第10期
主题词: 死亡率;老龄人口;Logistic两人口模型;动态模型
摘要:老龄人口死亡率建模和预测是长寿风险度量和养老金风险管理的基础.在我国,退休年龄及以上老龄人口死亡数据稀少,随机波动大,构建能够捕捉老龄人口死亡率随性别、年龄和时间变动的动态预测模型成为难题.本文采用Logistic两人口死亡率模型研究我国老龄人口死亡率的建模与预测.首先,运用死亡率数据质量较好的我国台湾地区数据,对模型结构进行选择,并检验模型的稳健性和预测性能.其次,基于我国大陆地区死亡率数据对模型结构进行二次验证和选择,应用所选模型对大陆地区老龄死亡率进行建模和预测.结果显示,对于我国男女老龄死亡率的拟合和预测,Logistic两人口模型均优于单人口CBD模型.最后,运用Logistic两人口死亡率模型对死亡率在年龄和时间两个维度上外推和预测,计算出时期和队列老龄人口分年龄的预期余寿,为养老金精算评估和长寿风险分析提供更准确的数据支持.。
通过吉布斯抽样法进行死亡率预测与生命表制作魏嘉辰
通过吉布斯抽样法进行死亡率预测与生命表制作魏嘉辰发布时间:2023-05-10T07:26:10.442Z 来源:《科技新时代》2023年5期作者:魏嘉辰[导读] 使用吉布斯抽样法对CBD模型进行固定日历年的参数估计,用ARIMA模型进行时间序列预测的方式来对CBD模型的参数进行预测,再以2020年数据为参照,制作出了2020年中国人口混合完全生命表,并与Lee-Carter模型制表以及伐尔法制表进行了对比,最后预测出了2025年中国人口混合完全生命表。
四川大学四川成都 610052摘要:使用吉布斯抽样法对CBD模型进行固定日历年的参数估计,用ARIMA模型进行时间序列预测的方式来对CBD模型的参数进行预测,再以2020年数据为参照,制作出了2020年中国人口混合完全生命表,并与Lee-Carter模型制表以及伐尔法制表进行了对比,最后预测出了2025年中国人口混合完全生命表。
关键词:CBD模型;吉布斯抽样;参数估计;ARIMA模型;完全生命表1.引言随着医疗科技的不断发展,21世纪已是人口老龄化的时代。
一般来说,当一个国家或者地区具有至少10%的60岁及以上人口,或者至少7%的65岁及以上人口,就称这个国家或者地区步入了老龄化。
按照这个标准来看,中国在1999年就已经进入了老龄化社会,且预计到2030年,我国将有18.2%的60岁及以上人口。
为了解决长寿风险,国外许多学者提出了多种方法来对死亡率进行预测,而国内仍需要确定哪些方法可以误差更小的估计出人口死亡率以尽最大的可能来抵消掉长寿风险。
这对于政府的养老系统,精算领域的寿险产品定价以及各个公司的养老预备金计算来说都是十分重要的。
2.吉布斯采样法估计参数在CBD模型的参数估计方面,常用方法为假设死亡人数服从参数为的泊松分布,即:再对的似然函数,采用牛顿迭代法进行参数的迭代估计。
但是,在使用牛顿迭代法时,过大会导致迭代步长过小,且参数的初始值选取如果偏离真实值较多,则迭代速度会变得非常慢。
未来 30 年中国人口趋势 光棍潮来袭 深度老龄化
未来 30 年中国人口趋势 : 光棍潮来袭深度老龄化图片来源 / 图虫摘要1、人口预测模型的简单介绍。
Leslie 模型主要做两大方面的预测,一是利用各年龄群体的死亡率来推算下一年的人口结构,二是利用女性生育率测算每年新出生的男性和女性婴儿数量。
在测算中,我们考虑了不同年龄阶段、不同教育程度女性的生育意愿的差异,也考虑了死亡率随时间的变化情况。
测算使用的结构数据,主要来自国家统计局 2015 年 1% 人口抽样调查数据。
2、趋势一:最快 10 年后,我国总人口将现负增长。
我国人口数量在全球的占比也将逐步下降,印度人口数量有望在 5 年后的 2024 年超过中国。
3、趋势二:中青年加速减少,高峰时每年超千万。
未来 5 年我国劳动年龄人口将每年减少 300 万以上,在 2028 年 -2039 年间,年均减少数量将超千万。
4、趋势三:二胎影响已过去,新生婴儿很快破 1300 万。
预计今年我国新出生人口数量将降至 1400 万左右,五年内大概率跌破 1300 万。
5、趋势四:2 年后进入深度老龄化,2050 年或接近日本。
我国或在 2037 年达到日本现在的水平,到 2050 年或将与日本当时的老龄化水平相接近。
6、趋势五:结婚率继续下滑," 光棍儿 " 数量增多。
2015 年我国 15 岁以上的未婚男性比未婚女性多 4000 万人,出生性别比例失调最严重的一代还没有大批量进入婚姻市场,未来结婚率会进一步下降。
7、挑战和机会并存,应对措施刻不容缓。
长期人口趋势的变化,会持续对我国经济增速构成压力,其可能带来的一些经济和社会问题,亟需我们做出政策准备和反映。
但挑战背后,也会带来一些结构性的机会,例如老龄化对养老、医疗等相关行业的需求会增加," 光棍潮 " 会催生 " 单身经济 " 需求。
1、人口预测模型的简单介绍我们预测人口采用的是经典的 Leslie 模型,该模型是 1945 年时由澳大利亚学者Leslie 首次提出,属于考虑生物种群年龄结构的离散模型,在人口预测中也被广泛运用。
基于灰色预测模型的我国心脑血管疾病死亡率预测
基于灰色预测模型的我国心脑血管疾病死亡率预测作者:李论来源:《现代电子技术》2015年第11期摘要:运用灰色预测模型GM(1,1)对我国心脑血管病的死亡率进行建模拟合和预测分析,为心脑血管病防控工作重点的有效确定及防控措施的合理制定提供科学依据。
以全国2003—2012年10年间的心脑血管病死亡率为研究对象,采用灰色预测模型GM(1,1)对2013—2020年的全国心脑血管病死亡率进行预测,利用后验差检验,通过小误差概率p值,方差比c值,误差q值,综合评价模型的预测精度。
建模分析的结果表明,全国心脑血管病死亡率呈逐年上升的趋势,其中,心脏病死亡率上升速度较快,而脑血管病的死亡率上升速度相对平缓。
灰色系统理论可以很好地运用到死亡率预测分析方面,未来几年我国心脑血管病死亡率仍居高不下,疾病预防与监控部门应做好防治工作,进一步提升我国的医疗卫生水准。
关键词:灰色预测;心脑血管病;死亡率; Matlab中图分类号: TN802⁃34 文献标识码: A 文章编号: 1004⁃373X(2015)11⁃0107⁃05 Mortality prediction based on grey forecasting model for cardio⁃cerebrovascular diseaseLI Lun(Business College, China University of Political Science and Law, Beijing 102249,China)Abstract: The modeling fitting and prediction analysis on mortality of cardio⁃cerebrovascular disease in China is proceeded with grey forecasting model GM(1,1), which provides scientific basis to effectively determine the emphasis of prediction and control work, and reasonably formulate the prevention and control measures for cardio⁃cerebrovascular disease. The mortality ofcardio⁃cerebrovascular disease in China from the year 2003 to 2012 is selected as the research object, and the mortality of cardio⁃cerebrovascular disease in China from the year 2013 to 2020 is predicted by grey forecasting model GM(1,1). The prediction accuracy of the forecasting model is checked by posterior error, and evaluated by small error probability p, variance ratio c, error q comprehensively. Results of modeling analysis show that the mortality of cardio⁃cerebrovascular disease is increased year by year, and the mortality of heart disease is increased more obviously while the mortality of the cerebrovascular disease is increased smoothly. The grey system theory is well applied in mortality forecast and analysis. The mortality of cardio⁃cerebrovascular disease in China should be remain high in the next few years. Disease prevention and monitoring departmentsshould do better in prevention and control work to further promote the medical and health level in China.Keywords: grey forecasting; cardio⁃cerebrovascular disease; mortality; Matlab0 引言心脑血管疾病是心血管疾病和脑血管疾病的统称,泛指由于高脂血症、血液黏稠、动脉粥样硬化、高血压等所导致的心脏、大脑及全身组织发生缺血性或出血性疾病的通称。
人大考研-统计学院研究生导师简介-王晓军
36.基于长寿背景下的企业年金风险评估,《统计与信息论坛》,2012.12
37.公共养老金体系偿付能力评估方法评析,《保险研究》,2012.10
38.中国人口死亡率改善水平分析,《统计研究》2013.2
主持项目
1.霍英东教育基金会青年教师基金项目:“我国企业养老金计划精算体系的研究”1996.5-1999.5
爱考机构-人大考研-统计学院研究生导师简介-王晓军
王晓军,博士,教授,博士生导师
职务:中国人民大学统计学院党委书记,副院长
中国人民大学风险管理与精算中心主任
通讯地址:北京市中关村大街59号,中国人民大学统计学院,邮编:100872
电话:010-8250-9088(办)
传真:010-6251-5246
2.国家教育部“九五”人文社会科学研究规划项目:“我国社会保障精算模型及其应用的研究”。1999.1-2001.12
3.教育部2002年度“优秀青年教师资助计划”:“中国养老金制度研究——精算和财务管理模型及其应用”,2002.12-2005.12
4.荷兰国际集团和广东省劳动与社会保障厅课题:“广东省养老保险体制改革”课题,2003.1-2003.12
6.《广东省养老保险制度精算报告》,政府咨询报告,2005.1
7.《养老保险原理与运营》,中国人身保险从业人员资格考试教材,2006
8.《保险精算学》中国人民大学出版社,2006.4
9.《精算管理控制系统》,主译,中国人民大学出版社,2006.6
10.《养老保险精算理论与实务》,中国劳动社会保障出版社,2008.1
9.财政部项目:我国基本养老保险短期精算评估模型和运用研究课题,2005.7-2007.2.
骨保护素作为预测心血管疾病发病率和死亡率的新标志物的研究进展
( 二) O PG /R A N K L /核因子 B 受体活化因子( R AN K ) / 肿瘤坏死因子相关凋亡诱导配体( T R A IL ) 系统 O PG /R AN K L 系统通过抑制成骨细 胞的分化及破骨细胞的增殖, 在 骨代谢系 统中起 着不可替 代的作 用, 维持着骨 形成及 骨吸收的动态平衡, 但具体机制直到 90 年代末才研究清楚� R A N K L 由成骨细胞� 基质细胞� T 淋巴细胞表达 的转录
[6 ] [4 ]
� R A N K 存在于细 胞表面, 如 单核细 胞� 巨 噬细胞� 破 骨细胞前 体细胞
[5] 和树突状细胞 �R A N K L 和 R A N K 的相互作用激活核因子 B( 一 种转录因 子) , 继而 开始对 破骨细 胞分化所 需的特 定基因
�
O PG 通过与 R A NK 竞争结合 R AN K L , 从而抑制 R AN K LR A N K 的相互作用[7] � O PG 和 R A N K L 的结合可防止破骨细胞的 分化� 增殖, 从而抑制骨吸收�O PG /R A NK L /R A N K 同样在血管系统及 免疫系统中 有着重要作 用�O PG 已被 证实对血 管钙化 有着重要的保护作用[7] � O PG 还与另一个肿瘤坏死因子 T R A IL 密切相关�T R A IL 作为 一个同 源三聚 体, � 表 达为 型跨膜 蛋白
谢钦菁 罗助荣
[1] 骨保护素( ost eo p rot egeri n , O PG ) 是 1 997 年 T s u da 等 在人胚胎肺纤维 细胞中发现的一种分泌蛋白, 是肿瘤坏 死因子受体
( T N F R ) 超家族的一员, O PG 与心血管疾病的关 系越来越被 重视, 具有调节骨 密度的作用�在随后的更多研究中, 它可保护血 管内皮细胞� 抑制血管钙化和动脉粥样硬化, 在动脉粥 样硬化的 发生发 展中起 着重要 的调节作 用�近来, 许 多研究发 现心血 管疾病患者血浆中 O PG 水平与其预后有着密切的关系, 血浆 O PG 水平 可以作为 评估冠状 动脉病 变风险 及危险 分层的指 标, O PG /核因子 B 受体活 化因子 配体( rec ept or a c t i va t o r of n uc l ea rf a c t or B � 预测心血管疾病的发病率和死亡率�因此, 为了对 � l i ga n d, R A N K L ) 系统在动脉粥样硬化病理生理过程中的作用有 一个系 统的了 解, 本文对 前人的一 些研究 进行了 归纳总 结, 希 望能为临床诊治提供新的途径� 一� O PG 系统的生物学特征 ( 一) O PG 的结构与分布 O PG 属于 T N F R 超家族的一员, � 是破骨细胞形成抑制 因子�人 类 O PG 基 因位于 染色体 8q2 3 2 4 , 为 单拷贝 序列, 由 40 1 � , 1 D4 ) , 个氨基酸组成 有 7 个不同的结构域及 3 个功能区�N 端为富含半胱氨酸结构区域( D 这 4 个区域主要参与和配体结 合, 抑制破骨细胞的合成; C 端的两个死亡结构区域 ( D 5, D 6 ) 具有诱导 细胞凋亡的功能; C 端的肝素结合区域及 1 个半胱氨酸 7 ) 是同源二聚体的二硫键结合位点�O PG 以单体及二聚体两种 形式存在, 残基( D 二聚体 比单体更具 生物活性� 现在的研究 使用酶联免疫吸附试验技术检测血清总 O PG 水平, 包括 O PG 单体� 二聚体及 O PG 配体� O PG 具有广泛的组织分布, 在人体内, 在肺� 心� 肾� 胎 盘� 肝� 胃� 皮 肤� 脑� 脊 髓� 甲状腺 和骨骼等 组织, 骨髓 基质细 胞� 成 骨细胞� 成纤维细胞� 主动脉平滑肌细胞以及单 核细胞及 B 淋 巴细 胞中都 有较 高的表 达水 平�体内 许多 细胞因 子均 可调节 O PG m R N A 及蛋白的表达 , NO � 1, 2 5 ( O H ) 2 Vi t D 3 等可促进其表达 , 如转化生长因子 J3� 而胰 岛素样生 长因子� 糖皮质激 素� 甲
基于SVM的死亡率时间序列预测设计与分析
1潍坊医学院 数学教研室(6 0 3 . 2 15 ) 2 潍坊医学院 预防医学系(6 0 3 . 2 15 )
图 1 支持 向量机模型简图
Ch n s o r a f He l t f t s F b 2 0, 1 2 No. i e e J u n lo a t S a si 。 e 01 Vo . 7, h c 1
原则及统计学习的样本集训练, 其线性约束凸优化算 法保 证 了全局 最优及 唯 一 解 , 优 良泛 化 能力 很 好地 其 解决 小样 本训 练集 的高 维输 入 、 输 出非 线性 回归 问 单
题 。简 略模 型如 下 图 1 :
于选择、 经验风险原则 的样本容量依赖 、 维数灾难、 过 拟合 而外推 差 、 部极 小 点 问题 。该方 法 基 于 结构 风 局
特征空 间上进 行线 性可分 。采用 基 于结构 风险最小 化
近 年来在 统计学 习理 论基 础上 , 支持 向量 机 (u— sp
p r vc rmahn , V ) 为新 兴 智 能 数 据挖 掘 技 ot et c ie S M 作 o
术用 于非 线性 回归领 域 , 更好 地 解 决小 样 本 集模 型难
续性 , 因此 可归结 为时 间序列 预测 问题 , 据一段 时期 根 内 自身历史 数据资 料 建立 死 亡 率 预测 模 型 , 研究 数 据 随时 问发展 变化规 律 、 前后 联 系及延 续趋势 , 对未来 年 份 死亡 率进行外 推 预测 。历 史数 据资料 中规 律性趋势 越稳 定 、 越能体 现延续 性变 化规律 , 外推 预测效 果就越 好 , 注 意待训 练数据 资料选 取 。 应 本文 以 国家监 测 网点 新 生 儿 死 亡率 预 测 为例 , 研 究 S M 非线 性、 V 非参 数 建 模 预 测 方 法 设 计 、 能 分 性 析, 以及 方法 推广应 用 , 据来 源 于( 08年 中国卫 生 数 20 统 计年 鉴》 如表 l , 。
传染病模型精选推荐(一)2024
传染病模型精选推荐(一)引言:传染病模型是研究传染病传播方式和防控策略的重要工具。
本文将介绍5个精选的传染病模型,并探讨它们的特点和应用领域。
大点一:SIR模型1. SIR模型是传染病模型中最基本的一种,包括易感者(Susceptible)、感染者(Infected)和康复人群(Recovered)。
2. SIR模型适用于研究人群中的疾病传播情况,可以预测传染病的爆发和蔓延趋势。
3. SIR模型假设人群中没有出生死亡和迁移,并且感染后具有免疫力。
4. SIR模型可以通过改变参数来研究不同防控措施的效果,如隔离、疫苗接种等。
大点二:SEIR模型1. SEIR模型在SIR模型的基础上增加了潜伏期(Exposed)的状态,即潜伏期内已经感染但还未展现症状的人群。
2. SEIR模型适用于研究传染病的潜伏期和潜伏期内的传播方式。
3. SEIR模型可以更准确地描述疾病的传播过程,并提供更精确的防控策略。
4. SEIR模型可以通过添加接触率和潜伏期的参数来模拟不同传染性和潜伏期的疾病。
大点三:SEIRD模型1. SEIRD模型在SEIR模型的基础上增加了死亡者(Death)的状态,用于研究传染病的死亡率和致死风险。
2. SEIRD模型适用于研究死亡率高的传染病,如高致病性禽流感等。
3. SEIRD模型可以通过改变死亡率和康复率的参数来预测传染病的死亡数量和康复情况。
4. SEIRD模型有助于评估不同防控策略对死亡率的影响,如加强医疗资源、提高疫苗接种率等。
大点四:Agent-based模型1. Agent-based模型是一种基于个体行为和交互的传染病模型。
2. Agent-based模型可以模拟个体之间的接触和传播过程,更加现实和细致。
3. Agent-based模型适用于研究人口密集区域的传染病传播,如城市、机场等。
4. Agent-based模型能够考虑到不同个体的行为差异和健康状态,有助于制定个体化的防控策略。
死亡率预测方法
死亡率预测方法作者:林之伦来源:《智富时代》2018年第07期【摘要】在过去的几十年里,中国和世界其他国家的人口死亡率都逐渐下降。
人口寿命的延长给老年保障体系带来财务压力,因此,预测死亡率至关重要。
自1980年以来的死亡率预测包括三种主要方法:期望,外推和解释。
本文介绍了三种主要方法的优缺点,并阐述目前死亡率预测模型的发展趋势。
【关键词】死亡率;预测;方法一、研究背景改革开放以来,我国社会经济水平快速发展,医疗卫生条件得到大幅度的改善,人们的生活水平提高,对于长寿的渴望使得人们的生活方式更加健康。
国家统计局公布的数据显示,1981年我国的人均预期寿命为67.77岁,2000年“第五次全国人口普查”时提高到71.4岁,2010年“第六次全国人口”时进一步提升高到74.83岁,到2015年,我国的人均预期寿命已经达到76.34岁,从数据上看,我国的人均预期寿命在不断提高,并有继续上升的趋势。
一方面,预期寿命的提高可以人们享受更长的生命时光,但另一方面,预期寿命使我国老龄人口在总人口中的比重上升,人口老龄化所带来的长寿风险是一个不可忽略的社会问题。
长寿风险是指个人或总体人群未来的平均实际寿命高于预期寿命而产生的风险。
其中个人长寿风险是指个人死亡率围绕基准死亡率正常波动,是特定风险,可以通过购买养老保险或生存年金的方式来避免;总体人群的长寿风险又称为聚合长寿风险,是指对于死亡率改善评估不准确导致的非预期寿命的增加,这类风险属于系统性风险,无法根据大数法则进行分散。
由于养老保险通常是基于固定的死亡率和利率进行设计的,当预计的死亡率高于未来真实的死亡率时,这种非预期的死亡率的改善将导致养老金支付期限延长,需要投入更高的运营成本来应对这种不确定性的支付。
,所以研究准确的预测死亡率有着十分重要的意义。
二、死亡率预测方法死亡率建模有很长的历史,自从Gompertz于1825年发布他的死亡定律以来,已经提出了许多模型,通过几十年的发展,死亡率预测方法就更多了。
两种死亡率预测方法的比较
D01:10.13546/ki.tjyjc.2020.23.001「理if探两种死亡率预测方法的比较肖鸿民,马海飞,康彦玲(西北师范大学数学与统计学院,兰州730070)摘要:文章基于中国人口死亡率完整数据和不规则的有限数据,分别运用ARIMA方法和双随机过程对Lee-Carter模型的时间项进行预测,通过残差图和损失函数,对两种预测方法的稳健性进行检验,比较他们的预测效果。
结果表明,经典AR1MA方法更适合目前中国的人口死亡率预测,更有利于进行长寿风险的研究。
关键词:Lee-Carter模型;ARIMA方法;双随机过程;Bootstrap方法;稳健性中图分类号:F840.6文献标识码:A文章编号:1002-6487(2020)23-0005-040引言随着社会经济的不断发展,我国医疗水平进一步提高,人口预期寿命不断延长.国家统计局公布的数据显示, 1990年我国人均预期寿命为68.55岁,到2015年时已经提高到76.34岁。
人口老龄化问题日益严重,人口预期寿命的不断延长和死亡率的持续下降.给老年保障体系带来巨大的财务压力,因此人口死亡率的预测和研究已经成为养老金机构和其他业界研究的重点。
死亡率的预测首先是从死亡率建模开始的,目前使用最为广泛的是由Lee和Carter(1992)1"提岀的Lee-Carter模型,之后各国学者结合本国数据对死亡率进行拟合与预测。
在参数估计方面,Brouhns等(2002严运用极大似然方法对Lee-Carter模型的参数进行估计。
Renshaw和Haber-man(2OO6尸进一步提出了考虑出生年份效应的死亡率模型。
针对我国死亡率数据量较少,且部分数据缺失的情况,李志生和刘恒甲(2010)'41利用Lee-Carter对我国人口死亡率数据进行拟合和预测,但并没有对缺失数据进行处理。
韩猛和王晓军(2010)3对Lee-Carter模型进行了改进,通过一-个双随机过程对Lee-Carter模型中的时间项进行建模。
基于机器学习的Lee-Carter模型死亡率预
2022年第6期(总第255期)人口与经济POPULATION &ECONOMICSNo.6,2022(Tot.No.255)基于机器学习的Lee-Carter 模型死亡率预测方法研究陶祥兴,杨㊀峥,季彦颋(浙江科技学院理学院,浙江杭州310023)收稿日期:2022-03-13;修订日期:2022-08-03基金项目:国家自然科学基金面上项目 若干非标准核奇异积分及相关分数次非线性方程的研究 (11771399);2020年度浙江省哲学社会科学重点研究基地课题 基于随机时滞模型的长寿风险量化理论与催化从策略研究 (20JDZD071)㊂作者简介:陶祥兴,数学博士,浙江科技学院理学院教授,博士生导师;杨峥,浙江科技学院理学院硕士研究生;季彦颋,哲学博士,浙江科技学院理学院副教授㊂摘㊀要:世界各国人口死亡率不断降低,预期寿命变得难以预测㊂改进死亡率预测方法,准确预测未来人口的数量变化有着重要意义㊂传统的Lee-Carter 模型通过年龄组平均死亡率㊁时间项以及年龄因子随时间变化的敏感度这三个参数来刻画死亡率的变化,模型中的时间项采用ARIMA 方法进行预测㊂但该方法并不能解决死亡率数据具有长记忆性的问题,并且现有研究很少将传统人口学方法与大数据背景下机器学习方法相结合㊂因此本文引入LSTM (长短期记忆深度学习神经网络)和分数布朗运动驱动的O-U 过程来对死亡率预测进行改进㊂由于中国大陆有关死亡率的数据样本量少且不完整,选用中国香港男性分年龄组死亡率数据,分别采用时间序列ARIMA 方法㊁时间序列与机器学习相结合的ARIMA-LSTM 方法以及分数O-U 过程来拟合和预测模型中的时间项,通过残差图和三种评价指标值来比较三种方法的短期预测效果㊂结果表明,ARIMA-LSTM 方法的短期预测效果最好,证明了引入机器学习方法对死亡率预测方法改进的可行性,为政府预测未来死亡率提供新思路,也为相关机构研究长寿风险提供依据㊂关键词:Lee-Carter 模型;ARIMA 方法;ARIMA-LSTM 方法;分数O-U 过程;死亡率预测中图分类号:C921㊀文献标识码:A㊀文章编号:1000-4149(2022)06-0047-11DOI :10.3969/j.issn.1000-4149.2022.00.032㊃74㊃㊀‘人口与经济“2022年第6期一、引言随着社会经济的迅速发展和医疗水平的大幅进步,世界人口死亡率逐渐降低,老龄化问题日益严重㊂人口寿命的非预期延长导致养老事业发展滞后于人口老龄化的进程,给养老金机构和人寿保险公司带来巨大压力,进而可能影响整个社会经济的发展㊂因此,提高死亡率预测精度对于政府制定未来人口政策㊁经济政策以及养老政策至关重要㊂纵观学者对死亡率模型的研究,影响力最大的当属Lee-Carter模型㊂该模型是由李(Lee)和卡特(Carter)提出的一个对数双线性模型,首次考虑时间因素和年龄因素对对数中心死亡率的影响,并通过时间序列ARIMA模型来外推预测死亡率[1]㊂Lee-Carter模型由于其形式简单㊁计算方便㊁参数可解释性强的特点被各国学者广泛应用㊂随着研究的不断深入,Lee-Carter模型也暴露出一定缺陷,如模型对参数的假设条件过高等㊂为了提高预测的精确性,国内外学者从不同方向对经典Lee-Carter模型进行了改进研究,其改进方面主要有:一是放宽了模型的假设条件㊂在经典Lee-Carter模型中关于死亡率误差的假设是独立同分布的,针对这一假设条件过强的情况,勃朗恩斯(Brouhns)等假设死亡人数服从泊松分布,提出泊松对数双线性模型,并对死亡率进行了预测[2]㊂二是对经典Lee-Carter模型参数估计方法的改进㊂经典Lee-Carter模型采用奇异值分解(SVD)法[3-4]进行参数估计,吴晓坤等学者采用加权最小二乘(WLS)法[5-7],极大似然(ML)法[8-9]和贝叶斯马尔科夫蒙特卡洛(MCMC)法[10]进行参数估计,发现这三种方法在提高参数估计的拟合优度和死亡率预测的精度上都有很好的表现㊂三是对有限死亡率数据下的预测方法的改进㊂Lee-Carter 模型对死亡率数据的连续性有着较高的要求,大大限制了该模型在有限数据国家的应用㊂考虑到中国死亡率数据量较小,王晓军和黄顺林通过改进时序中的波动性来提高模型预测的精度[11]㊂四是对刻画Lee-Carter模型中的时间项参数k t的改进㊂传统的Lee-Carter模型运用ARIMA方法拟合并预测k t的值,但该方法并不能捕捉到死亡率数据中的长记忆性特征,存在一定的缺陷㊂有学者采用一个带漂移项的随机游走模型来刻画Lee-Carter模型中的时间项k t,并证明该方法同样适用于稀疏数据[12]㊂而对于死亡率中存在的跳跃性变化,田梦和邓颖璐采用双指数跳跃扩散模型来描述这一特征,并得到了较好的预测效果[13]㊂近年来,我国对Lee-Carter模型中的时间项k t的改进研究较少,大多都是单独利用离散方法或是连续方法对时间项k t进行拟合和预测,很少在此基础上引入机器学习方法对时间项k t的拟合和预测进行改进㊂因此本文在Lee-Carter模型预测死亡率的基础上提出对时间项k t进行拟合和预测的两种创新方法:第一,引入机器学习中的长短期记忆网络模型(Long Short-Term Memory,LSTM),在Lee-Carter模型中时间项k t用离散ARIMA模型拟合的基础上,运用LSTM模型修正其残差并对死亡率进行短期预测;第二,引入分数布朗运动驱动的O-U过程来刻画Lee-Carter模型中的时间项k t,通过机器学习中的遗传算法来估计分数布朗运动驱动的O-U过程中的未知参数并进行死亡率的短期预测㊂本文通过残差图和三种回归指标将两种创新方法和ARIMA方法的死亡率预测效果进行对比,确定出一个短期预测精度最高的死亡率预测方法,为政府预测未来死亡率提供了一种新的思路,也为相关机构研究长寿风险提供了一定的依据㊂㊃84㊃陶祥兴,等:基于机器学习的Lee-Carter 模型死亡率预测方法研究二㊁基础模型1.模型简述Lee-Carter 模型考虑了年龄因素和时间因素对模型的影响,具体模型表达式如下:ln(m x ,t )=αx +k t βx +εx ,t(1)㊀㊀其中,m x ,t 表示t 时刻x 岁人群的中心死亡率;αx 为影响死亡率的年龄参数,表示x 岁人口对数死亡率的平均水平,即α^x =1Tðt ln(m x ,t )(T 为待估计死亡率数据中包含的日历年总数);βx 为年龄因子对时间的敏感度;k t 通常被称为死亡指数,表示时间t 对死亡率的影响程度,通常被认为是一个ARIMA 过程或随机游走过程;εx ,t 表示模型的随机误差项,且εx ,t ~N (0,σ2)㊂由模型可知{αx ,βx ,k t }是模型的一组解,取任意一个不为0的常数c ,将参数变换成{αx ,βx /c ,ck t }或{αx -cβx ,βx ,k t +c },都可使得原模型保持不变㊂因此本文对参数增加以下的约束条件使得模型满足唯一的参数估计结果:ðx βx=1,㊀ðt k t=0(2)2.参数估计由于现实中死亡率误差独立同分布的假设通常不成立,故本文采用勃朗恩斯等去除了εx ,t 同方差的假定[2],提出用极大似然法来进行参数估计㊂该方法假设死亡人数d x ,t 服从参数为λx ,t 的泊松分布,即d x ,t ~Poisson (m x ,t E x ,t ),其中λx ,t =m x ,t E x ,t ,m x ,t =exp (αx +k t βx ),E x ,t 表示t 时刻年龄为x 的暴露人数㊂传统Lee-Carter 模型的极大似然函数可表达为:L (αx ,βx ,k t )=ðx ,t [d x ,t (αx+k t βx )-E x ,t eαx +k t βx]+C (3)㊀㊀本文根据约束条件,借助李志生等运用的初始值选定方案来实现模型中三类参数的估计[14],从参数初始值α^(0)x =0,β^(0)x =1和k ^(0)t=0开始,按照以下步骤迭代参数:α^(n +1)x =α^(n )x+ðt d x ,t-d ^(n )x ,tðt d ^(n )x ,t,㊀β^(n +1)x =β^(n )x ,㊀k ^(n +1)t =k ^(n )t(4)k ^(n +2)t =k ^(n +1)t +ðt (d x ,t-d ^(n +1)x ,t )β^(n +1)xðx d ^(n +1)x ,t β^(n +1)x()2,㊀α^(n +2)x =α^(n +1)x ,㊀β^(n +2)x =β^(n +1)x(5)β^(n +3)x =β^(n +2)x+ðt (d x ,t-d ^(n +2)x ,t )k ^(n +2)xðx d ^(n +2)x ,t k ^(n +2)t()2,㊀α^(n +3)x =α^(n +2)x ,㊀k ^(n +3)t =k ^(n +2)t(6)㊀㊀其中,d ^(n )x ,t 表示的是第n 步迭代得到的死亡人数的估计值,即d ^(n )x ,t =E x ,te α^(n )x +β^(n )x k ^(n )t㊂三㊁ARIMA 方法预测死亡率1.数据来源与参数估计结果本文采用1971 2020年香港男性分年龄组死亡率㊁死亡人口以及暴露人口的数据,参㊃94㊃㊀‘人口与经济“2022年第6期图1㊀1971—2020年中国香港男性死亡率三维图照简易生命表和已有文献的年龄分组,将香港男性数据分为19个年龄组(即0 4岁㊁5 9岁㊁ ㊁85 89岁以及90岁及以上),其中每个年龄组的死亡率数据采用5年死亡率数据的算数平均㊂数据来源于人类死亡率数据库(Huamn MortalityDatabase)和香港特别行政区政府统计处㊂根据这些数据绘制了分年龄组死亡率三维图,如图1所示㊂从图1中能够看出每一个年龄组的死亡率都呈现出普遍下降的趋势,这符合死亡率正在逐渐降低的社会环境,但降低的程度在每个年龄组都有着差异㊂接下来将对死亡率模型的参数进行估计㊁拟合和预测㊂选取1971 2018年香港男性完整死亡率数据,采用极大似然法运用R 软件进行参数估计,得到Lee-Carter 模型的参数估计值如图2所示㊂图2㊀Lee-Carter 模型参数的估计值从图2可以看出,参数αx 表示年龄因素对死亡率的影响,这一影响随着年龄的增长呈现出了先下降后上升的趋势;βx 随着年龄的增加而逐渐下降,且低年龄组和高年龄组βx 值下降幅度相对较大,表明这两个年龄段对死亡率时间因子变化的敏感度相对较高;而参数k t 的估计值随着时间的推移表现出显著的递减趋势㊂2.死亡率预测本文利用1971 2018年的香港男性死亡率数据,对模型进行拟合,并根据上述参数估计结果,采用ARIMA (0,1,1)模型预测2019㊁2020年的k t 值(见图3)㊂根据k t 的预测值和式(1),可以得到2019 2020年香港男性分年龄组人口的死亡率预测值,结果如表1所示㊂㊃05㊃陶祥兴,等:基于机器学习的Lee-Carter 模型死亡率预测方法研究四、ARIMA-LSTM 方法预测死亡率1.LSTM模型介绍图3㊀时间项k t 的预测值长短期记忆深度学习神经网络(Long Short-Term Memory,LSTM)是一种改良过的循环神经网络,因其能够有效解决长时间依赖问题,被广泛应用于时间序列的预测㊂LSTM 神经网络的数据流向和传递过程如图4所示㊂表1㊀基于ARIMA 方法的2019—2020年死亡率预测值年龄组(岁)2019年2020年0 40.0003070.0002895 90.0000590.00005710 140.0000740.00007215 190.0001610.00015620 240.0002900.00028225 290.0003890.00037930 340.0004730.00046135 390.0006800.00066240 440.0009920.00096445 490.0016010.00155650 540.0026210.00254655 590.0043360.00421660 640.0069030.00670565 690.0113240.01101070 740.0195870.01911075 790.0329600.03219080 840.0564290.05524085 890.0922670.09045190及以上0.1836580.180977图中X t 表示t 时刻输入的训练样本数据,h t 表示神经网络当前单元的输出值,h t -1表示t -1时刻神经网络单元的输出值,f t 表示遗忘门㊁i t 表示输入门,O t 表示输出门,C ~t 表示前一时刻的单元状态,C t 表示当前时刻的单元状态,σ和tanh 表示神经网络内的激活函数㊂LSTM 神经网络通过遗忘门㊁输入门和输出门三种门控机制来完成数据的丢弃㊁增加㊁保存和传递,从而实现有用信息的长期记忆㊂在神经单元内的数据传递满足以下公式:f t =σ(W f [h t -1,x t ]+b f )i t =σ(W i [h t -1,x t ]+b i )C ~t =tanh W c ~[h t -1,x t ]+b c~()C t =f t ∗C t -1+i t ∗C ~tO t =σ(W o [h t -1,x t ]+b o )h t =O t ∗tanh (C t )(7)其中,W 表示权重,b 表示模型的偏置㊂图4㊀LSTM 神经网络结构图㊃15㊃㊀‘人口与经济“2022年第6期2.建模步骤本文引用具有长记忆性并且适用于时间序列建模的LSTM神经网络对ARIMA模型进行修正,具体步骤如下㊂(1)对获得到的k t序列进行平稳性检验㊂首先对k t序列作图来判断序列是否平稳,即是否需要经过差分处理㊂对差分后的序列进行单位根(ADF)检验,若通过ADF检验表明差分后的序列已经平稳,则不需要进行差分处理,否则需要在此基础上再进行差分处理㊂(2)对差分后平稳的序列做自相关(ACF)图和偏自相关(PACF)图,初步确定模型p㊁q的值并根据AIC最小准则确定最优模型㊂根据最优模型构造残差序列{e it},有e it= K it-k^it,K it为死亡率数据运用极大似然法估计出的参数k t的值,k^it为时间t下ARIMA模型的拟合值㊂(3)对残差序列{e it}进行白噪声(Ljung-Box)检验,若通过白噪声检验说明拟合模型充分提取了原序列中的相关信息㊂(4)将残差序列{e it}作为输入值,利用LSTM神经网络对其进行训练,其输出结果为时间t下模型残差的预测值l^it㊂根据ARIMA模型对k t序列的预测值和LSTM模型对其残差的预测值得到组合模型的k t预测值,即:K^it=k^it+l^it㊂本文提出的组合模型流程见图5㊂图5㊀流程建模图3.死亡率预测根据上述建模步骤可以得到未来两年k t的预测值,进一步运用Lee-Carter死亡率预测模型可得到未来两年死亡率的预测值,即m x,t=exp(αx+K^itβx),其中K^it为组合模型k t的预测值㊂2019 2020香港男性分年龄组人口死亡率的预测值如表2所示㊂㊃25㊃陶祥兴,等:基于机器学习的Lee-Carter 模型死亡率预测方法研究㊀㊀表2㊀基于ARIMA-LSTM 方法的2019—2020年死亡率预测值年龄组(岁)2019年2020年0 40.0002950.0002795 90.0000580.00005510 140.0000730.00007015 190.0001580.00015320 240.0002850.00027825 290.0003820.00037330 340.0004650.00045335 390.0006680.00065240 440.0009730.00094845 490.0015700.00152950 540.0025690.00250255 590.0042530.00414560 640.0067670.00658965 690.0111080.01082670 740.0192600.01882975 790.0324310.03173580 840.0556140.05453885 890.0910210.08937790及以上0.1818210.179385㊀㊀五、分数O-U 过程对Lee-Carter 模型时间项的拟合与预测1.分数O-U 过程分数O-U 过程是由分数布朗运动驱动的O-U 过程,对于处理实际问题中的长记忆性有着十分普遍的应用㊂我们考虑以下形式的分数O-U 过程来刻画Lee-Carter 模型中的时间项k t :d k t =-λk t d t +σd B Ht,㊀t ȡ0(8)㊀㊀将式(8)离散化得到如下表达式:k t +Δt=(1-λΔt )k t +σ(B H t +Δt -B Ht )(9)㊀㊀其中,{B H t ,t ȡ0}是Hurst 参数H >1/2的分数布朗运动,具有长记忆性的特点,所以本文引入其来刻画时间因子k t ;H ㊁λ和σ是需要估计的未知参数㊂2.参数估计根据Hurst 参数的研究成果[15],本文得到分数布朗运动驱动的分数O-U 过程中Hurst 参数H 的估计:H ^=12-12ln2ln ðN -1t =1(k t +1-k t )2ðN2-1t =1(k 2(t +1)-k 2t )2éëêêêùûúúú(10)㊀㊀利用二次变差法计算出σ2估计量的值:σ^2=ðN -1t =1[k 2(t +1)-k t ]2N -1(11)㊀㊀利用机器学习方法中的遗传算法来进行最后一个未知参数λ的估计㊂遗传算法(Genetic Algorithm,GA)是一种通过模拟自然进化过程搜索最优解的方法,它克服了传统极大似然等方法容易陷入局部极值丢失最优解的缺点,其具体步骤如下㊂(1)编码㊂随机产生一个种群作为该问题的初始解,并运用合适的编码方案对种群中的每一个个体进行编码,如二进制编码或实值编码等㊂本文采用的编码方式是二进制编码,其编码过程简单易行,相应的交叉算子㊁变异算子等操作运用位运算即可实现㊂(2)适应度函数设计㊂本文设计第i 个个体的回应度函数为:F i =ðni =1ωi [C H i (Ω)-C M i ]2,选取ωi=1/n ,n 为样本总量,F i 为种群中第i 个个体所表示的模型拟合效果的优劣程度,F i 越小,拟合效果越好㊂(3)选择㊂根据每一个个体的适应度值进行选择,选择的原则为适应度越高的个体可能被选中的概率就越大㊂本文按照轮盘赌的选择方法,每一个个体按照P i =F i /ðNj =1F j 的概率将一个圆盘划分为N 个扇形区域,N 为种群规模㊂通过转动圆盘,圆盘指针随机落在哪㊃35㊃㊀‘人口与经济“2022年第6期个区域,哪个区域的个体被选中㊂(4)交叉与变异㊂交叉是将随机配对的两个个体相互交换本体中的部分基因,其主要的方法有单点交叉㊁多点交叉等,本文采用多点交叉法,交叉点根据交叉概率随机选取㊂变异是指个体上的某些基因发生改变,主要的变异方法有基本位变异㊁均匀变异等㊂本文采用基本位变异法,根据变异的概率随机确定每个个体想要发生变异的基因点位,然后将二进制编码中的 1 变为 0 , 0 变为 1 ㊂表3㊀分数布朗运动驱动的分数O-U 过程的参数估计值H^λ^σ^0.5920.0100.907表4㊀基于分数布朗运动驱动的O-U 过程的2019 2020年死亡率预测值年龄组(岁)2019年2020年0 40.0003210.0003225 90.0000610.00006110 140.0000760.00007715 190.0001650.00016520 240.0002960.00029725 290.0003970.00039830 340.0004830.00048435 390.0006930.00069440 440.0010140.00101645 490.0016360.00164050 540.0026790.00268455 590.0044290.00443860 640.0070560.00707165 690.0115670.01159070 740.0199550.01999075 790.0335550.03361180 840.0573450.05743185 890.0936650.09379690及以上0.1857120.185904(5)参数选择(交叉概率㊁变异概率㊁种群规模㊁迭代次数)㊂遗传算法中,参数的选择是否合理将直接影响模型的精度和有效性㊂本文通过多次试验后,选取交叉概率为0.6,变异概率为0.1,种群规模为50,遗传算法迭代次数为500㊂利用PYTHON 实现上述遗传算法代码编程,可得分数布朗运动驱动的O-U 过程的参数估计值如表3所示㊂3.死亡率预测将分数布朗运动驱动的O-U 过程的参数估计值代入其离散表达式(9),可以对2019 2020年的香港分年龄组的死亡率进行预测,预测结果如表4所示㊂六、短期预测结果比较根据上述预测结果,结合2019 2020年真实死亡率数据的对比图(见图6)发现,2019年和2020年,80岁以下三种模型预测的死亡率均表现出较好的预测效果,而80岁以上死亡率的预测值与真实值之间存在较小偏差㊂图6㊀2019 2020年死亡率数值对比图㊃45㊃陶祥兴,等:基于机器学习的Lee-Carter 模型死亡率预测方法研究为进一步评估三种方法的预测效果,本文选用残差图以及三个评价指标对预测值进行综合比较,并选择出相对最优的预测方法㊂1.残差图检验由于三种预测方法得到的死亡率预测值与真实值之间均存在一定的差异,故本文通过考察分年龄组的死亡率残差图(见图7)来初步评估三种方法的预测效果㊂图7显示,60岁以下三种方法的死亡率残差值均位于0线附近,且并未表现出明显差异,表明该年龄段内,三种方法的预测效果较为稳定且精度较高;高年龄组的预测残差值差异较为明显,整体上ARIMA-LSTM 方法的短期预测表现相对最好,传统的ARIMA 方法次之㊂图7㊀2019—2020年死亡率残差对比图2.评价指标检验为了进一步比较三种方法的预测效果,本文引入平均绝对百分比误差(MAPE)㊁均方误差(MSE)和平均绝对误差(MAE)三个评价指标来评价模型的预测效果㊂MAPE y ^()=100%n ðn i =1y i -y ^i y i(12)MSE y ^()=1nðn i =1y i -y ^i ()2(13)MAE y^()=1nðn i =1y i -y ^i (14)表5㊀三种方法预测精度对比模型MAPEMSEMAEARIMA 0.1535630.0000310.001842ARIMA-LSTM0.1470060.0000270.001715FOU0.1595280.0000430.002180㊀㊀其中,y^i 为预测值,y i 为真实值,n 为预测期㊂三个评价指标数值越小,说明模型预测效果越好,故综合残差图和评估指标值(见表5),本文认为ARIMA-LSTM 方法在死亡率的短期预测中具有相对较好的预测能力㊂七、结论本文采用中国香港1971 2020年男性分年龄组数据,在Lee-Carter 模型的基础上,提出了两种改进方法对模型中时间项进行拟合和预测㊂第一种是引入机器学习LSTM 模㊃55㊃㊀‘人口与经济“2022年第6期型,在Lee-Carter模型中时间项k t用离散ARIMA模型拟合的基础上,运用LSTM来修正其残差并进行死亡率短期预测㊂第二种是引入分数布朗运动驱动的O-U过程来刻画Lee-Carter模型中时间项k t,通过遗传算法来估计分数O-U过程中的未知参数并进行死亡率短期预测㊂将本文提出的两种改进方法与传统ARIMA方法的预测效果作对比,结合预测残差图发现,60岁以下三种方法的死亡率残差值基本位于0线附近,而高年龄组的残差值表现出较大差异,整体上ARIMA-LSTM方法的残差值明显低于其他两种方法,表明ARIMA-LSTM方法的短期预测效果相对较好㊂最后引入MAPE㊁MSE和MAE指标进一步考察三种方法的预测效果,结果表明ARIMA-LSTM方法具有较好的短期预测能力㊂综合残差图和评估指标,本文认为ARIMA-LSTM方法能够更加精确地描述死亡率的短期变化,表明将机器学习方法应用于死亡率的短期预测中是切实有效的,有助于改善人口老龄化给政府和相关长寿保险机构带来的负面影响㊂在进一步的研究中,将尝试运用ARIMA-LSTM方法对大陆的死亡率数据进行拟合预测㊂同时考虑到大陆死亡率数据有限且有缺失,将采用贝叶斯方法进行参数估计,该方法能够有效减少数据质量不高带来的不利影响㊂参考文献:[1]LEE R D,CARTER L R.Modeling and forecasting US mortality[J].Journal of American Statistical Association,1992,87(419):659-671.[2]BROUHNS N,DENUIT M,VERMUNT J.A Poisson log-linear regression approach to the construction of projected lifetables[J].Insurance:Mathematics and Economics,2002,31(3):373-393.[3]黄匡时.Lee-Carter模型在模型生命表拓展中的应用 以中国区域模型生命表为例[J].人口研究,2015(5):37-48.[4]胡仕强.基于Lee-Carter模型和王变换方法的长寿债券定价研究[J].商业研究,2015(10):82-88.[5]吴晓坤,刘江涛,苏雨桐,高建伟.基于Lee-Carter模型的高龄人口死亡率预测[C]//2020 2021中国保险与风险管理国际年会论文集,2021:1134-1147.[6]赵明.中国男性人口死亡率动态预测的方法比较 基于Lee-Carter模型与贝叶斯分层模型的研究[J].人口与发展,2022(1):40-49.[7]高甲.基于Lee-Carter模型的香港人口死亡率预测[D].济南:山东大学,2020:1-51.[8]吴晓坤,李姚洁.Lee-Carter模型外推预测死亡率及偏差纠正[J].统计与决策,2016(20):19-21.[9]曹园.基于Lee-Cater模型的我国死亡率预测[J].统计与决策,2018(9):32-36.[10]胡仕强.基于贝叶斯MCMC方法的我国人口死亡率预测[J].保险研究,2015(10):70-83.[11]王晓军,黄顺林.中国人口死亡率随机预测模型的比较与选择[J].人口与经济,2011(1):82-86.[12]LI N,LEE R,TULJAPURKAR ing the Lee-Carter method to forecast mortality for populations with limited data[J].International Statistical Review,2004,72(1):19-36.[13]田梦,邓颖璐.我国随机死亡率的长寿风险建模和衍生品定价[J].保险研究,2013(1):14-26.[14]李志生,刘恒甲.Lee-Carter的估计与应用 基于中国人口数据的分析[J].中国人口科学,2010(3):47-56.㊃65㊃陶祥兴,等:基于机器学习的Lee-Carter模型死亡率预测方法研究[15]ZHANG P,XIAO W L,ZHANG X L.Parameter identification for fractional Ornstein-Uhlenbeck processes based on discreteobservation[J].Economic Modelling,2014,36(1):198-203.Research on the Prediction Method of Death Rate ofLee-Carter Model Based on Machine LearningTAO Xiangxing,YANG Zheng,JI Yanting(School of Science,Zhejiang University of Science and Technology,Hangzhou310023,China)Abstract:The death rate of the world s population has been continuously reduced,and the life expectancy has become unpredictable.Therefore,it is of great significance to improve the mortality prediction method to accurately predict the future population changes.The traditional Lee-Carter model describes the change of mortality through three parameters:the average mortality rate of the age group,the time term and the sensitivity of the age factor to change with time.The time term in the model is predicted by ARIMA method.However,the method can not solve the problem of long memory of mortality data,and the existing research rarely combines traditional demographic methods with machine learning methods in the context of today s big data.Therefore,this paper introduces LSTM(long-term and short-term memory deep learning neural network)and fractional Brownian motion driven O-U process to improve the prediction of mortality.Due to the small sample size and incomplete data on mortality mainland China,this paper selects the mortality data of male age groups in Hong Kong,China,and used time series ARIMA method,the ARIMA-LSTM method combined with time series and machine learning,and the fractional O-U process to fit and predict the time items in the model,and compares the short-term prediction effects of the three methods through residual diagram and three evaluation index values.The results show that ARIMA-LSTM method has the best short-term prediction effect,which proves the feasibility of introducing machine learning method to improve the mortality prediction method,provides a new idea for the government to predict future mortality,and also provides a certain basis for relevant institutions to study the risk of longevity. Keywords:Lee-Carter model;ARIMA method;ARIMA-LSTM method;fractional O-U process;mortality prediction[责任编辑㊀刘爱华]㊃75㊃Copyright©博看网. All Rights Reserved.。
老年人群全因死亡预测模型综述
·综述·基金项目:北京协和医院中央高水平医院临床科研专项(2022 PUMCH B 132)作者简介:李园园,住院医师,Email:17812090503@163.com通信作者:刘晓红,主任医师,Email:xhliu41@sina.com老年人群全因死亡预测模型综述李园园,刘晓红中国医学科学院北京协和医学院北京协和医院老年医学科,北京100730[摘要] 优化老年人的医护照料方案是复杂的,必须考虑个人的预后。
有效的死亡风险预测模型可以评估预后,为治疗决策提供重要信息,确定获益最大的诊疗方案,并为医患共同决策提供基础,是帮助临床决策的重要工具。
国外学者研发了多种老年人死亡预测模型,包括社区、住院以及长期照护机构人群,部分工具已经进行了验证及推广,但是在中国大陆尚缺乏相关研究。
该文将对老年人死亡预测模型的内容、准确度和适用性等进行综述,为开发适合我国老年人群的死亡预测模型,制定最优临床决策提供依据。
[关键词] 死亡;模型,理论;临终医护;老年人;综述DOI:10.3969/J.issn.1672 6790.2023.04.030Areviewofall causemortalitypredictionmodelsintheolderadultsLiYuanyuan,LiuXiaohongDepartmentofGeriatrics,PekingUnionMedicalCollege,ChineseAcademyofMedicalSciences,PekingUnionMedicalCol legeHospital,Beijing100730,ChinaCorrespondingauthor:LiuXiaohong,Email:xhliu41@sina.com[Abstract] Optimizinghealthcareinolderadultsiscomplexandmusttakeintoaccounttheirprognosis.Predic tionmodelscanprovidedeterminantsforshared decisionmakingandestablishthemostbeneficialcareoptions.Severalmortalitypredictionmodelshavebeendevelopedfordifferentsettingsofolderadults,includingthecommunity,inpatient,andlong termcare.Andsomemodelshavebeenvalidatedandgeneralized.ButthereisalackofrelevantresearchinChineseMainland.Inthispaper,wereviewthecontent,accuracy,andapplicabilityofmortalitypredictionmodels,topro videthefoundationfordevelopingamortalitypredictionmodelapplicabletotheChineseelderlypopulation.[Keywords] Death;Models,theoretical;Terminalcare;Aged;Review 老年人群因衰老、患多种慢性疾病、功能减退等原因,利用医疗保健资源远高于成年人[1]。
基于机器学习的SAE患者30天死亡风险预测模型
第13卷㊀第3期Vol.13No.3㊀㊀智㊀能㊀计㊀算㊀机㊀与㊀应㊀用IntelligentComputerandApplications㊀㊀2023年3月㊀Mar.2023㊀㊀㊀㊀㊀㊀文章编号:2095-2163(2023)03-0231-05中图分类号:TP181文献标志码:A基于机器学习的SAE患者30天死亡风险预测模型刘㊀彬1,肖晓霞1,2,龚后武3,周㊀展1,郑立瑞1,谭建聪1(1湖南中医药大学信息科学与工程学院,长沙410208;2湖南中医药大学中医学国内一流建设学科,长沙410208;3东华医为科技有限公司,北京100089)摘㊀要:脓毒症相关性脑病(SAE)是指在患脓毒症过程中发生的脑功能障碍,其与脓毒症患者短期死亡率的上升有关㊂本文从MIMIC数据库中抽取相关的脓毒症患者数据,其中SAE被定义为患脓毒症且GCS分数小于15分㊂使用RFE算法筛选出影响SAE患者30天死亡率的危险因素,对SAE病例数据采用逻辑回归㊁GBDT㊁XGBoost三种算法建立30天死亡风险预测模型㊂实验结果表明,GBDT算法的预测效果优于另外2种算法,其准确率为78.6%,AUC为78.3%,该模型能够对SAE患者30天死亡情况进行较为准确的预测㊂关键词:脓毒症;脓毒症相关性脑病;MIMIC数据库;逻辑回归;随机森林30-daymortalityriskpredictionmodelforSAEpatientsbasedonmachinelearningLIUBin1,XIAOXiaoxia1,2,GONGHouwu3,ZHOUZhan1,ZHENGLirui1,TANJiancong1(1SchoolofInformationScienceandEngineering,HunanUniversityofChineseMedicine,Changsha410208,China;2TheDomesticFirst-classDisciplineConstructionProjectofChineseMedicine,HunanUniversityofChineseMedicine,Changsha410208,China;3DHCMediwayTechnologyCo.,Ltd.,Beijing100089,China)ʌAbstractɔSepsisrelatedencephalopathy(SAE)referstobraindysfunctionoccurringinthecourseofsepsis,whichisrelatedtotheriseofshort-termmortalityinsepsispatients.Inthispaper,thedataofsepsispatientsareextractedfromtheMIMICdatabase,whereSAEisdefinedashavingsepsisandGCSscoreislessthan15.TheRFEalgorithmisusedtoscreenouttheimportantfactorsaffectingthe30daymortalityofSAEpatients,andthelogisticregression,GBDT,XGBoostareusedtoestablishthe30daymortalityriskpredictionmodelforSAEpatients.TheexperimentalresultsshowthatthepredictioneffectofGBDTalgorithmisbetterthanotheralgorithms,withanaccuracyof78.6%andanAUCof78.3%.Thismodelcanaccuratelypredictthe30daymortalityofSAEpatients.ʌKeywordsɔsepsis;SAE;MIMICdatabase;logisticregression;RandomForest基金项目:2017年科技部十三五重点研发计划(2017YFC1703300);大规模跨模态医疗知识管理㊂作者简介:刘㊀彬(1997-),男,硕士研究生,主要研究方向:数据挖掘㊁自然语言处理;肖晓霞(1977-),女,博士,副教授,主要研究方向:中医智能诊断㊁人工智能㊁生物医学工程等㊂通讯作者:肖晓霞㊀㊀Email:amily_x@hnucm.edu.cn收稿日期:2022-10-170㊀引㊀言脓毒症是由感染引起的全身炎症反应综合征,全球发病率较高,每年患脓毒症的人数约为3100万,住院病死率约为17%[1]㊂脓毒症相关性脑病(SAE)是指在患脓毒症过程中发生的脑功能障碍,是一种比较严重的脓毒症并发症,也是造成脓毒症患者死亡的独立危险因素[2]㊂并与人体行为㊁记忆㊁认知功能的长期损害密切相关,给患者的家庭和社会带来沉重的经济负担㊂仍需指出的是,SAE患者的死亡率往往高于只患脓毒症的患者㊂格拉斯哥昏迷评分法(GlasgowComaScale,GCS)是一种用来评估病人昏迷程度的方法,满分为15分[3],表示意识清楚;12 14分表示轻度意识障碍;9 11分表示中度意识障碍;8分以下为昏迷㊂Eidelman等学者[4]的研究表明脑病与医院死亡率的增加成正相关性,当格拉斯哥昏迷评分(GCS)为15分时,死亡率为16%,而当GCS分数为3到8分时,死亡率为63%㊂Sonneville等学者[5]的研究也得出了类似的结论,研究显示当GCS分数为15时,患者30天生存率为67%;当GCS分数为3 8分时,30天生存率下降到32%㊂即使发生轻度意识障碍(GCS分数为12 14)也是影响30天死亡的一个独立危险因素㊂综上表明,SAE对于脓毒症患者短期死亡率的增加是有影响的,而这将进一步影响患者的健康,同时加重医疗资源的消耗㊂基于上述问题,识别出短期死亡率较高的SAE患者,有利于及时进行医疗干预,对于改善这类患者的预后也具有重要的意义㊂因此本研究的主要目的是通过大型的临床数据库MIMIC去提取相应的SAE患者数据,然后通过rfe算法[6]对相应特征进行筛选,选出影响SAE患者30天死亡率的重要特征,最后基于这些特征构建机器学习模型,用于改善SAE患者的预后㊂1㊀算法原理1.1㊀RFE特征筛选特征递归消除(RecursiveFeatureElimination,RFE)是一种用来衡量特征变量重要性的方法,通过重复构建模型,逐步迭代选出最重要的特征变量,能够寻找出最优的特征子集,剔除不重要的特征变量㊂具体运算步骤如下:(1)设定需要进行选择的特征数㊂(2)选择一个基模型来进行多轮训练,每次训练将J(k)=(wk)2作为每个特征的排序准则,并且每次迭代去除排序最后需要移除的特征数量㊂(3)基于新的特征集进行下一轮训练,直至特征个数为特征设定值㊂本文选择的基模型为XGBoost模型,对总计17个特征进行筛选㊂1.2㊀逻辑回归逻辑回归[7]是一种广义的线性回归模型,属于机器学习中的监督算法,主要是用来解决二分类问题㊂该算法首先通过输入数据拟合出一条直线z=wTx+b,显然这样的函数图像是一条斜线,难以达到最终想要的结果(0或1),于是要将z通过一个函数映射成0 1之间的数,这个函数就是sigmoid函数,式子如下:g(z)=11+e-z(1)㊀㊀然后,通过极大似然估计推导出损失函数:㊀J(w)=min(-1nðni=1[yi(wTx+b)-ln(ewTx+b+1)])(2)最后,通过梯度下降法求解出式(2)中的参数,从而解决了二分类问题㊂1.3㊀GBDTGBDT(GradientBoostingDecisionTree)是一种基于决策树的集成算法㊂算法采用将基函数线性组合的方法[8],在训练过程中使得残差不断地减小,最终实现数据回归或者分类㊂GBDT算法的训练过程具体如图1所示㊂融合模型加权学习基分类器铨部样栵基分类器学习加权图1㊀GBDT算法训练过程Fig.1㊀GBDTalgorithmtrainingprocess㊀㊀GBDT通过多轮迭代,产生多个弱分类器,每个分类器在上一轮分类器的梯度(如果损失函数是平方损失函数,则梯度就是残差值)基础上进行训练㊂弱分类器一般会选择CARTTREE(分类回归树),这种树具有结构简单㊁高偏差㊁低方差的特点,因此十分适合用于GBDT算法的训练中㊂1.4㊀XGBoostXGBoost算法[9]是在GBDT算法的基础上发展而来的,主要改进有:算法不仅可以使用CART分类回归树,还能使用线性基础模型;在目标函数中加入了正则化项,用来防止模型出现过拟合;借鉴了随机森林的原理,支持列抽样,不仅能降低过拟合,还能够减少模型的计算量;考虑到了训练数据为稀疏值的情况,能为缺失值指定分支的默认方向,从而提高算法效率㊂2㊀数据与方法2.1㊀数据来源MIMIC[10](MedicalInformationMartforICU)是一个大型的㊁免费提供的数据库,其中包括来自美国马萨诸塞州波士顿贝斯以色列女执事医疗中心重症监护病房住院病人的高质量健康相关数据,数据包括生命体征㊁药物㊁化验数据㊁护理人员的观察和记录㊁输液㊁手术㊁诊断代码㊁成像报告㊁住院时间㊁生存数据㊂MIMIC数据库到现在已经发布4个版本㊂MIMIC-II中包含2001 2008年的数据,MIMIC-Ⅲ232智㊀能㊀计㊀算㊀机㊀与㊀应㊀用㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第13卷㊀包含2001 2012年的数据,MIMIC-IV包含2008 2019年的数据㊂本文将基于MIMIC-IV数据库抽取相应的SAE患者数据㊂2.2㊀数据抽取SAE被定义为脓毒症患者中GCS分数小于15的患者㊂研究使用的主要软件为NavicatPremium(15.0.12版本),按照关键字[11] s-epsis ㊁ severesepsis ㊁ septicshoc-k 从数据库中搜索被诊断为 脓毒症 ㊁ 严重脓毒症 ㊁ 脓毒症休克 患者的原始数据㊂根据以往研究,确定好纳排标准后进一步筛选患者㊂患者筛选的详细过程如图2所示㊂被诊断为“脓毒症”、“严重脓毒症”、“脓毒症休克”的患者(n =13360)剩余7681例进行继续筛选排除下列病人:未入住I C U (n =3068)入住I C U 时间少于24h (n =1672)患有关脑部疾病(n =939)排除下列病人:患有精神疾病(n =120)酒精中毒、滥用药物(n =29)患癫痫(n =360)患高钠血症(n =971)患肝病(n =2)血糖数据缺失,血糖值大于180m g /d l ,血糖值小于54m g /d l (n =1351)血清值小于120m m o l /l (n =37)没有G C S 评分(n =3)30天死亡(n =492)30天存活(n =1639)2131例S A E 患者被纳入最终队列,并进行下一步分析经过纳排后,最终剩余4808例脓毒症患者,非S A E 患者2677例,S A E 患者2131例图2㊀患者筛选图Fig.2㊀Patientscreening㊀㊀确定最终的SAE患者后,根据此前的研究文献,从MIMIC数据库中提取患者首次入院时对应的年龄(anchor_age)㊁性别(gender)㊁住院天数(day)㊁葡萄糖(glucose)㊁钠(sodium)㊁GCS分数(gcs)㊁血小板(platelet)㊁肌酐(creatinine)㊁血红蛋白(hemoglobin)㊁钾(potassium)㊁血尿素氮(BUN)㊁白细胞(WBC)㊁乳酸盐(lactate)㊁血浆凝血酶原时间(PT)㊁心率(heart_rate)㊁血氧饱和度(spo2)㊁呼吸速率(respiratory_rate)㊁30天是否死亡(morality)㊂数据总计17个特征属性,再加一个类别标签属性,其中类别标签表明患者是否在患病30天内死亡㊂2.3㊀数据预处理提取了数据后,对数据的缺失情况进行统计,结果见表1㊂表1㊀数据缺失情况表Tab.1㊀Datamissingtable特征缺失数缺失比例/%血小板60.12肌酐10.02血红蛋白50.10血尿素氮30.06白细胞60.12血氧饱和度130.27乳酸盐95419.84凝血酶原时间3657.59心率90.18呼吸频率120.25㊀㊀从表1的结果中可以看出10个特征存在数据缺失的问题,缺失最多的特征是乳酸盐,缺失比例为19.84%,缺失最少的是肌酐,仅缺失一例㊂根据文献[8]中对缺失数据的处理方法来看,缺失特征比例均小于20%,予以保留,并统一采用平均值对其进行填补,在此基础上将对数据进行具体分析㊂3㊀结果3.1㊀纳入病例的基本信息总计纳入4808例脓毒症患者,其中2131例为SAE患者㊂SAE患者年龄为19 91岁之间,中位年龄数为68岁㊂男性为1127例,女性为1004例㊂30天内死亡病例为492例,存活病例为1639例,数据分布较为均衡㊂3.2㊀筛选得到的特征变量根据RFE特征筛选,每一轮筛选移去特征系数(wk)2最小的特征,直到特征个数为设定值㊂结果显示,当特征数设定为13时,3个模型中GBDT的AUC值最高,其在测试集上AUC为0.783㊂此时选出的13个特征分别为:年龄㊁住院天数㊁钠㊁GCS分数㊁血小板㊁肌酐㊁钾㊁血尿素氮㊁乳酸盐㊁血浆凝血酶原时间㊁血氧饱和度㊁心率㊁呼吸速率㊂3.3㊀实验结果将SAE数据集按照7:3的比例随机划分为训练集和测试集进行训练㊂本文采用的评价指标为准确率㊁P值㊁R值㊁F1值㊁AUC值㊂具体的实验结果见表2㊁表3㊂332第3期刘彬,等:基于机器学习的SAE患者30天死亡风险预测模型表2㊀未进行特征筛选结果Tab.2㊀Nofeaturefilteringresults算法AccuracyPrecisionRecallF1ScoreAUCLR76.143.023.930.872.2XGBoost77.749.533.840.275.5GBDT79.154.733.141.277.4表3㊀特征筛选后结果Tab.3㊀Resultsafterfeaturescreening算法AccuracyPrecisionRecallF1ScoreAUCLR77.749.323.932.272.5XGBoost78.351.634.541.473.8GBDT78.652.931.739.678.3㊀㊀从表2和表3中可以看出,数据集经过特征筛选后,3个模型的某些指标得到了提高㊂逻辑回归模型的准确率提高了1.6%㊁精度提高了6.3%㊁F1值提高了1.4%㊁AUC值提高了0.3%;XGboost模型的准确率提高了0.6%㊁精度提高了2.1%㊁召回率提高了0.7%㊁F1值提高了1.2%;GBDT模型的AUC值提高了0.9%㊂为了更直观地比较3个不同算法的性能,绘制的ROC曲线如图3所示㊂L R 的A U C 值为0.725G B D T 的A U C 值为0.783X G B 的A U C 值为0.7381.00.80.60.40.200.20.40.60.81.0假正例真正例图3㊀3种分类算法的ROC曲线Fig.3㊀ROCcurvesofthreeclassificationalgorithms㊀㊀从图3中可以看出,在3个算法中GBDT算法的AUC值最大㊁为0.783,说明GBDT算法性能最优,更适合用于SAE患者30天死亡预测㊂4㊀分析与讨论在这项基于MIMIC-IV数据库的研究中,从MIMIC数据库中抽取出对应的SAE患者数据,然后使用了RFE特征选择,筛选出了与SAE患者30天死亡率相关的危险因素,最后基于这些特征建立了3个机器学习模型去对SAE患者30天死亡进行预测㊂其中,GBDT算法对于SAE患者30天死亡预测效果最佳,其精度为52.9%,准确率为78.6%㊁AUC值为78.3%,3个指标均为不同算法中最高的㊂与其它研究方法进行对比,文献[3]提出的列线图模型在训练集上的AUC值为0.763,在验证集上的AUC值为0.753,均比本文提出的GBDT算法的AUC值略低㊂说明本文提出的模型性能更优㊁泛化能力也更强㊂目前,对于SAE的治疗是具有挑战性的,有许多关于脓毒症的指南列出了各种治疗脓毒症的建议,但却很少有治疗SAE的建议㊂有关SAE患者死亡预测的研究也较为匮乏,本研究很好地弥补了这方面的空白㊂从应用价值来看,本文提出的GBDT预测模型能够辅助临床医生去评估SAE患者的预后,从而制定出相应的治疗措施,降低患者死亡率㊂一旦研究出针对SAE的具体治疗方法,该模型的应用价值就会更高㊂未来可以开发一款能嵌入电子医疗系统的软件,该软件能够在不增加临床医生工作时间和负担的情况下,辅助临床医生及时治疗SAE㊂5㊀结束语本文基于MIMIC数据库,提取相应的脓毒症患者数据,并通过GCS分数进一步筛选出SAE患者的数据㊂然后经过RFE特征筛选,筛选出13个重要的特征㊂使用逻辑回归㊁XGBoost㊁GBDT三种算法基于筛选后的特征进行建模,实验结果表明,GBDT算法更适合用于SAE患者30天死亡预测,其AUC值为78.3%,高于其他2种算法,也比其他文献中的方法略好㊂对于SAE患者的预后具有一定的参考价值㊂本次研究也存在局限性,即只对该数据库进行了内部验证,在今后的研究中还需要根据其它的数据进行外部验证,以进一步检验模型的鲁棒性和性能㊂参考文献[1]FLEISCHMANNC,SCHERAGA,ADHIKARINK,etal.Assessmentofglobalincidenceandmortalityofhospital-treatedsepsis.currentestimatesandlimitations[J].AmericanJournalofRespiratoryAndCriticalCareMedicine,2016,193(3):259-272.[2]周艺蕉,杨春燕,苏美仙.脓毒症相关性脑病脑功能监测的研究进展[J].医学综述,2022(16):3246-3251.(下转第241页)432智㊀能㊀计㊀算㊀机㊀与㊀应㊀用㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第13卷㊀[6]REDMONJ,DIVVALAS,GIRSHICKR,etal.Youonlylookonce:unified,real-timeobjectdetection[C]//ProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition.NewYork:IEEE,2016:779-788.[7]REDMONJ,FARHADIA.YOLO9000:Better,faster,stronger[C]//ProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition.NewYork:IEEE,2017:6517-6525.[8]REDMONJ,FARHADIA.YOLOV3:Anincrementalimprovement[C]//Proceedingsofthe2018IEEEConferenceonComputerVisionandPatternRecognition.SaltLakeCity,Utah:IEEE,2018:1-6.[9]BOCHKOVSKIYA,WANGCY,LIAOHYM.YOLOv4:Optimalspeedandaccuracyofobjectdetection[C]//ProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition.NewYork:IEEE,2020:1-17.[10]LIUWei,ANGUELOVD,ERHAND,etal.SSD:singleshotmultiboxdetector[M]//LEIBEB,MATASJ,SEBEN,etal.ComputerVision-ECCV2016.ECCV2016.LectureNotesinComputerScience().Cham:Springer,2016,9905:21-37.[11]LINTY,GOYALP,GIRSHICKR,etal.Focallossfordenseobjectdetection[C]//Proceedingsofthe2017IEEEInternationalConferenceonComputerVision.Piscataway:IEEE,2017:2999-3007.[12]杨传礼,张修庆.基于机器视觉和深度学习的材料缺陷检测应用综述[J].材料导报,2022,36(16):226-234.[13]戚银城,武学良,赵振兵,等.嵌入双注意力机制的FasterR-CNN航拍输电线路螺栓缺陷检测[J].中国图象图形学报,2021,26(11):2594-2604.[14]王宸,张秀峰,刘超,等.改进YOLOv3的轮毂焊缝缺陷检测[J].光学精密工程,2021,29(08):1942-1954.[15]李鑫,汪诚,李彬,等.改进YOLOv5的钢材表面缺陷检测算法[J].空军工程大学学报(自然科学版),2022,23(02):26-33.[16]刘群坡,方源,张建军,等.基于特征融合SSD的微电连接器缺陷检测[J].华中科技大学学报(自然科学版),2022,50(03):49-54.[17]HEKaiming,ZHANGXiangyu,RENShaoqing,etal.Spatialpyramidpoolingindeepconvolutionalnetworksforvisualrecognition[J].IEEETransactionsonPatternAnalysis&Machineintelligence,2015,37(9):1904-1916.[18]ZHENGZhaohui,WANGPing,LIUWei,etal.Distance-IoUloss:fasterandbetterlearningforboundingboxregression[C]//Proceedingsofthe34thAAAIConferenceonArtificialIntelligence.NewYork:AAAI,2020:12993-13000.[19]LINTY,DOLLÁRP,GIRSHICKR,etal.Featurepyramidnetworksforobjectdetection[C]//Proceedingsofthe2017IEEEConferenceonComputerVisionandPatternRecognition(CVPR).Honolulu,USA:IEEE,2017:936-944.[20]LIUShu,QILu,QINHaifeng,etal.Pathaggregationnetworkforinstancesegmentation[C]//ProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition.SaltLakeCity,UT,USA:IEEE,2018:8759-8768.(上接第234页)[3]YANGYang,LIANGShengru,GENGJie,etal.Developmentofanomogramtopredict30-daymortalityofpatientswithsepsis-associatedencephalopathy:Aretrospectivecohortstudy[J].JournalofIntensiveCare,2020,8(1):1-12.[4]EIDELMANLA,PUTTERMAND.Thespectrumofsepticencephalopathy[J].JournaloftheAmericanMedicalAssociation,1996,275(6):470-473.[5]SONNEVILLER,MONTMOLLINED,POUJADEJ,etal.Potentiallymodifiablefactorscontributingtosepsis-associatedencephalopathy[J].IntensiveCareMedicine,2017(8):1075-1084.[6]綦方中,俞婷婷,朱国荣.一种基于RFE特征选择的PSO-SVR用电需求预测模型[J].计算机应用研究,2020,37(S1):105-107.[7]郭志恒,刘青萍,刘芳,等.基于机器学习算法的脑卒中疾病早期预测模型研究[J].计算机与数字工程,2021,49(11):2180-2183,2247.[8]夏冰.基于GBDT算法的空气冲旋钻井机械速度预测方法[J].制造业自动化,2022,44(03):185-188.[9]王延安,刘庆芳,成卫.基于XGBoost算法的道路交通事故严重程度预测[J].软件导刊,2022,21(05):84-88.[10]张家艳,郑建立,郑西川,等.MIMIC数据库智能挖掘研究概述[J].计算机技术与发展,2020,30(01):144-148.[11]HOUNanzong,LIMingzhe,HELu,etal.Predicting30-daysmortalityforMIMIC-IIIpatientswithsepsis-3:AmachinelearningapproachusingXGboost[J].JournalofTranslationalMedicine,2020,18(1):462.142第3期李俊杰,等:基于改进YOLOv3的电容表面缺陷检测方法。
中国老年人口死亡率的建模分析
中国老年人口死亡率的建模分析黄佩佩;郑静【摘要】基于1963—2014年60岁到110岁人口死亡率,采用k-means聚类方法,以余弦相似度为距离函数,将其聚为3类,针对每类采用时间序列分析的方法进行建模.每类中分别选取62岁,86岁和94岁的死亡率数据,利用1963—2006年数据进行建模,并用2007—2014年数据进行验证,其样本内拟合精度和检验样本预测精度都比较好,从而验证了所建模型的有效性和可行性.最后用该模型预测了2015—2020年62岁,86岁和94岁的人口死亡率.【期刊名称】《杭州电子科技大学学报》【年(卷),期】2017(037)005【总页数】5页(P92-96)【关键词】死亡率;K-means聚类;ARIMA模型【作者】黄佩佩;郑静【作者单位】杭州电子科技大学理学院 ,浙江杭州310018;杭州电子科技大学理学院 ,浙江杭州310018【正文语种】中文【中图分类】O213人口死亡率一直是社会关注的一个焦点问题.随着生活水平的提高和医疗卫生条件的改善,人类死亡率呈下降趋势,寿命不断延长.1981—2010年,根据《中国统计年鉴》数据显示,我国人均寿命从66.77岁上升至74.83岁,如果按同样的速度增长,到2100年,我国的人均寿命将超过95岁.老年人口死亡率的准确预测为我国社会养老及医疗卫生预算提供了一定的理论依据.目前,人类死亡率预测模型主要有2类,分别为Lee-Carter模型及其改进和时间序列模型.Lee-Carter模型给出了不同年龄的对数死亡率关于时间的函数关系,其得到了广泛的应用,是当今世界上最流行的死亡率预测模型.但其也有一定缺陷,用一个模型来模拟所有年龄人口死亡率,只能有局部代表意义,一些年龄模型的误差较大,其人口死亡率预测不准确.文献[1]以中国人口生命表为基础,对2010年的人口按龄死亡模式进行修正,研究发现2010年中国人口死亡率下降至5.58‰.文献[2]介绍了预测死亡率常用的Lee-Carter模型的应用,估计其方法及预测原理,并选用该模型对我国未来人口死亡率进行了预测,结果表明未来人口死亡率将持续降低.文献[3]对Lee-Carter模型进行了完整的理论研究,并给出了完整的Lee-Carter模型理论分布和区间预测表达式,相比于传统Lee-Carter预测方法,得到的预测区间较宽,长寿风险评估更为准确.基于以上讨论并结合以往国内外学者对人口死亡率的研究,本文采用时间序列分析的方法对60~110岁老年人口死亡率进行了研究.首先对原序列采用k-means聚类的方法,利用余弦相似度对不同年龄死亡率进行分类,进而对每一类分别进行分析建立模型,弥补了直接建模带来的不足.相对以往研究,此方法建立的模型误差较小,预测结果更为精确.1.1 k-means聚类的基本思想聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,性质差别较大的归为不同的类,以使簇内有较高相似度,而簇间相似度较低[4].本文聚类采用k-means聚类,其基本思想是:从n个数据中任意选取c个对象用来作初始聚类中心,每个对象初始的代表一个簇的平均值或者中心,剩余n-c个对象,根据其到各个簇的距离,将它们归类到距离最小的簇中心,然后重新计算每个簇的平均值,重复此过程,直至聚类准则函数收敛;准则函数通常为平方误差准则:其中,mk为簇C中的均值,n为数据个数,c为选取对象个数,即1.2 余弦相似度本文k-means聚类中距离采用余弦相似度度量.余弦相似度是用向量空间中2个向量的夹角余弦作为衡量2个向量之间的贴合程度,其相似度度量为:其中,x1k,x2k为2个向量第k维的值,n为向量的个数,且cos θ的取值范围为[0,1].余弦值越大,对象间的相似度越大;余弦值越小,对象间的相似度越小.本文选用自回归移动平均模型即ARMA模型[5],它是由自回归模型AR和移动平均模型MA组成,其基本公式为:其中,p为自回归模型的阶数,φi为自回归系数,yt-i为时间序列在t-i期的观察值,et为不能用模型说明的随机扰动,q为移动平均模型的阶数,θi为移动平均系数,et-i为第t-i个时期进入系统的随机扰动.建立ARMA模型要求时间序列具有平稳性.原序列是不平稳的,通过差分使序列达到平稳;经过差分后建立的ARMA(p,q)模型称为求和自回归移动平均模型即ARIMA(p,d,q).3.1 数据分析与处理本文研究的老年人口死亡率数据从http://www.mortality.org/下载,数据为1963—2014年60~110岁人口死亡率,文中所有算法实现都是由R语言来实现.数据较多,首先对数据采用k-means聚类方法.由于考虑到人口死亡率的走势图,将1963—2014年死亡率走势相近的年龄聚为一类.这样,每类建立一个模型,并用该模型预测该类中其他年龄死亡率.基于以上特点,聚类中的距离采用余弦相似度,将数据聚为3类,分别为60~80岁、81~90岁、91~110岁.分别对3类数据采用时间序列方法进行分析.分别选取62岁、86岁和94岁数据作为每一类的代表序列进行建模,选取1963—2006年数据作为建模样本,2007—2014年数据作为测试样本来评估模型的优劣,并由模型预测2015—2020年老年人口死亡率.由R软件的单位根检验函数adf.test知,62岁、86岁和94岁死亡率数据的置信水平P值依次为0.838 8,0.380 7和0.539 5,从而数据为非平稳序列.接着对序列进行一阶差分得到的新序列Yt的P值依次为0.021 2,0.202 5和0.156 0,从而得到62岁的一阶差分序列为平稳序列,但86岁和94岁的一阶差分序列为非平稳序列.然后再对86岁和94岁数据进行二阶差分,得到序列的P值均为0.010 0,则其为平稳序列.3.2 模型建立与检验3.2.1 模型诊断模型诊断主要包括显著性检验和残差分析等[6].参数显著性检验就是检验参数是否显著异于零.如果参数不显著,说明影响不明显,将其从模型中删除;如果参数显著异于零,则将其保留在最终模型中.对于ARMA(p,q)模型,标准化残差为:其中,为白噪声的标准差估计值.令是标准化残差的样本自相关函数,将与2(95%置信水平)进行比较,若则存在k阶自相关.在判断ARMA(p,q)模型是否充分时,采用检验多个自相关系数是否联合为零的假设,相应零假设和备择假设为:H0:ARMA(p,q)是充分的.H1:ARMA(p,q)是不充分的.若ARMA(p,q)模型正确设定,则Ljung-Box统计量服从于自由度为K-p-q的卡方分布[6].若则拒绝H0,表明模型是不充分的;否则,ARMA(p,q)模型是正确设定的.3.2.2 模型建立与检验经过差分并由ADF检验得到62岁为一阶平稳序列,86岁和94岁为二阶平稳序列,即62岁、86岁和94岁序列的d分别为1,2,2,且新序列的ACF和PACF如图1所示.由图1、图2可以看出,新序列的自相关函数和偏自相关函数都是拖尾的[7],因此可建立ARMA模型,计算所有模型的AIC值,记下AIC最小时所对应的p,q.对62岁序列,当p=1,q=2时,AIC值最小,故此模型为ARIMA(1,1,2);而86岁和94岁序列都是当p=1,q=1时,AIC值最小,故这2类模型均为ARIMA(1,2,1).对模型的参数进行最小二乘估计,得到估计参数结果如表1所示.在表1中,ARIMA(1,1,2)62,ARIMA(1,2,1)86和ARIMA(1,2,1)94分别为62岁、86岁和94岁老年人口死亡率模型的参数估计,从数值中可以看出,对于任一模型,参数都显著异于零,则由参数显著性检验知参数对模型影响显著.然后用这3类模型分别预测2007—2014年62岁,86岁和94岁老年人口死亡率,预测结果如图3所示.从图3中可以看出,3个模型对于2007—2014年数据拟合效果较好,预测值与真实值在误差允许的范围内几乎接近一致.进一步通过sarima函数检验3类模型的残差自相关性,3类模型的白噪声方差估计值分别为0.001 8,0.078 2,0.460 4.Ljung-Box统计量结果表明,3类模型均在自由度为6的情况下,残差已经不存在自相关性,且P值分别为0.216 8,0.140 6和0.151 0,所有值远远大于5%,则残差有很好的独立性.由模型诊断的理论可知,这3类模型都是正确设定的.其中94岁模型的死亡率出现突然上升的情况,并且上升的时间正好处于2003年附近,这与此时间段内发生的非典疫情相吻合,而该年龄的人口基数小导致上升的最为明显.3.2.3 类模型的误差分析对上述所建3类模型进行误差分析,分别用R软件计算出模型误差与检验误差,来检验模型的优劣.3类模型的模型误差与检验误差如表2所示.从表2可以看出,3类模型中,模型误差和检验误差都比较小,则表明样本内拟合精度和检验样本预测精度都比较高,进一步说明所建模型是正确的.3.3 老年人口死亡率预测值由以上分析,3类模型样本内拟合精度和检验样本预测精度都比较好,实验结果表明该模型构造是充分的,所以其可用于预测.分别用此模型预测2015—2020年老年人口死亡率,如表3所示.由于聚类所选距离设定为余弦相似度,因此,其他年龄人口死亡率可代入相关参数来预测.由于模型样本内拟合精度和检验样本预测精度都比较高,所以此预测值具有一定的参考意义.本文提出了用ARIMA模型预测老年人口死亡率.通过研究表明,所建立的模型能较为准确地描述老年人口死亡率所呈现的特征,为保险公司企业退休金及商业保险提供了理论依据,对其制定决策有一定的参考价值;其次,预测值对国家社会养老保险及医疗卫生预算也有重大意义.【相关文献】[1] 张文娟,魏蒙.中国人口的死亡水平及预期寿命评估——基于第六次人口普查数据的分析[J].人口学刊,2016,38(3):18-28.[2] 苏华,赵文.我国死亡率预测与长寿风险[J].经营管理者,2016,31(6):3-4.[3] 王志刚,王晓军,张学斌.Lee—Carter模型的理论分布和区间预测[J].数理统计与管理,2016,35(3):484-493.[4] TAN P N,STEINBACH M,KUMAR V.数据挖掘导论(完整版)[M].北京:人民邮电出版社,2011:310-314.[5] Cryer J D,Chan K S.时间序列分析及应用[M].潘红宇,译.北京:机械工业出版社,2011:63-133.[6] 赵华.时间序列数据分析:R软件应用[M].北京:清华大学出版社,2016:58-88.[7] 于宁莉,易东云,涂先勤.时间序列中自相关与偏相关函数分析[J].数学理论与应用,2007,27(1):54-57.。
标准化死亡率
标准化死亡率标准化死亡率的计算方法是将某一特定人群的实际死亡率与标准人群的死亡率进行比较。
标准化死亡率的计算公式为,SMR = (观察到的死亡人数 / 观察到的总人口)/ (标准人群的死亡率)。
标准化死亡率的计算需要考虑到人口的年龄结构、性别比例、人种构成等因素,以消除这些因素对死亡率的影响,从而更准确地比较不同人群之间的死亡率。
标准化死亡率的应用非常广泛,它可以用来评估某一特定疾病的死亡风险。
例如,研究人员可以计算不同年龄、性别、人种等特定群体的标准化死亡率,从而了解某一疾病对不同人群的影响程度。
这有助于制定针对性的预防和治疗策略,以降低特定人群的死亡风险。
此外,标准化死亡率还可以用来比较不同地区或不同时间段的死亡率差异。
通过计算和比较不同地区或不同时间段的标准化死亡率,可以发现可能存在的健康问题和疾病流行趋势,为公共卫生政策的制定提供科学依据。
在进行标准化死亡率的计算和分析时,需要注意一些问题。
首先,要选择合适的标准人群,以确保比较的准确性。
其次,要考虑到人口的年龄结构、性别比例、人种构成等因素,进行适当的标准化处理。
最后,要充分利用标准化死亡率的优势,深入分析不同人群之间的死亡率差异,为健康政策的制定和疾病预防控制提供科学依据。
总之,标准化死亡率是研究人口死亡情况的重要指标,它可以帮助我们更准确地了解不同人群之间的死亡风险,也可以用来比较不同地区、不同时间段或不同人群之间的死亡率差异。
在公共卫生领域,标准化死亡率的计算和分析对于制定预防措施、评估健康政策和监测疾病流行病学具有重要意义。
因此,我们应该充分利用标准化死亡率的优势,深入分析不同人群之间的死亡率差异,为健康政策的制定和疾病预防控制提供科学依据。
急性呼吸窘迫综合征患者死亡率预测的两阶段堆叠异构集成模型
急性呼吸窘迫综合征患者死亡率预测的两阶段堆叠异构集成模型张文正;孔平;宋燕;周亮;陈立范【期刊名称】《北京生物医学工程》【年(卷),期】2024(43)3【摘要】目的建立一个机器学习模型能够准确预测急性呼吸窘迫综合征(acute respiratory distress syndrome,ARDS)患者死亡风险,选取合适的填充方式解决现有电子健康记录(electronic health record,EHR)中存在的稀疏性、不规则性问题,辅助医生进行临床决策。
方法从重症监护医学信息数据库(medical information mart for intensive care,MIMIC-Ⅲ)中筛选符合“柏林定义”的ARDS患者,并对患者入院24 h内的生命体征、实验室指标、诊断代码、影像学报告等数据进行回顾性分析,首先使用非负潜在因子分解填补缺失值,然后构建两阶段的堆叠异构集成学习方法,预测患者30 d内的死亡风险,采用受试者工作特征曲线下面积(area under the receiver operation characteristic curve,AUROC)、准确度、精确度、F1值等指标对模型进行评价,并进行特征重要性分析。
结果本研究共纳入2576个患者,80%用于训练,20%用于模型测试。
利用不同填充方式对数据进行处理,非负潜在因子分解相较于其他填充方式能够更好地保留原数据的分布结构,有着更高的填充精度。
对填充好的数据进行建模,两阶段堆叠集成模型的准确度为0.841,AUROC 为0.846,F1值为0.586,相较于其他机器学习模型展示出了更好的预测能力。
结论两阶段的堆叠异构集成学习模型能够较好地实现对ARDS患者死亡风险预测。
【总页数】8页(P259-266)【作者】张文正;孔平;宋燕;周亮;陈立范【作者单位】上海理工大学健康科学与工程学院;上海健康医学院协同科研中心;上海理工大学光电信息与计算机学院【正文语种】中文【中图分类】R318.04【相关文献】1.外伤患者的急性呼吸窘迫综合征:ICU死亡率和预测因素2.肺损伤预测评分联合不同潮气量机械通气治疗非急性呼吸窘迫综合征(ARDS)急性呼吸衰竭患者的临床分析3.重症谵妄预测模型框架下的风险分级预防护理对急性呼吸窘迫综合征患者机械通气时间及睡眠质量的影响4.ICU住院患者重度急性呼吸窘迫综合征早期预测模型的构建5.重庆市新型冠状病毒肺炎患者并发急性呼吸窘迫综合征风险预测模型的建立因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一
、
| 臣 7l
I士
部 分人群 的死 亡情 况 , 中 , ( =B B>0 c 其 ) c , ,>
在世 界各 国 , 据过 去 经验 数 据 和模 型 对 未来 依
1 , ≥0 o pr 。G m e z函数 和 经 验 数据 的 良好 拟 合 , t 表 明存 在一 种“ 亡 率法 则 ” 可 以描 述 分年 龄 死 亡率 死 ,
本 文 回顾 和 总结 了各类 死 亡率 预测模 型 , 对死 亡率预 测模 型的最 新 进 展 做 出评 述 , 同时 对 中 国死 亡率 预测模 型 的选 取给 出 了建 议 。
poet nmo e ,te ie o e c mmet o h e eeo met o r ly poe t n moes a d p t fr ad sm rjci d l h n gv ssm o o s ns n te nw dv lp ns fmot i rjci dl n us ow r o e at o
Ne vlp nso rai rjcinMo e w Deeo me t nMotlyP oet d l t o
Wa gX ajn& C i h n go n iou a Z e ga
Abtat I h at af e tr ,p p lt nmotlyhso vo sd ciet n ntew r sr c :ntep s h lc nuy o uai r i a b iu el r d i h ol h rjcinb rdt nl o at n e d.T epoet yt io a o a i
内容 提 要 :0世 纪 后 半 叶 以来 , 界 范 围 内 , 口死 亡 率 整 体 上 呈 现 下 降 趋 势 。 而依 据 传 统 死 亡模 型 对 死 亡 率 2 世 人 的预 测 往 往 高 于 实 际 水 平 , 给 养 老 金 财 务 安 排 和 养 老 年 金 的成 本 核算 带 来 了严 重 的 不 利 影 响 。 本文 沿 着 死 亡 率 这 模 型 的发 展 轨 迹 , 回顾 和总 结 了各 类 死 亡 率 预 测 模 型 , 死 亡 率 预 测 模 型 的 最 新 进 展 做 出 评 述 , 对 中 国 死 亡 率 预 对 并
划的基 础 , 政府 养 老 金 制度 、 主 职业 年 金 、 险 对 雇 保 公 司 的团体 和个人 养 老 金 业务 等 都 有 重要 的影 响 ,
关 系 到各类 养老计 划 的财务安 全 和可持续 发展 。
改进 , 死 亡 函 数 中 添 加 了一 个 常 数 项 。其 中 , 在
的变动 。 16 80年 , khm对 G m e z模 型 进行 了 Maea o pr t
死 亡率 做 出的预测 大 多低 于实 际结 果 。死 亡率 的降 低 和预 期寿命 的延 长 , 别 是 死亡 率 的非 预期 性 降 特 低, 给养 老金 制度 安排 和养 老 年金 财 务 核算 带 来 无 法预期 的财 务压力 。死 亡率预 测作 为养 老金财 务规
s g e to s o h e e t n o ra i d l t o c s Ch n s r a i u g s i n n t e s l c i fmo lt mo e o f r a t i e e mo lt o t y t y.
Ke r s: tr nsi rai d l So h si rai d lW a ee r n fr y wo d Dee miitc mot ly mo e ; tc a t mo ly mo e ; t c t t v ltta som
测 模 型 的选 取 给 出 了建 议 。
关 键 词 : 定 型死 亡 率 模 型 ; 确 随机 死 亡 率 模 型 ; 波 转换 小
中图 分 类 号 :2 2 3 F2. 文 献 标 识 码 : A 文 章 编 号 :0 2 5 5 2 0 )9 0 0— 5 1 —4 6 (0 8 0 —0 8 0 0
维普资讯
第2 5卷 第 9期 20 0 8年 9月
统 计 研 究
S a sia s a c t f t lRe e r h i c
Vo . 5. No 9 12 . S p. 2 0展
王 晓 军 蔡 正 高
mo aiy mo esi e eal ih rta h cu llv l t r lt d l s g n rl hg e h n te a t a e e ,whc a s ss ro sifu n e o h e so i a ca ln n ot y ih c u e ei u nl e c n t e p n in fn n ilp a s a d c s c luaino nn ie . F lo n h e eo me tta e o rai d l ac lto fa ut s i olwig te d v lp n rc fmo tly mo es,t s p p rrve n ummaie a iu rai t hi a e e iwsa d s rzsv ro s motlt y
( )=A + 曰 B >0 C> 1 A≥ 一 B, ≥0 1 3 c, , , 。 99
年 , i l则 给 出 了 死 亡 力 的 幂 函 数 形 式 , 非 指 We ul b 而
数 增长 , 中 , ( =k k , 0 ≥0 其 ) x , >0 n> , 。
18 9 0年 , l ma Hei n和 P l r g ol d提 出 了 一 个 包 含 八 a