一个医保基金风险防控平台中的数据挖掘技术_高臻耀
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键词 数据挖掘 医保 风险防控
中图分类号 TP311
文献标识码 A
A DATA MINING TECHNIQUE ON THE MEDICAL INSURANCE FUND RISK PREVENTION AND CONTROL PLATFORM
பைடு நூலகம்
Gao Zhenyao1 Zhang Jingyi2 Lin Zhijie3 Xiong Yun3 Zhu Yangyong3
1 ( Shanghai Medical Insurance Information Center,Shanghai 200040,China) 2 ( Wonders Information Co. ,LTD. ,Shanghai 201112,China)
3 ( School of Computer Science,Fudan University,Shanghai 200433,China)
3 医保基金风险防控数据挖掘模型与算法
针对医保基金风险防控管理的需求,结合医保行业的领域 知识、经验以及特殊的数据分析需求,我们设计和实现了具有针 对性的医保基金风险防控数据挖掘算法,构建针对医保基金风 险防控的数据挖掘方法库 / 模型库,实现对医保数据的挖掘分 析,有效支持医保基金风险防控平台的预测和处理,有利于医保 基金风险防控平台对日常业务数据进行更有效的实时监控。
医保基金管理是一项复杂的工程,涉及面广、数据量大,除 管理参保人,还涉及各级医疗机构; 要负责个人账户的建立和使 用,还要负责基本医疗保险费的征收、管理和支付,并对基金的 使用进行监督[1]。如 何 从 复 杂 的 海 量 数 据 中 得 到 有 价 值 的 信 息,从而指导决策是需要解决的关键问题。本文针对医保基金 管理的主要环节,研究医保基金风险的主要影响因素,设计实现 了多种数据挖掘算法,建立了相应的数据挖掘方法库 / 模型库。 使医保基金风险 防 控 从 过 去 的 事 后 稽 查 变 为“事 前 预 测、事 中 监控、事后稽查”全过程的控制,对有效防范医保基金风险起到 支撑作用,为有效控制基金风险提供指导,对医保基金的运营和 监控具有重要作用。
( 1) 在数据仓库逻辑模型上,设计业务数据到“业务大集 中库”再到数据仓库的 ETL 过程的调整及优化,在实施上探索 在部分数据集市上做到实时或准实时( T + 0,或仅相差几小时) 动态数据仓库。在线分析业务从高层次的汇总表到具体明细数 据的连结。
( 2) 加强基金运营风险的管理,在收入分析方面,在考虑人 口变动( 不同险种、不同人群筹资比例,含人口老龄化预测) 、收 入预测( 宏观经济) 、退休政策变动( 退休年龄,在职退休比) 等 影响因素的基础上,对筹资进行分析及预测; 在支出分析方面,
2 医保基金风险防控平台
医保基金面临的风险因素多种多样,主要包括政策因素、运 营因素、供需矛盾因素、违规欺诈因素和运行支撑因素等。针对 以上风险因素,医保基金风险防控平台主要涉及政策风险、运营 风险、供需矛盾风险、违规欺诈风险防控等四个方面。医保基金 风险防控平台针对监控对象设置预警、报警规则,建立预警、报 警系统,使业务人员和决策层及时了解基金收支、基金运营中潜 在的风险,提高监控效率。其主要功能有:
Abstract Aiming at the key steps of medical insurance fund management and the major factors of fund risks and deriving from practical medical insurance businesses,the authors have designed a corresponding data mining algorithm and constructed medical insurance fund risk prevention and control model base and method base to prevent and control political risks,operational risks,supplier-demander contradictory risks and fraud violation risks; then through the validation-revision-application cycle to influence the medical insurance business system in order to perfectly build a medical insurance fund risk prevention and control mechanism in accordance with the medical insurance revolution and management and then co-construct a healthy circulation with the daily medical insurance business system on fund operation and surveillance which is instructive to the foundation construction of the building and operation of the medical insurance fund risk prevention and control system.
1) 医保结算费用预测模型 采用时间序列预测方法———自动回归整合移动平均 ARIMA( AutoRegression Integrated Moving Average) 模型,建立医保结 算费用预测模型,实现对医保结算总费用的预测,并能详细到各 区县、各级别医院医保结算费用的预测,为医保基金监管提供方 向。医保结算费用预测数据模型导入的数据包括各医院每月结 算费用、医保支付费用和总控内医保支付费用。在预测过程中 实施平稳性检测、差分处理、白噪声检测、拟合预测模型、序列预 测等几个关键技术,实现对未来三期的时间序列预测。具体实 施分以下步骤: ( 1) 从数据仓库应用数据模型中获取医保结算 费用的时间序列数据; ( 2) 对医保结算费用时间序列做平稳性 检测,若无法通 过 平 稳 性 检 测,则 对 结 算 费 用 序 列 实 施 差 分 处 理,即转步骤( 3) ,否则进行白躁声检测,即转步骤( 4) ; ( 3) 对 结算费用序列作差分处理直到序列平稳化; ( 4) 对差分后序列 进行白噪声检测。通过白噪声检测则生成模型,否则使用模型 建摸,即转步骤( 5) ; ( 5) 使用 ARMA 模型建模非白噪声序列; ( 6) 生成 ARIMA 拟合预测模型; ( 7) 根据最终拟合模型对医保 结算费用进行预测。 2) 医保风险评估( 参保人类别管理) 模型 设计聚类算法实现对参保人的经济情况、健康状况和信用 情况聚类,为参保人的分类提供依据。并且,随着参保人数据的 更新,需要多次应用该模型进行聚类以调整类别信息。 我们选择的聚类方法有 K-均值和 K-中心点方法。这些方 法均可指定生成簇个数的区间。最终通过实验验证,选择了适 合医保数据的实际情况,并且聚类结果较好的 Ward 聚类算法。 根据医保数据实验结果表明,由于数据量大,数据点十分密集,
3 ( 复旦大学计算机科学技术学院 上海 200433)
摘 要 针对医保基金管理的关键环节和基金风险的主要因素,从医保业务出发,开发了相应的数据挖掘算法,构建医保基金风 险防控的模型库和方法库,实现政策风险、运营风险、供需矛盾风险和违规欺诈风险防控。通过实施验证,不断修正并应用,从而全 面建立与医保改革和管理相适应的医保基金风险防控机制,与日常运行的医保业务系统共同构成了基金运营、监控的良性循环,为 医保基金风险防控系统的建设、实施奠定基础并提供借鉴意义。
Keywords Data mining Medical insurance Risk prevention and control
0引言
社会医疗保险制度作为社会保障体系的有机组成部分之 一,对保障公民基本医疗、促进社会公平和维护社会稳定有着重 要意义。随着国民收入的增加和医疗保险覆盖面的扩大,医保 基金规模不断增大。医疗保险由于其自身特点,逐渐面临着一 系列突出问题,如我国人口老龄化、疾病谱改变、新医疗技术的 采用和医疗需求的增长等原因造成医疗费用增长迅速,对医保 基金形成了较大压力。然而,医保特有的复杂的委托代理关系 和严重的信息不对称,使医疗费用控制难度加大,医保基金被浪 费、骗取、挪用等现象不同程度地存在,损害了医保基金的使用 效果和效率。因此,为维护参保人的基本医疗保险权益,减少浪 费,促进医保制度可持续发展,加强医保基金支付控制、增强医 保基金风险监控已成为非常紧迫的现实问题。
第 28 卷第 8 期 2011 年 8 月
计算机应用与软件 Computer Applications and Software
Vol. 28 No. 8 Aug. 2011
一个医保基金风险防控平台中的数据挖掘技术
高臻耀1 张敬谊2 林志杰3 熊 赟3 朱扬勇3
1 ( 上海市医疗保险信息中心 上海 200040) 2 ( 万达信息股份有限公司 上海 201112)
根据以收定支的原则,对医保基金支付趋势及预测、逐月的医保 支付、缓 付 的 计 算、医 保 基 金 支 付 预 警、基 金 支 付 方 式 分 析、测 算、各种支付方式的分析。
( 3) 针对部分医疗机构、医师、参保人员由于利益驱动造成 医保医药费用 浪 费 等 违 规 欺 诈 行 为,监 控 其 在 门 急 诊、住 院 挂 号、用药、检查、治疗、收费等可能存在漏洞指标数据,建立各种 违规筛选模型,为审核监督提供重点监督管理对象,提高审核监 督力度和效率。同时,建立参保者个人、定点医药机构、定点医 生相关信息档案,并进行综合评分,为充分了解不同参保人员的 情况,选择定点医药机构及其医生提供科学依据。
( 4) 为医保政策调控提供模拟测算平台,主要针对现有政 策调整( 微调) : 帐户注入定额、三条线调整、支付比例调整等的 测算。使决策层充分了解政策调控所涉及的人群、费用、医疗等 多方面的信息,为政策调控提供可靠依据。
( 5) 客户管理及信息评估。对参保个人考虑医保待遇、缴 费情况、健康状况、违规行为评估等指标; 对定点医药机构考虑 服务范围、服务量、服务能力、服务质量、违规评估等指标; 对定 点医生考虑服务能力、服务质量、违规情况评估等指标。
收稿日期: 2010 - 03 - 31。上海市科委科研计划基金项目( 085115 00203) ; 上海市重点学科建设项目( B114) 。高臻耀,主治医师,主研领 域: 数据挖掘,数据仓库。
第8 期
高臻耀等: 一个医保基金风险防控平台中的数据挖掘技术
121
1 相关工作
控制医疗保险基金风险是世界各国一直努力解决的难题。 发达国家的医疗保险基金风险控制工作起步较早,例如德国在 80 年代建立了医保预测预警系统,由于建立时间长,覆盖范围 广,征缴严格,基金收入环节存在的问题相对较少,预测预警的 重点主要集中 在 支 出 上[2]。 但 最 为 关 键 的 是 借 助 计 算 机 应 用 系统开展实时监测和预警分析。
目前有些地区也开发了一些控制或监控费用的系统,虽然 部分实现了费用监控功能,但仍存在一些不足: ( 1) 由于系统建 设的目的并不主要是费用监控,监控的效果非常有限。( 2) 采 用的实现技术并不适合医保费用监控业务。
从长远看,医保基金管理仍面临着巨大压力,潜在因素主要 有: ( 1) 医疗服务需求随经济增长水平而大幅度提升,当经济增 长趋缓时,医疗需求增长的刚性仍然不变; ( 2) 新技术运用对医 疗卫生费用增长的作用凸显; ( 3) 城市人口老龄化趋势越趋明 显; ( 4) 医疗价格的增长和医院的利益驱动,造成医疗费用持续 增长。针对医保基金风险防控问题,上海已积累约 10 年的基础 业务数据; 医药机构对医保中心系统账务的可信性和数据采集 代码规范性的认可程度较高,形成上海地区医疗卫生行业信息 处理事实上的部分规范和标准; 已建立了一套基础性的统计分 析报表体系、数据随机查询功能,审核监督已依托计算机筛选数 据展开运作。因此,我们已经具有了丰富的数据基础和业务领 域知识,为有效利用数据资源,减缓医保基金风险管理的压力, 我们采用数据挖掘技术,针对风险防控需求和数据特点设计并 实现了医保基金风险防控平台中的数据挖掘方法库 /模型库。 实际应用表明,其对防控医保基金风险取得了良好效果。
我国社会医保工作开展较晚,从某种意义上讲,对医保基金 的管理缺乏一定的理论指导。受认识、技术以及数据等方面限 制,国 内 在 这 方 面 的 研 究 不 多,更 没 有 成 熟 的 软 件 开 发 和 应 用[3]。国内目前已 有 的 研 究,主 要 从 医 保 基 金 收 支 监 测、简 单 指标预警等方面开展基金风险管理工作,在医保基金预测预警 建模方面,仍处于起步阶段,一些相关研究缺乏系统性和深度。