城乡居民医疗保险欺诈损失实证研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Vol.39 No.4Aug. 2 0 2 0
第39卷第4期20 20年8月
怀化学院学报
JOURNAL OF HUAIHUA UNIVERSITY
城乡居民医疗保险欺诈损失实证研究
林源,谴立平,宋曙光
(怀化学院商学院,湖南怀化418008)
摘 要:医疗保险基金是医保制度得以正常运行的物质基础,是人民群众的“保命钱”。

目前,针对医保基金的
各种欺诈骗保行为比较严重,给医保基金造成了巨大的损失。

通过构建复合极值分布模型,应用VaR 方法,对医保 基金欺诈损失进行实证研究。

结果表明:(1)职业骗保人和定点医疗机构欺诈导致的损失占全部损失的80%;
(2)
医保基金欺诈损失服从负二项-对数正态复合分布; ⑶ 欺诈导致医保筹资费用提高10.84%,导致医保基金赔付多
支出12.33%。

此结果可为居民医疗保险筹资标准的制定和打击欺诈骗取医疗保险基金行为提供理论依据。

关键词:医疗保险基金; 欺诈损失;
复合极值分布; VaR
中图分类号:F840.684 文献标识码:A
文章编号:1671-9743(2020)04-0050-05
Empirical Study on the Fraud Loss of Medical Insurance for Urban and Rural Residents
LIN Yuan, CHEN Li-ping , SONG Shu-guang
(School of Business , Huaihua University, Huaihua, Hunan 418008)
Abstract : The medical insurance fund is the material basis for the normal operation of the medical insurance system , and it is
the u guarantee money ” for ordinary people. At present , a variety of fraud against the medical insurance fund is more serious ,
causing serious losses to the medical insurance fund. By constructing the compound extreme distribution model and applying the VaR
method , the paper made an empirical study of the fraud loss of medical insurance fund. The results showed that: (1) Occupational
swindlers and designated medical institutions caused fraud losses up to 80%; (2) Fraudulent losses of medical insurance funds are
subject to negative binomial-lognonnal normal distribution; (3) The fraud resulted in a 10.84% increase in the financing cost of
medical insurance , and thus a 12.33% compensation expense of medical insurance fund. The paper provides a theoretical basis for
the establishment of the financing standard of the residents' medical insurance and for combating the fraud of the medical security fund.
Key words : medical insurance fund; fraud loss; compound extreme distribution ; VaR
—、引言
城乡居民医疗保险(以下简称“居民医保”)对 于缓解居民“看病贵、看病难”和治理“因病致贫、 因病返贫”问题发挥了重大作用,而医疗保险基金 则是这一制度得以实施的物质基础。

中共中央国务 院伏于深化医疗保障制度改革的意见)(2020年 2月25日)指出,医疗保险基金是人民群众的“保 命钱”,必须始终把维护基金安全作为首要任务,以 零容忍的态度严厉打击欺诈骗保行为,确保基金安 全高效、合理使用。

在此之前,骗取套取医保基金
的事情经常发生。

据审计署2017年1月1日公布的 针对医保基金的审计结果,923家定点医疗机构和 定点零售药店涉嫌通过虚假就医、分解住院等方式,
骗取套取医疗保险基金2.07亿元作为本单位收入核 算,也有少数自然人涉嫌通过虚假异地发票等方式 骗取医疗保险基金1 007.11万元。

比较典型的有, 湖南省医疗保障局在2019年开展打击欺诈骗取医疗 保险基金专项行动中,发现中南大学湘雅二医院存 在虚记多记手术缝线等耗材费用、过度检查、过度 医疗等严重违规使用医保基金的行为,已经全部追 回违规医保基金并处罚金共计3 359.26万元。

医保 欺诈严重威胁到城乡居民医疗保险基金的安全,影 响到该制度的可持续发展。

因此,研究城乡居民医 疗保险欺诈发生规律并对欺诈损失进行度量,具有 重要的现实意义。

目前,"学界春对医疗保险欺诈损失度量的研究
收稿日期:2020-07-28
基金项目:教育部人文社科研究规划基金"武陵山片区农村大病保险调查研究” (19YJA850011);湖南省哲学社会科学基
金“湖南武陵山片区农村大病保险制度研究” (15YBA314);湖南省教育厅科学研究重点项目"基于医保扶贫 视角的大湘西农村大病保险制度研究” (16A169) o
作者简介:林 源,1968年生,男,苗族,湖南沅陵人,教授,博士,研究方向:金融风险管理、保险与社会保障。

第39卷第4期林源,等:城乡居民医疗保险欺诈损失实证研究•51•
相对较少,相关研究主要有:Vera Hernandez™提出用健康状态和治疗成本的方差来衡量医疗保险道德风险,Jim Gee冋用欺诈损失率和欺诈频率计算医疗保险欺诈的规模。

针对医保的道德风险,杨金侠冋采用“同行评审”和“病例对照”的方法,以定点医疗机构为例进行了实证分析,李连友和林源旳采用聚合风险模型实证测量了新型农村合作医疗保险的欺诈风险,而李杰等切应用大数据方法构造基本医疗保险参保人欺诈风险评估集成模型,不过其主要是识别和量化欺诈行为人的潜在特征以构造欺诈风险评估指标体系。

与本文研究有关的是复合极值分布模型,相关研究主要有:马逢时等同提出了复合极值分布理论,构建了“复合极值分布”模型,给出了复合极值分布的解析表达式,并成功应用于推算台风波浪多年一遇波高设计和风速设计的统计分析中。

该理论提出后被国内外学者大量引用和应用,在工程界得到了普遍重视和运用(Langly等叫刘家福等呀。

目前该理论主要应用于海啸、台风等海难事件中,在经济领域还没有得到很好的应用。

叶五一等网应用复合极值理论给出了动态流动性调整的VaR的一种估计方法,并对上海汽车和中国石化两只股票风险进行了实证分析。

Jing Liu等㈣采用Poisson-Gumbel复合极值分布计算VaR,并用美元/英镑的汇率数据进行了实证分析,结果显示模型的适用性较好。

叶孜文问建立了一个既能反映某时段内风险发生的次数,又能反映价格波动的Poisson-GP复合极值分布模型,并应用到我国股指期货保证金水平的设置中。

本文将构建复合极值分布模型,并用于计算医疗保险欺诈损失VaR值。

二、居民医保欺诈损失度量模型
(_)复合极值分布理论
定理:假设“为随机变量,其分布函数分别为G(x),Q&),记竝为$的第i个独立观测值,设N是与G,4)独立的非负整数随机变量,记:P{N=k}=p k,k=O,l,-,勿尸1,定义随机变量乙
,f",N=0
1=max£},NN1⑴〔l<i<N
则1的分布函数为
00
F&)=》MG&)卜Po[l-Q&)].(2)直=0
马逢时疇给出了该定理的证明。

8
记F°(”)=Y p»[G(%)]*,则F°(”)是由N的分布
k=0
和$的分布所构成的复合极值分布,它可以被N和$的分布完全决定。

显然:
(1)若po=O,则F(x)=F0(x);
(2)如果“有上界M(即P{“>M}=0),则对于x>M,F(x)=F0(x).
在实际应用中,p。

的值往往很小。

在估计VaR 时,只关注损失大的部分,条件⑵也可以得到满足。

因此,在估计VaR时可以用局&)来近似F&)。

(二)构建复合极值分布模型
针对居民医疗保险,假设右表示欺诈索赔额变量①,“表示合法索赔变量,N表示欺诈索赔次数。

对于新农合合法索赔(合法报销),欺诈次数N=0;受封顶线的限制,“有上界M(M为封顶线的报销金额),显然有P(7]>M}=0o实际上,度量欺诈损失时,关心的是较大的损失部分。

因此,上述⑵的条件可以得到满足。

在保险精算中,索赔次数通常服从Poisson分布、二项分布和负二项分布,而这三种分布中,円的值非常小,近似于0。

以泊松分布为例,当参数A=3时,p°=0.0498;当入=4时,p°= 0.0183;当入=5时,卩尸0.0067。

因此⑴的条件也近似满足。

于是可以用F°&)近似F&)以计算VaR。

具体来说,使用VaR方法度量欺诈损失时,f表示欺诈损失强度随机变量,GG)表示欺诈损失强度分布函数;N表示欺诈损失次数(频率)的随机变量,其分布为:
P{N=k}=p k,k=0,1,…,Ep»=l,(3)
于是,复合极值分布为:
00
F0M=^Pk[GM]k⑷k=0
设a表示置信水平,则有VaR=F^(a)⑸
本文假定城乡居民医疗保险欺诈损失次数(频率)服从负二项分布,欺诈损失强度服从对数正态分布。

即:
1.7V为负二项分布
)(荷)'(缶也0,1,…,⑹则局&)=[1甲(1-G(%))『(7)令F0(x)=a,得到G&)=l-#[a二1]⑻
2.假设G&)为对数正态分布
即:Lnx^N((i,a2),于是有
G(x)=KX<x)=A曲屮<Lnxp)
a a
=0(丄叱d)⑼
a
由式⑻和式⑼可得:
y迟=严3(io)
其中"話a二11。

(三)欺诈损失纯保费计算模型
从理论上讲,欺诈损失纯保费恰好能补偿居民医保基金所承担的期望欺诈索赔额,即欺诈损失纯保费民E(S”),其中S”为某个时期内(通常为1年)总欺诈索赔额,W是该期内的欺诈索赔次数,&表示第i次欺诈索赔额,",^,^,…,/”是相互独立的随机变量,且兀,&,…,相同分布。

则有:
•52•怀化学院学报2020年8月
s”=e+X2+・・・+x”=Z&(11)
于是,医保欺诈嗚失纯保费为:
圧£(5”)=隔[民051"|]=珈"・£匡]]=£|7¥]・E[X](12)
即医保欺诈损失纯保费等于年均欺诈索赔次数和欺诈索赔额均值的乘积,假定N服从负二项分布,&服从对数正态分布等。

三、实证分析
(-)欺诈损失经验数据描述
1.数据来源及整理说明
国内目前没有建立医疗保险欺诈损失数据库,数据来源于作者收集的国内媒体报道的医疗保险欺诈案件。

从报道的案件中提取了欺诈发生的时间、损失金额、欺诈主体、欺诈类型和手段(冒名顶替、挂床住院等)及主要过程等。

损失金额指医保部门已经支付的、被确认骗保成功的数额,而非涉案金额。

由于数据收集困难,本文以收集到的2004—2012年新型农村合作医疗保险(以下简称“新农合”)发生的257个骗保案例整理的数据为例进行分析。

2.医保欺诈特征
对257个骗保案件进行分析发现,骗保人包括法人和自然人,法人主要是定点医院和药店等医疗机构,自然人包括参合农民、职业骗保人、医生和医保管理人员。

从骗保的损失频率即骗保次数来看,职业骗保人占35.8%,参合农民占36.2%,定点医疗机构占17.9%,是三大主要骗保主体。

从骗保造成的损失来看,职业骗保人和定点医疗机构造成的损失接近80%,而医生个人骗保造成的损失仅占2.8%。

进一步分析发现,各骗保主体所采用的手段各不相同,职业骗保人主要采用假发票等伪造报销手续骗保,参保农民大多以冒名顶替或隐瞒病因骗保,医生骗保则以收受回扣、过度医疗为主,医保管理人员通过内外勾结、伪造报销凭证骗保,定点医院主要采用挂床住院、虚增住院天数等手段骗保。

具体情况见表1。

3.数据描述统计
对骗保案件进行整理,得到了257个欺诈损失数据。

欺诈损失频率及相应损失强度的数据见表2。

进一步,通过计算得到欺诈损失强度的统计量(见表3)。

由表3可见,欺诈的平均损失高达14万元,超出当时的平均封顶线金额②。

损失数据的偏度系数为7.94,峰度系数高达84.16,呈明显的尖峰厚尾特征。

从损失强度经验分布图也可发现分布呈明显右偏、尖峰厚尾的特征。

(二)医保欺诈损失度量
1.医保欺诈损失次数(频率)拟合分布
通过对欺诈次数(频率)的样本分析,得到欺
表1各欺诈行为人欺诈手段及损害程度
欺诈主体欺诈次数欺诈次数比例/%欺诈损失/万元损失比例/%主要骗保手段
职业骗保人9235.802134.1259.20伪造报销手续(假住院证、假病历和假发票)
参合农民9336.20329.659.10冒名顶替、隐瞒病因、报销资料作假等
定点医疗机构4617.90681.8618.90挂床住院、分解服务、虚增住院天数、伪造报销手续等
医生11 4.30100.83 2.80滥开药物、不必要服务、收受 回扣等
医保管理人员15 5.80358.9710.00内外勾结、伪造报销凭证
表2各年度欺诈损失数据
年份损失频率/次损失强度/万元年份损失频率/次损失强度/万元2004 3.017.48200962.01054.63 2005 5.098.60201036.0216.90 200611.053.42201125.0351.76 20074&0889.722012&0102.86 200859.0820.05合计257.03605.34备注:损失按当年的实际发生金额计算,未对其按物价水平进行折算。

表3欺诈损失强度描述/万元
均值最小值最大值标准差中位数峰度偏度N=25714.030.07449.4837.03484.167.94
第39卷第4期林源,等:城乡居民医疗保险欺诈损失实证研究
• 53 •
诈损失频率描述(见表4)。

通过对欺诈损失频率数据拟合Poisson 分布、二 项分布和负二项分布进行KS 检验,发现欺诈次数 不服从Poisson 分布和二项分布。

而负二项分布的检 验统计量为0.1622,小于显著水平为0.05的临界值 0.4300,且p 值为0.9559,因此,医保欺诈损失次 数(频率)服从负二项分布。

进一步对参数应用极 大似然法进行估计,可得到欺诈损失频率分布为:
4(N=%)=(;+“" …,
(⑶
其中,r=1.3114, p=0.0439。

或者:
盼4(芦打(荷y (荷也。

丄…,(14)其中 r=1.3114, 0=21.779。

2.医保欺诈损失强度拟合分布
针对欺诈损失强度,选取对数正态分布、韦伯 分布、伽马分布和指数分布来拟合。

拟合结果见表5。

由表5可知,对数正态分布和韦伯分布的拟合 通过检验。

其中,对数正态分布拟合的p 值较大而 检验统计量值较小,因而其拟合效果最优。

这一结 论还可从对数正态分布QQ 图得到进一步验证。

通过 极大似然估计可得,欺诈损失强度分布函数G&)为:
Ln (X )~N ( 1.3281,1.63782) (15)其密度函数为:
血)=1
V277 x 1.6378%
(lm ;-1.3281)2 ] 2X1.63782 I (16)
3.建立复合极值分布模型
通过上述检验发现,医保欺诈损失频率服从负 二项分布,损失强度服从对数正态分布,这符合最 初的假定。

根据复合极值分布理论,由式(13)、式 (15)和式(7)可得,医保欺诈损失分布为负二 项一对数正态复合极值分布,分布函数为:
其中从为负二项分布(见式(13)), G&)为对数正 态分布(见式(15)) □
4.计量医保欺诈损失
根据式(15)、式(17)和复合极值分布的VaR 解析表达式(10),可以得到不同置信水平下的医保 欺诈潜在损失值,见表6。

由表6可知,随着置信水平的提高,医保欺诈 潜在损失值也大幅提高。

这恰好反映了医保欺诈 “低频高损”的特征。

其中,年欺诈损失超过1 306.6 万元的可能性为0.5%。

根据财政部和卫生部烘于建立新型农村合作 医疗风险基金的意见)(财社[2004]96号),新农合 基金中必须提取风险基金作为专项储备资金,主要 用于弥补合作医疗基金非正常超支时周转的临时困 难等。

非正常超支是指因当年大病人数异常增多等 因素导致按规定应由合作医疗基金支付的医疗费用 大幅度增加,致使合作医疗基金入不敷出。

风险基 金由参合县(市)每年从筹集的合作医疗基金中按 3%左右提取,规模应保持在年筹资总额的10%左 右。

由此可知,新农合风险基金中,尚未把欺诈风 险作为一个重要风险来考虑。

因此建议城乡居民医 保风险基金中应包括欺诈损失风险基金。

针对保险 行业的操作风险(包含了欺诈风险),做盟偿付能 力II 》建议,选取置信水平为99.5%、时间为1年 的VaR 值作为偿付能力资本要求。

考虑到居民医保 的实际,建议选取置信水平为99%,时间周期为1 年的Va 冬值来计提欺诈损失风险基金,此时,VaR =962万元。

(三)医保欺诈损失纯保费的计算
由于欺诈损失强度分布服从对数正态分布,即 Ln (X )~N ( 1.3281,1.63782),得到:
]2
£(%)=/2 " =14.4298 (万元)
由表4可知,E[7V]=28.5556,因此根据式(12)
表4欺诈损失频率描述
F°&)= Y t 4G&)F= [ 1+21.779( l-G(x)) ] -13114
(17)
k=0
最小值
最大值均值
中位数标准差
3
62
28.5556
25
23.5325
表5欺诈损失强度分布拟合
拟合分布H
P Ks-stat
CV
Lognormal
00.81970.0391
0.0840Weibull
0.1035
0.0753
0.0840Gamma 1 1.6679e-0040.13410.0840Exponential
1
1.7778e-016
0.2660
0.0840
表6不同置信水平下的医保欺诈损失VaR 值
置信水平 VaR/^*元
置信水平 VaR/万元置信水平 VaRZ 厅元
置信水平 VaRZB ■元
置信水平 ¥aR/^*元90%
295.217695%
437.4398
97.5% 624.321399%
962.0927
99.5%
1
306.6
•54•怀化学院学报2020年8月
表7参合县新农合基金基本情况
年度开爾农合县
(市、区)/个擁基橙年度开展新农合县
(市、区)/个
筹资额
/亿元
基金支出
/彳乙兀
200433340.0026.3720092716944.29922.92 200567875.3661.75201026781308.931187.84 20061451213.61155.81201126372048.471710.19 20072451427.61346.63201225662483.432408 20082729784.85662.31
来源:EPS数据平台。

表8新农合欺诈索赔程度估计及欺诈风险基金比重(县级统筹)/万元
参合县(市、区)县年均
筹资额
年均基金
支出额
平均值3801.8210.843368.9912.2325.3
可得医保欺诈损失纯保费:E(S”)=412.052万元。

(四)医保欺诈对筹资的影响及欺诈赔付率估计
在度量医保欺诈损失后,可进一步分析欺诈对医保基金的损害程度。

考虑到采用的是新农合数据,而新农合是以县级来统筹,因此以全国县级平均水平来估计筹资额中欺诈损失纯保费所占比例、基金支出额中欺诈赔付的比例等。

通过表7计算得到,各县年均筹资额为3801.82万元,县年均基金支出额为3368.99万元。

由前述已知欺诈纯保费(预期欺诈索赔额)为412.05万元,欺诈损失VaR值为962万元,经计算得到表8的结果。

由表8可知,平均来看,筹资额中的10.84%被用于应对欺诈风险,未来期望欺诈赔付额占基金支出额的12.23%,也就是因欺诈导致筹资费用标准提高了10.84%,欺诈导致基金赔付达到12.23%o欺诈损失风险基金(VaR)占到筹资额的25.3%。

考虑到医疗保险“欺诈暗数”的存在,这些比例可能会更高O
四、结论和政策建议
以新农合欺诈损失数据为样本,通过构建负二项一对数正态分布复合极值模型,采用VaR方法对居民医保欺诈损失进行实证研究。

结果表明:(1)职业骗保人和定点医疗机构导致的欺诈损失达到全部欺诈损失的80%;⑵医保欺诈损失频率服从负二项分布,欺诈损失强度服从对数正态分布;(3)欺诈损失纯保费占筹资额的10.84%,期望欺诈赔付占基金支出的12.33%,也即欺诈赔付规模达到12.33%,因欺诈导致新农合筹资费用提高了10.84%;⑷对参合县而言,计提欺诈损失风险基金962万元后,能应对百年一遇的欺诈风险。

因此建议:(1)围绕医保基金筹集、存储和支付等环节,规范流程,尤其是规范异地报销流程,从而降低医保欺诈频率并控制损失程度,防范欺诈的发生;⑵应加大对医保欺诈的打击力度,加强对定点医疗机构的监管;(3)建立以VaR为基础的医保基金欺诈损失风险补偿机制。

注释:
①"欺诈索赔”可能成功,即获得支付因而导致新农合基金损失,也可
能被发现,因而被拒付,鼻0。

后一情况对我们的研究结果没有影响,因此,不再区分。

②封顶线的金额各地规定不一,2011年前通常都是5万元左右,自
2011年以来有所提高。

如江西新农合住院补偿封顶线提至6万元(人民网,2012510),河南商丘市封顶线提高至15万元(商丘日报,2011.11.2)o
参考文献:
[1]V era-Hemandez,M.Structural estimation of a principal-agent model:
moral hazards in medical insurance.[J]RAND Journal of Economics,vol.
34,2003(4):670-693.
[2]J im Gee,Dr.Mark Button and Graham Brooks.The Financial Cost of
Healthcare Fraud-2011Report,University of Portsmouth:Centre for Counter Fraud Studies[EB/OL].2011,.
⑶杨金侠,李士雪,温丽娜,等.新型农村合作医疗医疗费用控制实证
研究—
—新型农村合作医疗制度中是否存在道德风险[J].中国卫生经济,2008(6):28-30.
[4]李连友,林源.新型农村合作医疗保险欺诈风险度量实证研究[J].中
国软科学,2011(9):84-93.
[5]李杰,兰巧玲,马士豪•基于大数据的基本医疗保险参保人欺诈风险
评估[J]•中国卫生政策研究,2018,11(10):43-50.
[6]马逢时,刘德辅•复合极值分布理论及其应用[J].应用数学学报,1979
(11):366-375.
[7]L angley R M,El-Shaarawi A H.On the calculation of extreme wave
heights:Areview[J].Ocean Engineering,1986,13(1):93—118.
[8]刘家福,吴锦,蒋卫国,等.泊松-对数正态复合极值模型的洪水灾害
损失分析[J].自然灾害学报,2010(12):61-66.
[9]叶五一,缪柏其.应用复合极值理论估计动态流动性调整VaR[J].中
国管理科学,2008(5):44-49.
[10]J ing Liu,Daoji Shi,Xinrong Wu.Estimation of Poisson-Generalized
Pareto Compound Extreme Value Distribution by Probability-Weighted Moments and Empirical Analysis[J].Transactions of Tianjin University,2008(01):50-54.
[11]叶孜文.基于Poisson-GP复合极值分布的股指期货保证金设置研
究[J]•曲阜师范大学学报:自然科学版,2011,37(04):49-52.
(贵任编辑:彭铁祥)。

相关文档
最新文档