应用极值理论建立大额损失模型的方法论研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用极值理论建立大额损失模型的方法论研究
作者:靳曲
来源:《管理观察》2010年第07期
摘要:利用极值理论中的POT模型来考虑大额保险损失额的尾部分布,提出一套清晰的方法论体系:对待一组数据,如何进行恰当的描述统计分析,进而通过数据选取合适的极值模型,并以合适的方法估计选取的损失额模型的参数,最终估计出拟合分布的尾部分位数。

关键词:极值理论广义极值分布广义帕累托分布大额损失建模
在非寿险精算中,找到合适的赔付额分布函数是最基本的要求;而对于保险公司而言,研究大额损失额的一些性质有助于公司更好的运行,因此对于大额损失额分布函数的研究就显得尤为重要了。

本文主要利用极值理论的优良性质,即极值理论中的POT模型,仅考虑分布尾部,而不是对整个分布进行建模,这就避开了分布假设的难题,对损失分布建模十分有利,而且极值理论可以准确地描述分布尾部的分位数,这有助于非寿险公司进行风险管理。

因此本文的目的即是,在上述理论的基础上,整理出一套清晰的方法体系:分析数据、选取合适的极值模型、估计模型参数以及估计分布尾部分位数。

一、理论基础
在对样本极值的研究中,极值分布族扮演着非常重要的角色,本文主要研究用广义极值分布来拟合损失额分布函数的尾部,即大额损失额部分。

在Fisher-Tippett定理的基础之上,Jeok1nson 和Von-Mises得出下面的结论:不论总体的分布函数F的形式如何,其极限分布必可以表示为一个单参数的分布,即广义极值分布(GEV)。

标准广义极值分布的分布函数为:
exp[-(1+ζ())-1/ζ],如果ζ≠0exp[-e-1/σ],如果ζ=0
由Balkema-deHaan-Piekand(PBdH)定理可知:对于总体的分布函数F(x)而言,在足够大的点u 之后的分布F(u),即超越门阀值的超越点分布可以用广义帕累托分布来逼近,广义帕累托分布定义如下:
Gζ,μ,σ(X)=
1-(1+ζ())-1/ζ],如果ζ≠01-e-x/σ,如果ζ=0
进一步,由文【2】可知可以用下式来逼近分布函数F(x): (x)=(1-Fn(u))Gζ,μ,σ(X)+Fn(u),其中Fn(u)是样本的经验分布函数。

本文下面的行文思路即为,先对原始数据做简单的描述统计分析,即通过做P-P图或Q-Q图,以及做出均超额损失图(Mean Excess Loss Plot)等方法判断数据的尾部特征,根据尾部特征来判
断是否可用广义帕累托分布来做拟合,接着给出估计函数参数的方法,最后使用拟合分布来进行尾部高分位数的估计。

二、描述统计分析
对于原始的损失数据,我们可以有很多方法对这些数据进行探索性的分析;限于篇幅,本文只给出做Q-Q图和均超额损失图(Mean Excess Loss Plot)这两种方法来判断数据的尾部特征:
(1)Q-Q图
一般来讲,如果分布函数F(x)的尾部比指数分布的尾部更厚,即对任意的λ>0,有:=0,则认为
F(x)属于厚尾分布。

具体而言,做出以(Xn-j+1,-log())为坐标的Q-Q图,其中Xn-j+1为经验的分位数。

当所有的样本点围绕在一条线周围时,意味着F(x)是指数分布(成为理想形状);如果样本点
的分布与理想形状相比出现凹偏离,则说明F(x)属于厚尾分布;反之凸偏离则说明F(x)属于薄尾分布。

Embrechet和Veraverbeke曾经对常见的几种损失分布按照其尾部薄厚进行了以下的分类:薄尾:指数分布,Gamma分布,广义逆高斯分布λ>0;中尾:逆高斯分布,广义逆高斯分布;厚尾:对数正态分布,Pareto分布,变形Beta分布。

(2)均超额损失图(Mean Excess Loss Plot)
定义e(u)=E(X-u|X>u),称e(u)为均超额损失(Mean Excess Loss )。

以u为自变量做e(u)的函数图,我们可以发现以下规律:若x服从指数分布,则图像为一条水平的直线e(u)=λ-1;对于x服从广义Pareto分布 ,有e(u)=。

这是在实际应用之中常会遇到的情形。

当然我们更关注样本带给我们的关于总体分布的信息,于是可以定义样本的经验均超额损
失en(u)==Xn-j+1,n-Xn-k,n,其中I{Xi>u},并且取u=Xn-k,n,其中Xk,n为n个样本的第k个顺序统计量。

以坐标(u,en(u))作图即可得到样本的均超额损失图。

如果图中的样本点呈现向上的趋势,那么分布是厚尾的,如果样本点呈现向下的趋势,那么分布是薄尾的;特别的,如上文所述,若近似
呈现一条水平直线则服从指数分布,若组成一条有正斜率的直线,则数据近似服从广义Pareto分布。

三、参数估计
如前文所言,由于分布函数F(x)可以用F(x)=(1-Fn(u))Gζ,μ,σ(X)+Fn(u)来逼近,那么只需要估计Gζ,μ,σ(X)的参数;由于参数μ只是位置参数,因此重点研究参数ζ和σ的估计方法。

文【1】
给出了以下几种方法:
(1) 最大似然估计
令γ=-ζ/σ,Y1,Y2,...YN定义为Y1=(X1-u|X1>u);可以通过下面两个方程的解来得到ζ和σ的估计:
+(+1)=0和
=1n(1-γYi )=0
(2)Probability-Weighted Moments
=2- ;=;
其中,0为样本的一阶矩,1为样本的二阶矩
除此之外,如何确定最优的超越门阀值u也是很重要的一步。

在这里我们面临这有偏与方差之间的权衡:一方面,如果阀值u较低,则PBdH定理不再成立,那么极值理论将不再适用于估计分布,得到的估计量将存在系统偏差,是有偏的;另一方面,如果阀值u设定得过高,那么很可能可以使用的观测值将变少,此时得到的估计量的方差会比较大。

文【1】和文【2】给出了求出u 的最优值的几种方法,整理如下:
(1) 经验法则:
定义:k=#{i:Xi,n>u},其中Xk,n为n个样本的第k个顺序统计量。

一般认为,k的选取应该满足使它占总样本的比例小于10%,由此数量不等式的关系可以逆推出u的值。

(2)根据上文提到的样本的均超额损失图来判断:
文【1】建议选择这样的u:对于x>u,,en(x)几乎是线性的。

即在u之后en(x)几乎是线性的,这样更好的符合广义Pareto分布。

(3)通过对不同u值下估计出来的形状参数判断:
文【2】给出了一种超越门限值样本个数的自适应选择算法:令:σk,n表示基于k个超越门限值的样本个数的形状参数估计值,k的定义仍然是k=#{i:Xi,n>u};用med(σ1,n , σ2,n ... σk,n)表示这组形状参数估计的中位数,通过最小化下式就可以选择出一个最优的k:iβ|σi ,n-med(σ1,n ,
σ2,n ... σk,n)|;其中.0≤β
四、应用模型进行高分位数估计
在非寿险中,对损失分布的分位数的估计,特别是对高分位数的估计将为保险公司提供十分重要的信息,因为这个高分位数点在一定程度上就是保险人可能会面临的潜在巨额损失。

通常,
分位数点可以由它所对应的经验分布函数来估计,但是,当感兴趣的是损失分布右端的高分位数点、甚至非常高的分位数点时,使用经验分布函数来估计的方法己经不再适用了,因为一般来讲损失数据在高分位数点部分通常只有数量相当小的观测,在这种情况下利用经验分布函数来估计高分位数点将会是十分不精确的。

因此,可以用对损失分布尾部建立的广义帕累托分布来估计高分位数点。

由分布F(x)的拟合公式:(x)=(1-Fn(u))Gζ,μ,σ(X)+Fn(u),和Fn(u)=(其中n为样本数,Nu为大于u的样本数),因此F(x)的拟合公式可以整理为:(x)=(1+[Gζ,μ,σ(X)-1]。

在ζ≠0的时候可以根据公式反解出拟合的p分位数为:xp=u+[(1-p)--1],根据此公式就可以对高分位数点进行拟合估计,来判断潜在的巨额损失。


参考文献:
【1】P.Embrechts,C.kluppelberg,T.Mikosch. Modelling Extremal Events for Insurance and Finance,Springer-Verlag ,February 12,1997
【2】赵智红,基于极值理论的非寿险精算研究,2008年。

【3】高洪忠,精算分布理论研究,知识产权出版社,2008年。

注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。

相关文档
最新文档