基于复合负二项分布的短期聚合风险模型
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方差的概念。 设 X 是一个独立随机变量,Y 是一个与 X 有关的随机变量,定义 E(Y|X=x)为在 X 取确定值 x 的情
况下 Y 的条件期望值,记 Z=E(Y|X),则 Z 相应于 X 的随机性也是一个随机变量,因此可以考虑它的均值 和方差,相应地记为 E[E(Y|X)] 和 Var[E(Y|X)]。同样,若记 W=Var(Y|X),则 W 可看作是随机变量 X 的 函数,也是一个随机变量,相应地有 E[Var(Y|X)]和 Var[Var(Y|X)]。现在就连续型情况计算复合随机变 量 Y 的均值和方差,离散型情况可平行地推得。
关键词:复合分布;负二项分布;聚合风险;索赔次数;总理赔量
Short-term collective risk model basing on Compound negative binomial distribution
QIAO Leilei1,CHEN Shuchen2
(Department of Management, China University of Mining & Technology, Beijing 100083)
5090
分布为复合负二项分布。 本文探讨了负二项分布的性质,主要讨论了在索赔次数服从负二项分布的情况下理赔总量的分布及
其性质,即复合负二项分布的性质。在引入条件期望和条件方差的概念下得出了理赔总量服从复合负二 项分布下的均值、方差和矩母函数。本文就对于复合泊松分布成立的合成定理和分解定理讨论了复合负 二项分布有没有类似的结论成立,通过证明得出了合成定理对复合负二项分布有相类似的结论,分解定 理对于复合负二项分布没有相类似的结论。在本文的最后,给出了基于负二项分布的聚合理赔的两种近 似模型,一是正态近似,二是平移伽玛近似。在理赔分布基本上对称的情形时采用正态近似,在理赔分 布有偏斜的情形时则采用平移伽玛分布近似。
3 复合负二项分布及其性质
如前所述,若理赔次数 N 服从负二项分布,则称聚合理赔量 S 服从复合负二项分布。 对复合负二项分布重新定义如下:
N
随机变量
S
=∑
i =1
Ci
服从复合负二项分布是指它满足:
1.随机变量 N,C1,C2,…是相互独立的; 2.C1,C2,…是具有相同分布的随机变量; 3. N 服从负二项分布,参数 r>1,0<p<1。
= E[Var(Y | X )] +Var[E(Y | X )] 在上面的式子中用 N 替换 X,用 S 替换 Y,得到第一个问题的答案:
E(S)=E[E(S | N )] = E[NE(C )] = E(N )E(C)
(2.1)
Var(S ) = Var[E(S | N )] + E[Var(S | N )] = Var[NE(C)] + E[NVar(C)]
P{C1+……+Cn ≤ x}=P*P*……* P=P*n (x)
5092
即对
P(x)作
n
次卷积,由此:
F ( x)
=
∞
∑
P(N
=
n)P*n
(x)
n=0
相应地,若记 C
的密度函数 p(x)的 n 次卷积为 p*n (x) ,也有: f (x) =
∞ ∑
P(N = n)p*n (x)
n=0
对于离散随机变量,概率密度理解为 p(x)=P(X=x)。
按矩母函数定义有:
M S (t) = E(etS ) =E[E(etS |N )] =E{[M C (t)]N } = E[eNlogMC (t) ] = M N [log M C (t)]
因此,只要获得了理赔次数 N 的矩母函数 MN(t)和个别理赔额 C 的矩母函数 MC(t),便可把这两个
函数进行复合运算,得到 S 的矩母函数。
1 理赔次数和理赔额的分布
1.1 理赔次数的分布——负二项分布
在非寿险实务中,保险人承保的某一险种的保单组合一般说来是非同质的风险,这时该保单组合 的索赔次数很可能是服从负二项分布的。设索赔次数 N 服从负二项分布,即:
P{N = k}= ci prqk,
k=0,1,2,…
参数 r,p 满足 r>0,0<p<1,p+q=1。N 的均值、方差和矩母函数分别为:
= E2 (C)Var(N ) +Var(C)E(N )
(2.2)
(3.1)式表明理赔总量的期望值等于平均理赔数与个别平均理赔额的乘积,(3.2)式可理解为理赔总 量的方差由两部分构成,一部分由于个别理赔量的变动造成,另一部分由于理赔次数的变动造成。
2.2 获得理赔总量 S 分布的矩母函数法
获得 S 的概率分布常有两种方法,一是寻求 S 的矩母函数,二是从分布函数的定义出发并用卷积 等方法获得关于 S 的分布函数和密度函数的迭代公式。
=
rq p
(p2-p12)+
rq p2
p12= rq
p
p2
+
rq2 p2
p12
= E(Y | X )2 − 2E(Y )E(Y | X ) + E2 (Y )
∫ 得: Var(Y) = L fX (x)[E(Y | X )2 − 2E(Y )E(Y | X ) + E2 (Y )]dx = E[E(Y | X )2 ] − E2 (Y )
= E[E(Y | X )2 ] − E[E(Y | X )]2 + E[E(Y | X )]2 − E2 (Y )
Keywords: compound distribution; negative binomial distribution; collective risk; claim number; aggregate claim
文献综述
非寿险精算学是保险精算学的分支,20 世纪 40 年代后期,适合非寿险的风险理论开始建立。上世 纪初叶,Lundberg 提出了风险理论的核心理论聚合风险模型,其核心是经典风险模型。经典风险模型 是最简单的风险模型,也是目前研究的最为充分的模型。但是,经典风险模型主要研究的是索赔次数服 从泊松分布下的短期聚合风险模型。到了 20 世纪 70 年代,非寿险精算学已发展成为一个独立的分支学 科。迄今为止,风险理论经历了个体风险理论,聚合风险理论和现代风险理论等几个发展阶段。但是, 在中国这门学科还处于起步的阶段,2000 年,谢志刚和韩天雄老师在南开大学出版社出版了《风险理 论与非寿险精算》一书,这本书几乎是中国在非寿险精算领域中最早的一本书。由于非寿险精算的起步 比较晚,非寿险精算涉及的随机因素更多、计算误差更大、定量分析更困难,所以其理论的系统性还有 待于完善。
2.3 用卷积方法获得 S 的分布
N
S
现在从分布函数的定义出发寻求聚合理赔
=
∑
i=1
Ci
的分布函数和密度函数,设 S 的分布函数和密
度函数分别为 F(x)和 f(x),则有:
∑ F(x)
=
P(S≤x)
=
∞
∑
P(S
≤
x|N
=
n)P(N
=
n)
=
∞
P(N
= nຫໍສະໝຸດ BaiduP{C1+……+Cn
≤ x}
n=0
n=0
由于 C1,C2,……,Cn 独立同分布,记个别理赔额 C 的分布函数和分布密度为 P(x)和 p(x),则:
2.1.1 理赔总量 S 的均值和方差 设 X 的分布函数为 F(x),密度函数为 f(x),并设(X,Y)的联合分布为 F(x,y),Y 的边际分布和边际密度
为 FY(y)和 fY(y),并记 FY|X(y)和 fY|X(y)分别为 Y 在 X=x 时的条件概率分布和条件密度。Y 作为一个随机变 量,它的均值和方差为:
基于复合负二项分布的短期聚合风险模型
乔蕾蕾 1,陈树琛 2 (中国矿业大学(北京)管理学院,北京 100083) 摘要:保险公司为了准确估计和预测某险种在定期内累计损失的大小,需要研究聚合风险模型累计损失分布。有别于
经典风险理论中对复合泊松分布的讨论,本文探讨了在索赔次数服从负二项分布的情况下单个险种和多个险种的聚合风 险模型,得出了在这种模型下理赔总量的均值、方差、矩母函数及复合负二项分布的性质,证明了复合负二项分布的合 成定理,对分解定理的性质进行了讨论。最后,给出了聚合理赔量的近似模型,一是正态近似,二是平移伽玛近似。
0 引言
聚合风险模型是将所有的保单视为一个整体,以每一次理赔为基本对象来考虑某保单组合在一定时 期内可能发生的理赔总量,按理赔发生的时间顺序将所有理赔累加起来。
用 Ci 表示对某类保单的第 i 次理赔,N 表示在单位时间比如一个会计年度内所有这类保单发生理赔
的次数,记这一年中对这类保单的理赔总量为 S,则有
2 基于负二项分布的理赔总量模型
用聚合风险模型描述理赔总量无非是要获得对理赔总量 S 的概率分布信息,按讨论顺序可类似地 归结为如下三个问题:
(1)获得关于 S 的均值、方差; (2)获得关于 S 的概率分布和概率密度; (3)S 的近似概率分布和概率密度。
2.1 理赔总量 S 的均值和方差 聚合理赔的期望值 E(S ) 不再是每一项独立的个别理赔期望值的简单和,必须引入条件期望和条件
∫ ∫ ∫ Var(Y)=
2
[ y − E(Y )]
D
fY ( y)dy =
2
[ y − E(Y )] [
D
L f X (x) fY|X ( y)dx]dy
2
∫ ∫ =
L fX (x)dx
[ y − E(Y )]
D
fY|X ( y)dy
∫ ∫ 由:
[y
D
−
E(Y )]2
fY | X
( y)dy
=
D[ y2 − 2yE(Y ) + E2 (Y )] fY|X ( y)dy
记 具 有 相 同 分 布 的 个 别 理 赔 额 变 量 为 C , 其 分 布 函 数 为 P(x) , 并 记 其 k 阶 原 点 矩 为 :
∫ pk =
∞ xkdP(x), k = 1, 2, ……。对于复合负二项分布 S,有:
0
E(S)=E(C)E(N)=p1E(N)=
rq p
p1,Var(S)
Abstract. The thesis discusses the negative binomial distribution in the collective risk model. The author gets the
aggregate claim’s mean、variance、moment generating function and Compound Negative Binomial Distribution’s character. At last, we get two collective claim’s approximate models. One is normal approximation; the other is gamma translation approximation.
N
∑ S =
C1
+
C2
+…+
CN =
Ci
i =1
N 为理赔次数,是与理赔发生频率有关的随机变量; Ci 则是测量每个独立理赔量额度大小的随机
变量。为了使该模型在理论上具有可操作性,对其中的随机变量给予以下假设:
(1).随机变量 N, C1 , C2 ,…是相互独立的。 (2). C1 , C2 ,…是具有相同分布的随机变量,即 Ci 中的风险都为同质风险。 由上式可以看出,研究聚合风险模型的第一步是研究如何用 N 的分布和 Ci 的分布来表示 S 的分布。 对于 N,本文中我们选择负二项分布;对于 Ci ,通常用正态分布、伽玛分布或其他分布。这时称 S 的
∫ ∫ E(Y)=
D yfY ( y)dy ,Var(Y)=
[
D
y
−
E(Y
)]2
fY
(
y)dy
按照全概率公式,有:
5091
∫ fY(y)= L f X (x)fY|X (y)dx ,
∫ ∫ ∫ 因此有:E(Y)=
D yfY ( y)dy =
y
D
L fX (x) fY|X ( y)dxdy
∫ ∫ ∫ = L fX (x)[ D yfY|X (y)dy]dx = L fX (x)E(Y | X =x)dy = E[E(Y|X)]
E(N) = CN ,
rq Var(N) = p2
,
和
MN(t)
=
⎛ ⎜ ⎝
p 1-qet
⎞r ⎟
。
⎠
1.2 理赔额的分布
对个别理赔额分布的估计是获得对复合理赔总量分布信息的另一重要方面。对于非寿险问题来说, 它的主要特点是短期性和多样化,情况复杂,不可能用一个或几个随机模型来概括各类千差万别的承保 风险的损失分布规律。概率统计中的各类离散型分布、连续分布、混合分布和经验分布都可以用于描述 理赔分布。
况下 Y 的条件期望值,记 Z=E(Y|X),则 Z 相应于 X 的随机性也是一个随机变量,因此可以考虑它的均值 和方差,相应地记为 E[E(Y|X)] 和 Var[E(Y|X)]。同样,若记 W=Var(Y|X),则 W 可看作是随机变量 X 的 函数,也是一个随机变量,相应地有 E[Var(Y|X)]和 Var[Var(Y|X)]。现在就连续型情况计算复合随机变 量 Y 的均值和方差,离散型情况可平行地推得。
关键词:复合分布;负二项分布;聚合风险;索赔次数;总理赔量
Short-term collective risk model basing on Compound negative binomial distribution
QIAO Leilei1,CHEN Shuchen2
(Department of Management, China University of Mining & Technology, Beijing 100083)
5090
分布为复合负二项分布。 本文探讨了负二项分布的性质,主要讨论了在索赔次数服从负二项分布的情况下理赔总量的分布及
其性质,即复合负二项分布的性质。在引入条件期望和条件方差的概念下得出了理赔总量服从复合负二 项分布下的均值、方差和矩母函数。本文就对于复合泊松分布成立的合成定理和分解定理讨论了复合负 二项分布有没有类似的结论成立,通过证明得出了合成定理对复合负二项分布有相类似的结论,分解定 理对于复合负二项分布没有相类似的结论。在本文的最后,给出了基于负二项分布的聚合理赔的两种近 似模型,一是正态近似,二是平移伽玛近似。在理赔分布基本上对称的情形时采用正态近似,在理赔分 布有偏斜的情形时则采用平移伽玛分布近似。
3 复合负二项分布及其性质
如前所述,若理赔次数 N 服从负二项分布,则称聚合理赔量 S 服从复合负二项分布。 对复合负二项分布重新定义如下:
N
随机变量
S
=∑
i =1
Ci
服从复合负二项分布是指它满足:
1.随机变量 N,C1,C2,…是相互独立的; 2.C1,C2,…是具有相同分布的随机变量; 3. N 服从负二项分布,参数 r>1,0<p<1。
= E[Var(Y | X )] +Var[E(Y | X )] 在上面的式子中用 N 替换 X,用 S 替换 Y,得到第一个问题的答案:
E(S)=E[E(S | N )] = E[NE(C )] = E(N )E(C)
(2.1)
Var(S ) = Var[E(S | N )] + E[Var(S | N )] = Var[NE(C)] + E[NVar(C)]
P{C1+……+Cn ≤ x}=P*P*……* P=P*n (x)
5092
即对
P(x)作
n
次卷积,由此:
F ( x)
=
∞
∑
P(N
=
n)P*n
(x)
n=0
相应地,若记 C
的密度函数 p(x)的 n 次卷积为 p*n (x) ,也有: f (x) =
∞ ∑
P(N = n)p*n (x)
n=0
对于离散随机变量,概率密度理解为 p(x)=P(X=x)。
按矩母函数定义有:
M S (t) = E(etS ) =E[E(etS |N )] =E{[M C (t)]N } = E[eNlogMC (t) ] = M N [log M C (t)]
因此,只要获得了理赔次数 N 的矩母函数 MN(t)和个别理赔额 C 的矩母函数 MC(t),便可把这两个
函数进行复合运算,得到 S 的矩母函数。
1 理赔次数和理赔额的分布
1.1 理赔次数的分布——负二项分布
在非寿险实务中,保险人承保的某一险种的保单组合一般说来是非同质的风险,这时该保单组合 的索赔次数很可能是服从负二项分布的。设索赔次数 N 服从负二项分布,即:
P{N = k}= ci prqk,
k=0,1,2,…
参数 r,p 满足 r>0,0<p<1,p+q=1。N 的均值、方差和矩母函数分别为:
= E2 (C)Var(N ) +Var(C)E(N )
(2.2)
(3.1)式表明理赔总量的期望值等于平均理赔数与个别平均理赔额的乘积,(3.2)式可理解为理赔总 量的方差由两部分构成,一部分由于个别理赔量的变动造成,另一部分由于理赔次数的变动造成。
2.2 获得理赔总量 S 分布的矩母函数法
获得 S 的概率分布常有两种方法,一是寻求 S 的矩母函数,二是从分布函数的定义出发并用卷积 等方法获得关于 S 的分布函数和密度函数的迭代公式。
=
rq p
(p2-p12)+
rq p2
p12= rq
p
p2
+
rq2 p2
p12
= E(Y | X )2 − 2E(Y )E(Y | X ) + E2 (Y )
∫ 得: Var(Y) = L fX (x)[E(Y | X )2 − 2E(Y )E(Y | X ) + E2 (Y )]dx = E[E(Y | X )2 ] − E2 (Y )
= E[E(Y | X )2 ] − E[E(Y | X )]2 + E[E(Y | X )]2 − E2 (Y )
Keywords: compound distribution; negative binomial distribution; collective risk; claim number; aggregate claim
文献综述
非寿险精算学是保险精算学的分支,20 世纪 40 年代后期,适合非寿险的风险理论开始建立。上世 纪初叶,Lundberg 提出了风险理论的核心理论聚合风险模型,其核心是经典风险模型。经典风险模型 是最简单的风险模型,也是目前研究的最为充分的模型。但是,经典风险模型主要研究的是索赔次数服 从泊松分布下的短期聚合风险模型。到了 20 世纪 70 年代,非寿险精算学已发展成为一个独立的分支学 科。迄今为止,风险理论经历了个体风险理论,聚合风险理论和现代风险理论等几个发展阶段。但是, 在中国这门学科还处于起步的阶段,2000 年,谢志刚和韩天雄老师在南开大学出版社出版了《风险理 论与非寿险精算》一书,这本书几乎是中国在非寿险精算领域中最早的一本书。由于非寿险精算的起步 比较晚,非寿险精算涉及的随机因素更多、计算误差更大、定量分析更困难,所以其理论的系统性还有 待于完善。
2.3 用卷积方法获得 S 的分布
N
S
现在从分布函数的定义出发寻求聚合理赔
=
∑
i=1
Ci
的分布函数和密度函数,设 S 的分布函数和密
度函数分别为 F(x)和 f(x),则有:
∑ F(x)
=
P(S≤x)
=
∞
∑
P(S
≤
x|N
=
n)P(N
=
n)
=
∞
P(N
= nຫໍສະໝຸດ BaiduP{C1+……+Cn
≤ x}
n=0
n=0
由于 C1,C2,……,Cn 独立同分布,记个别理赔额 C 的分布函数和分布密度为 P(x)和 p(x),则:
2.1.1 理赔总量 S 的均值和方差 设 X 的分布函数为 F(x),密度函数为 f(x),并设(X,Y)的联合分布为 F(x,y),Y 的边际分布和边际密度
为 FY(y)和 fY(y),并记 FY|X(y)和 fY|X(y)分别为 Y 在 X=x 时的条件概率分布和条件密度。Y 作为一个随机变 量,它的均值和方差为:
基于复合负二项分布的短期聚合风险模型
乔蕾蕾 1,陈树琛 2 (中国矿业大学(北京)管理学院,北京 100083) 摘要:保险公司为了准确估计和预测某险种在定期内累计损失的大小,需要研究聚合风险模型累计损失分布。有别于
经典风险理论中对复合泊松分布的讨论,本文探讨了在索赔次数服从负二项分布的情况下单个险种和多个险种的聚合风 险模型,得出了在这种模型下理赔总量的均值、方差、矩母函数及复合负二项分布的性质,证明了复合负二项分布的合 成定理,对分解定理的性质进行了讨论。最后,给出了聚合理赔量的近似模型,一是正态近似,二是平移伽玛近似。
0 引言
聚合风险模型是将所有的保单视为一个整体,以每一次理赔为基本对象来考虑某保单组合在一定时 期内可能发生的理赔总量,按理赔发生的时间顺序将所有理赔累加起来。
用 Ci 表示对某类保单的第 i 次理赔,N 表示在单位时间比如一个会计年度内所有这类保单发生理赔
的次数,记这一年中对这类保单的理赔总量为 S,则有
2 基于负二项分布的理赔总量模型
用聚合风险模型描述理赔总量无非是要获得对理赔总量 S 的概率分布信息,按讨论顺序可类似地 归结为如下三个问题:
(1)获得关于 S 的均值、方差; (2)获得关于 S 的概率分布和概率密度; (3)S 的近似概率分布和概率密度。
2.1 理赔总量 S 的均值和方差 聚合理赔的期望值 E(S ) 不再是每一项独立的个别理赔期望值的简单和,必须引入条件期望和条件
∫ ∫ ∫ Var(Y)=
2
[ y − E(Y )]
D
fY ( y)dy =
2
[ y − E(Y )] [
D
L f X (x) fY|X ( y)dx]dy
2
∫ ∫ =
L fX (x)dx
[ y − E(Y )]
D
fY|X ( y)dy
∫ ∫ 由:
[y
D
−
E(Y )]2
fY | X
( y)dy
=
D[ y2 − 2yE(Y ) + E2 (Y )] fY|X ( y)dy
记 具 有 相 同 分 布 的 个 别 理 赔 额 变 量 为 C , 其 分 布 函 数 为 P(x) , 并 记 其 k 阶 原 点 矩 为 :
∫ pk =
∞ xkdP(x), k = 1, 2, ……。对于复合负二项分布 S,有:
0
E(S)=E(C)E(N)=p1E(N)=
rq p
p1,Var(S)
Abstract. The thesis discusses the negative binomial distribution in the collective risk model. The author gets the
aggregate claim’s mean、variance、moment generating function and Compound Negative Binomial Distribution’s character. At last, we get two collective claim’s approximate models. One is normal approximation; the other is gamma translation approximation.
N
∑ S =
C1
+
C2
+…+
CN =
Ci
i =1
N 为理赔次数,是与理赔发生频率有关的随机变量; Ci 则是测量每个独立理赔量额度大小的随机
变量。为了使该模型在理论上具有可操作性,对其中的随机变量给予以下假设:
(1).随机变量 N, C1 , C2 ,…是相互独立的。 (2). C1 , C2 ,…是具有相同分布的随机变量,即 Ci 中的风险都为同质风险。 由上式可以看出,研究聚合风险模型的第一步是研究如何用 N 的分布和 Ci 的分布来表示 S 的分布。 对于 N,本文中我们选择负二项分布;对于 Ci ,通常用正态分布、伽玛分布或其他分布。这时称 S 的
∫ ∫ E(Y)=
D yfY ( y)dy ,Var(Y)=
[
D
y
−
E(Y
)]2
fY
(
y)dy
按照全概率公式,有:
5091
∫ fY(y)= L f X (x)fY|X (y)dx ,
∫ ∫ ∫ 因此有:E(Y)=
D yfY ( y)dy =
y
D
L fX (x) fY|X ( y)dxdy
∫ ∫ ∫ = L fX (x)[ D yfY|X (y)dy]dx = L fX (x)E(Y | X =x)dy = E[E(Y|X)]
E(N) = CN ,
rq Var(N) = p2
,
和
MN(t)
=
⎛ ⎜ ⎝
p 1-qet
⎞r ⎟
。
⎠
1.2 理赔额的分布
对个别理赔额分布的估计是获得对复合理赔总量分布信息的另一重要方面。对于非寿险问题来说, 它的主要特点是短期性和多样化,情况复杂,不可能用一个或几个随机模型来概括各类千差万别的承保 风险的损失分布规律。概率统计中的各类离散型分布、连续分布、混合分布和经验分布都可以用于描述 理赔分布。