非寿险定价模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

21
小结
仅仅讨论了非寿险定价模型的一小部分。不同保险产品的定价模型有较大差异。 非寿险定价模型主要是统计模型: 单项分析法 ----- 边际总和法 ----- GLM 信度模型 ---- 线性混合模型 ----- 广义线性混合模型 模型越来越复杂,边际效果会递减。 需要关注费用附加、风险附加和利润附加
i
2 i
var(yi )= V ( i )
逆高斯: Tweedie:
3 i
p i ,
1
p
2
7
均值相等,方差相等条件下 IG 与 GA 的比较
8
Tweedie 的密度函数: power=1.5; mu=200;
var(y)=phi*mu^power
9
分类费率:广义线性模型及其推广
索赔频率:泊松、负二项(泊松-伽马) 、泊松-逆高斯、泊松-对数正态,零膨胀、hurdle 零膨胀:
应用:以车险为例
2
保费构成:
保费 = 纯保费 + 费用附加 + 安全附加和利润附加 核心:纯保费
主要的定价方法:
分类费率(先验费率) : 传统方法:单项分析法、最小偏差法(如:边际总和法) 流行方法: GLM 探索中的方法:GAM、GAMLSS、...... 经验费率(后验费率) :信度模型,奖惩系统(BMS) 。 分类费率与经验费率的结合:GLM+CM,GLM+BMS,GLMM,GAMLSS 目的:体现公平,防止逆选择
yit
0i 0i 00 it
u0i
00
信度模型: yit
u0i
it
14
分类费率与经验费率的结合:广义线性混合模型
分类费率:广义线性模型 经验费率:信度模型(线性混合模型) 分类费率与经验费率的结合:广义线性混合模型(变截距)
yit ~D( g(
0i it ) 00 it ,
)
0i 1x1it 2x 2it
22
参考文献:
[1] Yan J. Enjoy the Joy of Copulas: With a Package copula[J]. Journal of Statistical Software. 2007, 21(4): 1-21. [2] Kramer N., Silvestrini D. Bivariate Copula Based Regression Models. ; 2012. [3] Ohlsson E. Combining generalized linear models and credibility models in practice[J]. Scandinavian Actuarial Journal. 2008, 2008(4): 301-314. [4] Rigby R. A., Stasinopoulos D. M. Generalized additive models for location, scale and shape[J]. Applied Statistics. 2005, 54(3): 507-554. [5] Ohlsson E., Johansson B. Non-life insurance pricing with generalized linear models[M]. Heidelberg: Springer. 2010.
23
谢谢!
24
在北京大学数学学院的报告
非寿险定价模型:理论与应用
孟生旺
中国人民大学统计学院 /mengshw
2013.4.22
1
主要内容
定价模型的分类 1:时间顺序
传统模型 当前行的模型 探索过程中的模型
定价模型的分类 2:模型性质
分类费率 经验费率 分类费率与经验费率的结合
i
从观察者中剔除 u j ,重新应用 GLM 估计 ......
16
GLM 的推广:广义可加模型(GAM)
g( i )
0
f1(x1i )
f2 (x2i )
...
进一步推广:GAMLSS
GAMLSS: 关于位置参数、尺度参数和形状参数的广义可加模型[4]
gk (θk ) Xk βk Zk γ k, k 1, 2, 3, 4
p0 = (1 - )q 0 k 1, 2, ... pk =(1 - )qk ,
p0
例:q ~ 泊松
Hurdle:
pk
(1 - )
qk 1 - q0
,
k
1,2,...
索赔强度:伽马、逆高斯、对数正态、帕累托、GB2 纯保费:Tweedie、零调整逆高斯 零调整逆高斯:
f (0) f (y ) (1 - )h(y ), h(y )~IG
A 商 B 商
车年数 1 1 1 k
1000 k
B 私 B 商
2000 1800 k
900
私家车 : 1000 商用车 : 1000
A 私 A 商
1000 1000
1000 k 2000
900 1800 k
2/ 1 =
k > 0,收敛到真实值:区域 B 的费率因子
2/ 1 =
0.9,商用车的费率因子
2
6
分类费率(传统模型:线性回归) 分类费率:广义线性模型
数据: Ei , N i , li1,...,liNi , x i1,...,x im ,
yi ~D( i , ), g( i )=xi
Ei , N i , Li =
Ni j =1
lij , x i1,...,x im
D:指数分布族, E(yi )= i , 常用分布的方差函数: 泊松: 伽马:
u0i
15
GLM 与信度模型的结合应用[3] :多水平因子
E(Yij |u j )=
i
iu j
表示第 i 个风险类别的所有普通费率因子的乘积;
u j 表示多水平费率因子的第 j 个水平, E (u j )=1 。
迭代: 假设 u j =1,应用 GLM 估计 从观察值中剔除
i
i
,应用信度模型估计 u j
不同方法估计的品牌因子
18
GLM 与 GLMM 估计的品牌因子估计值之比与车年数的关系 数据:2:普通因子+品牌+车型
是否考虑多水平因子对普通费率因子的估计值有影响吗?
19
定价中的几个实际问题
平衡调整: 泊松回归是平衡的。 伽马回归在对数连接下不平衡: 数据 2: 拟合值之和为 875406896, 实际赔款金额之和为 875790967, 低估了 0.044%。 [5] Offset 的应用 : 等价的泊松回归(对数连接) : (1) y=索赔次数,offset=log(车年数) (2) y=索赔频率,weight=车年数 等价的伽马回归(对数连接) : (1) y=案均赔款,weight=索赔次数,offset=log(已知因子值) (2) y=扣除已知因子值的案均赔款。weight=索赔次数 等价的 Tweedie: (1)y,weight,offset=log(u) (2) y/u,weight*u^(2-p)
4
5
分类费率:传统模型(最小偏差法:边际总和法)
风险类别(i, j)的纯保费: 行驶区域 A B 区域的边际总和: 用途的边际总和:
1000
ij
i j
汽车用途 私家车 商用车 私家车 商用车
A : 1000 B : 1000
A 私 B 私
每个车年的损失 1000 2000 900 1800
1000 1000
11
经验费率:信度模型
yit
ui
it
, ˆi
Z yi
(1 - Z )
,
Z
n
n v /a
12
13
经验费率:信度模型与线性混合模型
普通线性模型: yi
0 1x1 i
1i x1it 01w1i 11w1i
yit
0i 00 10
it
2 水平线性混合模型:
0i 1i
u0i u1i
化简:无解释变量,只保留截距项
分布假设:可计算 f (y)和f (y) 的所有分布 特例:GLM,DGLM,GAM,GLMM 例:对风险附加的计算更加合理,以标准差原理为例: 保单 A:均值 1000,标准差 1000 保单 B:均值 1000,标准差 500
17
中国车险数据分析:多水平因子的估计
数据 1:普通因子+品牌
不同方法估计的品牌因子
3
分类费率:传统模型(单项分析法)
行驶区域 A B 汽车用途 私家车 商用车 私家车 商用车 每个车年的损失 1000 2000 900 1800 车年数 1 1 1 1
基准类别:行驶区域 A、私家车。保费 = 1000 费率因子: 区域 B = [(900 + 1800)/2] / [(1000 + 2000)/2] = 0.9 商用车 = [(2000 + 1800)/2] / [(1000 + 900)/2] = 2 缺陷:如果车年数的分布不均衡?如:上表中最后一个车年数为 k(参见下图)
20
多重共线性:
车龄 投保类型 新投保 续保 1 年 续保 2 年 续保 3 年及以上 转入 1 4523 0 0 0 0 2 0 8996 0 0 11843 3 0 7593 6144 0 9634 4 0 5873 4965 3898 8319 5 0 5274 3850 4145 7367 6 0 4520 3214 3599 6371 7 0 3847 2677 3068 5436 8 0 2961 2135 2396 4387 9 0 2159 1592 1919 3382 10 0 1422 966 1239 1965
10
分别建模还是一次性建模? (1)索赔频率与索赔强度的影响因素不同 (2)索赔频率与索赔强度的相依性 S X1 X2 XN , E(S ) E(Xi )E(N ), 如果Xi 是iid且与N 相互独立
(3)分别建模,用 copula 反映相依性:R 程序包(copula[1],CopulaRegression[2])
相关文档
最新文档