非寿险费率厘定的索赔频率预测模型及其应用
非寿险第三章3.4
R P F R V R Q 其中,RV为可变费用;RQ为利润。
例 假设: 纯保费
每个危险单位的固定费用
可变费用因子 利润因子
75.00
12.50
17.5% 5.00%
则费率为
75.00 12.50 R 112 .90 1 0.050
75.00
据其投保时所定的保险费率,向保险人交付的费用。保险 人依靠其所收取的保险费建立保险基金,对被保险人因保 险事故所遭受的损失进行经济补偿。因此,缴付保险费是 被保险人的基本义务,只有在被保险人履行了约定交费义
务的前提下,保险人才能承担保险合同载明的保险责任。
保险费由纯保费和附加保费构成,纯保费是保险人用于赔 付给被保险人或受益人的保险金,它是保险费的最低界限; 附加保费是由保险人所支配的费用,主要用于保险业务的 各项营业支出,包括营业税、代理手续费、企业管理费、
L S C
其中,S为索赔强度;L为损失;C为索赔总次数。
3.1.6 纯保费
纯保费(pure premium) :
每危险单位的平均损失。
纯保费的计算公式为
L P E
其中:P为纯保费;L为损失;E为危险单位总数。
纯保费也可以表示为: C L P FS E C 纯保费等于每危险单位的索赔频率与索赔强度的乘积。
承保危险(written exposures):
指所签的保单在某个时间内所有的危险单位数量 ;
承担危险(earned exposures):
指各个相应时间内已经承担责任的危险单位数量;
有效危险(in-force exposures):
指在一个给定的时刻危险单位数量。
例 4份保险期限为12个月的每份承保1辆车的 汽车保单,其承保危险、承担危险、有效危险 如下表
车险费率厘定的索赔概率预测模型及其比较分析
车险费率厘定的索赔概率预测模型及其比较分析
卢志义;蔡静
【期刊名称】《河北工业大学学报》
【年(卷),期】2017(046)003
【摘要】广义线性模型和广义可加模型作为经典线性模型的扩展,近年来在非寿险精算中得到了广泛的应用.本文在对2种模型进行简介的基础上,将驾驶员的性别、车型等8个变量作为费率因子,分别建立了车险索赔发生概率估计的广义线性模型和广义可加模型,并选取瑞典瓦萨(Wasa)保险公司的车险数据对2种模型的估计效果进行比较分析.结果表明,对于离散型费率因子占绝大多数的车险数据,广义可加模型并不具有明显的优势.因此,在车险费率厘定实务中,若离散型费率因子较多,应选择结构相对简单的广义线性模型.
【总页数】7页(P56-62)
【作者】卢志义;蔡静
【作者单位】天津商业大学理学院,天津300134;天津商业大学理学院,天津300134
【正文语种】中文
【中图分类】F224.7;O212
【相关文献】
1.非寿险费率厘定的索赔频率预测模型及其应用 [J], 孟生旺;徐昕
2.面板数据下的线性混合模型及其在车险费率厘定中的应用 [J], 张连增;王皎
3.基于Tweedie类分布的广义可加模型在车险费率厘定中的应用 [J], 孙维伟
4.大额索赔条件下的车险费率厘定 [J], 张连增;王缔
5.P2P租车平台商业车险费率厘定方法与实证研究 [J], 肖陆祇;肖陆镝;杜平;刘小西
因版权原因,仅展示原文概要,查看原文内容请购买。
市场约束条件下的非寿险费率厘定
l x b e a d fa il n a ov h o fe i l n e sb e a d c n s le t e c mmo r b e so r e o sr it n no l ei s r n e r tm a n . n p o lm fma k tc n tan so n-i n u a c a e kig f Key w or ds:n u a c i s r n e;n n—ie i s r n e;ma k tc n tan ;GLM ;r tm a i g o lf n u a c r e o sr it ae k n
ti cru tn e h a e rp s sameh dt dutteg n rl e ie rmo esb e u s eagr h o hs i msa c .T ep p rpo oe to oa j s h e eai dl a d l yrc ri loi m t c z n v t
费则 可 以用 T ede回归等 , 见孟 生 旺 。 wei 参
对广 义 线性模 型 回归系数 的估 计 , 常用 的方法是 极大似 然法 。对 于指数分 布族 而 言 , 最 具体 方法包 括
N wo . a ho 代法 和得分法 等 。然而 在一些特 殊情况 下 , 统 的估 计方 法可 能并 不完 全适 用 。譬 如 , e t R p sn迭 n 传
( 国 人 民大 学 统 计 学 院 。 京 10 7 ) 中 北 0 8 2
摘 要 : 非 寿 险 费 率 厘 定 中 , 常 遇 到 的 一 个实 际 问题 是 某 些 风 险 类 别 的 费 率 不 能 过 高 或 不 能 过 低 。在 这 种 在 经 约 束 条 件 下 , 统 的广 义 线 性 模 型 将 不 能 直 接用 于费 率 厘 定 。本 文 给 出 了 一 种 在 一 般 线 性 : 条 件 下 , 何 应 传 约束 如 用 迭代 算 法 对 常 用 的 广义 线 性 模 型 进 行 调 整 , 而 得 到 满 足 特 定 约束 条 件 的费 率 厘 定 结 果 。本 文 的 实 证 研 究 结 从 果 表 明 , 方 法 具 有 灵 活 性 和 现 实 可行 性 , 够解 决 非 寿 险 费 率 厘 定 中 常见 的 市 场约 束 问题 。 该 能 关 键 词 : 险 ; 寿 险 ; 场 约 束 ; 义 线 性 模 型 ; 率 厘 定 保 非 市 广 费
非寿险产品费率厘定精算准则
非寿险产品费率厘定精算准则目录第一章总则 (1)第二章原则与方法 (1)第三章风险因素 (4)第四章监控及报告 (7)第一章总则第一条为加强对保险公司非寿险产品费率厘定的监督管理,确保保险公司稳健经营和偿付能力充足,保护被保险人利益,根据《中华人民共和国保险法》和《保险公司管理规定》制定本指导原则。
第二条本指导原则所称保险公司,是指在中华人民共和国境内依法设立的经营财产保险业务的中资保险公司、中外合资保险公司、外资独资保险公司以及外国保险公司分支公司。
第三条凡是经营非寿险产品业务的保险公司,应当按照保险监督管理机构的规定,遵循非寿险精算的原理、方法和谨慎性原则,合理厘定非寿险产品费率。
第四条当本指导原则与任何法律法规或保险监督管理机构对于费率厘定的要求有所冲突时,应遵守法律法规或保险监督管理机构的规定。
因遵守法律或监管部门的规定而无法遵守本指导原则的规定,不属于违反本指导原则。
第二章原则与方法第五条经营非寿险产品业务,应该建立费率的管理制度,费率厘定的流程及配备相关的精算专业人员和必要地软硬件设备。
第六条费率厘定时应满足以下原则(一)费率是对未来风险转移成本的估计值。
(二)费率应反映所有风险转移的成本。
(三)费率应反映个体风险转移的成本。
(四)费率应当是合理的、适当的、充分的,并且是公平的。
第七条费率厘定过程中,除了考虑纯风险损失外,还需要考虑包括信用风险、操作风险等在内的各类风险。
除精算外,也应该听取承保、理赔、销售、法律、财务等领域专业人员的意见和建议。
第八条费率厘定应考虑其变化趋势:必须考虑过去的和未来的索赔成本、索赔频率、风险暴露、费用和保费的变化。
推荐使用动态财务分析,即在各变量互相关联的前提下,考虑未来的行为与环境的变化,进行预测分析。
第九条费率厘定时,需要考虑投保人、被保险人或相关人员的心理承受能力及经济支付能力。
第十条应当考虑到法律环境、经济环境和政府监管行为的变化对未来风险的影响。
非寿险定价模型
21
小结
仅仅讨论了非寿险定价模型的一小部分。不同保险产品的定价模型有较大差异。 非寿险定价模型主要是统计模型: 单项分析法 ----- 边际总和法 ----- GLM 信度模型 ---- 线性混合模型 ----- 广义线性混合模型 模型越来越复杂,边际效果会递减。 需要关注费用附加、风险附加和利润附加
i
2 i
var(yi )= V ( i )
逆高斯: Tweedie:
3 i
p i ,
1
p
2
7
均值相等,方差相等条件下 IG 与 GA 的比较
8
Tweedie 的密度函数: power=1.5; mu=200;
var(y)=phi*mu^power
9
分类费率:广义线性模型及其推广
索赔频率:泊松、负二项(泊松-伽马) 、泊松-逆高斯、泊松-对数正态,零膨胀、hurdle 零膨胀:
应用:以车险为例
2
保费构成:
保费 = 纯保费 + 费用附加 + 安全附加和利润附加 核心:纯保费
主要的定价方法:
分类费率(先验费率) : 传统方法:单项分析法、最小偏差法(如:边际总和法) 流行方法: GLM 探索中的方法:GAM、GAMLSS、...... 经验费率(后验费率) :信度模型,奖惩系统(BMS) 。 分类费率与经验费率的结合:GLM+CM,GLM+BMS,GLMM,GAMLSS 目的:体现公平,防止逆选择
yit
0i 0i 00 it
u0i
00
信度模型: yit
u0i
it
14
分类费率与经验费率的结合:广义线性混合模型
分类费率:广义线性模型 经验费率:信度模型(线性混合模型) 分类费率与经验费率的结合:广义线性混合模型(变截距)
分位数回归在非寿险产品费率厘定中的应用
分位数回归在非寿险产品费率厘定中的应用
郭念国;徐昕
【期刊名称】《统计与决策》
【年(卷),期】2010()24
【摘要】文章首先分析了非寿险产品费率厘定中的零索赔额现象;指出了线性回归模型和广义线性模型在非寿险产品费率厘定中存在的问题和不足;分析了分位数回归模型在非寿险产品费率厘定中的优点,并结合实例,给出了实证分析。
结果表明,分位数回归模型更能从整体上反映出费率厘定变量之间的关系及其对索赔额的影响。
【总页数】3页(P28-30)
【关键词】费率厘定;线性回归模型;广义线性模型;分位数回归
【作者】郭念国;徐昕
【作者单位】中国人民大学统计学院;河南工业大学理学院;中国保险监督管理委员会博士后科研工作站
【正文语种】中文
【中图分类】O212.1;F840.65
【相关文献】
1.广义线性混合模型及其在非寿险信度费率厘定中的应用 [J], 康萌萌
2.对非寿险级别费率厘定过程中损失率法的探究——基于同整体费率厘定的比较分析 [J], 汤志云
3.非寿险费率厘定中的分类费率因子研究 [J], 张俊岭;张俊峰
4.基于中位数回归模型非寿险精算中费率因子的显著性判别分析 [J], 郭念国
5.Copula函数在非寿险费率厘定中的应用 [J], 郭莲丽;李建勋
因版权原因,仅展示原文概要,查看原文内容请购买。
非寿险精算中的无赔款优待模型在信用卡年费定价中的运用_张青庚
л 1 = p0(1-p0)/(1-p0 +p02 ) л 2 = p02 /(1-p0+p02 ) 保单持有人在损失较小时可能不会索赔, 而 是用风险自负来换取保费的折扣, 对于投保人来 说, 只要折扣额高于损失额, 就不会索赔。 对于 保险人来说, 理赔次数减少也是有利的。 在损失分布一定的情况下, 由于保单持有人 选择大于折扣额的损失索赔, 最终将导致高折扣 组别的保单数比重增加。
三、 银行运用保险精算技术的意义
保险精算技术对于银行的金融产品开发和产 品定价是有一定的借鉴意义的, 特别是非寿险产 品的管理与银行产品的管理有很多类似的地方。 在国外, 有相当比例的精算师供职于银行机构, 并 运用专门的技术为产品开发提供支撑。 在我国, 精 算技术在保险领域的运用还处于初级阶段, 在银 行界的运用更是稀缺。 事实上, 提高银行界金融 服务的技术含量, 引入精算技术, 在理论上是必 要的, 在实践上也是可行的。 随着金融市场的进一步开放, 银行服务的定 价将更加灵活, 对定价技术与艺术的要求也就更 高。 非寿险精算技术中的 NCD模型, 是比较简单 并易于实践的, 引入这一模型, 对于探索信用卡 年费定价模型是有益的。
2 解得: л 0 =(1- p0) /(1-p0+p02)
一、 非寿险精算中的无赔款优待模型
保险的基本原理是积聚大量不相关的同质风 险, 通过保费的收取来补偿出险的支出。 但在险 种设定时, 风险异质的现象却比较普遍。 因此, 在 机动车辆保险中就有无赔款优待计费法。 其做法 是根据投保人的索赔历史记录, 确定是否给予保 险费的优惠以及优惠的程度。 把保费与历史损失 概率直接挂钩, 实质上是减少风险的不均匀性, 增 强风险单位的同质性。 NCD 模型最早出现于 20 世纪 50 年代的欧洲, 现已广泛运用。 我国在1995年以法规的形式确定了 NCD模型在机动车辆保险中的运用 《机动车辆 (见 保险条款》。 )我国在机动车辆保险条款中设定 有 : 一个无赔款年, 保费折扣率为10% 连续两年无赔 ; 款时, 折扣率15% 三年以上无赔款时, ; 折扣率20%。 虽然 NCD模型在精算界还存在争议, 但其优 点也是明显的, 比如 (1) : 有助于减少同一风险 组别中风险的非均匀性(2) ; 能够避免小金额的 索赔, 降低保险公司的理赔成本和索赔支出(3) ; 促进投保人安全驾驶, 减少交通事故, 从而降低 索赔支出(4) ; 鼓励驾驶安全度较高的驾驶员投 保, 聚集一批优等投保群体。 NCD 体系是马尔可夫(Markoff)链的一个类 型。 用向量л(t)表示时刻t下各个组别保单持有人的
非寿险精算理论与实验
一、索赔次数的拟合与检验表一给出了某非寿险公司100000份机动车损失频率和累计频率,它包括n=100000辆机动车,每辆汽车签订一份保单,每辆汽车的保险责任都是一整年,既没有中途退保的汽车,也没有未及时续保的汽车。
1.泊松分布拟合与检验1.1建立零假设和备选假设H0:总体服从泊松概率分布H1:总体不服从泊松概率分布1.2对于泊松分布,参数λ的据估计和极大似然估计值均为样本均值,即λ=0.12318。
1.3运用卡方拟合优度检验。
注意到“4”、“5”类的期望频率小于5,不满足卡方检验的要求。
因此我们把“4”、“5”两类合并为一类。
带入数值,得到卡方检验统计量的值71.881395>CHIINV(0.05,4-1-1)= 5.9914645,从而拒绝原假设H0。
2.负二项分布拟合与检验2.1建立零假设和备选假设H0:总体服从负二项概率分布H1:总体不服从负二项概率分布2.2运用矩方法,参数r=3.506912,p=0.9660672.3运用极大似然估计, 参数r=3.59840748233245,p=0.966901092646243每个理赔次数类别下的期望频数=样本容量*理论频率,由此我们可以计算出负二项分布拟合的期望理赔频数,结果如表二所示。
与前相同,我们把“4”、“5”两类合并为一类。
带入数值,得到卡方检验统计量的值1.1365479<CHIINV(0.05,4-2-1)= 3.8414591,从而接受原假设H0。
显然,负二项分布是一个更优的结果。
Excel计算结果如下所示:二、损失分布的拟合与检验如下表所示, 给出了某非寿险公司近几年来的损失分布记录:3030 3120 9960 690 15660 6060 60605160 8160 2310 2970 1110 11460 15602310 9100 14910 360 435 3360 33606045 11760 6960 7860 660 1725 756012060 510 3960 3660 3210 8760 119552 3000 6000 8 0.228571 7.62E-053 6000 9000 8 0.228571 7.62E-054 9000 120005 0.142857 4.76E-055 12000 16000 3 0.085714 2.14E-05合计35画出频率分布直方图:1.对数正态分布拟合1.1对数正态分布拟合(矩估计法)建立零假设和备选假设H0:总体服从对数正态分布H1:总体不服从对数正态分布用K—S0.152400666,查表的显著性水平0.05下的临界值为0.22425,从而我们不能拒绝原假设H0,用对数正态分布拟合是合理的。
非寿险第四讲
第五章经验费率厘定本章主要内容一、引言二、信度的含义三、有限波动信度四、贝叶斯方法五、一致最精确信度六、NCD系统例:假设某保险公司开发一新险种,保单组合由10位投保人构成。
开始,由于没有任何理赔经验数据,只能先验地假定他们具有相似的风险水平。
然后假定每一投保人每年至多引发一次理赔,且理赔额为1。
最初,根据同行业的损失水平,估计这一保单组合的保费为0.2,我们称这种保费为先验保费,或集体保费。
这样的估计是否符合实际情形,需要经验数据来验证。
为了搜集足够的理赔数据,保险公司连续追踪十年,采集的全部数据显示于下表。
请分析下表的数据,说明保费收取是否合理,该如何改进。
(1)总体平均理赔额为23/100=0.23。
(2)投保人9和1的理赔记录明显偏高,0.7与0.6的比例足以认为这二人的风险水平要劣于集体的风险水平;(3)投保人7、8和10无理赔记录,表明他们的风险水平又优于集体的风险水平。
经验费率厘定就是非寿险精算中用于消除风险子集的非同质性而发展起来的一类方法。
这些方法主要包括两大类:一类是在保险年度开始前,根据被保险人最近几个保险年度的理赔经验确定下一个保险年度的续期保费。
另一类是在保险年度末,根据被保险人当年的理赔经验来调整他在当年已经交纳的保险费。
二、信度与保费保费的构成)pure premium ⎧⎪⎧⎨⎨⎪⎩⎩纯保费(保险费完全附加保费(应付难以预料的确定性赔付)附加保费费用附加(支付经营费用,代理费用,税金等)纯保费是保险公司为了支付该保单在保险期间的期望赔付成本而收取的保险费。
可以分成两种情况考虑:(1)个别保单情形: ()i i p E C =,其中i p 表示第i 份保单的纯保费,()i E C 表示该保单的期望赔付成本。
(2)保单组合的情形设有N个同质的保单在观察时期内发生理赔,每一份保单的纯保费可以表示为()E SpN=, 其中()E S表示保单组合的总理赔额的期望,如200辆汽车总理赔额的期望为80000美元,则保费为80000400 200=⏹经验估费所谓经验费率厘定,就是在确定投保人的保费时,要考虑个人的理赔经验。
保险费制定的预测模型介绍
保险费制定的预测模型介绍随着社会的不断发展和进步,保险行业越来越成为人们生活中必不可少的部分。
保险公司需要根据风险进行保险费的制定,确定适当的价值水平。
然而,不同的保险公司采用的保险费率制定方法不同,其依赖的因素也不尽相同。
因此,开发方法来对保险费的制定进行预测是必不可少的。
本文将介绍一种预测保险费制定的预测模型——时间序列模型。
时间序列模型是一种分析数据变化趋势的方法,能够提供对未来数据值的预测。
在保险领域中,时间序列模型可以利用历史保险数据,预测未来保险费水平。
时间序列模型由三个重要的组成部分构成,即趋势(trend)、季节性(seasonality)和随机性(randomness)。
趋势是指数据值随着时间的推移而发生的持续性变化,季节性是指周期性变化的部分,而随机性则是指无规律变化的部分。
利用这些基本元素,我们可以建立时间序列模型来预测未来的保险费水平。
在建立时间序列模型时,我们需要首先确定时序数据中是否存在趋势、季节性和随机性。
如果存在以上三种元素,我们就可以根据时序数据中的趋势、季节性和随机性,建立相应的预测模型。
一般来说,我们可以采用一些方法来建立预测模型。
例如,我们可以利用平均值、加权平均值或指数平滑法等,来进行较为粗糙的预测。
这些方法的只能考虑到保险费制定的简单趋势,而没有考虑到可能存在的季节性和随机性,因此,它们的预测精度相对较低。
如果我们需要更加精确地预测未来保险费水平,我们可以采用较为复杂的时间序列预测方法,如“ARIMA模型”或“季节性ARIMA模型”。
这些方法可以更好地考虑到趋势、季节性和随机性因素,提高预测精度。
最后,我们还需要说明的是,预测模型并非万无一失,它所建立的预测结果是具有不确定性的,因此,我们还需要进行预测误差分析,防止其误导经营决策。
总之,时间序列模型是一种有效的预测保险费制定的方法。
它可以更好地考虑到不同因素的影响,提高预测精度,为保险公司的发展提供重要的决策支持。
预测模型运用简介
互联网大数据时代的到来,为保险业的改革和发展创造了难得的机遇,保险业是数据依赖型企业,精算师的工作也是建立在数据分析的基础上,近年来互联网大数据不仅为精算师提供了方便的分析工具,也在改变着现有的精算技能和方法。
数据量的增加及获取难度的降低,为“预测模型”的建立提供了保障。
传统精算技术碰上大数据时代,撞出了许多火花,预测模型也越来越多地为精算师所使用。
保险业正值供给侧改革,费率市场化为公司转型和结构调整创造了空间,科学运用预测模型,为公司实现销售创新、差异化定价和精准风险管理等提供了重要的技术支持。
一、预测模型的使用传统的精算技术利用大数法则计算平均值,只能在静态环境下较低的维度来量化风险,很难充分地反映风险的复杂性,一旦未来环境变化因素变多,对结果的预测效果将会大打折扣。
而且对于一些具有高度相关性的数据缺乏甄别作用。
随着技术的发展,数据数量的增加以及获取难度的降低,目前精算师越来越多地采用预测模型的方法来分析结果,预测模型建模其实是一个多变量统计方法。
与传统精算方式相比,采用预测模型建模的方式有如下优势:∙可以有效消除单变量所造成的偏差;∙是一种能有效使用数据的方式;∙得到的不仅仅是平均值,更是一个体现出不确定性的统计结果;能更好的体现不同变量间的联系。
二、如何建立预测模型预测模型一般先根据结果的需要收集原始数据,将尽可能多维度的数据收集起来,理解数据,清洗数据,并根据需要把数据变形或拓展。
挑选有用的数据作为自变量,然后再利用模型将因变量和自变量联系起来,常用的有广义线性模型(Generalized Linear Model),决策树模型(Classification and Regression Tree)等。
建立模型之后还需要通过如双向提升图,累计收益图,实际/预测之比等的不同方式评估模型,验证有效后执行,从而在今后利用自变量信息直接通过模型计算出需要的结果。
三、预测模型运用举例(一)保证续保定期寿险退保率预测保证续保定期寿险,一般以10年期,20年期为主,在10年或20年这段保费固定期内每年缴纳固定的保费,过了固定期后可以不经过核保直接保证续保,有的可以续保成另一个10年期或20年期保证续保定期寿险,有的可以续保成每年续保定期寿险(Annually Renewable Term,以下简称ART)。
非寿险的预测问题分析
一的自变量,这种模型通常被称作单变量模型。如果自变量不止一个,那么相应的模型称作 多变量模型。 在建立预测模型时,自变量的选取是值得深入分析的,而且预测的模型,在不影响预测 结果的情况下,一个简单的模型要优于复杂的模型。 5、误差 预测的误差主要来源于下述四个方面: (1) 选择误差:由自变量的选择不当而造成的误差。 (2) 建模误差:由模型的选择不当而造成的误差。当建模的基本条件发生了变化,从而 使得过去存在的某种关系受到干扰时,往往发生建模误差。 (3) 估计误差:这是由于历史数据中包含的随机波动而造成的误差。历史数据中包含的 随机波动将在建模的参数估计中得到反映。 (4) 随机误差:这是由于其他随机原因而造成的误差。 数据分析 在保险预测中,我们所获得的数据往往不是所期望得到的数据,在这种情况下,就要对 保险人所提供的数据进行 分解和分析。 在对数据分析之前, 我们必须考虑数据的充足性以及对其分解的意义, 另外必须对保险 人提供的数据进行检验,剔除有缺陷的数据。对数据进行分解时,必须注意到预测的实际要 求。 1、折线图 数据经过检验后, 下一步就要对观察值通过折线图的方式加以描述。 一个好的统计图可 以揭示出时间序列的主要构成因素,包括:异常值、间断点、拐点、长期趋势、周期波动以 及数据的其他波动。 对于折线图中异常值的出现, 往往表明数据中存在某种误差, 而异常值的处理有赖于其 产生的原因和预测的目的。 2、时间序列的构成要素 在自变量仅仅是时间的时间序列中,它由五个要素所组成:长期趋势、季节波动、周期 波动、残差和间断点。 长期趋势:变现为时间序列的推移而逐渐上升或下降的趋势。这种趋势可以是线性的, 也可以是指数型的或者其他更加复杂的曲线形式。 季节波动: 是时间序列随着时间的推移而呈现出的一种规律性变化。 这一术语通常用于 那些简单而又易于解释的周期性波动。 周期波动:相比于季节波动,周期波动倾向于较长的时期,而且周期波动的发现依赖于 较长时间的时间序列观察值。 残差:是时间序列中除长期趋势、季节波动和周期波动之外的生于变异。可以看作是一 种随机变异。 间断点: 间断点是两个时间序列的分界点: 第一个时间序列的尾部和第二个时间序列的 首部。间断点的出现可能会使间断点之前的部分或全部信息对今后的预测失去意义。 预测模型 数学模型是连接时间序列与保险预测的一个纽带。 数学模型是结合时间序列的分析结果并以 历史数据为基础而建立的,根据预测者的个人判断对数学模型进行调整即可得预测模型。 1、模型分类 在时间序列中,通常应用的数学模型可以分为两大类:一类是单变量模型,另一类是多 变量模型。
非寿险分类费率模型及其参数估计
正态的 ,如索赔频率可能更加接近于泊松分布 ,而索赔强度可能更加接近丁伽玛分布等 。在广
义线性模型中 ,可以允许因变量服从一种更为广泛的分布族 ———线性指数分布族 。该分布族
包含了我们所熟悉的许多分布 ,如指数分布 、泊松分布 、二项分布 、正态分布利伽玛分布等 。因
此 ,与普通的线性同归模型 (即用最小二乘法估计的加法模型 )相比 , 广义线性模刑具有更大
孟生旺
(中国人民大学应用统计科学研究中心 ,北京 , 100872)
摘要 :在非寿险分类费率厘定中 ,存在各种模型可供选择 ,如加法模型 、乘法模型 、混合模型和广义
线性模型等 ,而在这些模型的参数估计中 ,还存在各种可供选择的估计方法 ,如最小二乘法 、极大
似然法 、最小 x2 法 、直接法和边际总和法等 。这些模型和参数估计方法散见于各种精算学文献中 ,
可以证明 ,根据最小 χ2 法计算的纯保费 , 其保费总额不会小于赔款总额 。这对保险人而
言是一个不错的性质 ,因为可以保证不会因为保费不足而遭受损失 。
2. 4 直接法
直接法从乘法模型本身出发 ,确定相对费率的迭代公式 。譬如 , 如果已知 βj, 则由乘法模
型
μ ij
= E [ Xij ]
=αiβj 可知 ,αi
e- n iμj ij
( nij yij ) !
取对ij yij , μ nij ij ) ] = nij yij ( lnnij +αi +βj ) - nij eαi +βj - ln ( nij yij ! )
故对数似然函数为 L = ∑lij i, j
∑nijw ij (αiβj - yij ) = 0 j
在上述加权边际总和法中 ,当 w ij =αiβj 时 , 即得最小二乘法 :当 w ij = 1 / (αiβj ) , 即得直接 法 ;当 w ij = 1 + yij / (αiβj )时 ,即得最小 χ2 法 ;当 w ij = 1时 ,即得边际总法 。
非寿险公司赔付率应用与机构考核建议
综 合赔 付 率 影 响 较 大 , 支 机 构 分
往 往会 就准 备金 计提 的合 理性 问
21 0 0年 3月 份 的保 单 截 至 2 1 01
在对 分 支 机 构 进 行 考 核 时 , 年 6月 3 日的 满 期 赔 付 率 ; 0 到
题 与 精算 人 员 争 论 不 休 , 一 定 赔付 率 是 经 常使 用 的参 考 指 标 , 2 1 从 0 1年 7月 3 1日评 估 时 点 , 再 程 度 上给 精 算 人 员 制 造 压 力 , 容 它 们 从 各 个 角 度 反 映 了承 保 质 考核保 险 起 期 在 2 1 0 0年 4月 份 承保保 单 的业 务 质 销 、 案 延 迟 、 为 降低 未 决 估 立 人
都 其 中 , 取 未 决 赔 款 准 备 金 量 和核保 政 策 的执 行 情 况 , 在 损 充 足 性 等 , 是 机构 为 迎 合考 提 并
段时间后回溯检验 当时的承保 核 而 玩 “ 字游 戏 ” 数 的典 型 例 子 。 因 而 , 实 务 中 , 们 建 议 将 能 在 我 期 初 未决 赔 款 准 备 金 ; 取 未 到 政 策和 核保 松 紧程 度 , 常 为 承 提 经 期 责 任准备 金 =期末 未到期 责任 保 部 门所 用 , 被 产 品 定 价 部 门 够提 供 决 策 支 持 的 参 考 指 标 与 也 准备 金 一期 初 未 到 期 责 任 准 备 用 来进 行风 险分级 、 费率 调整 等 。 对分 支 机 构 的考 核 指 标 有 效 分 但 一 方 面 , 于 未 包 含 I NR、 离 。 由 B 金。
易导致 精算 部 门和分 公 司之间 的 量 、 赔 控 制 和 经 营 管 理 水 平 。 的保单 截至 2 1 理 0 1年 7月 3 1日的
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14
孟 生 旺 ,徐 昕 :非 寿 险 费 率 厘 定 的 索 赔 频 率 预 测 模 型 及 其 应 用
的随机变量,其 密 度 函 数 为 u(θ),通 常 称 作 结 构 函 数,那么Y 的边际分布就是一个混合泊松分布,均值 为λ[5]135-144。采用不同 的 结 构 函 数 将 生 成 不 同 的 混 合泊松分布,因此混 合 泊 松 分 布 的 尾 部 特 征 与 结 构 函 数 密 切 相 关 ,结 构 函 数 的 尾 部 越 厚 ,混 合 泊 松 分 布 的尾部将会越长。 在 混 合 泊 松 分 布 中,最 常 见 的 结 构函数是伽玛分布 和 逆 高 斯 分 布,相 应 的 混 合 泊 松 分布就是负二项分布和泊松-逆高斯分布。当然, 还 可 以 考 虑 其 他 结 构 函 数 ,如 对 数 正 态 分 布 、广 义 逆 高斯分布和平移伽 马 分 布,它 们 分 别 对 应 泊 松 - 对 数正态分布、Sichel分布和 Delaporte布。
过离散程度的索赔次 数 数 据。虽 然 可 以 证 明 广 义 泊
松分布和混合负二项 分 布 也 属 于 混 合 泊 松 分 布,但
由于其结构函数比较 复 杂,因 此 目 前 还 难 以 与 前 述
三个模型的过离散特征进行直接比较。
(一 )负 二 项 回 归 模 型
负二项 分 布 有 两 种 常 见 类 型,分 别 称 之 为 负 二
第 27 卷 第 9 期 Vol.27 No.9
【统 计 理 论 与 方 法 】
统计与信息论坛 Statistics & Information Forum
2012 年 9 月 Sep.,2012
非寿险费率厘定的索赔频率预测模型及其应用
孟 生 旺1,徐 昕2
(1.中国人民大学 应用统计研究中心,北京 100872;2.首都经济贸易大学 金融学院,北京 100070)
关 键 词 :非 寿 险 ;费 率 厘 定 ;索 赔 频 率 ;过 离 散 中 图 分 类 号 :O212 文 献 标 志 码 :A 文 章 编 号 :1007-3116(2012)09-0014-06
一、引 言
在 非 寿 险 分 类 费 率 厘 定 中,通 常 需 要 建 立 索 赔 频率的预测模型,并 通 过 该 模 型 对 被 保 险 人 的 期 望 索赔频率进行预 测,从 而 作 为 费 率 厘 定 的 基 础。 在 传 统 的 线 性 回 归 模 型 中 ,假 设 因 变 量 服 从 正 态 分 布 、 且具有相同的方差,但 索 赔 频 率 是 严 格 非 负 的 离 散 型 随 机 变 量 ,其 方 差 的 大 小 往 往 与 均 值 有 关 ,通 常 遇 到 的 情 况 是 均 值 越 大 ,方 差 也 会 越 大 ,故 传 统 的 线 性 回归模型很难满足建立索赔频率预测模型的需要。
摘要:在非寿险分类费率厘定中,泊 松 回 归 模 型 是 最 常 使 用 的 索 赔 频 率 预 测 模 型 ,但 实 际 的 索 赔 频 率 数 据往往存在过离散特征,使泊松回 归 模 型 的 结 果 缺 乏 可 靠 性。 因 此,讨 论 处 理 过 离 散 问 题 的 各 种 回 归 模 型, 包括负二项回归模型、泊 松 - 逆 高 斯 回 归 模 型、泊 松 - 对 数 正 态 回 归 模 型 、广 义 泊 松 回 归 模 型 、双 泊 松 回 归 模 型、混合负二项回归模型、混合二项回归模型、Delaporte回归模型和 Sichel回 归 模 型,并 对 其 进 行 系 统 比 较 研 究认为:这些模型都可以看 做 是 对 泊 松 回 归 模 型 的 推 广,可 以 用 于 处 理 各 种 不 同 过 离 散 程 度 的 索 赔 频 率 数 据 ,从 而 改 善 费 率 厘 定 的 效 果 ;同 时 应 用 一 组 实 际 的 汽 车 保 险 数 据 ,讨 论 这 些 模 型 的 具 体 应 用 。
二项 Ⅰ 型的过离散程度越严重;当a → ∞ 时,负二 项 Ⅰ 型退化为泊松分布。令λi = wiexp(xiTβ),即得 到负二项 Ⅰ 型回归模型。
负二项 Ⅰ 型的概率函数可以表示为: Pr(Yi =yi)=Γ(λi/σ)ΓΓ((λ1i/+σy+iy)(i1)σ+yiσ)yi+λi/σ
(yi =0,1,…) 负二项 Ⅰ 型的均值和方差分别为: E(Yi)=λi Var(Yi)=λi(1+σ) 可以看出:σ越大,负 二 项 Ⅱ 型 的 过 离 散 程 度 越 严 重;当σ→0时,负二项 Ⅱ 型退化为泊 松 分 布。令λi = wiexp(xiTβ),即得到负二项 Ⅱ 型回归模型。 (二)泊松 - 逆高斯回归模型
广义线性模型是对传统线性回归模型的推广, 在因变量服从指数 分 布 族 的 情 况 下,可 以 建 立 相 应 的广义线性模型,并 采 用 迭 代 加 权 最 小 二 乘 法 对 模 型参数进行估计。指数分布族包括一些很常见的分 布 类 型 ,如 二 项 分 布 、泊 松 分 布 、正 态 分 布 、逆 高 斯 分 布 等 。 可 以 证 明 ,在 广 义 线 性 模 型 中 ,迭 代 加 权 最 小 二乘法的估计结 果 等 价 于 极 大 似 然 估 计 。 [1]81-89 广 义线性 模 型 在 非 寿 险 费 率 厘 定 中 的 应 用 十 分 广 泛[2][3]36[4]81-127,在 索 赔 频 率 的 预 测 模 型 中 ,最 常 见
当实 际 观 察 数 据 存 在 过 离 散 特 征 时,可 将 泊 松 回归模型进行推广。由于混合泊松分布的方差总是 大于均值,因此一种 自 然 的 想 法 就 是 建 立 混 合 泊 松 回归模型。生成混合泊松分布 的 基 本 思 想 是:假 设 在θ给定的条件下,损 失 次 数 随 机 变 量Y 服 从 泊 松 分 布,即Y|θ=Poisson(λθ),而θ是一个均值等于1
在 处 理 过 离 散 数 据 时,可 以 考 虑 的 另 外 几 个 分 布 模 型 包 括 广 义 泊 松 分 布 、双 泊 松 分 布 、混 合 二 项 分 布和混合负二项 分 布。 可 以 证 明,广 义 泊 松 分 布 和 混合负二项分布也 可 以 表 示 为 混 合 泊 松 分 布,只 不 过其结构 函 数 较 为 复 杂[6-7])。 虽 然 还 不 能 证 明 前 面提到的其他过离散分布是否也可以表示为混合泊 松 分 布 ,但 由 于 其 具 有 方 差 大 于 均 值 的 性 质 ,因 此 也 可用于建立过离散索赔频率的预测模型。
二、泊松回归模型与混合泊松回归模型
假设共有 p 个分类变量,将所有保单 分 为n 个
风 险类别,其中第i个风险类别在p 个分类变量上的 取 值用xi = (xi1,…,xip )T 表示,并用wi 表示第i个 风险类别包含的风 险 单 位 数 (如 汽 车 保 险 中 的 车 年
数)。
令Yi 表 示 第i 个 风 险 类 别 的 索 赔 次 数 随 机 变 量,i=1,2,…,n。若Yi 服从泊松 分 布,则 其 概 率 函 数为:
泊松 - 逆高斯分布的概率函数有不同的表达 式 ,其 中 以 均 值 为 参 数 之 一 的 表 达 式 如 下 :
∞
∫ Pr(Yi =yi)=
exp(-θλi)(θλi)yi yi!
0
exp[- (θ-1)2/(2τθ)]dθ
槡2πτθ3
(yi =0,1,…)
15
收 稿 日 期 :2012-04-23;修 复 日 期 :2012-07-03 基 金 项 目 :教 育 部 重 点 研 究 基 地 重 大 项 目 《随 机 效 应 模 型 及 其 在 非 寿 险 风 险 管 理 中 的 应 用 》(12JJD790025);国 家 自 然 科 学
基 金 项 目 《考 虑 风 险 相 依 的 非 寿 险 精 算 模 型 研 究 》(71171193);中 国 人 民 大 学 科 学 研 究 基 金 项 目 (中 央 高 校 基 本 科 研 业 务 费 专 项 资 金 资 助 )《非 寿 险 定 价 的 精 算 统 计 模 型 及 其 应 用 研 究 》(10XNI001) 作 者 简 介 :孟 生 旺 ,男 ,甘 肃 秦 安 人 ,教 授 ,博 士 生 导 师 ,研 究 方 向 :风 险 管 理 与 保 险 精 算 ; 徐 昕 ,男 ,河 南 郑 州 人 ,讲 师 ,研 究 方 向 :风 险 管 理 与 保 险 精 算 。
项 Ⅰ 型和负二项 Ⅱ 型。
负二项 Ⅰ 型的概率函数可以表示为:
Pr(Yi =yi)
( )( )
=
Γ(a+yi) Γ(a)Γ(1+yi)a
a +λi
a λi a +λi
yi
(yi =0,1,…)
负二项 Ⅰ 型的均值和方差分别为:
E(Yi)=λi Var(Yi)=λi +λi2/a
从上述均值和方差的关 系 可 以 看 出:a 越 小,负
Pr(Yi
=
yi)=
exp(-λi)λiyi yi!
(yi =0,1,…)
泊 松 分 布 的 均 值 与 方 差 相 等,即 E(Yi)= Var(Yi)=λi。若令λi = wiexp(xiTβ),其中β是p × 1阶的参数向量,将其代入概率函 数,即 可 得 到 求 解
泊松回归模型的似然函数。
由于混 合 泊 松 分 布 的 方 差 总 是 大 于 均 值,因 此
的广义线性模型是 泊 松 回 归 模 型,即 在 索 赔 次 数 服 从泊松分布的假设基础上建立的回归模型。
泊松 分 布 的 特 点 之 一 是 方 差 等 于 均 值,而 实 际 上的索赔次数数据 往 往 具 有 过 离 散 特 征,即 方 差 大 于均值。导致过离 散 的 原 因 可 能 多 种 多 样,如 由 于 保险公司和保单持 有 人 增 强 了 风 险 防 范 意 识,大 多 数保单不会发生保 险 事 故;或 因 为 保 险 公 司 应 用 了 免赔额或无赔款折 扣 等 条 款,许 多 被 保 险 人 在 发 生 轻微事故时不会提 出 索 赔;或 个 别 被 保 险 人 的 风 险 太 大 ,其 索 赔 频 率 远 远 高 于 总 体 的 平 均 水 平 ,在 这 些 情况下若仍使用泊 松 回 归 模 型,可 能 会 低 估 参 数 的 标准误和高估其显 著 性 水 平,从 而 在 模 型 中 保 留 多 余 的 解 释 变 量 ,最 终 导 致 不 稳 定 的 费 率 厘 定 结 果 。