基于分层广义线性模型的非寿险费率厘定精算模型研究
广义线性模型的性质及其在非寿险中的应用
件 对 组 数 进 拟 模型 一 实际 据 行了 合。
2 广义线性模 型
21 指数分布族 .
在 讨 论广 义线 性模 型之 前首先 来 介绍 指数 分 布 族 。指数分布族按照 Jresn B n ̄ cgne , e t的定义包括一般 t 指 数分布族和 自然指数分布族 。一 般指数分布族包括 所有的分 布类型 : 连续型 、 离散型和混合型 。它 的一般
形式如下[ 3 1 :
, ; = x { ( ‘ ( + (i+ (/ ) ( ) ep d ) e ) g O) h y)
模 型引入精算学 中。从那时起广义线性模型就在精算
学 中得到 了广泛 的推广应 用 , 直到现在还 作为 汽车保 险和商业保 险定价 的常用方法 。广义线性模 型与普通 线 性模型相 比一个很大 的优点在于误差 项 的分 布 : 广 义 线性模 型的误 差项服从 自然指数分布 , 而普 通线性 回归模型 的误差 项服从正 态分布 , 这样 就使得 广义线 性 模型更加灵 活 , 适用范 围更加广 阔。 比如在保 险实 务 中 ,许 多损 失分布模 型的误差项方 差不再 是常数 , 用广义线性模 型处理这类 数据更加符 合实 际 , 出结 得 果 也 比较精确 。本文介绍 了广义线性模 型的基本理论 以及常用 的性质 , 对一些 常见 的属 于广义线性 模型 范 畴的模 型进行 了讨论分 析。并结合 S S A 软件用广义线
Ap l a in fGe e aie ie rmo esi I-i n u a c n r p ris pi t so n r l d Ln a d l c o z n ̄o leI s r n ea d P o e t f e
Xu Xi Gu a g o n o Ni n u
非寿险费率厘定中的分类费率因子研究
非寿险费率厘定中的分类费率因子研究作者:张俊岭张俊峰来源:《金融教学与研究》2008年第01期摘要:在非寿险保险业务中,风险特征完全相同的个体风险是几乎不存在的,即使存在,保险公司也不可能或很难将它们区分开来。
因此,保险公司只是将风险近似相同的保险标的划分在同一个类别里,用于划分风险的变量就是“分类费率因子”。
在保险实务中,分类变量的选择必须考虑到各方面的具体要求,同时分类变量过多,会使每个类别的保单数量相对减少,这将影响到大数法则的应用。
在风险划分的过程中,必须综合考虑风险基础、经验费率系统、市场运作等各个方面的情况,为保险公司厘定一个合理、公平、有效的保险产品价格。
关键词:非寿险费率;厘定;分类费率因子中图分类号:F840.6文献标识码:A文章编号:1006-3544(2008)01-0077-05一、保险分类费率因子概述保险是一种将少数人的损失由大多数人以相对较小的“公平份额”合理负担的机制。
它的一个基本运行原则是,这种“公平份额”应以被保险人的潜在损失为基础,支付了相同保费的被保险人应该具有相同的潜在损失。
因此,保险公司厘定保险费率时,首先应该将被保险人根据其风险大小进行分类,将风险相同的被保险人划入一个类别,并收取相同的保险费。
为了防范投保人的逆选择问题,在费率厘定过程中考虑风险的异质性也是十分必要的。
换句话说,保险费率应该合理反映投保人真实的风险水平。
在非寿险保险业务中,风险特征完全相同的个体风险是几乎不存在的,即使存在,保险公司也不可能或很难将它们区分开来。
因此,保险公司只是将风险近似相同的保险标的划分在同一个类别里,并对它们收取相同的保险费。
保险公司一般是根据保险标的自身的一些特征来划分风险类别的。
譬如在人寿保险中,保险公司根据被保险人的性别、年龄收取保险费;在汽车第三者责任保险中,根据驾驶员的年龄、汽车的车辆类型、使用性质等收取保险费。
保险公司用于厘定保险费率的这些变量就是分类变量,也被称作“分类费率因子”。
广义线性模型与汽车保险费率厘定
广义线性模型与汽车保险费率厘定胡三明西南财经大学保险学院【摘要】本文回顾了汽车保险费率厘定模型的发展历程,并对广义线性模型从建模、统计分析、模型的选择与诊断等方面进行了比较系统的介绍,最后通过一个汽车保险的实例来介绍其在分类费率厘定过程中具体运用,具有较强的实践意义。
【关键词】广义线性模型分类费率厘定一、导论对于传统费率厘定模型,精算师过于依赖简单的单因素分析法和双因素分析法,其中,单因素分析常受到费率因子间相关性的影响而被扭曲,同时也没有考虑到因子间独立性的影响。
对此,精算师在六十年代探索出了迭代模型——最小偏差法,使其得到重大的改进,但仍然没有形成完整的统计框架。
最小偏差法试图通过迭代的方法来求出一系列方程的最优解,但它无法测试一个特定的变量的影响效果,同时也不能提供可靠的参数估计范围。
广义线性模型(GLM)是传统线性模型以及许多最常见的最小偏差法的延伸,从技术角度看,比标准的迭代模型更有效率,它提供的统计诊断功能,有助于挑选重要的变量并且确认模型的假设条件。
如今,广义线性模型在欧盟和许多其他市场,被公认为是对私家车和其他私人业务以及小额的团体业务进行定价的行业标准模型。
广义线性模型的个别特例很早就已出现,早在1919年就曾被Fisher使用过,二十世纪四五十年代,Berkson,Dyke和Patterson等人使用过最著名的Logistic模型,1972年Nelder和Wedderburn在一篇论文中率先使用广义线性模型一词,此后相关研究工作逐渐增加,1983年McCullagh和Nelder出版了系统的论著,并于1989年再版。
二、广义线性模型(一)、线性模型一个传统的线性模型具有如下形式:'i iy xβε=+i其中iy是响应变量的第i次观测,ix是协变量,表示第i 次观测数据,未知系数向量β通过对数据iy的最小二乘拟合估计出来。
假定εi是均值为零,方差为常数的独立正态随机变量。
分层模型在非寿险精算学中的应用研究评述
2 0 1 3 年 5月
统 计 研 究
St a t i s t i c a l Re s e a r e h
Vo 1 . 3 0。No . 5
M a y 2 0 1 3
分 层模 型 在 非 寿 险精 算 学 中 的 应用研r i n c o r po r a t e s Ba y e s i a n me t h o d s, s t o c h a s t i c s i mu l a t i o n,c r e d i b i l i t y t he o y ,da r t a a n a l y s i s t e c hn i q u e s a n d s c i e n t i f i c
学科的发展具有重要的科学研究意义 。
An Ov e r v i e w o f App l i e d Re s e a r c h o f Hi e r a r c h i c a l M o de l s
i n No n. 1 i f e Ac t ua r i a l S c i e nc e
一
些 有 待 深 入 探 索 和 进 一 步 扩 展 的 新 思 路 。 这 对 提 升 我 国 非 寿 险精 算 学 科 的 统计 分 析 体 系 , 促 进 我 国 非 寿 险精 算 关键词 : 分 层模 型 ; 非寿险定价 ; 索 赔 准 备金 评 估 ; 贝叶斯方法 ; 信 度 理 论
中 图分 类 号 : F 2 2 2 . 3 文献标识码 : A 文章编号 : 1 0 0 2—4 5 6 5( 2 0 1 3) 0 5—0 0 9 8—0 7
Du a n Ba i g e & Zh a n g Li a n z e n g
非寿险费率厘定中的分类费率因子研究
公 司也不可能或很难将它们区分开来 。 因此 , 险 保 公 司只是将 风险近似相 同的保 险标 的划分在 同一 个类别里 , 并对它们收取相 同的保 险费 。 险公 司 保
一
又减少 ̄ 27 1 1个类别。 ] 影响车辆发生损失的风险因素 很多 , 在费率市场化的大背景下 , 计算每一类风险的 损失成本是非常重要 的, 保险公司可以借此来确定 每一类风险的保费。 例如 , 青年人相对成年人驾驶风 险要高些 , 以对青年人收取的保费也就相应要高 所 些。 如果对于驾驶员年龄因素不实行差别定价 , 那么 在 激烈 的市场 竞 争 中就会 因此 而 丧失 市 场 份额 , 那
收 稿 日期 :0 7 0 — 6 20— 90
作者简介 : 张俊岭 (9 0 , , 18 一)男 河北邯郸 人 , 中国人 民大学 统计学院
风险管理 与精算 学博士研究 生 , 究方 向 : 研 保险精 算 、 统
计模型 ; 张俊峰( 9 8 , 17一)河北邯郸人 , 西安交通大学 软件 学院硕士研究生 , 解放军西 安通信学 院讲 师 , 究方 向 : 研
的保单数量相对减少 , 这将影响到 大数 法则的应 用。 在风 险划分 的过程 中, 必须综合 考虑风 险基础 、 经验费率 系统、 市 场运作等各个方面的情况 , 为保险公 司厘定一个合理 、 平、 公 有效的保险产品价格 。
关 键
词 : 寿险 费率 ; 定 ; 类费率 因子 非 厘 分
文献标识码 : A 文章编号 :0 6 3 4 (0 8 0 — 0 7 0 10 — 54 20 ) 10 7 — 5
20 年第 1 总第 1 期) 08 期( 1 7
广义线性模型在保险业中的应用研究
广义线性模型在保险业中的应用研究广义线性模型是现代统计学中常用的一种模型,其广泛应用于各个领域,包括保险业。
保险业需要通过分析数据来预测风险和损失,从而制定保险策略。
广义线性模型可以应用于保险业的数据分析,从而使得保险公司更加准确地估计客户的保险需求和赔偿金额,降低公司的风险和成本,增加公司的竞争力。
广义线性模型是一个包含了线性模型和一些非线性模型的广泛类别,它可以描述多种不同类型的数据。
它能够处理连续型数据、离散型数据、计数数据和二分类数据等等,因此在保险业中应用广义线性模型不仅是因为其在数据分析中的灵活性,也是因其较为完备的统计理论基础。
保险业在数据分析中,广义线性模型的主要应用领域是回归分析、分类分析和多元分析等。
在回归分析中,广义线性模型可以通过分析客户数据和保险策略,预测客户未来可能的收入、财产、事故风险等。
在分类分析中,广义线性模型可以对不同形式的保险进行分类预测,帮助保险机构设计不同的保险产品,以更加全面地覆盖客户需求。
在多元分析中,广义线性模型可以使用多种变量同时解释数据,加上各项指标作为数据分析的依据,从而分析出保险产品的成本、投资收入和保险收益等指标,并为商业决策提供数据支持。
广义线性模型在保险数据中的应用需要根据具体的数据特点进行模型定制化,同时要结合业务经验来进行合理的变量选择和参数设定。
在模型的完善和调整上,保险机构需要持续研发优化、改进模型捕捉客户需求的能力,同时根据模型分析结果来优化公司的产品、策略和业务流程。
此外,在使用广义线性模型进行数据分析时,保险公司还需要注意数据隐私保护、信息安全以及模型预测的准确度等问题。
数据隐私保护是指在分析数据时保证客户的隐私得到完整保护,信息安全是指在数据分析过程中避免数据泄露等信息安全问题,而模型预测的准确性则是对模型质量的最终检验。
总的来说,广义线性模型在保险业中的应用,对于保险业的发展和经营是非常重要的。
只有通过数据分析,保险业才能更好地满足客户的需求、增强管理能力,并发挥其在经济社会中的积极作用。
广义线性混合模型及其在非寿险信度费率厘定中的应用
二、理论模型
(一)线性混合效应模型下的信度模型 根据 Frees等构建的 Bühlmann信度模型表达 式为:
狔犻狋 =β+α犻+ε犻狋 其中,狔犻狋 表示第犻个风险第狋年的损失,犻=1,2,…, 狀;狋=1,2,…,犜犻。假设α犻 均值为犈(α犻)=0,方差为 犇 = Var(α犻)=σα2,ε犻狋 均 值 为犈(ε犻狋)= 0,方 差 为 犚犻 =Var(ε犻)=σε2犐犜犻,α犻、ε犻狋 相互独立。β表示所有风 险损失的均值;α犻 表示第犻个风险的损失与总体损失 均值β之差,α犻 的方差σα2 为结构参数,表示风险间的 差异;ε犻狋 表示犻,狋固定时,第犻个风险第狋年的损失与 第犻个风险平均损失之间的差额,ε犻狋 的方差σε2 表示 同一个风险不同时期损失的差异。
信度理论是非寿险重要的定价方法,主要包括 有限波动信度理论和最精确信度理论。有限波动信 度理论假设随机因素是造成经验数据波动的最主要 原因。 为 了 克 服 该 理 论 的 不 足,1950 年 Arthur Bailey利用贝 叶 斯 方 法 研 究 信 度 理 论,开 创 了 最 精 确信度理论。1967 年 Bühlmann在贝叶斯理论框 架下,提出最简单的线性信度模型。随后,学者不断 改进该模型,提出BühlmannStraub和Hachemeister
72
康萌萌:广义线性混合模型及其在非寿险信度费率厘定中的应用
模型对非寿险信度保费进行厘定[5-6]。谢远涛等利 用广义线性混合模型研究非寿险信度模型,并以特 例形式利用同时考虑先验和 后 验 信 息 的 Tweedie 模型重新构建经典 Bühlmann和 BühlmannStraub 信度模型[7]。张连增和孙维伟利用因变量服从泊松 分布的广义线性混合模型对汽车保险费率进行厘 定,并用 R软件进行实证分析[8]。康萌萌和孟生旺 在广义线性混合模型框架下,利用 MCMC 模拟和 伪似然估计法对因变量服从伽玛分布和逆高斯分布 的交叉分类信度模型进行估计[9]。李政宵和孟生旺 建立具有空间效应的零膨胀贝叶斯分层模型,并对 模型中连续型协变量引入惩罚样条函数来描述非线 性效应,并将其用于非寿险索赔频率预测,研究表明 该模型优于传统的广义线性模型[10]。
基于 Tweedie 类分布的广义可加模型在车险费率厘定中的应用
选择 , 由于索 赔额 的损 失分 布通 常晕现 连续 右偏 的
分布 , 所 以常 常使用 伽玛 分布 、 逆 高斯分 布 、 对数 正 态 分布 或 帕 累托 分 布 来 对 索 赔 额 进 行 研 究 分 析
S a m s o n 在 车险定 价 中引入 经典线 性 回归模 型 ,
自1 9 8 0年 中 国人 民保 险公 司逐 步恢 复 中断近 2 5年 之 久 的机 动 车 辆 保 险 ( 简称“ 车险” ) 业 务 至
测 汽车保 险 的索赔 频率 和索 赔强 度 , 对 索赔 额 的研 究 町以归 为后 者 。B a i l e y和 S i m o n _ l 提出_ 『 加法 模 型 和乘法 模 型 , 并利用最 小二乘法对参数进 i 估
计 。Ho g g和 K l u g ma n 给 出 索赔 额 分 布 的 廿 f 能
今, 住 财产 险业 务 的 发展 中若 以保 费 论英 雄 的话 ,
车 险始终 处 于 主导 地 位 。2 0 0 0年 以来 , 车 险 保 费 收入 占整 个财 产 保 险保 费收 入 的 比重一 直 维 持 在 6 0 %以 } : 。机动 车辆保 险如 此重 要 , 财 险公 司收 取
造 了索赔 额 服从对 数 正态分 布时 , 索赔 金额 的结构 密 度 函数 , 引出 厂 保 单 末来索 赔金 额 的最优 估 计模 型 。黄顺林 等 基 于 T w e e d i e 分布和 Z A I G分布 建 立 索赔 额 回归模 型 , 应 用 汽车第 三者 责任 保 险 的损
第3 4 卷 第 1 期 2 0 l 4年 1门
大 津 商 业 大 学 学 报 J o u na r l o f T i a n j i n U n i v e r s i t y o f C o l l l l n e r c e
广义线性滤波模型在非寿险准备金评估中的应用
广义线性滤波模型在非寿险准备金评估中的应用赵立戎2012-6-14 14:11:03 来源:《统计与决策》(武汉)2011年14期第162~165页内容提要:文章在非寿险未决赔款准备金评估中,借鉴状态空间模型如Kalman滤波在准备金评估中的应用,以广义线性模型为基础,通过在贝叶斯估计中利用泰勒展开式的二阶近似式构造了离散指数族内的后验似然函数,生成广义线性滤波,可实现动态广义线性模型的参数估计,从而能够向模型中引入新的观测数据递归出更新的参数估计结果。
文章通过实例演示了伽玛广义线性滤波模型在准备金评估中的应用。
关键词:准备金广义线性模型滤波动态广义线性模型作者简介:赵立戎(1985-),女,安徽淮南人,中国人民大学统计学院博士研究生,研究方向:风险管理与精算学(北京100872)。
0引言对于一个广义线性模型(GLM),按照贝叶斯统计推断的理论,假设GLM的参数向量服从某个形式已知的先验分布,其后验分布就是该参数向量关于观测数据的条件分布,通过计算参数向量的后验分布解决参数估计问题。
在某些特殊情况如一元离散指数族下,能够找到自然共轭的先验分布,因而容易计算出后验分布的具体形式,此结论在多元离散指数族中并不成立。
因此在一般情况下,贝叶斯GLM的后验分布形式很难直接计算,因而产生了很多近似计算的方法。
例如West et al.在保留自然参数服从自然共轭先验分布的约束条件下给出了几种参数变换的形式。
Fahrmeir和Kaufman研究了估计后验分布的模。
近年来还有不少利用MCMC方法处理贝叶斯GLM问题的文献。
在精算领域的应用如Scollnik及de Alba等人的研究。
MCMC方法便于操作,但得不出后验分布的具体形式。
在实际应用中,近似的解析法虽然精度高但计算过于复杂,而随机模拟方法虽然便于实现却又得不到分布形式。
Greg Taylor[4]利用泰勒展开式,在多元离散指数族下构造出后验分布的二阶近似解析表达式,使其满足与贝叶斯GLM的先验分布同分布族的性质,并能够进一步产生迭代公式,生成一个与Kalman滤波算法类似的GLM滤波算法,可推广至动态广义线性模型(DGLM)的参数估计。
基于广义线性模型的分类费率厘定方法_汪妍
i
= E [ Yi ] = g Var[ Yi ] =
X ij V(
i
j
+
i
i
( 1) ( 2)
)
收稿日期 : 2009 -06 -04。 作者简介 : 汪妍 ( 1982- ) , 女 , 辽宁辽阳人。
392
辽宁科技大学学报
j
第 32 卷
式中 : Yi 为因变量向量; g ( x ) 为联结函数; X ij 为已知自变量矩阵 ; 干扰项向量; 1 2 为方差函数 V ( x ) 的散布参数 ;
u n
机变量。将 Y u 作为反应变量 , 采用幂方差函数, 建立广义线性模型
u
( 16) ( 17) ( 18) 2 时的分布具有上述性质。典型的
V(
) = = nu
u
经验表明, 索赔额的分布通常具有正的偏度且取正值。当 情况是 = 2, 对应的分布是 Gamma 分布和 Pareto 分布。 若设平均索赔额服从 Gamm a 分布 , 建立模型 u = E( Y u )
( 1. 辽宁科技大学 理学院 , 辽宁 鞍山 114051; 2. 辽宁科技大学 , 辽宁 鞍山
要: 在我 国传统 的财产 保险计量 模型基 础上, 提出 广义线 性模型与 风险费 率厘定 相结合 的定价 方法。
广义 线性模型有三项构成要素 : 随机成分 , 系统成分 , 联结函数 。 在非 寿险业务 中 , 通常 需要根据 个体风险 的 特征对其进行分类 , 并在分类的基础上厘定各个 风险类别的费 率 。 本文将这 两方面结合 起来 , 并在非寿险 的 费率厘定方面建立了相应模型 。
n
V( =
u
) = 1 v
车险费率厘定的索赔概率预测模型及其比较分析
车险费率厘定的索赔概率预测模型及其比较分析卢志义;蔡静【摘要】As extensions of classical linear model,Generalized linear models and Generalized additive models recently have been widely used in non-life actuarial science.In this paper,by using eight variables including gender and vehicle type as the rating factors,the probability of claim is modeled applying Generalized linear models and Generalized additive models respectively.Furthermore,the estimation effects between the two models are compared by applying the data of Wasa insurance company of Swedish.It is shown that Generalized additive models does not has clear advantage in fitting the data of automobile insurance because of the existence of more discrete covariables.Therefore,Generalized linear models should be adopt in insurance practice when there are more discrete risk factors.%广义线性模型和广义可加模型作为经典线性模型的扩展,近年来在非寿险精算中得到了广泛的应用.本文在对2种模型进行简介的基础上,将驾驶员的性别、车型等8个变量作为费率因子,分别建立了车险索赔发生概率估计的广义线性模型和广义可加模型,并选取瑞典瓦萨(Wasa)保险公司的车险数据对2种模型的估计效果进行比较分析.结果表明,对于离散型费率因子占绝大多数的车险数据,广义可加模型并不具有明显的优势.因此,在车险费率厘定实务中,若离散型费率因子较多,应选择结构相对简单的广义线性模型.【期刊名称】《河北工业大学学报》【年(卷),期】2017(046)003【总页数】7页(P56-62)【关键词】广义线性模型;广义可加模型;索赔概率;Logit联结函数;比较分析【作者】卢志义;蔡静【作者单位】天津商业大学理学院,天津300134;天津商业大学理学院,天津300134【正文语种】中文【中图分类】F224.7;O212对非寿险产品进行分类费率厘定的传统方法包括单项分析法、最小偏差法以及多元回归模型.单项分析法是最早出现的分类费率模型,属确定性模型,其优点是直观易懂,计算方便,而其主要缺陷是当各个费率因子存在相依关系时,单项分析法得到的结论不可靠.最小偏差法最早是由Bailey R和Simon L于20世纪60年代首先提出的[1],包括边际总和法、最小二乘法、最小χ2法、最大似然法等,其思想是设定一个目标函数,并在目标函数达到最优时得到相对费率的估计.最小偏差法可通过迭代公式求解,简便易行,因而也称为迭代法.最小偏差法虽然克服了单项分析法的不足,但和单项分析法一样,仍然缺少一个完整的统计分析框架对模型进行分析和评价[2].作为统计模型,多元回归模型克服了以上2种方法的缺点,在非寿险分类费率厘定中得到了较多的应用,但其严格的假设条件通常无法满足[2-3].1972年,Nelder对经典线性回归模型作了进一步推广,建立了统一的理论和计算框架,对回归模型的应用产生了重要影响,这种新的统计模型称作广义线性模型.与古典线性模型相比,广义线性模型将因变量的分布假设从正态分布扩展到包括正态分布在内的指数型分布,其方差随着均值的变化而变化,解释变量通过线性关系对因变量的期望值的某种变换产生影响.由于广义线性模型的模型假设满足了保险数据中特别是非寿险数据中非对称分布、非常值方差、非线性影响的典型特征,因而从其诞生起,便被广泛地用于包括费率厘定、准备金估计等非寿险精算的各个领域.广义线性模型理论的建立,极大地推动了以统计方法为基石的精算学的发展.近年来,广义线性模型在许多国家的保险实践中得到了广泛的应用,并逐渐成为行业标准模型.McCullagh和Nelder在文献[4]中首次对广义线性模型进行了全面的总结,并将其应用于一组汽车保险损失数据的分析.文献[5-7]介绍了广义线性模型及其在精算中的应用.文献[8]是最早讨论广义线性模型在非寿险费率厘定中应用的文献.文献[9]详细讨论了广义线性模型在费率厘定中的应用问题,该文分别讨论了对索赔概率(Claim frequency)和索赔额度(Claim severity)进行估计时,因变量的分布及联系函数(Link function)的选取等问题.文献[10]是关于广义线性模型在非寿险定价中应用的第1部专著.较早的文献中,都是假设索赔频率与索赔额度相互独立.在此假设下,纯保费就是索赔频率与索赔额度期望的乘积.大部分模型都对索赔频率与索赔额度分别建立模型进行估计,而文献[11-12]则通过建立基于Tweedie类分布的广义线性模型对总赔付额进行估计,但此类模型隐含了索赔频率与索赔额度之间是独立的假设.然而,在实务中,许多情况下索赔频率与索赔额度是不独立的.为了在模型中反映二者之间的相依性,学者提出了2类模型.一类是在建立平均索赔额的估计模型中将索赔次数作为解释变量而反映二者之间的相依关系,此方面的研究见文献[13-16];另一类方法则分别对索赔频率与索赔额度建立模型,然后通过Copulas将二者联结起来,如文献[17-18].文献[19]对以上2种方法的估计进行了对比分析.广义线性模型是经典线性回归模型的延伸和扩展,它将线性模型中的分布从正态分布推广到指数分布族,从而使模型的适用条件和范围得到了极大的扩展.然而,广义线性模型的一个主要缺陷是,其解释变量是以线性预测量的形式出现的.对于连续型的解释变量,当其对因变量存在非线性效应时,只有对其进行了适当的变换,才能使其非线性效应得到体现.但是,采取何种变换才能反映出这种效应是一个较难解决的问题.可加模型也是经典线性回归模型的扩展,它将线性回归模型中的预测变量的参数形式改为非参数的形式.可加模型在预测变量的效应上是可加的,为分别检验预测变量的效应提供了条件,并且克服了高维度带来的问题.广义可加模型是广义线性模型与可加模型的结合,它集成了二者的优点,因此是处理非线性关系的一种更加灵活而有效的工具.广义可加模型是由Hastie和Tibshirani于1990年提出的,文献[20]对广义可加模型进行了详细的介绍.文献[10]对广义可加模型在非寿险费率厘定中的应用进行了讨论.为了同时在模型中纳入离散型、连续型、分类变量以及空间效应因子,文献[21]采用更加灵活的Bayesian广义可加模型分别对索赔频率和索赔额度进行了预测.从经典线性模型扩展到广义线性模型,是非寿险费率厘定的一大进步.而广义可加模型又在广义线性模型的基础上,引入了非参数光滑技术,从而使模型的拟合具有更小的偏差和更大的灵活性.但是,对于车险费率的厘定,由于其风险因子大多是分类变量,使得广义可加模型的优势并不能得到充分发挥.因而,一个自然的问题是,在非寿险分类费率厘定中,广义可加模型是否比广义线性模型具有更大的适用性?本文拟在实证分析的基础上对这一问题进行探讨.由于对索赔概率和索赔额度分别建立的广义线性(可加)模型在模型结构上基本相同,因而本文只对索赔概率的广义线性模型和广义可加模型的估计效果进行讨论.本研究的着眼点在于不同模型预测效果的比较分析,因而在研究视角与研究内容上与前述文献有着本质的区别.本文在对广义线性模型和广义可加模型进行介绍的基础上,采用瑞典瓦萨(Wasa)保险公司的车险索赔数据,建立了索赔发生概率的广义线性模型和广义可加模型,并对2种模型进行了比较分析.研究表明,与广义线性模型相比,虽然对于连续型变量的非线性部分的拟合,广义可加模型具有其自身的优点,但对于离散型费率因子占绝大部分的车险数据,广义可加模型并没有特别明显的优势.因此,根据模型的简约性原则(Principle of parsimony.简约性原则是指在统计建模中,应通过较少的假设和较少的变量达到较大的解释和预测能力[22]).在车险费率厘定实务中,若离散型费率因子较多,应选择结构相对简单的广义线性模型.1.1 广义线性模型广义线性模型假设因变量服从指数型分布族,其方差随着均值的变化而变化,解释变量通过线性相加关系对因变量的期望值的某种变换产生影响.广义线性模型包括3个部分.1)随机成分,即因变量Y或误差项的概率分布.因变量Y的每个观察值yi相互独立且服从指数型分布族中的某一分布.指数型分布族的概率密度函数可以表示为其中:yi表示第i个观察值;a(φ),b(θi),c(yi,φ)为已知函数.2)系统成分,即解释变量的线性组合,表示为η=β1x1+β2x2+…βpxp.系统成分与古典线性模型没有区别.3)联结函数,联结函数g单调且可导,它建立了随机成分与系统成分之间的非线性关系,即g(μ)=η或E(Y)=μ=g-1(η).上式表明,在广义线性模型中,对解释变量的线性组合(ηi)通过函数g-1的变换之后即得对因变量的预测值.常用的联结函数包括恒等函数、对数函数、指数函数、logit函数等[4].显然,在正态分布假设和恒等联结函数下,广义线性模型等价于古典线性回归模型.需要强调的的,广义线性模型采用的是线性结构来描述解释变量对连结函数作用后的响应变量均值的影响,它虽然也体现了二者之间的非线性关系,但其函数形式有限.当解释变量以更加复杂的非线性影响形式存在时,就会极大地限制广义线性模型的应用,特别是当解释变量为连续型变量时.1.2 广义可加模型广义可加模型是广义线性模型的扩展,它保留了广义线性模型的基本框架,只是在模型的参数估计中植入了非参数光滑技术,从而使部分解释变量的影响表示成非参数函数形式.与广义线性模型相类似,广义可加模型也是由随机部分、系统部分和联结函数3部分组成,具体形式如下:设Y为反应变量,服从指数族分布,X1,X2,…,XP为解释变量,广义可加模型一般可表示为如下形式:其中:μ=E(Y|X1,…,XP);g(·)是联结函数;sj(·)是变量Xj的非参数光滑函数,并且假设sj(·)的二次导数存在且连续.实务中比较常用的模型是光滑函数可以采用各种类型的函数,如光滑样条函数、局部回归函数、自然三次样条函数、B-样条函数和多项式函数等.实务中常采用多项式函数反映非线性效应.但多项式函数的缺陷是当其次数较小时,模型不能灵活地反映数据的变化趋势;而次数较大又会导致估计的不稳健,特别是对于xj左右两边的极端点.因而最常用的就是样条函数.广义可加模型不仅体现了解释变量的线性影响,也包含了非线性影响,并且对解释变量的具体函数形式不作具体规定,体现了模型的灵活性.光滑函数sj(xj)可以根据实际情况采用任何形式,一般可使用光滑样条函数来进行拟合.对于光滑样条函数来说,一般采用惩罚最小二乘法来求解,也可以通过惩罚极大似然法求解.光滑样条的求解结合了粗糙度惩罚的思想,即找到合适的sj (xj)使得惩罚最小二乘函数或者惩罚极大似然函数最小化.其数学形式为:其中:λ表示光滑参数;n表示光滑节点数代表光滑度,当λj较大时,光滑度相对权重较大,拟合的曲线较平滑,反之,曲线较粗糙.2.1 数据及变量本文采用文[10]中的数据进行实证分析,该数据是1994-1998年瑞典瓦萨(Wasa)保险公司的车险数据.数据包含64 548个观测值,在观察期间,至少发生一次索赔的有670个,其中有27个索赔次数为2次,最大索赔额为365 347.数据包括9个变量,每个变量的含义如表1所示.文[8]采用此数据建立广义线性模型对索赔次数和索赔强度进行估计,并得出相对费率.本文分别建立广义线性模型和广义可加模型对索赔概率进行估计,并对2种模型的拟合效果进行对比分析.2.2 索赔概率的预测模型为估计索赔概率,本文仍采用常用的Logistic回归模型,即假设因变量服从二项分布,使用Logit联结函数.为了得到良好的估计效果,对于连续型费率因子,可采用多项式回归的思想,将费率因子的高次项加入线性预测部分.对于本文的数据,通过绘制散点图,发现索赔频率的logit函数与年龄呈非线性关系,于是,根据散点图,考虑将年龄的二次方项加入线性预测量,建立如下广义线性模型:采用SAS的GENMOD过程进行分析,输出结果见表2~表4.由表3和表4可知,7个费率因子变量总体效应是显著的,且各变量的等级因子大部分都通过了参数的显著性检验.以下采用广义可加模型对索赔概率进行拟合.同广义线性模型相同,在用广义可加模型拟合索赔发生概率时,假设因变量服从二项分布,使用Logit联结函数.考虑将驾驶员的年龄、性别、所在区域、车型、车龄、折扣以及保单持有期作为解释变量,索赔概率作为因变量,建立如下模型:其中,s(·)表示光滑函数.利用SAS软件进行数据拟合,程序运行结果见表5~表7.由此可知,所建立的广义可加模型的非参数部分的拟合优度较好,大部分分类变量的等级因子是显著的.2.32 种模型的比较分析考虑到2种模型在模型评价指标上的差异性和非一致性,本文主要采用模型的偏差(Deviance)对所建立的2种模型进行评价和比较.本例中,广义可加模型的偏差为6 659.04,而广义线性模型的偏差为6 699.54,由此可知广义可加模型的拟合结果稍好.这说明,较广义线性模型而言,广义可加模型的非参数特性增加了模型的灵活性和适应性,具有较好的拟合效果和更大的适用范围.但是,从数据可以看出,两模型的偏差并无明显的差别,因而广义可加模型比广义线性模型并未体现出明显的优势.事实上,广义可加模型也有其局限性,在样本量不变的情况下,当模型中的解释变量较多时,广义可加模型会因为“维度的灾难(curse of dimensionality)”而使方差急剧增加,从而导致拟合效果的下降.另外,虽然对连续型解释变量的非线性部分来说,广义可加模型具有更好的拟合优度和更大的灵活性.但是,车险数据大都比较复杂,既有只取少数几个值的分类变量,也有连续型的变量,并且一般情况下分类变量较多.对分类变量占绝大多数的车险数据进行拟合,采用对于连续变量非线性拟合有极强能力的广义可加模型并不是最佳的选择.因而,在实务中,应将2种模型结合使用,互相映衬.如可以采用两阶段法进行建模,即在第1阶段采用广义可加模型对各费率因子进行探索性研究,找出对具有非线性影响的费率因子及其影响形式;第2阶段,将不同类型(线性影响和非线性影响)的费率因子以不同的形式纳入模型,建立广义可加模型,并将其与广义线性模型的拟合效果进行对比,在兼顾模型复杂程度与拟合效果的基础上选择较好的模型.【相关文献】[1]孟生旺,刘乐平.非寿险精算学[M].第2版.北京:中国人民大学出版社,2011.[2]孟生旺.广义线性模型在汽车保险定价中的应用[J].数理统计与管理,2007,26(1):24-28.[3]孟生旺.非寿险定价[M].北京:中国财政经济出版社,2011.[4]McCullagh P,Nelder J.Generalized linear models[M].London:Chapman and Hall,1983.[5]De Jong P,Heller G.Generalized linear models for insurance data[M].New York:Cambridge University Press,2008.[6]Haberman S,Renshaw A E.Generalized linear models and actuarial science[J].The Statistician,1996,45:407-436.[7]卢志义,刘乐平.广义线性模型在非寿险精算中的应用及其研究进展[J].统计与信息论坛,2007,22(4):26-31.[8]Brockman M J,Wright T S.Statistical motor rating:making effective use of yourdata[J].Journal of the Institute of Actuaries,1992,119:457-543.[9]Renshaw A E.Modeling the claims process in the presence of covariates[J].ASTIN Bulletin,1994,24:265-285.[10]Johansson B,Ohlsson E.Non-Life insurance pricing with Generalized Linear Models[M].Springer,2010.[11]JorgensenB,deSouzaMCP.FittingTweedie’scompoundPoissonmodeltoinsuranceclaimsdata[J].Scan dinavianActuarialJournal,1994,1:69-93.[12]Quijano-XacurOA,GarridoJ.Generalisedlinearmodelsforaggregateclaims:ToTweedieornot[J].EuropeanActuar ialJournal,2015,5(1):181-202.[13]Frees E W,Wang P.Copula credibility for aggregate loss models[J].Insurance Mathematics and Economics,2006,38(2):360-373.[14]Gschlubl S,Czado C.Spatial modelling of claim frequency and claim size in non-life insurance[J].Scandinavian Actuarial Journal,2007,3:202-225.[15]Frees E W,Gao J,Rosenberg M A.Predicting the frequency and amount of health care expenditures[J].North American Actuarial Journal,2002,15(3):377-392.[16]Garrido J,Genest C,Schulz J.Generalized linear models for dependent frequency and severity of insurance claims[J].Insurance:Mathematics and Economics,2016,70:205-215.[17]Czado C,Kastenmeier R,Brechmann E C,Min A.A mixed copula model for insurance claims and claim sizes[J].Scandinavian Actuarial Journal,2012,4:278-305.[18]Kramer N,Brechmann E C,Silvestrini D,et al.Total loss estimation using copula-based regression models[J].Insurance:Mathematics and Economics,2013,53(3):829-839.[19]Shi P,Feng X,Ivantsova A.Dependent frequency-severity modeling of insurance claims[J].Insurance:Mathematics and Economics,2015,64:417-428.[20]Wood S.Generalized Additive Models:an introduction with R[M].Chapman&Hall,2006.[21]Denuit M,Lang S.Non-life rate-making with BayesianGAMs[J].Insurance:Mathematics and Economics,2004,35(3):627-647.[22]Spirer H F,Spirer L.Misused Statistics[M].2nd edition.CRC Press,1998.。
广义线性模型在非寿险精算中的应用及其研究进展
二、 广义线性模 型与非寿 险精算
( ) 非 寿 险精 算 中 , 典 线 性 模 型 虽 然得 到 一 在 经 广泛 的应 用 , 也面 临 无法克 服 的缺 点 但 1 在 经典 线性 模 型 中 , . 假定 反 应 变 量 是 服从 正
基金项目: 天津市 20 05年度社科研究 规划项 目( J5 Jm ) T0 一T 0 ;中国人 民大学应用统计科学研究 中心重 大项 目
8 年代。其应用涉及到精算学的各个领域 , 0 如生命 表的修匀 、 损失分布、 信度理论 、 风险分类、 准备金和
费率估计等方面。广义线性模 型的建立 , 大地推 极 动了以统计方法为基石的精算学的发展。经典的线 性 回归模型, 都是建立在对称分布的基础上 , 以常值 方差为假设。但在精算实践中 , 所采集的数据往往
卢 志义 , 平 : 线性 模型在非寿险精算 中的应 用及其研究进展 刘乐 广义
态分布 的连续 变 量 , 这 一 假 定 在 应 用 中可 能 是 不 但
成立的。如索赔 次数是 离散变量 , 索赔 额大小 的分 布往往是右偏 的。 2 经典线性模型中, . 假定各数 据点 的方差是相 等的, 但在实际应用中这一假定会遭到破坏 。如索 赔次数的方差可能随其期望值 的增大而增大。 3 在非寿险中, . 损失事件发生的概率是 0和 1 之间的数 , 若将 此变量作为反应变量 , 如果再简单地 将概率表示为解释变量的线性组合是不合适 的, 因 为该线性组合 的取值可 以是 ( 一∞ , +∞) 中的任何
相继 问世 , 目前 除 了 由 N AG( mei l grhms Nu ra Aloi a c t G op研 发 的专 用 程 序 GLM ( eeazdLna ru ) I G nrle ier i
基于广义线性模型的住宅工程质量保险费率厘定
( 大连理工 大学 建设工程学部 ,辽 宁 大连 1 2 ,Emal j 04 — i j 1 6 :l@mal lt d . idu. u n) . e a 摘 要 :为 了合理 、科 学地计 算住 宅工程质量保 险 费率 ,采用广义线性模型对该险种分类 费率进行厘定 。介绍 了建筑工程质
K e wo d : rs et l r et ulyisrn e n un e atr eeai dl er d l r ig y r s ei ni o c;q ai uac ;if e c co;gn rl e na e;pin d ap j t n l f z i mo c
目前 ,我 国建筑 工程 质 量施 行质 量保 修制 度 。 责 任 方是施 工 单位 ,开 发单 位负 连带 责任 。其 中 ,
考虑分类费率厘定时 , 风险因子和费率影响因
子是不同的,风险因子对于索赔事故的频率或强度
具有直接的影 响,但有时不宜度量,因此 , 在厘定
偏差法 ,而最小偏差法的最大缺陷是不能够提供一
收稿 日期 :2 1一O 2 0 1】一 0
费率时 往往选择易度量的费率因子。结合影响建
筑工 程质 量 的风 险因子 与 费率 厘定 的易 度量 性 ,本
种统 计方法 对 特定 费率 因子 的显著性 进行 评价 ,也 就是 不 能提 供 一个完 整 的统计 分 析框架 【。二是 运 7 J
用最小偏差法时 , 两个费率因子的迭代求值过程 已
经够 复 杂 的了 ,而建 筑工程 质量保 险 的费 率 因子 不
工 程 管 理 学 报
其他 原因 1 0 00%
第2 6卷
1 . 施工单 位 3
基于广义多项式混合效应模型非寿险信度费率厘定
Non-life Insurance Credibility Ratemaking Based on Generalized Polynomial Mixed Effect Models
作者: 康萌萌
作者机构: 山东财经大学保险学院,济南250014
出版物刊名: 统计与决策
页码: 31-35页
年卷期: 2017年 第23期
主题词: 广义多项式混合效应模型 信度理论 限制性虚拟似然法
摘要:广义线性混合效应模型在非寿险精算中有着广泛的应用。
然而,广义线性混合效应模
型假设模型的系统成分随时间变化是线性的。
但在精算实践中,系统成分随时间的变化并非线性,而是不同时间系统成分的变化率可能不同。
当变化为非线性时,通常将时间变量的多项式函数加
入广义线性混合效应模型的系统成分中,从而得到广义多项式混合效应模型。
文章将广义多项式
混合效应模型用于信度费率厘定中,并用美国马塞诸州城镇车身损失责任保险的损失额数据进行
实证分析,研究表明,当系统成分随时间非线性变化时,用广义多项式混合效应模型比用广义线性混合效应模型预测效果好。
精算技术在非寿险中应用的探讨
精算技术在非寿险中应用的探讨
马剑鹤
【期刊名称】《上海保险》
【年(卷),期】2005(000)010
【摘要】精算业最早起源于英国的人寿保险业,经过200多年的发展,在寿险的险种费率厘定、准备金提取、财务分析、再保险安排等方面都已得到广泛的应用。
近年来,精算技术开始应用于非寿险。
【总页数】2页(P50-51)
【作者】马剑鹤
【作者单位】中国太平泮财产保险股份有限公司核保核赔中心
【正文语种】中文
【中图分类】F8
【相关文献】
1.模糊数学在非寿险精算中的应用 [J], 樊婷婷;吴穹
2.精算技术在社会保险基金管理课程教学中的应用--以养老保险为例 [J], 李锐;杨雷;刘倩
3.广义线性模型在非寿险精算中的应用及其研究进展 [J], 卢志义;刘乐平
4.分层模型在非寿险精算学中的应用研究评述 [J], 段白鸽;张连增
5.基于统计学原理的非寿险精算应用探讨 [J], 杨鑫;蔺琳
因版权原因,仅展示原文概要,查看原文内容请购买。
我国车险费率厘定的实证研究——基于广义线性模型的分析
我国车险费率厘定的实证研究——基于广义线性模型的分析赵慧卿;王汉章【期刊名称】《天津商业大学学报》【年(卷),期】2011(031)005【摘要】Automobile insurance industry has been developing rapidly in China. Scientific and fair rate making system is important for the sound development of automobile insurance industry in China. The paper evaluates rate making with the generalized linear models of loss frequency and loss severity, and analyses respectively the impacts of automobile, hmnan and area on loss frequency and loss severity.%目前,我国的机动车保险业进入快速发展阶段。
科学、公平的费率厘定方法,对我国车险行业健康发展具有积极意义。
从索赔频率和索赔额度两个方面利用广义线性模型估计保险费率,分析了从车、从人、从地三个因素的变动对索赔频率和索赔额度的影响。
【总页数】5页(P8-12)【作者】赵慧卿;王汉章【作者单位】天津商业大学经济学院,天津300134;天津商业大学经济学院,天津300134【正文语种】中文【中图分类】F840【相关文献】1.车险费率厘定的索赔概率预测模型及其比较分析 [J], 卢志义;蔡静2.基于广义线性模型的我国车险赔付费用厘定的应用研究 [J], 王星皓3.我国合资寿险公司效率的实证研究——基于Tobit广义线性模型 [J], 何小伟;谢远涛4.基于Tweedie类分布的广义可加模型在车险费率厘定中的应用 [J], 孙维伟5.P2P租车平台商业车险费率厘定方法与实证研究 [J], 肖陆祇;肖陆镝;杜平;刘小西因版权原因,仅展示原文概要,查看原文内容请购买。
基于广义线性模型的保险风险识别和定价的开题报告
基于广义线性模型的保险风险识别和定价的开题报告一、研究背景保险风险识别和定价一直都是保险公司非常关注的问题。
传统的保险风险识别和定价方法往往只考虑少数的因素,如年龄、性别、职业等,忽略了其他可能对保险风险产生影响的因素。
由于保险公司的合理利润是建立在成功控制风险的基础之上的,因此,对于保险公司来说,采用一种更加全面的方法来识别和定价风险显得尤为重要。
广义线性模型是一种广泛应用于统计建模的方法,在保险风险识别和定价中也有广泛的应用。
它能够考虑到多种因素的影响,甚至包括不同的因素之间的交互作用,能够很好地帮助保险公司识别不同风险的类型,并对这些风险进行合理的定价。
二、研究目的本次研究旨在利用广义线性模型,结合保险行业的实际情况,对保险风险进行全面、科学的识别和定价。
通过对各种可能影响保险风险的因素进行全面的分析和建模,寻找保险品种中不同的风险类型和变量之间的关系,并在此基础上制定出合理的保险风险定价策略。
三、研究内容1. 分析保险风险识别和定价的现状和存在的问题,总结广义线性模型在保险风险识别和定价中的应用。
2. 研究保险风险的相关因素,包括个人信息、家庭信息、健康状况等方面的因素,结合保险公司的实际情况确定具体的模型变量。
3. 基于广义线性模型,建立完整的保险风险识别和定价模型。
在模型的构建中,考虑变量之间的相关性和交互作用,选择合适的分布族和连接函数,同时考虑到实际应用中的数据处理、模型评价和不确定性的问题。
4. 基于模型结果,制定出合理的保险风险定价策略。
四、研究意义本次研究以广义线性模型为基础,针对保险行业的实际情况,对保险风险识别和定价进行了深入研究。
具有以下意义:1. 提高保险公司的风险识别和定价水平,有利于保险公司的可持续发展。
2. 扩大保险行业对现有网络数据和结构化数据的应用,促进大数据和互联网技术在保险风险识别和定价方面的广泛应用。
3. 为保险公司提供科学的保险风险定价策略,提升保险公司的市场竞争能力。
广义线性模型在保险精算中的应用研究
广义线性模型在保险精算中的应用研究广义线性模型(GLMs)在保险精算中的应用研究随着信息技术的不断发展和应用范围的日益扩大,保险行业也面临着诸多挑战。
保险精算作为保险业务中的重要组成部分,通过对大量的数据进行统计分析和风险评估,为保险公司的决策提供依据,实现了保险风险的可控和盈利的最大化。
其中,广义线性模型(GLMs)作为一种重要的统计方法,被广泛应用于保险精算中。
首先,广义线性模型提供了一种灵活的建模框架,能够同时处理连续型和离散型的因变量。
在保险精算中,往往需要对不同类型的风险进行评估,而这些风险可能是连续型的,如理赔金额、保费等,也可能是离散型的,如赔付次数、保单状态等。
传统的线性回归模型只能对连续型因变量进行建模,对于离散型因变量则无能为力。
而GLMs则通过通过引入一个链接函数将预测变量与因变量联系起来,从而可以灵活地处理不同类型的因变量。
其次,广义线性模型在建模过程中允许引入各种协变量和非线性关系,提高了模型的灵活性。
保险行业中丰富的数据类型和复杂的关系,常常需要考虑多个协变量之间的相互作用以及其与因变量之间的非线性影响。
GLMs通过引入链接函数和广义估计方程等手段,能够更好地应对这些情况,提高模型的拟合度和预测准确度。
此外,广义线性模型在保险精算中还能够应用于费率调整和风险评估等领域。
在保险业务中,费率的制定涉及到众多因素,包括历史数据、市场竞争、新产品推广等。
GLMs通过对历史数据的分析和建模,能够对费率进行合理的调整和优化,以实现保险公司的盈利目标。
同时,在风险评估方面,GLMs能够通过建立预测模型,对未来可能出现的风险进行预测和评估,为保险公司的业务决策提供科学依据。
然而,广义线性模型在应用过程中也存在一些挑战和限制。
首先,模型的建立和训练需要大量的数据和计算资源,这对于一些规模较小的保险公司来说可能是一个障碍。
其次,GLMs在处理非线性关系时,常常需要通过引入多项式项或转换变量等方式进行处理,这增加了模型的复杂度和解释的困难度。
广义线性模型在中国车险费率厘定中的研究的开题报告
广义线性模型在中国车险费率厘定中的研究的开题报告
题目:广义线性模型在中国车险费率厘定中的研究
摘要:
车险是指机动车辆保险,通常包括车辆损失险和第三者责任险两个方面。
中国的车险市场随着人口和汽车保有量的增加而快速发展。
对于保险公司来说,正确估计风
险和定价是保持竞争力和获得利润的关键之一。
广义线性模型(GLM)是一种广泛应用于风险管理和保险精算的统计方法,它将响应变量(即赔款金额)与协变量(即车辆基本信息,行驶记录等)建立了预测模型。
本研究将探讨GLM在中国车险费率厘定中的应用,并且使用真实数据对其进行验证。
本研究的主要目的是确定中国车险的主要风险因素,并建立车险的最佳定价模型,以提高精算师和保险公司的精算水平以及保险公司的竞争优势。
本研究的详细内容包
括建立车险GLM模型、对模型进行评估和验证、分析和讨论研究结果,并提出相关建议和未来展望。
研究方法将提取中国大量的车险数据进行GLM模型的建立和验证,并且比较模
型的预测结果和实际建模过程中发现的因素。
最后,本研究将探讨利用机器学习算法
来改进车险GLM模型的可靠性和预测精度。
本研究的成果将对中国车险市场具有重要的理论和实践意义,对提高保险公司的精算水平,增强竞争力和获得利润等方面都有积极的推动作用。
关键词:车险;广义线性模型;精算;风险定价。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第32卷第6期 Vol. 32 No. 6统计与信息论坛Statistics &Information Forum2017年6月Jun. , 2017【统计应用研究】基于分层广义线性模型的非寿险费率厘定精算模型研究孙维伟S张连增2,胡祥3(1.天津理工大学管理学院,天津300384; 2.南开大学金融学院,天津300350;3.中南财经政法大学金融学院,湖北武汉430073)摘要:非寿险业务中的损失数据结构日益复杂,呈现异质性与相关性并存的异象。
分层广义线性模型能够突破传统费率厘定精算方法仅分析风险个体同一保单年损失数据的局限,可以提高复杂结构损失数据预测的准确性。
基于分层广义线性模型等方法,研究具有多年损失数据的非寿险费率厘定问题,并以车险和工伤补偿保险的两组损失数据为例进行实证分析。
研究结果表明,相对于G L M而言,考虑随机效应后GLMM的拟合优度大幅改善,G L M M与H G L M可以更有效地反映不同风险个体的差异,并有利于揭示风险个体在多个保险期内损失的异质性与相关性。
关键词:分层广义线性模型;费率厘定;非寿险;随机效应中图分类号:F840. 65 文献标志码:A文章编号= 1007 — 3116(2017)06 — 0048 — 07一、引言在当今竞争日益激烈的保险市场中,相对于寿 险产品而言,非寿险产品创新严重滞后于市场需求,在费率厘定方面亟需从遵循大数定律向以复杂数据 为支撑的模式转变。
传统的精算方法在厘定基础费 率时通常视同一风险个体具有风险分布均匀的特 点,进而以一个保单年的损失数据为基础厘定费率。
然而,这种方法导致的问题是风险个体在连续投保 期间自身行为间的差异被忽视,即只考虑不同风险 个体间的异质性而未考虑个体自身行为的相关性或 不确定性,进而大大降低了精算定价的精准性;而过 高的保费将导致财险公司丢失一定的市场份额,过 低的保费会使财险公司亏损乃至破产。
上述问题如 果得不到有效解决,难以化解非寿险产品定价过高 或过低的诟病,这势必会严重影响非寿险产品的创 新进程,并阻碍非寿险行业的可持续发展。
鉴于此,综合考虑保险大数据的产生及现代保 险实务领域费率厘定精算技术的迫切需求,本文从 挖掘非寿险费率厘定中损失数据异质性与相关性的 视角出发,采取前沿统计技术构建多个精算模型以 比较并讨论非寿险业务中的纵向损失数据,期冀准 确地揭示在连续多个保险期内风险因子对风险个体 损失的影响。
二、文献评述依据非寿险精算理论,纯保费等于索赔频率与 索赔强度的乘积,因而非寿险费率厘定需要对索赔 频率与索赔强度建模(也可以是对索赔次数与索赔 金额的建模),进而厘定纯保费费率与附加费率。
目前,关于非寿险费率厘定精算模型或者方法的研究,主要集中于分类风险费率厘定、个体风险费率厘定 与相依风险费率厘定三个方面:第一,就分类风险费 率厘定而言,基于广义线性模型(GLM)的非寿险精收稿日期:2016 —12 — 09;修复日期:2017 — 04 —17基金项目:国家自然科学基金青年项目《驾驶行为对车险市场索赔的影响、风险评估与激励策略研究》(71603180);《基于 不完全信息和相依结构的最优再保险策略研究》(71601186);《基于相依结构的多元索赔准备金评估随机性方法研究》(71401041)作者简介:孙维伟,女,辽宁鞍山人,经济学博士,讲师,研究方向:精算与风险管理;张连增,男,山东莱芜人,理学博士,教授,博士生导师,研究方向:精算与风险管理;胡祥,男,安徽安庆人,经济学博士,讲师,研究方向:精算与风险管理。
48孙维伟,张连增,胡祥:基于分层广义线性模型的非寿险费率厘定精算模型研究算方法已有了 一系列的研究[1]l13°[2]nH°°,并逐步 推广到保险实务中。
在非寿险费率厘定与准备金评 估中,相关学者已展开了对G L M拓展类模型的研 究,相比之下对分层建模在非寿险费率厘定中的理 论与应用则研究甚少。
第二,就个体风险费率厘定 而言,其经典成果当属信度理论与奖惩系统,其中最 大精度信度模型下的Biihlmann信度模型与Biihlmann-Straub信度模型的应用较为广泛。
作为 进一■步的研究,Ohlsson 和 Johansson[2]、Ohlsson[3]将信度理论与GLM结合研究了多水平因子的费率 厘定问题;谢远涛等人也将信度理论与广义线性混合 模型(GLMM)结合进行了个体风险的经验费率厘 定[4],可见GLM拓展类模型的研究逐渐兴起但不成 熟,仍需要学者进行深人研究。
第三,就相依风险费 率厘定而言,既有研究主要是引人Copula函数(包括 Archimedean Copula、Gumbel Copula和 Frank Copula 等)构建回归模型,并作为刻画非寿险损失数据、索赔 频率与索赔强度之间相依性特征的主要手段[5]。
纵观已有研究,虽然学术界对非寿险费率厘定 问题进行了深人研究并取得了一定成果,但依然存 在进一步完善的空间,其中重要的一点是忽视了风 险个体自身索赔(或损失®)数据结构的复杂化动态 发展,对于既包含不同风险个体的异质性又含有同 一风险个体连续多年投保相关性的损失数据进行费 率厘定,缺乏系统性研究。
同时,关于异质性与相关 性在管理学、社会学、经济学等其他领域的研究较 多,而非寿险费率厘定领域中基于异质性与相关性 视角估计或预测损失的研究却鲜有提及。
本文在已有理论研究基础上,在纵向数据分析 框架下审视非寿险索赔(或损失)数据的损失异质性 与相关性,并通过构建多种精算模型分析揭示风险 个体在随机效应存在的条件下风险因子对索赔次数 与损失金额的影响。
所做工作的贡献主要是,在非 寿险分类风险费率厘定方法中引人分层广义线性模 型(HGLM),识别、判断与分析由于风险个体行为 特征引发的随机效应,并对现阶段非寿险精算中基 于G L M费率厘定进行了拓深与延展,有益于精算 人员进一步辨别风险个体自身的行为特点对损失次 数或者损失金额的影响,以便及时调整费率因子,降 低风险不确定性,从而为提高非寿险产品创新提供 理论參考…_______________三、分层模型框架下非寿险费率厘定的基本理论模型(一)G L M费率厘定模型的不足既有研究表明G L M至少存在以下方面的不 足[6]h:第一,G L M要求观测数据来自独立(随机)变量,而非寿险费率厘定越来越需要处理具有层次 结构的纵向数据或分层数据,由于此类数据往往难 以满足独立性要求,因此G L M难以适用;第二,G L M要求对模型的具体形式做出假设,如果模型 中某些分类变量的水平数过多而对应于某个水平的 数据量过少,那么虽可获得该水平变量的参数估计 值但其标准误差较大;第三,虽然G L M可以同时考 虑多个风险因素,即对风险个体的索赔频率与索赔 强度进行拟合或预测损失,但仍无法分析风险个体 的索赔(或损失)在多个观测期内受随机效应的影响。
(二) 基于G LM M费率厘定模型的理论简介假定存在™个风险个体,第z个风险个体在第j 个保单年发生的索赔(或损失)次数或金额用随机 变量 Y= (Y y.)(i=1,2,…,=1,2,…,w)表示。
在GLM M框架下进行费率厘定,需要对三个部分进 行合理设定。
1. 随机部分:在指定随机效应6 = (h,62,•••,的条件下,的观测变量相互独立且服从指数族分布(简记为EDF),其概率密度函数为:f(y t, \bt=啡(从;眞)+^:(騎))j = 1,2 ,•••,n(1)其中#•)和^卜)是已知函数為是自然参数…为尺度参数。
随机部分的核心是两个分布:一是在随机效应6的影响下服从指数族分布;二是随机效应6应服 从均值为〇、协方差矩阵为G(y)的多维正态分布,即6〜JV(0,G),y是方差分量参数向量。
2. 系统部分:响应变量的均值和解释变量的系可以用线性预测项jy=X/5+2&来表示,其中X为固定效应的设计矩阵,Z为随机效应的设计矩阵,①索赔与损失是两个紧密相关又有区别的概念。
损失是相对于被保险人而言,索赔是指保险发生后由索赔人根据保险合同的规定向保险人提出的赔付请求。
索赔依赖于损失大小,然而由于保险合同中免赔条款的存在或者被保险人不报案的事 实,在非寿险定价等保险业务中索赔与损失往往不完全相等。
49统计与信息论坛为模型固定效应的待估参数。
3•联结函数:g (") = X /5 + 2&,其中g (.)是一 个单调可微的函数,称为联结函数,包括恒等联结、 对数联结、logit 联结等,记其逆联结函数g -1 (•)= «•),则条件均值可表示为E (Y | W = " = /l (X i 3 +Zb ) 〇(三)基于H G LM 费率厘定模型的理论框架H G L M 由L e e 和Nelder 提出[7],不仅考虑了 均值受固定效应与随机效应的影响,并且可以对离 散参数(dispersion parameter )进行建模。
1.H G LM 的基本结构。
对于〇^)而言,为进一步揭示与刻画不同风险个体间索赔(或损失) 次数或金额存在的异质性以及风险个体内索赔(或 损失)次数或金额存在的相关性特征,引人随机性 风险参数(Ml ,m 2,…,w m )T ,:H GLM 的结构包含 以下四个基本假设:1)独立性假设:是指在风险参数影响的条件下,假设风险个体的索赔(或损失)次数或(或损失) 金额是相互独立的。
2) 分布假设:是指1, 服从指数族分布,其概率密度函数可以表示为:U ,= exp—b (.d ‘y )、c('y(2)其中>0为某已知权重(视为常数),t ?y 为自然参 数…为离散参数,&(•)与•)为某已知函数。
3)结构性假设#与X /? + Z W 之间的变化关系可以通过某个联结函数联系起来,即= X /? +办或"=/i (X /? +厶)。
作为GLMM 进一步的拓展,X /?+ Z »中包含的随机效应W 是由M 通过某个严格单调函数沿(•)的作用后生成的新变量,即^ =沿(M )。
4) 风险参数的分布假设:即在HGLM 中,随机性风险参数能够刻画不同风险个体z 的异质性风 险特征。
与GLMM 中只假设随机效应^服从正态分 布相比,HGLM 假设功服从EDF 的共轭分布为:f vXzv) = exp|^-(^T O — 6(w )),A,) (3)其中0 =(办,01 ,…,办)称为超参数,9 = (9y )和又=(A 。
^,…,A m )称为离散参数。
2.办似然与参数估计。
关于H G LM 的参数估计 问题,L e e 和Nelderm 、L e e 等[8]提出基于/^似然 (hierarchical likelihood ,简记为 /i -likelihood )函数 和拟/i 似然(quasi 士likelihood )函数的方法,用于H G LM 中固定效应与随机效应的估计。