广义线性模型与汽车保险费率厘定

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

广义线性模型与汽车保险费率厘定

胡三明

西南财经大学保险学院

【摘要】本文回顾了汽车保险费率厘定模型的发展历程,并对广义线性模型从建模、统计分析、模型的选择与诊断等方面进行了比较系统的介绍,最后通过一个汽车保险的实例来介绍其在分类费率厘定过程中具体运用,具有较强的实践意义。

【关键词】广义线性模型分类费率厘定

一、导论

对于传统费率厘定模型,精算师过于依赖简单的单因素分析法和双因素分析法,其中,单因素分析常受到费率因子间相关性的影响而被扭曲,同时也没有考虑到因子间独立性的影响。对此,精算师在六十年代探索出了迭代模型——最小偏差法,使其得到重大的改进,但仍然没有形成完整的统计框架。最小偏差法试图通过迭代的方法来求出一系列方程的最优解,但它无法测试一个特定的变量的影响效果,同时也不能提供可靠的参数估计范围。

广义线性模型(GLM)是传统线性模型以及许多最常见的最小偏差法的延伸,从技术角度看,比标准的迭代模型更有效率,它提供的统计诊断功能,有助于挑选重要的变量并且确认模型的假设条件。如今,广义线性模型在欧盟和许多其他市场,被公认为是对私家车和其他私人业务以及小额的团体业务进行定价的行业标准模型。

广义线性模型的个别特例很早就已出现,早在1919年就曾被Fisher使用过,二十世纪四五十年代,Berkson,Dyke和Patterson等人使用过最著名的Logistic模型,1972年Nelder和Wedderburn在一篇论文中率先使用广义线性模型一词,此后相关研究工作逐渐增加,1983年McCullagh和Nelder出版了系统的论著,并于1989年再版。

二、广义线性模型(一)、线性模型

一个传统的线性模型具有如下形式:

'

i i

y xβε

=+i

其中

i

y是响应变量的第i次观测,

i

x是协变量,

表示第i 次观测数据,未知系数向量β通过对数据i

y的最小二乘拟合估计出来。假定εi是均值为零,方差为常数的独立正态随机变量。对于一般的线性

回归模型(LM)'

i i

y xβε

=+i可以分解为三个要素:LM1:随机要素,即Y服从正态分布,

()

i

E y

μ=;

LM2:系统要素,'

i

x

ηβ

=;

LM3:连接要素,ημ

=;

(二)、广义线性模型

尽管传统的线性模型广泛地应用于统计数据分析中,但它却不适合处理如下几类问题:

(1) 将数据分布假设为正态分布并不合理;

(2) 当数据的均值被限制在一定的范围内时,传

统的线性模型就不适用了,因为线性预测值'

i

xβ可以取任意值;

(3) 假定数据的方差对于所有观测都是一个常数并不现实。

广义线性模型扩展了传统的线性模型,因此它适用于更广范围的数据分析问题。一个广义线性模型包括以下组成部分:

GLM1:随机要素,Y 服从比正态分布更一般的分布,即指数族分布;

GLM2:系统要素同LM2,即保持线性结构; GLM3:连接要素,()g ημ=其中g 为严格单调可微的函数,称为连接函数。

GLM 的通常表述如下:

()1i i ij j i j E Y g X μβξ-⎛⎫

==+ ⎪⎝⎭

()()

i i i

V Var Y φμω=

其中:i Y :响应变量向量;()g x :连接函数;

ij X :自变量矩阵;j β:待估计的参数向量;i ξ:

干扰项向量;φ:方差函数()V x 的散布参数;

()V x :方差函数;i ω:信度或权重;i Y 、ij X 、i

ω和i ξ依赖于对已知数据的处理,()g x 和()V x 则根据事先设定的模型得出,而φ或为已知,或为估计值。

1、指数族分布

设Y 为随机变量,若其密度函数为:

()()()();;exp ,y b f y c y a θθθφφφ⎧⎫⎛⎫-⎪⎪

=+ ⎪⎨⎬ ⎪

⎪⎪⎝⎭⎩⎭

其中a( )、b( )、c( )为已知函数,θ称为典型参数,φ称为散度参数。由Y 的对数似然可以计算得:

()()'E y b μθ== ()()()''Var y a b φθ=

Y 的方差是()b θ的二阶导数与()a φ的积,

()b θ只依赖于典型参数,因而只依赖于μ,所以,

一般记()b θ的二阶导数为()V μ,并称()V μ为方差函数。此外,一般取() a φ

φω

=

,ω称为权数。 对于一个指数族分布,当()b θ确定后其分布形式即确定了,所以只要方差函数V 确定了,对应的指数族的形式(如果存在)也就确定了。常见的几种分布都属于指数族,如下所示:

表一、常见指数族分布参数表

2、连接函数

连接函数是用来描述系统要素与随机要素期望值之间关系的函数形式。作为连接函数必须严格单调且充分光滑,即有足够阶数的导数。

()()()()exp ,i i i Y i y b f y c y a θθφφ⎧⎫-⎪⎪

=+⎨⎬⎪⎪⎩⎭

()()()()()()()()11'1'1exp ,i i i y b g b b g c y a ηηφφ----⎧⎫

-⎪⎪

=+⎨⎬

⎪⎪⎩⎭

(由于:()()()1

'1

b

g θηη--==)

当θη=时,上式可以简化为

()()()exp ,i i i y b c y a ηηφφ⎧⎫-⎪⎪

+⎨⎬⎪⎪⎩⎭

我们称之为自然连接函数,其最重要的优点在于它使广义线性模型下统计推断的大样本理论变得更易于处理。当然,实际处理过程中,连接函数的选取主要取决于问题本身。

3、参数估计

设1y ,2y ,…,n y 独立同分布,服从指数族分布:

()()()();;exp ,i i i i y b f y c y a θθθφφφ⎧⎫⎛⎫-⎪⎪

=+ ⎪⎨⎬ ⎪

⎪⎪⎝⎭⎩⎭

相关文档
最新文档