区间数据下EV线性回归模型修正的广义最小二乘估计_何其祥

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第20卷第4期 2011年7月

系统管理学报

Journal o f Systems &M anagement

Vol.20No.4 Jul.2011

文章编号:1005-2542(2011)04-0480-05

区间数据下EV 线性回归模型修正的

广义最小二乘估计

何其祥

(上海财经大学应用数学系,上海200433)

=摘要>研究了当响应变量为区间数据时的EV 线性回归模型,通过构造区间数据的无偏转换,并对广义最小二乘估计作适当修正,得到了回归参数的估计,在较一般的条件下证明了强相合性和渐近正态性。最后作了若干模拟计算,从模拟的结果发现,利用本文提出的方法所获得的估计具有较高的精度。

关键词:区间数据;EV 线性模型;无偏转换;修正的广义最小二乘估计中图分类号:O 212.1 文献标识码:A

The Modified Generalized Leas-t Square Estimation for EV Linear

Regression Model with Censored Interval Data

H E Qi -x iang

(Depar tm ent o f Applied M athematics,Shanghai U niversity of Finance and Econom ics,

Shanghai 200433,China)

=Abstract >In this paper,w e co nsider an EV linear regr ession m odel under censored interval respo nse.By constructing unbiased tr ansform ation of the censo red interval data,and mo dify ing the generalized least square estimation,w e obtain the estimators o f regr ession parameters and prov e te strong consistency and asym ptotic no rmality under g eneral conditions.T he simulation results indicate that o ur m ethod performs very w ell in term s of the accuracies of the estim ation.

Key words:censored interval data;EV linear mo del;unbiased transfor matio n;m odified generalized least square estimation

收稿日期:2009-11-26 修订日期:2010-07-05基金项目:国家自然科学资助基金项目(10971033)

作者简介:何其祥(1963-),男,副教授。研究方向为非参数统计

及不完全数据分析。

E -mail:qxhe@m

众所周知,线性回归模型是统计学中最重要的模型之一,其参数的估计有许多良好的性质。但在许多应用问题中,变量之间的关系无法用精确的线性模型加以刻画。考虑如下的Erro r -in -Variable (EV)模型

Y i =x T

i

B +E i X i =x i +u i

i =1,2,,,n (1)

式中:x i 为R p

上不可观测的随机向量,且独立同分布;X i 为R p

上可观测的随机向量;B 为p @1未知参数;E i 为独立同分布的模型误差,均值为0,其分布函数F 连续可导;u i 为p 维独立同分布的测量误差。记e i =(E i ,u i ),假设e i 的均值为0,协方差矩阵为2ee ,并设x i 与e i 相互独立(i,j =1,2,,,n)。对模型(1),最早的研究可以追溯到Tintner [1]和Geary

[2]

;Gleser

[3]

在2ee =R 2

I p +1的假定下,给出了B

的极大似然估计的极限分布;Daham 等[4]

讨论了B

的广义最小二乘估计;崔恒建[5-6]考虑了B 的L 1-估计和M-估计,在较一般条件下,证明了它们的强相合性和渐近正态性;高玉福等

[7]

证明了2ee =R 2

I p +1

情形下,B 的广义最小二乘估计的强相合性和渐近正态性;李高荣等[8]讨论了带有协变量误差的部分线性EV 模型,得到了未知参数的极大经验似然估计以及估计的渐近正态性;崔恒建[9]

定义了线性EV 模型的T -型估计,并给出了T -型估计的EM 算法,同时获得了估计的相合性;冯三营等[10]

对非线性EV 模型作了研究,通过构造未知参数的经验对数似然比统计量,利用统计量的渐近分布,构造得到了未知参数的置信域。刘强等[11]

考虑了响应变量随机缺失的线性EV 模型,依然通过构造未知参数的经验对数似然比统计量,得到了未知参数的置信域。

在EV 模型的应用过程中,待处理的数据通常是不完整的,会遇到区间删失的情况。如在问卷抽样调查中,被调查者每月收入的准确数值通常无法得知,而只知道落入某区间

;又如在医药统计中,为了得到某种新药的最大安全剂量,通常采用的办法是让受试者不断加大剂量,观察其是否出现不良反应。若第i 个受试者在服用剂量为U ij 时无不良反应,而剂量增至U i,j +1时出现不良反应,则最大安全剂量位于区间(U i,j ,U i,j +1)内,但无法确定其具体的数值。对于响应变量被区间删失的EV 线性回归问题的研究,至今还未有文献上出现。本文首次在响应变量区间删失情形下对模型(1)进行讨论,构造未知参数B 的估计,并讨论估计的大样本性质。由于响应变量无法观察到具体的数值,得到的信息只是它们落入某一区间,因此,本文吸取了Zheng [12]

和邓文丽[13]处理区间数据的无偏转换的思想,即构造区间数据变量的无偏转换,它们与原变量有相同的均值,将转换后的量用于广义最小二乘估计。同时,为保证B 的估计具有良好的大样本性质,文中对B 的广义最小二乘估计作了修正。

1 模型与估计

在模型(1)中,假定2ee =R 2

I p+1。响应变量

Y i (i =1,2,,,n)被区间删失,观察到的数据为

(U i ,V i ,D 1i ,D 2i ,X i )=(U i ,V i ,I Y i [U i

,I U i 0。

引进如下记号:

X =(X 1,X 2,,,X n )T

, Y =(Y 1,Y 2,,,Y n )T

x =(x 1,x 2,,,x n )T ,

2=E(x 1,x T 1)

A n =

1n

Y T Y 1n

Y T X 1n X T Y 1n

X T X , A =

EY 2

1

B T

2

2B 2+R 2I p 当x i 无测量误差且Y i 未被区间删失时,B 的最

小二乘估计为

(x T x )-1x T Y

(3) 当存在测量误差u i 、Y i 仍为完整数据时,由于

Y i =X T

i B -u T

i B +E i , i =1,2,,,n (4)

若取B 的估计为

(X T

X )-1

X T

Y (5)

显然,模型(4)不是同方差的,且式(3)不具有相合性。因此,考虑如下的广义最小二乘估计,使得

Q n (B )=

E

n

i=1

(Y i -X T i B )

2

1+B T

B

= 1-B T

A n

1-B

1-B T

1

-B

(6)

达到最小的解,记为B GL S 。

对于Y i 被区间删失的情形,类似于文献[7],以下就p =1和p >1分别讨论。

(1)p =1的情形。通过直接计算,不难得到使得式(6)达到最小的广义最小二乘估计为B

GLS =2X T Y (Y T Y -X T X )2+4(X T Y)2-(Y T Y -X T X )

(7)

由于Y i 无法直接观察到,自然的想法是:构造Y i 的无偏转换,它和Y i 有相同的均值,并直接代入式(7)。为此,令

Y *i =U 1(U i ,V i )D 1i +U 2(U i ,V i )D 2i +

U 3(U i ,V i )(1-D 1i -D 2i )

i =1,2,,,n

其中,U 1、U 2和U 3为连续函数,与Y i 的分布函数独立,并且假设存在连续偏导数5U j 5u ,5U j 5v (j =1,2,3),

同时满足

Q +]v=0

Q v

u=0

U 1

(u,v)g (u,v)d u d v =0

Q +]x

U 2

(x ,v)-U 1

(x ,v)g(x ,v)d v +

Q x 0

U 3

(u,x )-U 2

(u,x )g(u,x )d u =

1

(8)则[12]EY i =E Y *i 。但是,通过直接与仔细的计算,发现B *GLS =

T *

481

第3期

何其祥:区间数据下EV 线性回归模型修正的广义最小二乘估计

相关文档
最新文档