变系数模型的研究与分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变系数模型的研究与分析
【摘要】:非参数回归一般假定回归函数属于某一个函数类,如常常假定回归函数是一个光滑的函数,因此非参数回归对模型的假设很少,最主要的优点就是模型具有稳健性。非参数回归作为现代统计分析的主要方法之一,得到广泛的应用。对于非参数回归人们提出了许多估计方法,如核估计,局部多项式估计,光滑样条估计,级数估计(傅里叶级数估计,小波级数估计)等。这些方法本质上讲都是局部估计或局部光滑,当回归变量X为一维变量时,非参数回归函数用这些方法一般都能得到很好的估计。但当回归变量是多维向量时,由于X的局部邻域包含很少的数据,用这些估计方法,很难估计出一般的多元非参数回归函数,人们把这种现象称为‘维数祸根’(thecurseofdimension)。可是实际中我们经常遇到的是高维数据,因此高维数据分析是人们一直关心的问题,近年来统计工作者提出了许多分析方法,总得来说可以分为两大类:一类称为函数近似(functionapproximation),如可加模型(HastieandTibshirani,1986),部分线形模型(Engle,etal;1986);另一类为降维(dimensionreduction),如SIR 回归(slicedinverseregression(Li,1991)),投影追踪回归(projectionpursuitregression)(FriedmanandStuetzle,1981);图回归(graphicalregression,Cook,1994),PHD(principalHessiandirection)分析(Cook,1998),MA VE方法(minimumaveragevarianceestimationmethod(Xia,Y.etal.,2002)。本论文主
要讨论的是变系数模型(thevaryingcoefficientmodel),属于函数近似这一类。变系数模型的一般形式为y=χ_1β_1(t_1)+…+χ_pβ_p(t_p)+ε(1)其中X=(χ_1,…,χ_p)~T和t=(t_1,…,t_p)~T为回归变量,y为响应变量,ε为随机误差,Eε=0,Eε~2=σ~2.β_l(t_l),l=1,…,p为未知的光滑函数,t_1,…,t_p是通过未知的函数β_l(t_l)来改变χ_1,…,χ_p的系数,β_l(t_l)暗含了t_l与χ_l的一种特殊的交互关系,t_l可能互不相同,也可能相同,也可能是某个χ_l。特别地,当t_1,…,t_p均相同时,不妨记为t,则模型(1)变为y=χ_1β_1(t)+…+χ_pβ_p(t)+ε(2)本文我们都在模型(2)下讨论函数系数模型.华东师范大学博士学位论文(20韶)相对于一般的多元非参数回归,变系数模型对回归函数的结构提出了一些限制.可是,尽管变系数模型看起来比较具体,实际上它是一个非常一般的模型,许多模型如可加模型,部分线形模型,线形模型等都可以看作是变系数模型的特殊情形.变系数模型既部分保留了非参数回归稳健性的特点,又具有结构简单,容易解释等优点.广泛应用到纵向数据分析,非线性时间序列分析,生物数据分析等,近年来受到人们的普遍关注(W、,。亡all998:Fa:,andZ}lal,g,2000:Chiang,RieeandWu:2001,Cai,FanandYao;2000)等.本文提出用B样条函数和贝叶斯模型平均等方法来估计变系数模型中的函数系数,主要内容为:第一章绪论,主要介绍常见的一些光滑方法,光滑参数,光滑参数的选择,高维数据,B徉条函数,变系数模型及其本文的主要内容.第二章在数据为独立观察的场合下,给出了函数系数的B样条最小二乘估计,并讨论该估计的性质.假设弋二(二,,,…,从;),观察数据(军‘,弋,t‘)几1
相互独立,它们为来自于变量(,,X,:)的样本,二(亡)=(二l仕),…,二N仕))了为。次B样条函数的基,N二。+k+1为基的维数,k为节点的个数.若山,l=1,…,p使得艺[::一(x*1二丫(‘:)al+…+二‘p二了(‘,)ap)]“最小.则模型(2)中的函数系数的B样条最小二乘估计八(,)二二了(t)dz假定凤(t)。cm卜,句,在一定的正则条件下,若节点个数k=O(。石轰了),函数系数的B样条最小二乘估计能够达到非参数估计的最优收敛速度(定理2.1)}}户(*)一。(,)*卜O;(二一击))进一步地,假定。1,…,。。独立,均值为。,方差尹已知,任意的l兰l兰熟国:城,且“一口(。流)则对任意给定的‘,风t)一流(t),…,几(t))·具有渐近正态性(定理2.3):万去(‘)(户(。)一刀(‘))马N(o,‘a,)华东师范大学博士学位论文归口0s)第三章讨论了在纵向数据(lollsitlldillaldata)场合下,函数系数的B样条M估计.在重复观察试验中,假设叭t)和x(t)是在时刻t的响应变量和回归变量,叭t)和X(t)之间有一种线性关系.即:粉(t)=X了(t)口(t)+:(t)其中。(幼是一个均值为。的随机过程,现有。个个体,对第‘个个体有个体的第j次观察记为(物,弋,,t*,州弋,=X:(t勺)=(Xij;,…,X。,,)了〔Rp,万:,口(t)=(口1(亡),二。:次重复观测,,丙川)了是函数系数向量.(,(亡),X(t),亡)关于第乞个二1,…,.:7、*,艺儿1。*二。,其中=梦(t:,)·重复测量数据(物,弋,,ti;)可以看作是模型(3)的凸损失函数,7r(·)为B 祥条函数的基,若d‘.艺兄。(。,,一X‘;1·‘了(‘。)“,一的一个随机抽样.设风·)为一般1,…,p使得式子丸p·7r了(t*,)外)z=IJ二1最小,?【关键词】:变系数模型广义变系数模型B样条最小二乘法M
估计收敛速度渐近正态性贝叶斯模型平均可逆的跳MCMC方法(reversiablejumpMCMC)Laplace’smethod重要抽样部分线性模型光滑样条EV回归Gibbs抽样
【学位授予单位】:华东师范大学
【学位级别】:博士
【学位授予年份】:2003
【分类号】:O211.67
【目录】:摘要7-20第一章序言20-361.1光滑方法21-241.2光滑参数及其选择24-271.3高维数据271.4变系数模型27-301.5B样条函数30-331.6函数系数的B样条估计--本文方法33-36第二章独立场合下,变系数模型B样条估计的渐近性36-512.1变系数模型的B样条估计36-372.2函数系数B样条估计的性质37-392.3定理的证明39-472.4模拟研究47-51第三章重复观察场合下,变系数模型B样条M估计的收敛性51-643.1系数函数的估计52-533.2条件与结论53-543.3证明54-613.4模拟研究61-64第四章变系数模型的Bayes样条估计64-774.1函数系数为B样条函数的变系数模型65-664.2函数系数的Bayes估计66-684.3后验模拟68-704.4模拟例子70-77第五章广义变系数模型的Bayes样条估计77-895.1函数系数的贝叶斯样条估计78-805.2后验模拟80-835.3模拟例子83-89第六章回归变量具有测量