部分线性测量误差模型的模拟_推断估计_赵昕[1]
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 模拟 - 推断法及其渐近性质
·)的 估 本文结合模拟 - 推断法 、 局部线性回 归 及 加 权 最 小 二 乘 法 构 造 了 参 数 β 及 非 参 数 函 数 g( )进行估计 , 计. 即先利用局部线性回归对未知函数 g( 然后对参数β 进行加权最小二乘估计 . 具体的算 · 法如下 : )模拟 ( i
1 4 于是β( λ)的估计可定义为
大 学 数 学 第 3 2卷
1 ^ . λ) λ) = ∑^ b( β( β B
b=1
B
( )推断 i i i ^ , ( ) 我们定义 G( 基于 G( 从而得到 λ, Γ)为推断函数 . λ, Γ)对数据 { λ, λ) λ ∈ Λ}建立回归模型 , β( ^ 进一步给出β 的模拟 - 推断估计量 Γ 的一个估计量Γ .
^ ^ . -1, Γ) S I ME X = G( β ^ , , 注意到当λ 缩减至 0 时 , 可以得到^ 即忽略测量误差的 它是直接替代 X 为 ( ) 0Γ N a i v e估计 , i v e = G βNa W 所得的估计量 . , 通常无法得到精确的推断函数 . 常用的推断函数有三种 ( 线性推 断 、 二 次 推 断 及 非 线 性 推 断) 本文 2 ^ 使用二次推断函数 GQ ( λ, Ψ) λ+ψ λ 逼近β( λ). =ψ 1 +ψ 2 3 , ( ) 类似地 可以定义 g x 的模拟 - 推断估计 . 将估计过程第一步中的β 替换为^ 从而得到估计 I ME X , βS ^ ( ; )( ) ( ; ) , …, , 量^ 此时取适当的带宽 对 关于 取平均 得到估计量 h . g b=1 B g b λx 0 2 b λx 0
( ) 1. 1
)是未知的一元联系函数 , ( , · 其中β 是p 维参数向量 , Z X 1 ≤i ≤ n}的随机 ε g( i 是独立于样本 { i, i)
2 p 且有 E( 误 差, ( a r Z X Ui 为 ε ε =0 及 V =σ . i) i) i 是来自Z ∈ 瓗 的随机向量 , i 和U i 是一维随机变量 . 2 2 2 , 具有零均值及σ 方差 , 且与 { 该文假定σ 对σ 测量误差 , ( Yi, Z X 1 ≤i ≤ n}独立 . i, i) U 是已知的 . U 未 U 知的情形 , 可以用其估计量替代 , 从而进行类似讨论 .
B …, 均生成一列变量 { 对于每一个i = 1, } n, Wi λ) b( b=1
( ) Wi Ui 2. 1 =X λ) λ2σ b( i+ U b, , …, ( 其 中 Ui 表示推断 ( 0, 1) B 是任一个给定的正整数 , M 常取6~1 0的整数 ) λ∈Λ = { λ λ b ~N 1, M} 过程中格子点λ 的取值范围 . 通常取该值域在 0 到 2 之间 . ( ) 估计 i i )在 x · 假设函数 g( 那么 g( 即 x)可被一线性函数逼近 , 0 的邻域内有连续的二阶导数 , ( x)≈ g( x ′( x x -x x -x +g = a+b( g( 0) 0) 0) 0 ), 其中 x 为x0 邻域内的点 . 由此 , 来构造 g( 和β( x λ; λ)的估计量 : 0) , ( ; ) 第一步 : 对于每个固定的点 x 及 及 的估计量 ( 即^ 及^ 可以 ′( ′( x x x λ; λ; λ; g( g g 0 0 0) 0) 0 )) β gλx 归结为二次极小化问题
第 4 期 赵昕 : 部分线性测量误差模型的模拟 — 推断估计来自百度文库
1 3
了部分 线 性 模 型 中 误 差 方 差 的 分 布 的 收 敛 速 度 及 B 其它成果包括( 周 恒 忠 和 陈 明 华, e r r E s s e e n 界. - y ) 任哲和陈明华 , 等. 由于实际数据的多样性 , 许多学者还 将 部 分 线 性 模 型 应 用 到 测 量 误 差 数 1 9 9 5; 1 9 9 5 ( ) 据、 缺失数据及纵向数据等复杂数据的问题上去 , 并取得了很多研究成果 . 构造了随机删失 W a n 1 9 9 6 g ( 的部分线性模型的参数及非参数分 量 的 权 估 计 并 证 明 了 它 们 的 大 样 本 性 质 . 提 Z e e r和 D i l e 1 9 9 4) g g g ) 并对 C 利用修正方法研究了部 出后移算法对模型进行估计 , D 4 细胞数据进行实例分析 . L i a n 2 0 0 9 g等( 使得估计量具有相合性和渐近正态性 . 但是 , 他们考虑的是参数部分协变量 Z 分线性测量误差模型 , i 带 有测量误差的情形 , 目前很少有文献针对本文模型进行研究 . 本文通过模拟 - 推断方法并结合局部线性回归及加权最小二乘对模型 ( 模拟 - 推 1. 1)进行估计 . ( , ) , 、 可以 断法 C a r r o l l等 1 9 9 6 是一种偏差修正 的 方 法 它 具 有 算 法 简 洁 应 用 性 广 泛 及 近 似 推 断 等 优 点 , 有效处理测量 误 差 问 题 . 本 文 先 通 过 局 部 线 性 回 归 对 非 参 数 g( 再由模拟过程得到 x)进 行 估 计 , ^ ^ ; ( ) 和 最后 由 推 断 过 程 得 出 参 数 和 非 参 数 函 数 的 模 拟 推 断 估 计. 本文与 L ( ) ( ) - i a n g gx gλ βλ β ( ) 的估计方法 ( 忽略非参数部分的测量误差 ) 进行了比较 , 结果表明本文所提出方法的合理有效性 . 2 0 0 0 值得一提的是 , 本文的方法无需对不可观测的协变量 X i 进行分布假设 . 本文其余内容安排如下 : 第二节 介 绍 了 模 拟 - 推 断 ( 方法并证明了所得估计的渐近性质; S I ME X) 第三节通过一些模拟实验以验证该方法的有效性 , 此外 , 本文还与 L 提出的估计方法进行了 i a n 2 0 0 0) g( 比较 , 通过一些数量特征直观地反映出本文方法的优越性 . 文中定理的证明在附录中给出 .
n T ^( ) }. Wi λ) -βZ i -g b(
2
Q( = β)
直接计算可得β 的估计为
i=1
Y ∑{
i
T 1 T - ^ 珟) , ( Z Z) Z Y = ( λ) b( β
其中
^ 珟= ( 珟 珟 珟 …, , , …, ) Y Y Y Y Wi Z= ( Z Z . λ) 1, n) i =Y i -g( b( 1, n)
当X 模型 ( 该模型一直以来 备 受 学 者 们 的 关 注, 已 1 . 1)就成为 了 部 分 线 性 模 型 . i 可以被观测时 , ( ) ; 取得了丰富的研究成果 . L i a n 0 0 0 对参数及非参 数 进 行 估 计 并 给 出 了 它 们 相 应 的 渐 近 正 态 性 当 参 g2 ( 数向量β 为零向量时 , 模型 ( 最近 , 提出利用经验似然的方法 1 . 1)就变成了非参数模型 . H u a n 2 0 1 2) g 构造部分线性测量误差模型参数分量的置信域 . 部分线性模型结合了 线 性 模 型 及 非 参 数 模 型 的 特 点 , 可 以 更 加 灵 活 有 效 地 处 理 统 计 问 题. E n l e g ( ) 在分析电力需求与气候变化之间的关系时首次提出了 该 模 型 . 利用加权最小二 1 9 8 6 R o b i n s o n( 1 9 8 8) )的估计量 , 乘法构造了参数β 及非参数g( 并在适当的条件下研究了参数估计量^ · g β 的渐近正态性及^ ( ) )的估计量 , 的收敛速度 . 使用光滑样条方法构造了β 和g( 并给出了相应的算法 . · S c h i m e k 2 0 0 0 W a n g ( ) ( ) 和J 构造了参数β 的经验似然估计 , 并在适当条件下证明了其似然比函数^ 依分布收敛于 i n 2 0 0 3 l g β , , ) 自由度为 p 的χ2 分布 . 其它研究成果还有 ( 等. 柴 S h e n等, 2 0 1 1; L i a n i n 2 0 0 9; X u e和 L i u 2 0 1 0 g和J g ) 根象和徐克军 ( 将小波方法应用到该模型中 , 构造且证明了所得参数 及 未 知 函 数 的 小 波 估 计 具 有 1 9 9 9 ( 并研究了误差方差的小波估计及其相应的渐近性质 . 进一步研究 优良的大样本性质 , Z h u和 X u e 2 0 0 5)
1 引 言
本文研究如下模型 ( 1. 1)中非参数部分协变量 X i 具有测量误差时 ,参数分量及 非 参 数 分 量 的 估 计问题 . 当X 人们可观测到它的替代变量 Wi . 考虑部分线性测量误差模型 i 具有测量误差时 ,
{
T Yi =β Z X +ε i +g( i) i, …, Wi = X i = 1, n i +U i,
( ) 指出若在上述问题中使用相同的带宽 h , 则g 因此 , 我们另取适 X u e 2 0 0 6 ′ 的收敛速度将会比g 要慢 . ^ ( 当的带宽 h 即以 h 并记为 g ′( ′( ′ x). x x . λ; λ; 1 用以估计 g 1 替代 h 估计g 0) b, h 0) 1 第二步 :通过极小化目标函数 Q( β)得到β 的估计 1 n
第3 2 卷第 4 期 2 0 1 6年8月
大 学 数 学
C O L L E G E MATHEMAT I C S
V o l . 3 2, №. 4 A u . 2 0 1 6 g
部分线性测量误差模型的模拟 — 推断估计
赵 昕
( ) 南京理工大学 理学院 , 南京 2 1 0 0 9 4 摘 要 ] 该文研究了部分线性测量误差模型 , 即无法直接观测非参数部分协变量 , 只能得到其替代变量 [ 利用局部线性估计并结合模拟-推断的方法( 得 到 参 数 及 非 参 数 的 估 计, 并在适当的条件 的模 型 . S I ME X) 下, 得到了所提估计量的渐近偏差及方差 . 将该文提出的模拟 - 推 断 方 法 与 L 的估计方法比较, 表 i a n 2 0 0 0) g( 明模拟 - 推断法在处理测量误差问题上的有效性 . 值得一提 的 是 , 模拟-推断方法不需要对非参数部分协变 量的分布提出假设 . [ 关键词 ] 测量误差 ;部分线性模型 ;替代变量 ;模拟 - 推断方法 [ ( ) 中图分类号 ]O 文献标识码 ]A [ 文章编号 ]1 2 1 2. 7 [ 6 7 2 1 4 5 4 2 0 1 6 0 4 0 0 1 2 0 8 - - -
n
2
1
i=1
Y ∑{
i
, }Kh ( b( Wi Wi λ) λ) -βZ -x -x i -a- b( 0) b( 0)
T
( ) 2. 2
1 - 其中 Kh ( ·) ·/ ·)为核函数 , K( h), K( h 为带宽 . =h 记上述加权最小二乘问题 ( 即分别有 ^ a 和^ b, a 和^ ′( b. 2 . 2)的解为^ x x Z h u和 =^ =^ λ; λ; g( g 0) 0)
; 收稿日期 ]2 修改日期 ]2 0 1 6 0 4 0 1 0 1 6 0 4 2 2 [ - - [ - - ) ; ; 基金项目 ] 国家自然科学基金 ( 国家统计科学研究重点项目( 中央高校基本科研 1 0 8 7 1 0 7 2; 1 1 5 0 1 2 9 2 2 0 1 3 L Z 4 5) [ ) ; ) 基金 ( 江苏省自然科学基金面上项目 ( 资助 . 3 0 9 2 0 1 3 0 1 1 1 0 1 5 B K 2 0 1 3 1 3 4 5 , : 作者简介 ] 赵昕 ( 女, 硕士 , 研究生在读 .从事非参数统计分析研究 . . c o m 1 9 9 2- ) E m a i l 2 6 9 0 1 6 7 2 0 3@q [ q