半参数纵向数据的Logistic模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

cij
=
lnççèæ
nij
yij -
+ yij
0.5 + 0.5
÷÷øö,
i =1,2,L , m, j =1,2,L , ni ,
1,3,18,33,37,41,42,47,59,62,67,75,76,83,89。协变 量 xij1~N (μ1,τ21),xij2~N (μ2,τ22),其中 μ1=2,τ21=0.01, μ2=3.5,τ22=0.01。
1 参数估计
同一般的线性回归一样,首先我们要利用观测数据 对模型中的参数 βp 及函数g(tij)作出估计。函数g(tij)是 关于时间tij 的函数,函数g(tij)可由TTijβq 逼近,即设
(2)
其中Tij=(B1(tij),B2(tij),…,Bq(tij))T 是基函数向量。 设对变量xij=(Xij1,Xij2,…,Xijp-1)T 给定了 m×ni 组值,
和 V(1)代人式(16),求 β(2)。 ④重复步骤 3。直到 t=t0 时,对给定的误差限 ε,有
设 β(t)为第 t 次迭代所得的 β值,代入上式可得 U(t) 和 V(t)。在 β(t)处将 h(β)按 p+q 元函数的 Taylor 公式展 开,并取至二次项(记为 Q(t)(β)),有
这时 β的最大似然估计 ⑤由(15)的第二个等式得,在迭代过程中,我们可 同时得到信息矩阵的估计为
第 21 卷第 2 期 2008 年 4 月
四川理工学院学报( 自然科学版) JOURNAL OF SICHUAN UNIVERSITY OF SCIENCE & ENGINEERING( NATURAL SCIENCE EDITION)
文章编号: 1673- 1549( 2008) 02- 0008- 04
从而可得β! 的协方差矩阵的估计为 (17)
它是 Newton-Raphson 迭代计算的一个很有用的副 产品。 3. 3 初值 β(0) 的确定
理论上,虽然初值 β(0)可以任意给定(如取 β(0)=(0,0 …,0)T),但是,初值对于达到指定精度 ε所需要的迭代 次数 t0 有较大的影响。因此,初值 β(0)的确定有时是很重 要的。下面介绍一种常用的迭代初值 β(0)的选取方法,即 利用所谓修正的经验 Logistic 变换确定 β(0),具体方法 如下: 令
从而对数似然函数为 由于(
(7)
(10)
β的信息矩阵是上述 (p+q)2 个二阶偏导数所组成
(p+q)×(p+q)方阵的负矩阵的期望,记为 I(β)。I(β)中
各元素与随机变量
的观测值
无关,故
10
四川理工学院学报( 自然科学版)
2008 年 4 月
由式(8)及式(10)可得当 β=β(t)时,
(11) 根据最大似然估计理论,β的最大似然估计β! 的协 方差矩阵为
(Y11=y11,Y12 =y12, … ,
Y21=y21,
),
的似然函数为
则得似然方程
(9) 关于 β求解方程组(9),便得 β的最大似然估计β! 。 但式(9)关于 β是非线性方程组,所以我们要用迭代方 法求解。
2 信息矩阵及其估计
下面我们在(8)式的基础上,求对数似然函数关于 参数的二阶偏导数,并给出 β的信息矩阵及其估计式。
参 考 文 献: [1] Dalton F Andrade,Heliton R Tavares. Item response theory
for longitudinal data:population parameter estimation [J]. Journal of Multivariate Analysis,2005,95:1- 22. [2] Qin Guoyou,Zhu Zhongyi.Robust estimation in generalized semiparametric mixed models for longitudinal data [J]. Journal of Multivariate Analysis.(2007), doi: 10.1016/j.jmva. 2007. [3] 张尧庭.定性资料的统计分析[M].桂林:广西师范大学出版 社, 1991. [4] 范金城,梅长林.数据分析[M].北京:科学出版社,2002. [5] 田 萍,薛留根.纵向数据半参数回 归 模 型 估 计 的 强 相 合 性 [J].工程数学学报,2006,23(2):369- 372. [6] 孙 孝 前,尤 进 红.纵 向 数 据 半 参 数 建 模 中 的 迭 代 加 权 偏 样 条最小二乘估计[J].中国科学,2003,33(5):470- 480. [7] 余 火 军,朱 仲 义.纵 向 数 据 模 型 均 值 参 数 和 方 差 参 数 的 影 响分析[J].应用概率统计,2005,21(1):40- 52. [8] 林 金 官,韦 博 成.非 线 性 纵 向 数 据 模 型 中 方 差 和 自 相 关 系 数的齐性检验[J].应用数学学报,2004,27(3):466- 480. [9] 钱 伟 民,柴 根 象.纵 向 数 据 混 合 效 应 模 型 的 统 计 分 析[J].数 学年刊, 2004,(25):445- 456.
(12) 若利用方程(9)求得 β的最大似然估计β! ,代入 π(Dij)的 表达式便得 π(Dij)的估计
其中
,这时,
从而可得
的估计为

3 似然方程的 Newt on- Raphs on 迭代求解
3. 1 Newt on- Raphs on 迭代法的一般描述
设 h(β)是关于
,的 p+q 元函
数,我们要求β! ,使
我们考虑纵向数据半参数回归模型

(3)
在我们研究的问题中,我们可能更关心因变量是一 个二值变量,即yij 只取 0 与 1 两个值时,Yij=1 的概率 P= Pr (yij=1)。因此我们建立如下的纵向数据的半 参 数 Logistic 模型。
(1)
其中 (x!ij,tij)∈Rp×R 是已知的设计点列,βp 是 p 维未 知参数,g(·)是定义在区间 I 上的未知回归函数。E(εij) =0,0<Var(εij)=σ2<∞,当i≠j 时,εik 与 εir 相互独立。其 中 yij 是第i个体在时间tij 的响应值。记ni 为有界正整数, N=mni。
则初值 β(0)可取为 (18)
4 随机模拟
我们从下面的半参数 Logistic 回归模型产生纵向 数据,
其中
,随机变量 εij 假设为独立
同wk.baidu.com布,且服从正态分布
。β和 σ2 的真实值为
β= (-1,1,-0.5,1.5),σ2=0.01。我们观测 的 个 体 数 为
m=20,每个个体进行了 ni= 15 次观测,ni 的取值时间为
我们利用上面模型产生的随机数据,根据纵向数据 Logistic 模型参数最大似然估计的 Newton-Raphson迭 代 法 编 程 ,我 们 选 两 组 初 值 ,一 组 是 β(0)= (-0.5,0.5, 0.5,0.5),另一组是 β(0)=(-1.5,0.2,0.2,1),经过 15 次 迭代都收敛到 β=(-0.9943,1.0211,-0.5365,1.6074), 则得到 β的估计值 β=(-0.9943,1.0211,-0.5365,1.6074)。 可以看出,在迭代次数不多的情况下,收敛到 β估计值; 而且偏差比较小。
上面的模型我们考虑的yij 是多个输出或连续输出 的情形,但在有些情况下,我们考虑yij 只取两个值。如在 医药和其它行业的试验中,我们可以用yij=0 表示第 i个 体在tij 时刻正常,用yij=1 表示不正常。因此我们可以建立 如下纵向数据的半参数模型
(4) 其中(!x ij,tij)∈Rp×R 是已知的设计点列,βp 是p 维未知参 数,g(·)是定义在区间 I 上的未知回归函数。E(εij)=0, 0<Var(εij)=σ2<∞,当i≠j 时,εik 与 εir 相互独立。π(xij, tij)是随机变量 Yij 取 1 时的概率大小。
半参数纵向数据的 Logi s t i c 模型
2V00o8l.2年1 N4o月.2 Apr.2008
魏强强, 魏立力
( 宁夏大学数学计算机学院, 银川 750021)
摘 要: 以纵向数据的半参数模型为基础, 建立了半参数纵向数据的 Logi s t i c 回 归 模 型 , 对 此 模 型 中 的 参 数

(13)

(15)
将式(15)代入(14)可得 Logistic 模型参数 β的最大似 然估计的 Newton-Raphson 迭代式为:
(16)
具体计算步骤如下: ①给定初值 β(0),计算 π(0)(Dij),并计算 U(0)和 V(0)。 ②将 β(0),U(0)和 V(0)代人式(16),求 β(1)。 ③由 β(1)计算 π(1)(Dij),并计算 U(1)和 V(1)。将 β(1),U(1)
(5) 故对于 bl (l = 0,1,2,L , p + q -1)


其中
再令

则相应的 Logistic 模型为
其中
。令

9 (8)
(6)
其中
为未知参数。
设在 x=xij 的 nij 次独立观测中,事件 A 发生了 yij 次
(即 Yij=yij),i=1,…,m, j=1,…,ni。则由式(5)和(6)知

可解得 β(看作 β的第 t+1 次迭代所得的值,记为 β(t+1)) 为
(14) 这便是求解问题(13)的一般 Newton-Raphson 迭代公式。 3. 2 Logi s t i c 模型参数的最大似然估计的 Newt on- Raphs on 迭代法
这时,对数似然函数(7)为其目标函数,即
进行了参数估计, 讨论了它的信息矩阵, 给出了似然方程的 Newt on- Raphs on 迭代求解过程。
关键词: Logi s t i c 回归; 纵向数据; Newt on- Raphs on 迭代
中图分类号: O212.4
文献标识码: A
引言与模型
纵向数据是指对每一组个体在不同时间进行观测 而得到的由截面和时间序列融合在一起的数据,其特点 是将截面数据和时间序列数据结合在一起,既能分析出 个体随时间变化趋势,又能分析总体的变化趋势。近年 来,对纵向数据各种模型的研究引起国内外统计学者的 广泛关注。本文用 Logistic 回归对纵向数据建立模型, 可用此模型分析纵向数的内部结构,及个体间的差异。
B1(t11) B1(t12)
L
B1(t1n1 ) B1(t21)
L B1(tmnm )
B2(t11) L B2(t12) L
LL
B2(t1n1 ) L B2(t21) L
LL B2(tmnm ) L
Bq(t11) ù
Bq(t12)
ú ú

Bq
(t1n1
)
ú ú
Bq(t21)
ú ú

Bq(tmnm )úû
Logis tic Mode l of Longitudina l Da ta
WEI Qiang-qiang, WEI Li-li (College of Mathematics and Computer Science, Ningxia University, Yinchuan 750021, China)
第 21 卷第 2 期
魏强强等: 半参数纵向数据的 Logi s t i c 模型
11
é x110
ê ê
x120
êL
X
=
ê ê
x1n10
ê ê
x210
êL
êëxmnm0
x111 L x121 L LL
x1n11 L x211 L LL xmnm1 L
x11p-1 x12p-1 L
x1n1p-1 x21p-1 L xmnmp-1
收稿日期: 2007-10-16 基金项目: 国家自然科学基金项目( 60663003) 作者简介: 魏强强( 1981-) , 男, 甘肃静宁人, 硕士生, 主要从事统计学方面的研究。
第 21 卷第 2 期
魏强强等: 半参数纵向数据的 Logi s t i c 模型
xij=(Xij1,Xij2,…,Xijp-1)T,i=1,…,m,j=1,…,ni,对于其中的 ij 则 组直,共独立观测了nij 次,i=1,…,m,j=1,…,ni。令 Yij 为 在对 xij 的nij 次观测中事件 A 发生的次数,以 π(xij,tij) 记在 x=xij 且t=tij 时事件 A 发生的概率,则 Yij 服从参数 为nij 和 π(xij,tij)的二项分布。即
相关文档
最新文档