广义估计方程课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)方差齐性,即ei的方差相等
一般线性模型
局限性:
线性模型只能拟合应变量服从正态分 布的资料,如果应变量是分类变量,或不服从正 态分布的变量,线性模型则不能适用。
广义线性模型
2)广义线性模型
概念:
很多非线性模型,如指数模型、Logistic回归 模型,如对应变量作一定的变量变换可满足或近似满足线 性模型分析的要求,能够借助线性模型的分析思路解决模 型构造、参数估计和模型评价等一系列问题。这就是广义 线性模型(generalized linear model)
纵向数据
概念:
纵向数据(longitudinal data)是按照 时间顺序对个体进行重复测量得到的资料。
比如儿童的生长监测资料,出生后每月 测量其体重(Y变量)以及影响体重的因素(X变量, 如性别、喂养、疾病等),这样每个儿童的多次测 量值称为纵向数据的一个串(cluster),是由一组 Y变量(各次测定的体重)和一组相对应的X变量组 成。
传统的统计方法一般都要求应变量 是独立的,因而,由于应变量之间的相关, 纵向数据不能用传统的方法来分析。因为 如果忽略重复测量间的相关性,将损失数 据中的信息,参数估计可能不准确。因此, Liang和Zeger等创立了广义估计方程 (generalized estimating equations) 。
广义估计方程
模型构成如下:
(1) 指定Yij的边际期望(marginal expectation) 是协变量Xij线性组合的已知函数。 E(Yij)=μij,g(μij)=β0+β1Xij1+β2Xij2+…βpXijp 式中:g(.)称为联接函数; β=(β1…βp)’为模型需要估计的参数向量。
广义线性模型
模型构造:
(1)应变量,相互独立,服从指数分布族,方差能够 表达为均数的函数。应变量的期望值记为: E(Yi)=μi。
(2)线性部分,即自变量的线性组合,β为待求的Βιβλιοθήκη Baidu 数向量。 η i=β0+ β1Xi1+ β2Xi2+ … βjXij=X’i β
广义线性模型
(3)联接函数(link function),将应变量的期望值 和线性预测值η i关联起来。 g(μ i )= η i=β0+ β1Xi1+ β2Xi2+ … βjXij g(. )是联接函数,联接函数的作用就是对应变 量作变换使之符合正态分布,变量变换的类型依 应变量的分布不同而不同。通过指定应变量的分 布和联接函数,就可以拟合各种不同的模型。
广义线性模型
分布 模型
表1 常见的概率分布和联接函数
联接函数
数学表达式
正态分布
恒等函数
多元线性回归模型
log
1
η =μ
二项分布
Logit函数
Logistic回归模型
二项分布 Probit回归模型
Probit函数
η =Φ -1(π )
广义线性模型
优点:
广义线性模型不仅可以用于拟合应变 量服从正态分布的模型,还可以拟合应变量服从 二项分布、Poisson分布、负二项分布等指数分布 族的模型,通过指定不同的联接函数,把指数分 布族的众多模型统一到一个模型框架中,具有极 大的灵活性,其应用也日趋广泛。
SUCCESS
THANK YOU
2019/9/16
广义估计方程
(3)
指定Yij协方差是边际均数和参数α的函
数。
μit;α)
Cov(Yis,Yit)=c(μis,
式中:c(.)为已知函数;α又叫相关参
数 (correlation parameter);s和t分别表示
第s次和第t次测量。
广义估计方程
析 一般线性模型
方差分
一般线性模型
应用:
用于研究某个指标(应变量,记为Yi) 与一组指标(Xi1, Xi2,… ,Xij)之间的线性关 系。
表达式: yi=β0+ β1Xi1+ β2Xi2+ … βjXij+ei
一般线性模型
一般线性模型对于残差分布的三个重要假设: (1)独立 (2)符合正态分布,且均数为0
纵向数据
纵向数据特点 :
同一对象的多次观测之间呈相关倾向 因而,纵向数据与一般的多元应变量的 资料不同,因为它的反应变量之间高度相关。也 有别于时间序列数据,纵向数据是由每个个体的 重复测量数据,按时间顺序组成较短的序列,并 由大量这样的序列组成,而时间序列数据是很多 各数据组成一个长的序列。
纵向数据
广义估计方程
主要内容
一、广义线性模型简介 1)一般线性模型 2)广义线性模型
二、广义估计方程 1)纵向资料 2)广义估计方程 3)应用举例
一、广义线性模型简介
1)一般线性模型
一般线性模型(general linear model),简称线性模型(linear model),是数理 统计学中发展较早、理论丰富而且应用性很强的 一个重要分支。
构造如下广义估计方程为:
S(;, )
n i
i
Vi1 ( )(Yi
ui )
Op
求解方程Var(Yij)=V(μij)·Ф可得到β的一致性 估计。其中VVi表i 示作A业i1/ 协2 R方i (差)矩A阵i1/ 2(working covariance matrix),并有
广义估计方程
(2)
指定Yij边际方差(marginal variance)
是边际期望的已知函数。
Var(Yij)=V(μij)·Ф
式中:V(.)为已知函数;Ф为尺度参 数(scale parameter),表示Y的方差不能被 V(μij)解释的部分。这个参数也是需要模型估 计的,对二项分布和Poisson分布而言,Ф=1。
广义估计方程
2)广义估计方程
应用:
广义估计方程是在广义线性模型的基础 上发展起来的、专用于处理纵向数据的统计模型。 广义估计方程可以对符合正态分布、二项分布等 多种分布的应变量拟合相应的统计模型,解决了 纵向数据中应变量相关的问题,得到稳健的参数 估计值。
广义估计方程
一、模型的基本构成
假设Yij为第i个个体的第j次测量的 变量(i=1, … k,j=1, … t),Yi=(Yi1,Yi2 … Yij)′,Xij=(Xij1 … Xijp),为对应于Yij的p×1 维解释变量向量。如果解释变量在各个观察时 刻不变(比如性别),则Xi1p=Xi2p … =Xijp。如果j 时刻没有观测值,则Yij和Xij都缺失。
一般线性模型
局限性:
线性模型只能拟合应变量服从正态分 布的资料,如果应变量是分类变量,或不服从正 态分布的变量,线性模型则不能适用。
广义线性模型
2)广义线性模型
概念:
很多非线性模型,如指数模型、Logistic回归 模型,如对应变量作一定的变量变换可满足或近似满足线 性模型分析的要求,能够借助线性模型的分析思路解决模 型构造、参数估计和模型评价等一系列问题。这就是广义 线性模型(generalized linear model)
纵向数据
概念:
纵向数据(longitudinal data)是按照 时间顺序对个体进行重复测量得到的资料。
比如儿童的生长监测资料,出生后每月 测量其体重(Y变量)以及影响体重的因素(X变量, 如性别、喂养、疾病等),这样每个儿童的多次测 量值称为纵向数据的一个串(cluster),是由一组 Y变量(各次测定的体重)和一组相对应的X变量组 成。
传统的统计方法一般都要求应变量 是独立的,因而,由于应变量之间的相关, 纵向数据不能用传统的方法来分析。因为 如果忽略重复测量间的相关性,将损失数 据中的信息,参数估计可能不准确。因此, Liang和Zeger等创立了广义估计方程 (generalized estimating equations) 。
广义估计方程
模型构成如下:
(1) 指定Yij的边际期望(marginal expectation) 是协变量Xij线性组合的已知函数。 E(Yij)=μij,g(μij)=β0+β1Xij1+β2Xij2+…βpXijp 式中:g(.)称为联接函数; β=(β1…βp)’为模型需要估计的参数向量。
广义线性模型
模型构造:
(1)应变量,相互独立,服从指数分布族,方差能够 表达为均数的函数。应变量的期望值记为: E(Yi)=μi。
(2)线性部分,即自变量的线性组合,β为待求的Βιβλιοθήκη Baidu 数向量。 η i=β0+ β1Xi1+ β2Xi2+ … βjXij=X’i β
广义线性模型
(3)联接函数(link function),将应变量的期望值 和线性预测值η i关联起来。 g(μ i )= η i=β0+ β1Xi1+ β2Xi2+ … βjXij g(. )是联接函数,联接函数的作用就是对应变 量作变换使之符合正态分布,变量变换的类型依 应变量的分布不同而不同。通过指定应变量的分 布和联接函数,就可以拟合各种不同的模型。
广义线性模型
分布 模型
表1 常见的概率分布和联接函数
联接函数
数学表达式
正态分布
恒等函数
多元线性回归模型
log
1
η =μ
二项分布
Logit函数
Logistic回归模型
二项分布 Probit回归模型
Probit函数
η =Φ -1(π )
广义线性模型
优点:
广义线性模型不仅可以用于拟合应变 量服从正态分布的模型,还可以拟合应变量服从 二项分布、Poisson分布、负二项分布等指数分布 族的模型,通过指定不同的联接函数,把指数分 布族的众多模型统一到一个模型框架中,具有极 大的灵活性,其应用也日趋广泛。
SUCCESS
THANK YOU
2019/9/16
广义估计方程
(3)
指定Yij协方差是边际均数和参数α的函
数。
μit;α)
Cov(Yis,Yit)=c(μis,
式中:c(.)为已知函数;α又叫相关参
数 (correlation parameter);s和t分别表示
第s次和第t次测量。
广义估计方程
析 一般线性模型
方差分
一般线性模型
应用:
用于研究某个指标(应变量,记为Yi) 与一组指标(Xi1, Xi2,… ,Xij)之间的线性关 系。
表达式: yi=β0+ β1Xi1+ β2Xi2+ … βjXij+ei
一般线性模型
一般线性模型对于残差分布的三个重要假设: (1)独立 (2)符合正态分布,且均数为0
纵向数据
纵向数据特点 :
同一对象的多次观测之间呈相关倾向 因而,纵向数据与一般的多元应变量的 资料不同,因为它的反应变量之间高度相关。也 有别于时间序列数据,纵向数据是由每个个体的 重复测量数据,按时间顺序组成较短的序列,并 由大量这样的序列组成,而时间序列数据是很多 各数据组成一个长的序列。
纵向数据
广义估计方程
主要内容
一、广义线性模型简介 1)一般线性模型 2)广义线性模型
二、广义估计方程 1)纵向资料 2)广义估计方程 3)应用举例
一、广义线性模型简介
1)一般线性模型
一般线性模型(general linear model),简称线性模型(linear model),是数理 统计学中发展较早、理论丰富而且应用性很强的 一个重要分支。
构造如下广义估计方程为:
S(;, )
n i
i
Vi1 ( )(Yi
ui )
Op
求解方程Var(Yij)=V(μij)·Ф可得到β的一致性 估计。其中VVi表i 示作A业i1/ 协2 R方i (差)矩A阵i1/ 2(working covariance matrix),并有
广义估计方程
(2)
指定Yij边际方差(marginal variance)
是边际期望的已知函数。
Var(Yij)=V(μij)·Ф
式中:V(.)为已知函数;Ф为尺度参 数(scale parameter),表示Y的方差不能被 V(μij)解释的部分。这个参数也是需要模型估 计的,对二项分布和Poisson分布而言,Ф=1。
广义估计方程
2)广义估计方程
应用:
广义估计方程是在广义线性模型的基础 上发展起来的、专用于处理纵向数据的统计模型。 广义估计方程可以对符合正态分布、二项分布等 多种分布的应变量拟合相应的统计模型,解决了 纵向数据中应变量相关的问题,得到稳健的参数 估计值。
广义估计方程
一、模型的基本构成
假设Yij为第i个个体的第j次测量的 变量(i=1, … k,j=1, … t),Yi=(Yi1,Yi2 … Yij)′,Xij=(Xij1 … Xijp),为对应于Yij的p×1 维解释变量向量。如果解释变量在各个观察时 刻不变(比如性别),则Xi1p=Xi2p … =Xijp。如果j 时刻没有观测值,则Yij和Xij都缺失。