广义线性模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SAS软件中的PROC GENMOD:
The GENMOD Procedure
The GENMOD procedure fits generalized linear models. The class of generalized linear models is an extension of traditional linear models that allows the mean of a population to depend on a linear predictor through a nonlinear link function and allows the response probability distribution to be any member of an exponential family of distributions. Many widely used statistical models are generalized linear models. These include classical linear models with normal errors, logistic and probit models for binary data, and log-linear models for multinomial data. Many other useful statistical models can be formulated as generalized linear models by the selection of an appropriate link function and response probability distribution.
因变量常见分布及其常用的连接函数
概率密度(概率函数)及其主要参数
连接函数
Identity (恒等函数)
Inverse squared (平方的倒数)
2
Inverse (倒数)
1
①Logit:
ln 1
②probit: 1()
2 1/ 2 2
1
3 2
伽玛分布
1
ln
1
1
2
二项分布 ln p
ln1 e 1
1 p
Poisson 分布 ln
e
1
p
e 1 e
e
p1 p
Hale Waihona Puke Baidu
负二项分布 ln
e
k
e
k2
何为“广义线性模型”?(续)
一个广义线性模型包括以下三个组成部分: (1)线性成分(linear component ) :
指数分布族的概率密度(概率函数)可表示为:
f(y)exypa b()c(y,)
其中,和为两个参数, 称为自然参数, 为离散参 数;a、b、c为函数。
E yb'
Va y rb''
各种常见的指数型分布及其主要参数
分布
b
Ey b' Vary b''
正态分布
2 /2
2
2
1
逆高斯分布
2
广义线性模型
Generalized linear model
明确两个概念:
线性模型(linear model),也称经典线性模型 (classical linear model)或一般线性模型 (general linear model, GLM)。
广义线性模型(generalized linear model, GENMOD)是一般线性模型的直接推广,由 Nelder & Wedderburn(1972)首先提出。
i0 1 x 1 i2 x 2 i m x mi
(2)随机成分(random component ):
i Yi i
(3)连接函数 ( link function):
i g(i)
连接函数为一单调可微(连续且充分光滑)的函数。
分布 正态分布
逆高斯分布
伽玛分布 二项分布 Poisson 分布 负二项分布 多项分布
一、何为“广义线性模型”?
广义线性模型(generalized linear model)由 Nelder & Wedderburn(1972)首先提出,是一般线 性模型的直接推广,它使因变量的总体均值通过 一个非线性连接函数(link function)而依赖于线 性预测值,同时还允许响应概率分布为指数分布 族中的任何一员。许多广泛应用的统计模型均属 于广义线性模型,如logistic回归模型、Probit回 归模型、Poisson回归模型、负二项回归模型等。
SAS软件中的PROC GLM:
PROC GLM analyzes data within the framework of general linear models. PROC GLM handles models relating one or several continuous
dependent variables to one or several independent variables. The independent variables may be either classification variables or continuous variables. Thus, the GLM procedure can be used for many different analyses, including simple regression multiple regression analysis of variance (ANOVA), especially for unbalanced data analysis of covariance response-surface models (响应面模型) weighted regression polynomial regression (多项式回归) partial correlation multivariate analysis of variance (MANOVA) repeated measures analysis of variance