统计学:多重线性回归与相关

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

性回归,是研究一个应变量与多个自变量间线性依存关系
数量变化规律的一种方法。
一、数据与模型
观察单位
应变量 y X1 X2
自变量 … Xk
1
2 … n
y1
y2 … yn
X11
X21 … Xn1
X12
X22 … Xn2

源自文库… … …
X1k
X2k … Xnk
假定y与x1,x2,,…,xk间存在线性关系,则y满足多重线性回归模型:
一重线性回归是描述一个应变量与一个自变量间线性
依存的一种分析方法。但医学研究中,一种事物现象的数
量关系往往与多种事物现象的数量变化有关,如肺活量与 年龄、体重、胸围等有关。这些事物现象间的关系在应变 量的取值上可以是确定型的与概率型的;在几何上可以是 线性的,也可以是非线性的。多重线性回归是确定型的线
1756
1200 1200 1820 948
29.5
22.5 27.0 22.0 22.5
72
69 58 83 69
0.90
1.80 1.70 0.40 2.00
0.156
0.040 0.100 0.135 0.005
1754
1500 1476 1436 1440
30.0
21.8 27.0 28.0 21.5
0.003
0.039 0.087 0.222 0.029
1844
1656 960 1496 1436
26.0
20.0 24.8 27.0 28.0
73
83 67 65 68
1.00
1.45 1.50 0.65 2.00
0.140
0.059 0.039 0.145 0.099
CORR; /*线性回归模型*/
786
1652 … 1436
26.5
23.0 … 28.0
64
84 … 68
1.50
0.40 … 2.00
0.001
0.170 … 0.099
例13-1的SAS程序
DATA a1;/*建立SAS数据集*/ INPUT x1-x4 y; DATALINES; 1300 786 20.0 26.5 80 64 0.45 1.50 0.066 0.001 1444 1652 23.0 23.0 57 84 0.50 0.40 0.076 0.170
按最小二乘法(least squares method)估计原理,计算式中的各项偏回归系数的估计值bi

y b0 b1 X 1 b2 X 2 bk X k
二、回归参数的估计
1.计算基本统计量
x j xk
, xj
, x2 j
,
y
,
x y
j
2.建立正规方程组(normal equations)
b1l11 b2 l12 bk l1k l1 y b l b l b l l k 2k 2y 1 21 2 22 b1l k1 b2 l k 2 bk l kk l ky 其中 l ji lij ( j , i 1,2 k ) 当 j i 时, l ji ( x j x j )( xi x i )
y 0 1 X 1 2 X 2 k X k
1 ~ p 是偏回归系数(partialregression coefficien t) 0是常数项(const ant
term) 是随机误差,又称残差(residual ) ~ N (0, )

x x ( x )( x ) / n
j i j i
当 j i 时, lii ( xi x i ) ( xi ) / n l jy ( x j x j )( y y ) xjy ( b0 y (b1 x1 b2 x 2 bk x k )
INTERCEP X1 X2 X3 X4
1 1 1
-0.141663 0.000116 0.004494
0.06916107 0.00002748 0.00190112 0.00069083 0.01081187
-2.048 4.227 2.364 -0.009 -3.208
0.0546 0.0005 0.0289 0.9925 0.0046

2

2 xi

2
x )( y) / n
j
1 . 1
例13-1
为了研究空气中一氧化氮(NO)的浓度与汽车流量、气温、空气湿度和风速
的关系,测定数据如下:
空气中 NO 浓度与相关因素的检测数据 车流 x1 1300 1444 气温 x2 20.0 23.0 气湿 x3 80 57 风速 x4 0.45 0.50 一氧化氮 y 0.066 0.076
多重线性回归与相关
( multiple linear regression & correlation 要求: 1.掌握多重回归模型主要指标的统计意义 2.了解 偏相关系数的统计意义 3.会用SPSS过程建立多重线性回归模型 4.理解SAS多重线性回归程序 )
第一节 多重线性回归的概念及其统计描述
76
77 65 68 79
0.80
0.60 0.65 2.00 2.40
0.120
0.120 0.129 0.099 0.011
1084
1116 1536 1784 1060 ; PROC REG
28.5
35.0 23.0 23.3 26.0
59
92 57 83 58
3.00
2.80 1.50 0.90 1.83
1 -0.000006552 1 -0.034685
回归方程:

y 0.14166 0.00011619 x1 0.00449 x2 0.00000655 x3 0.03468 x4
第二节
多重线性回归方程的假设检验
目的:考察回归方程是否符合资料特点
1.方差分析法
MODEL y=x1-x4 /PARTIAL STB; MODEL y=x1-x4 /SELECTION=STEPWISE ; RUN;
例13-1的回归SAS结果
Parameter Estimates
Parameter Variable DF Estimate
Standard Error
t for H0: Parameter=0 Prob > |t|
相关文档
最新文档