第九章 双变量回归与相关 ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
SS l 2
回 XY
R SS l l 总
XX YY
(9-23)
(例 9-5) =r2=0.88182=0.7775
五、注意事项
1.选方法:回归为依存关系(Y 也可作自变
量),相关变量无主次;专业知识、散点
图,残差图、实际意义
2.模型假设条件:回归要求 Y 正态,相关要
求 X、Y 双变量正态分布;残差图:
表 9-1 8 名正常儿童的年龄 X(岁)与尿肌酐含量 Y
(mmol/24h)
编 12345678 号
X 13 11 9 6 8 10 12 7 Y 3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65
X X / n 76 / 8 9.5
Y Y / n 23.87 / 8 2.9838
0.47
7 1.19
8 -1 1 56
0.65
8
4.74 12 -4 16 96
0.95
9 2.31
9 0 0 81
0.96 10 5.95 14 -4 16 140
2.44 11
1.11
7 4 16 77
……
… …… … …
合计 171
Y 0 / 2, 0
(9-15)
Y
0
1.6617
0.1392
12
3.3321
3.3321±2.447×0.1031=(3.080,3.584)
2. 个体 Y 值的预测区间
2
S S
Y0
YX
1
1 n
(X 0X )
2
(X X)
,(9-16)
1 (129.5)2
0.1970 1
0.2223
8
42
(二) β的可信区间 b±tα/2,υSb=0.1392±2.447×0.0304
=(0.0648,0.2136) (三) 估计和预测
1.
Y X 0
Y
0
的区间估计
2
S S
Y0
YX
1 n
(X 0 X XX
)
2
(9-14)
0.1970 1 (129.5)2 0.1031
8
42
Y t S
(一)假设检验
1.方差分析
Y Y (Y Y ) (Y Y )
(Y
Y
)
2
Y
Y
2
பைடு நூலகம்
Y
Y
2
SS 总=SS 回+SS 残
(9-6)
H0:β=0, H1:β≠0,α=0.05
l l SS 回=
2/
XY
XX =5.8452/42=0.8134
表 9-2 例 9-1 的方差分析表
变异来源 df SS MS F P
相关系数r表示两个变量间直线相关关系的方向与 密切程度。
线性相关的性质可由散点图来直观地说明。
12
10
8
6
4
2
0
0
2
4
6
8
10
二、相关系数的意义与计算
相关系数:反映两变量间直线相关程度与方 向的指标
r
( X X )(Y Y )
l
XY
2
2
X X Y Y
l lXX YY
r 5.845 0.8818 42 1.046
表 9-3 某省居民死因构成与 WYPLL 构成
死因 构成 WYPLL 构成 XPYQ
d d2 PQ
0.03
1
0.05
10 0 1
0.14
2
0.34
20 0 4
0.20
3 0.93
6 -3 9 18
0.43
4
0.69
4 0 0 16
0.44
5 0.38
3 2 4 15
0.45
6 0.79
5 1 1 30
ei Y i Y i 为纵坐标,Y i为横坐标
3. b 与 r 的区别、联系:符号相同、假设检 验等价,b 的大小不反映密切程度 4. P 值的正确理解 5. 内插与外延
第三节 秩 相 关
适用资料:①不服从双变量正态分布, ②分布型未知 ③等级资料
一、Spearman 秩相关 例 9-8 某省调查了 1995 年到 1999 年 当地居民 18 类死因的构成以及每种死因导 致的潜在工作损失年数 WYPLL 的构成,结 果见表 9-3。以死因构成为 X,WYPLL 构 成为 Y,作等级相关分析。
(9-18)
三、相关系数的统计推断
H0:ρ=0, H1:ρ≠0,α=0.05
t r 0 r , n 2
S r 1r2
n2
(9-19)
0.8818 4.579
1 0.88182
8 2
0.002<P<0.005,…
四、决定系数
决定系数:回归平方和与总平方和之比, 反映回归贡献的相对程度,值 0~1
总变异 7 1.0462
回归 1 0.8136 0.8134 20.97 <0.01
残差 6 0.2328 0.0388
2. t 检验
ss
残 0.2328 0.1970
S YX n 2
82
S YX 0.1970 0.0304
Sb
42
l XX
t=b/Sb=0.1392/0.0304=4.579 t 0.005/2,6=4.317<4.579<5.208=t 0.002/2,6 0.002<P<0.005,…
Y t S
0
Y / 2, 0
(9-17)
3.3321±2.447×0.1031=(2.788,3.876)
第二节 直 线 相 关 一、直线相关概念
主要目的:
对两个随机变量间的关 系作量化研究
适用于双变量正态分布变量
线性相关
(linear correlation )
简单相关
(simple correlation)
第九章
两变量回归 与相关
回归关系
描述变量间的依存关系
首先,在直角坐标系中绘制散点图,观 察是否有直线趋势,但并不是要求所有的点 都在一条直线上。
回归方程与线性函数的区别:
线性函数要求变量间有严格的函数 关系──一一对应。
P ·Y Y
Y
Y Y · ·
·
· · YY
···
··
Y
·
Y a bX
X (9-1)
条件:Y正态分布
二、直线回归方程的求法
最小二乘法原理( (Y
i
Y
)
i
2
达最小):
b
l XY l XX
( X X )(Y Y )
2
(X X)
(9-3)
a Y bX
(9-4)
l
XY
XY
(
X
)(Y
n
)
(9-5)
例 9-1 某地方病研究所调查了 8 名正 常儿童的尿肌酐含量(mmol/24h)如表 9-1。 估计尿肌酐含量(Y)对其年龄(X)的回 归方程。
l XX 764 762 / 8 42
lYY=72.2683-23.872/8=1.0462 lXY=232.61-76×23.87/8=5.8450 b=5.8450/42=0.1392,a=2.9838-0.1392×0.95 =1.6617
Y 1.6617 0.1392X
三、直线回归中的统计推断