简单回归分析卫生统计学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
LINE
图12-3 线性回归模型的适用条件示意图
三、回归参数的估计
(一) 回归参数估计的最小二乘原则
0.25 N O 浓 0.20 度
0.15
0.10
0.05
0.00 0.75 1.00 1.25 1.50 1.75 2.00
图12-4 基础代谢与体重的回归直线的最小二乘原则的直观表达
由于考虑到所有点的( Yi Yˆi )有正有负,通常变成考察所有点 的( Yi Yˆi )平方和最小,这就是最小二乘原则(least squares method)。
5
沉淀环直径(mm ) Y
4.0 5.5 6.2 7.7 8.5
沉淀环直径(mm )
10.0
9.0
8.0
7.0
6.0
5.0
4.0
3.0
2.0
1.0
0.0
0
1
2
3
4
5
6
IgG浓度(IU/ml )
图12-2 IgG浓度与沉淀环直径数据的散点图
二、线性回归模型的适用条件
(1) 线性(Linear) (2) 独立性(Independent) (3) 正态性(Normal distribution) (4) 方差齐性(Equal variance)
残 n2
总 回 残
回 1
H0:β= 0, H1:β≠0
F MS回 MS残
MS回
SS回
回
MS残
SS残
残
例12-2 试对例11-1资料的样本回归方程作假设 检验(用方差分析)
H0: β= 0 即基础代谢与体重之间无线性回归关系
H1: β≠0 即基础代谢与体重之间有线性回归关系
α= 0.05
SS总 (Y Y )2 4645447.0121
直线连接两点即得回归直线。本例可取X1=37.1,
得Yˆ1 3385;.4取7 X2=67.3,得
Yˆ2 。52连40接.3点6 即得本
资料的回归直线。
注意:回归直线的适用范围一般以自变量的取值 范围为限,若无充分理由证明超过自变量的取值 范围还是直线,应该避免外延(即不要超过自变
量取值范围计算 Yˆ 值)。
min
Y
Yˆ
来自百度文库
2
min
Y
a
bX
2
(二) 回归参数的估计方法
n
( X i X )(Yi Y )
b i 1 n
(Xi X )2
i 1
a Y bX
(i 1,2,...,n)
例12-1 计算例11-1的基础代谢(Y)关于体重(X) 的线性回归方程。
n
( X i X )(Yi Y )
第一节 线性回归
1、线性回归的概念及其统计描述
引例:
在上一章中,对14名40~60岁的健康妇女的体 重(X)与基础代谢(Y)数据计算了相关系 数 r 0.964 ,定量地描述了变量X与Y间的线性 关联性。现在试用回归分析的方法,从预测的角度 来描述基础代谢(Y)如何依存体重(X)的变化 而变化的规律性。
得
F (1,2 ) F0.0=5(41,1.27) 5,今求得F = 158.361>4.75,则
P<0.05,按α=0.05水准拒绝H0,差异有统计学意义。可
认为体重与基础代谢之间有线性回归关系。
变异来源 回归 残差 总变异
表12-2 线性回归的方差分析表
SS
df
MS
4318227.72
1
4318227.72
第十二章
简单回归分析
引言:
身高与体重存在相关(相关关系) 可否通过身高预测体重的平均水平? 新生儿的体重与体表面积存在相关 可否通过体重预测体表面积?(依存关系)
线性回归(linear regression),又称简单回归 (simple regression),
非线性回归(nonlinear regression)
SS残 (Y Yˆ)2 327219.2962
SS回 SS总 SS残 4645447 .0121 327219 .2962 4318227 .7159
F MS回 4318227.7159 158.361 MS残 27268.2747
已知ν1=ν回= 1,ν2=ν残= n-2=12,查F界值表(附表3.1)
Sb
SY X l XX
165.1311 4.8810 1144.5771
tb
b Sb
61.4229 4.881
12.584
t0.05/ 2,12 2.179
注意:对同一资料作总体回归系数β是否为 零的假设检验,方差分析和t检验是等价的,
并且有tb F 的关系。
四、总体回归系数β的统计推断
H0: β= 0 即基础代谢与体重之间无线性回归关系 H1: β≠0 即基础代谢与体重之间有线性回归关系α= 0.05
(一) 方差分析
图12-5 回归前后因变量Y残差的示意图
(Y Y )2 (Yˆ Y )2 (Y Yˆ)2
SS总 SS回 SS残
总 n 1
II型回归
5800 5300 4800 4300 3800 3300 2800
30 35 40 45 50 55 60 65 70 75
体重 (kg)
图12-1 14例中老年健康妇女的基础代谢与体重的回归直线
I型回归
表12-1 不同IgG浓度下的沉淀环直径数据
IgG浓度(IU/ml ) X
1
2
3
4
327219.30
12
27268.27
4645447.01
13
F
158.36
P
<0.05
(二) t 检验
tb
b0 Sb
n2
Sb
SYX lXX
lXX (X X )2
SYX
SS残 n2
例12-3 试对例11-1资料的样本回归方程作假设
检验(用t 检验)。
SYX
SS残 n2
327219.2962 165.1311 14 2
线性回归模型(linear regression model):
Y|X X
:截距(intercept)
β:斜率(slope),又称回归系数 (regression coefficient)
样本线性回归方程(regression equation) :
Yˆ a bX
基础代谢 (KJ/day)
b i1 n
61.4229
(Xi X )2
i 1
a Y bX 63232.9 61.4229 777.2 1106.7864
14
14
Yˆ 1106.79 61.42X
为了直观分析或实际需要,可按求出的回归方程
作回归直线图。在X的实测全距范围内,任取相距较
远且易读数的两个X值,代入方程得到两个 Yˆ 值,以