(卫生统计学)第十二章 简单回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.78655
(二)回归系数 β 的假设检验
H
:
0
0
即两变量之间无直线关 系
t 检验法 统计量:
t
b0 Sb
~
t
(n
2)
, 其中
Sb
SY .X l xx
例12 1 中, b -6.9802 , Sb 0.78655
6.9802 tb 0.78655 8.8767 P 0.001
y
图12-2
μ3 μ2 μ1
x1
x2
x3
x
三、回归参数的估计—最小二乘估计
求法:利用最小二乘法原理( least square method)— 回归残差平方和最小
n
n
n
S di2 (yi yi)2 [yi (abxi)]2 min
i1
i1
i1
S
a
n
2
[yi
(ab
xi )](1)
S n
b
2
i1
[yi
(ab
xi )](xi
)
n
2
i 1 n
[
yi
(a bxi )](1) 0
2
i1
[ yi
(a bxi )](xi )
0
b lxy lxx
a y bx
离差参数
n
n
n
n
( xi )( yi )
l xy ( xi x )( yi y ) xi yi i1
lXX 14.81 15 0.404
2242 lYY 3368 15 22.933
l XY
216.7 14.7 224 15
2.82
b 2.82 6.98020 0.404
a 21.77393
回归方程:
Y
21.77393 6.9802X
四、总体回归系数 β 的统计推断
(一)回归系数b的标准误 Sb
(卫生统计学)第十二章 简单回归分 析
第一节 简单线性回归 一、线性回归的概念及其统计描述
凝血时间(秒)
18 17 16 15 14 13 12
0.5
0.7
0.9
1.1
凝血酶浓度(毫升)
图12-1 例11-1中数据散点图
y a bx
1.3
二、回归模型的前提假设
自变量 x 是精确可测的,因变量y是服从正态分布的随机变量
在例12-1中 第一观测点x1=1.1,求 y 的个体值的95%可信区间
y1 21.773936.98021.114.0957 SY.X 0.4999
Sy/x 0.4999
1 1 (1.10.98)2 15 0.404
0.5249
14.09572.160.5249(12.9618 , 15.2297)
S 0.4999
y1
1 (1.10.98)2 0.1599 15 0.404
14.09572.160.1599(13.7502 , 14.4412)
2.当x=x0固定时,对个体 y 的区间估计
(y 0 t ,(n 2 )S y /x,y 0 t ,(n 2 )S y /x )
S y /x S y .x1 1 n (x ( 0 x i x ) x 2 )2
详见表12-2
利用回归方程进行预测
例 某地卫生防疫站研究10年来乙脑发病率(1/10万,预报量Y)与相应前一年7月份日 照时间(小时,预报因子X)之间的数量关系,先将乙脑发病率作平方根反正弦变换:
即 y arc Y ,sin
求得 y 回 1 .1 9 0 归 .0 70 X ,且 方 6 S y .X 8 0 .程 0,2 X 2 2.4 3 3 ,lX 3 7 X 5,6 n 1 90 0
第二节 线性回归的应用
1.当x=x0固定时,对估计值y的均数的区间估计
(y 0 t,(n 2 )S ,y 0 t,(n 2 )S )
y 0
y 0
S S y .x y 0
1 (x 0 x )2 n (x i x )2
在例12-1中 第一观测点x1=1.1,求 y 的均数的95%可信区间
y1 21.773936.98021.114.0957 SY.X 0.4999
i 1
i 1
i 1
n
n
n
n
( xi ) 2
l xx ( xi x ) 2 xi 2
i 1
i 1
i 1
n
n
n
n
( yi ) 2
l yy ( yi y ) 2 yi 2
i 1
i 1
i 1
n
n
n
n
n
n
而
xiyi xi2 yi2 xi yi xy
i 1
i 1
i 1
i 1 i 1
可在计算器上实现
x与y的简单线性回归 Yi 模 型 Xi: i
x与y的样本回归y方 a程 b: x
且: 1.线性性 (x与y呈线性关系) 2.独立性 (n个观测值是独立的) 3.正态性 (误差项εi是正态的, εi ~N(0,σ2) 4.等方差性 (无论x在什么范围取值,y 都具有相同的方差) 见图12-2
回归模型前提假设
n
n
n
n
n
x iy i x i2 y i2 x i y i ko u 调 t 出
i 1
i 1
i 1
i 1 i 1
x y sh if调 t 出
结果
n 15
X 14.7
Y 224
X 2 14.81 Y 2 3368
XY 216.7
X 0.98 Y 14.93 14.7 2
2 1
例12-1 估计血液的凝血酶浓度(单位/毫升)x与凝固时间y的回归方程
浓度x 时间Y
1.1 1.2 1.0 … … … … 0.7 14 13 15 … … … … 17
开机 mode → 2 → shift → AC → 1.1 → xD,yD → 14 → DATA
1.2 → xD,yD → 13 → DATA → … → … → …
SS残 是2 的无偏估计
n2
Sb
Sy.x lxx
其中 Sy.x
(y y)2
SS残
(剩余标准,也差是y的标准误)
n2
n2
在例121中,n 15
SS残 lyy lx2y / lxx 22.9332.822 / 0.404 3.2492
Sy,x
3.2492 0.4999 13
Sb
0.4999 0.404
理论上,tb=tr ( 见第十一章第一节,P210 )
(三) 直线回归系数β的可信区间
回归系数的区间估计为:
(b t,(n 2 )S b,b t,(n 2 )S b )
在例12-1中,估计总体回归系数的95%可信区间
已知 b6.980S2b0.7865 t0.055 /2,132.16 6.98 022 .16 0.786 ( 5 58.67~95 1.28) 13