直线相关与回归分析-PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
ay b x
y
ˆ a y bx
ˆi yi y
ˆ (y y )
2
x
2 ˆ 最小 ( y y )
回归系数的显著性检验
从样本资料中算得的回归系数b,也有抽样误 差,因此需作显著性检验,检验其是否是回归系 数为零的总体中抽得的。 H0:β=0 H1:β≠0。
当拒绝H0时,可认为x与y间的直线回归方程 有统计学意义。 显著性检验可有两种方法:t 检验法和方差 分析法。
方差分析法:
X和Y的线性关系引起的变异
Y的总变异 误差引起的变异
2 ˆ Q ( y y )
2 2 2 ˆ ˆ ( y y ) ( y y ) ( y y )
2 ˆ U ( y y )
2 ˆ Q ( y y )
回归平方和
误差平方和
总的自由度:n-1 回归自由度:1
体重
心脏横径
设有n对x,y的观察值,先在直角坐标系中 作散点图,如果散点的分布呈直线趋势,则可设法 求出直线方程。 通常用最小二乘法,依据:各点与该直线的 纵向距离的平方和为最小
先由(6.3)式求得b,再由(6.4)式求得a,就得出 直线回归程。
b ( x x )( y y ) /[ ( x x ) ]
医学统计学及其软件包
第六章 直线相关与回归
上海第二医科大学
生物统计教研室
第一节 概述
分析两个变量间的关系常用回归及相关分析的统 计方法。 如两个变量间的关系是线性的,可用直线相关与 回归分析;如两个变量间的关系是非线性的需用非线 性(曲线)回归。 回归分析适用于分析变量间的因果关系;用一个 自变量的值来估计另一个应变量的值。 相关分析用于分析两变量间相互联系的密切程度 及相关方向。
t 5 . 4078 , df 12 , P 0 . 01 b
U 2404 . 5954 , df 1 1 Q 987 . 4046 , df 12 2
F 29 . 2232 , P 0 . 01
直线回归相关分析的注意事项:
1. 相关分析只是以相关系数来描述两个变量 间线性相关的程度和方向,并不阐明事物间存在 联系的本质,也不是两事物间存在联系的证据。 要阐明两事物间的本质联系,必须凭专业知识从 理论上加以论证。因此,把两个毫无关系的事物 放在一起作相关分析是毫无意义的。同样,作回 归分析也要有实际意义。
( x x ) 32 . 63 ( x x ) 93 . 01 ( x x )( x x ) 54 . 95
1 2 1
2 2 2
1
1 2
2
r 0 .9975
tr 46 .82 df 11
P0 .01
两法的测得值有相关(P<0.01)
第三节 直线回归方程
目的:找出描述x与y依存关系的直线方程。
ቤተ መጻሕፍቲ ባይዱ 第二节 相关系数
相关分析的目的在于通过相关系数r来描述和度 量两变量线性联系的程度和方向。 r>0 正相关 图例1
r<0 负相关
r=0 零相关
图例2
图例3
零相关即两变量间无关。
样本相关系数不等于零,并不表示总体相关系 数不等于零,还要作显著性检验。
next
3.7 3.5 3.3 3.1 2.9 2.7 2.5 40 45 50 55
(总例数减1) (自变量个数)
误差自由度:n-2
(总的自由度减去回归自由度)
F 回归均方 /误差均方
F
U/1 Q /(n 2)
查方差分析用的F界值表,得P值
df1=1, df2=n-2
例6.2 研究正常男性年龄与运动后最大心率 的关系,求直线回归方程。
ˆ y 302 . 2684 3 . 2496 x
r=0.7495
回
60
3.2 3.1 3 2.9 2.8 2.7 2.6 2.5 40 45 50 55
回
r=-0.83597
60
65
r
相关系数的计算: xx yy 2 2 x x y y
xxx
x x y y xy x y n
t 检验法:
tb b/ sb
s s b y . x/
2 ˆ (y y )
dfn 2
( x x )
2
样本回归系 数的标准误 剩余标准差
2 ˆ s ( y y )/( n 2 ) x . y
估计误差平方和
2 2 2 2 ˆ ( y y ) ( y y ) [ ( x x )( y y )] / ( x x )
直线回归相关分析的注意事项:
5. 在资料要求上:
相关分析要求两个变量服从双变量正态分布。
回归分析要求因变量服从正态分布,自变量可 以是精确测量和严格控制的变量。如两个变量服 从双变量正态分布,则可以作两个回归方程,用 X推算Y,或用Y推算X。
ˆ abx y
Y为应变量(dependent variable)
X为自变量(independent variable)
A为截距(intercept) b为回归系数(regression coefficient) 回归系数b表示x每改变一个单位,y平均改变b 个单位。
Y=10x+5
ˆ =4.22+0.20x y
X和Y的离均差积和
n x x x x
2 2 2
X的离均差平方和
相关系数的显著性检验
H : 0 H : 0 0 1
sr 1 r2 n 2
样本相关系 数的标准误
tr
r sr
df n2
查t界值表, 得P值
例6.1 极谱法和碘量法测定水中溶解氧的含 量,两法的测得值是否有相关性?
直线回归相关分析的注意事项:
2. 在进行直线回归前应绘制散点图,有直 线趋势时,才适宜作直线回归分析。散 点图还能提示资料有无异常点。 3. 直线回归方程的适用范围一般以自变量 的取值范围为限。
直线回归相关分析的注意事项:
4. 对同一组资料作回归和相关分析, 其相关系数和回归系数的显著性检验结果完 全相同。由于相关系数的显著性检验结果可 直接查表,比较方便;而回归系数的显著性 检验计算复杂,故在实际应用中常用相关系 数的显著性检验结果代替回归系数的显著性 检验。
ay b x
y
ˆ a y bx
ˆi yi y
ˆ (y y )
2
x
2 ˆ 最小 ( y y )
回归系数的显著性检验
从样本资料中算得的回归系数b,也有抽样误 差,因此需作显著性检验,检验其是否是回归系 数为零的总体中抽得的。 H0:β=0 H1:β≠0。
当拒绝H0时,可认为x与y间的直线回归方程 有统计学意义。 显著性检验可有两种方法:t 检验法和方差 分析法。
方差分析法:
X和Y的线性关系引起的变异
Y的总变异 误差引起的变异
2 ˆ Q ( y y )
2 2 2 ˆ ˆ ( y y ) ( y y ) ( y y )
2 ˆ U ( y y )
2 ˆ Q ( y y )
回归平方和
误差平方和
总的自由度:n-1 回归自由度:1
体重
心脏横径
设有n对x,y的观察值,先在直角坐标系中 作散点图,如果散点的分布呈直线趋势,则可设法 求出直线方程。 通常用最小二乘法,依据:各点与该直线的 纵向距离的平方和为最小
先由(6.3)式求得b,再由(6.4)式求得a,就得出 直线回归程。
b ( x x )( y y ) /[ ( x x ) ]
医学统计学及其软件包
第六章 直线相关与回归
上海第二医科大学
生物统计教研室
第一节 概述
分析两个变量间的关系常用回归及相关分析的统 计方法。 如两个变量间的关系是线性的,可用直线相关与 回归分析;如两个变量间的关系是非线性的需用非线 性(曲线)回归。 回归分析适用于分析变量间的因果关系;用一个 自变量的值来估计另一个应变量的值。 相关分析用于分析两变量间相互联系的密切程度 及相关方向。
t 5 . 4078 , df 12 , P 0 . 01 b
U 2404 . 5954 , df 1 1 Q 987 . 4046 , df 12 2
F 29 . 2232 , P 0 . 01
直线回归相关分析的注意事项:
1. 相关分析只是以相关系数来描述两个变量 间线性相关的程度和方向,并不阐明事物间存在 联系的本质,也不是两事物间存在联系的证据。 要阐明两事物间的本质联系,必须凭专业知识从 理论上加以论证。因此,把两个毫无关系的事物 放在一起作相关分析是毫无意义的。同样,作回 归分析也要有实际意义。
( x x ) 32 . 63 ( x x ) 93 . 01 ( x x )( x x ) 54 . 95
1 2 1
2 2 2
1
1 2
2
r 0 .9975
tr 46 .82 df 11
P0 .01
两法的测得值有相关(P<0.01)
第三节 直线回归方程
目的:找出描述x与y依存关系的直线方程。
ቤተ መጻሕፍቲ ባይዱ 第二节 相关系数
相关分析的目的在于通过相关系数r来描述和度 量两变量线性联系的程度和方向。 r>0 正相关 图例1
r<0 负相关
r=0 零相关
图例2
图例3
零相关即两变量间无关。
样本相关系数不等于零,并不表示总体相关系 数不等于零,还要作显著性检验。
next
3.7 3.5 3.3 3.1 2.9 2.7 2.5 40 45 50 55
(总例数减1) (自变量个数)
误差自由度:n-2
(总的自由度减去回归自由度)
F 回归均方 /误差均方
F
U/1 Q /(n 2)
查方差分析用的F界值表,得P值
df1=1, df2=n-2
例6.2 研究正常男性年龄与运动后最大心率 的关系,求直线回归方程。
ˆ y 302 . 2684 3 . 2496 x
r=0.7495
回
60
3.2 3.1 3 2.9 2.8 2.7 2.6 2.5 40 45 50 55
回
r=-0.83597
60
65
r
相关系数的计算: xx yy 2 2 x x y y
xxx
x x y y xy x y n
t 检验法:
tb b/ sb
s s b y . x/
2 ˆ (y y )
dfn 2
( x x )
2
样本回归系 数的标准误 剩余标准差
2 ˆ s ( y y )/( n 2 ) x . y
估计误差平方和
2 2 2 2 ˆ ( y y ) ( y y ) [ ( x x )( y y )] / ( x x )
直线回归相关分析的注意事项:
5. 在资料要求上:
相关分析要求两个变量服从双变量正态分布。
回归分析要求因变量服从正态分布,自变量可 以是精确测量和严格控制的变量。如两个变量服 从双变量正态分布,则可以作两个回归方程,用 X推算Y,或用Y推算X。
ˆ abx y
Y为应变量(dependent variable)
X为自变量(independent variable)
A为截距(intercept) b为回归系数(regression coefficient) 回归系数b表示x每改变一个单位,y平均改变b 个单位。
Y=10x+5
ˆ =4.22+0.20x y
X和Y的离均差积和
n x x x x
2 2 2
X的离均差平方和
相关系数的显著性检验
H : 0 H : 0 0 1
sr 1 r2 n 2
样本相关系 数的标准误
tr
r sr
df n2
查t界值表, 得P值
例6.1 极谱法和碘量法测定水中溶解氧的含 量,两法的测得值是否有相关性?
直线回归相关分析的注意事项:
2. 在进行直线回归前应绘制散点图,有直 线趋势时,才适宜作直线回归分析。散 点图还能提示资料有无异常点。 3. 直线回归方程的适用范围一般以自变量 的取值范围为限。
直线回归相关分析的注意事项:
4. 对同一组资料作回归和相关分析, 其相关系数和回归系数的显著性检验结果完 全相同。由于相关系数的显著性检验结果可 直接查表,比较方便;而回归系数的显著性 检验计算复杂,故在实际应用中常用相关系 数的显著性检验结果代替回归系数的显著性 检验。