第10章 线性相关与回归818
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.正相关 2.负相关 3.无相关
二、线性相关系数
相关系数就是说明具有直线关系的两个变量间相关密切 程度和相关方向的统计量。
皮尔森(Pearson)相关系数的计算公式为:
r
r rXY
( X X )(Y Y ) LXY
( Xi X )2 (Yi Y )2
LXX .LYY
相关系数r没有测量单位,其数值为-1≤r≤1
400
1156
33
726
484
1089
246
3622
2024
6610
根据表10-2数据绘制散点图,如下图所示:
40
30
蛙心律
20
Yˆ 4.087 1.523X
10
0
0
10
20
30
温度
三、线性回归方程的显著性检验
对线性回归方程要进行假设检验,就是要检验b是否 为β=0的总体中的一个随机样本。该假设检验通常 用采用方差分析或者t检验,两者的检验效果等价。
医学统计学
第十章 线性相关与回归
房价走势图
模拟数据
症状监测图
模拟数据
一、线性相关的基本概念
把这种Y随着X变化而变化的关系称之为相关关系,如果这种变 化呈现直线关系,又称之为直线相关(线性相关)或简单相关。
相关关系 直线相关
根据散点图中点的分布即线性相关的性质和相关之间的密 切程度,可分为以下几种情况:
t检验: t | b 0 | , =n-2
sb
方差分析: SS总 SS回归 SS剩余,总 =回归 +剩余
MS回归
SS回归
回归
,MS剩余
SS剩余 ,F
剩余
MS回归 MS剩余
对象
温度(X)
心率(Y)
XY
X2
Y2
1
2
2
4
3
6
4
8
5
10
6
12
7
14
8
16
9
18
10
20
11
22
合计
132
5
10
4
25
11
44
16
121
11
66
36
121
14
112
64
196
22
220
100
484
23
276
144
529
32
448
196
1024
29
464
256
841
32
576
324
1024
34
680
系,需要作总体相关系数ρ是否为零的假设检验。
常用的检验方法:
t检验,其公式为:
r 0 tr 1 r 2
n2
n2
例10.1所得的 r 值检验男青年身高与
前臂长之间是否存在相关关系?
1. 建立检验假设 H0:ρ=0,即身高与前臂长之间不存在相关关系; H1:ρ≠0,即身高与前臂长之间存在相关关系; α=0.05
根据散点图中点的分布即线性相关的性质和相关之间的密 切程度,可分为以下几种情况:
1.正相关 2.负相关 3.无相关
例10.1 从男青年总体中随机抽取11名男青年组成样本, 分别测量每个男青年的身高和前臂长,身高和前臂长均以cm 为单位,测量结果如下表所示,试计算身高与前臂长之间的 相关系数。
编号
身高(cm)
前臂长(cm)
XY
X2
(X)
(Y)
1 2 3 4 5 6 7 8 9 10 11 合计
170 173 160 155 173 188 178 183 180
28900
42
7266
29929
44
7040
25600
41
6355
24025
47
8131
29929
30天监测总体A
10天监测样本
样本对总体代 表性不好! 样本相关系数 无意义! 30天监测总体B
三、相关系数的显著性检验
原因:由于根据样本资料计算出来的相关系数存在抽样 误差。
举例:假设在一个X与Y无关总体中作随机抽样,由于抽
样误差的影响,所得的样本相关系数也常常不等于零。
结论:要判断两个变量X与Y在总体是否真的存在相关关
2. 计算检验统计量 t=4.013,ν=11-2=9
3. 确定 P 值,作出结论 P=0.005(SPSS 软件计算)<0.05,按照α=0.05 水准拒绝 H0,接受 H1,差异有统计学 意义,可以认为身高与前臂长之间存在相关关系。
回归系数的意义
二、线性回归方程的计算
例10.3 有人研究了温度对蛙的心率的影响,得到了 表10-2中所示的资料,试进行回归分析。
50
9400
35344
47
8366
31684
46
8418
33489
49
8820
32400
43
7095
27225
44
3174
28561
500
86185
326081
r=0.8
Y2
2209 1764 1936 1681 2209 2500 2209 2116 2401 1849 2116 22810
样本对总体 代表性好! 样本相关系 数有意义!
二、线性相关系数
相关系数就是说明具有直线关系的两个变量间相关密切 程度和相关方向的统计量。
皮尔森(Pearson)相关系数的计算公式为:
r
r rXY
( X X )(Y Y ) LXY
( Xi X )2 (Yi Y )2
LXX .LYY
相关系数r没有测量单位,其数值为-1≤r≤1
400
1156
33
726
484
1089
246
3622
2024
6610
根据表10-2数据绘制散点图,如下图所示:
40
30
蛙心律
20
Yˆ 4.087 1.523X
10
0
0
10
20
30
温度
三、线性回归方程的显著性检验
对线性回归方程要进行假设检验,就是要检验b是否 为β=0的总体中的一个随机样本。该假设检验通常 用采用方差分析或者t检验,两者的检验效果等价。
医学统计学
第十章 线性相关与回归
房价走势图
模拟数据
症状监测图
模拟数据
一、线性相关的基本概念
把这种Y随着X变化而变化的关系称之为相关关系,如果这种变 化呈现直线关系,又称之为直线相关(线性相关)或简单相关。
相关关系 直线相关
根据散点图中点的分布即线性相关的性质和相关之间的密 切程度,可分为以下几种情况:
t检验: t | b 0 | , =n-2
sb
方差分析: SS总 SS回归 SS剩余,总 =回归 +剩余
MS回归
SS回归
回归
,MS剩余
SS剩余 ,F
剩余
MS回归 MS剩余
对象
温度(X)
心率(Y)
XY
X2
Y2
1
2
2
4
3
6
4
8
5
10
6
12
7
14
8
16
9
18
10
20
11
22
合计
132
5
10
4
25
11
44
16
121
11
66
36
121
14
112
64
196
22
220
100
484
23
276
144
529
32
448
196
1024
29
464
256
841
32
576
324
1024
34
680
系,需要作总体相关系数ρ是否为零的假设检验。
常用的检验方法:
t检验,其公式为:
r 0 tr 1 r 2
n2
n2
例10.1所得的 r 值检验男青年身高与
前臂长之间是否存在相关关系?
1. 建立检验假设 H0:ρ=0,即身高与前臂长之间不存在相关关系; H1:ρ≠0,即身高与前臂长之间存在相关关系; α=0.05
根据散点图中点的分布即线性相关的性质和相关之间的密 切程度,可分为以下几种情况:
1.正相关 2.负相关 3.无相关
例10.1 从男青年总体中随机抽取11名男青年组成样本, 分别测量每个男青年的身高和前臂长,身高和前臂长均以cm 为单位,测量结果如下表所示,试计算身高与前臂长之间的 相关系数。
编号
身高(cm)
前臂长(cm)
XY
X2
(X)
(Y)
1 2 3 4 5 6 7 8 9 10 11 合计
170 173 160 155 173 188 178 183 180
28900
42
7266
29929
44
7040
25600
41
6355
24025
47
8131
29929
30天监测总体A
10天监测样本
样本对总体代 表性不好! 样本相关系数 无意义! 30天监测总体B
三、相关系数的显著性检验
原因:由于根据样本资料计算出来的相关系数存在抽样 误差。
举例:假设在一个X与Y无关总体中作随机抽样,由于抽
样误差的影响,所得的样本相关系数也常常不等于零。
结论:要判断两个变量X与Y在总体是否真的存在相关关
2. 计算检验统计量 t=4.013,ν=11-2=9
3. 确定 P 值,作出结论 P=0.005(SPSS 软件计算)<0.05,按照α=0.05 水准拒绝 H0,接受 H1,差异有统计学 意义,可以认为身高与前臂长之间存在相关关系。
回归系数的意义
二、线性回归方程的计算
例10.3 有人研究了温度对蛙的心率的影响,得到了 表10-2中所示的资料,试进行回归分析。
50
9400
35344
47
8366
31684
46
8418
33489
49
8820
32400
43
7095
27225
44
3174
28561
500
86185
326081
r=0.8
Y2
2209 1764 1936 1681 2209 2500 2209 2116 2401 1849 2116 22810
样本对总体 代表性好! 样本相关系 数有意义!