【医学统计学】8双变量关联性分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体相关系数用 表示,样本相关系数用r表示
直线相关
进行相关分析时,首先绘制散点图(scatter plot), 初步判断两变量间的关系。
(a) 0< r <1
(b) -1< r <0
(c) r =1
(d) r =-1
直线相关
(e) r =0
(f) r =0
(g) r =0
(h) r =0
直线相关
t检验方法
tr
r0 Sr
Sr
1 r2 n2
n2
直线相关
下面对例12-1所得相关系数进行假设检验 【检验步骤】 1. 建立检验假设,确定检验水准
H0 : 0 H1 : 0
0.05
直线相关
【检验步骤】
2.计算检验统计量 tr 值
r 0
0.924
tr
1 r2
9.041 1 0.9242
直 线 相 关 (1inear correlation) , 又 称 简 单 相 关 (simple correlation),是用来描述具有直线关系的 两变量x、y的相互关系的统计方法。 要求两变量均来自于双变量正态总体的随机变量。
直线相关
相关系数的意义及计算 直线相关系数(linear correlation coefficient)亦称 Pearson积矩相关系数,是定量描述两个变量间直线 关系的方向和密切程度的指标
接受H1,可认为慢性支气管炎有无与吸烟习惯之 间有关联。
列联表的关联性分析
2×2列联表的关联性分析
该 研 究 者 采用2
检 验 进 行 假 设 2 检 1验3.4,33 结
果
,P<0.01,按水准,拒绝H0,接受
H1,可认为慢性支气管炎有无与吸烟习惯之间有
关【联问。题12-8】
(1)该资料属于哪种类型?
(2)该资料设计及目的与完全随机设计有无区 别?
(3)分析两个分类变量的关联性应该采用什么 方法?
T min 167 79 5 360
2=
a
ad bc2 n bc d a cb
d
51
51165 281162 360 1162816551 28116
165
13.433
R 1C 1 2 12 1 1
列联表的关联性分析
【检验步骤】 3.确定P值,做出统计推断
查附表9, 2 13.433 ,P<0.01,按水准,拒绝H0,
患病 51 28
未患病 116 165
合计
79
281
合计 167 193
360
列联表的关联性分析
【检验步骤】 1. 建立检验假设,确定检验水准
H0:吸烟习惯与慢性支气管炎相互独立 H1:吸烟习惯与慢性支气管炎之间有关联
0.05
列联表的关联性分析
【检验步骤】
2.计算检验统计量 2 值
n 360 40
直线相关
【案例12-1】 某医科大学一年级16名男生身高与前臂长资料,见表12-1。
编号
1
9
身高(cm)
170
180 前臂长(cm) 43
47
表12-1 某医科大学一年级16名男生身高与前
2
3
4
5
6
7
8
10
11
12
13
14
15
16
173
160
158
173
186
178
183
165
166
174
168
163
n2
16 2
直线相关
【检验步骤】 3.确定P值,做出统计推断 按自由度 n - 2 16- 2 14 ,查附表4, P 0.001 按水准,拒绝H0,接受H1,可认为该医科大学一 年级男生身高与前臂长呈线性相关关系。
等级相关
等级相关应用范围: (1)不服从双变量正态分布的资料 (2)总体分布类型未知的资料 (3)等级资料 Spearman等级相关系数的取值和意义与Pearson直线相关 系数相同 计算得到的等级相关系数,需对其进行假设检验
28900 29929 25600 24964 29929
1849 2116 1764 1681 2209
7310 7958 6720 6478 8131
15 177
45
16 170
43
合计 2744 x
714
y
31329 28900 471570
x2
2025 1849 31946
y2
7965 7310 122715
177
170
46
42
41
47
49
45
48
43
43
46
44
42
45
43
直线相关
【问题12-1】 该资料属于哪种类型?有何特点? 利用资料分析两变量的关联性时,应采用何种统 计方法?
【分析】 两变量均属于定量资料 。 可以探讨它们之间的相关关系,根据数据
特征采用直线相关分析或等级相关分析。
直线相关
相关分析的概念
列联表的关联性分析
【分析】 (1)该资料是计数资料,是两个定性变量交叉分
类的列联表资料。 (2)完全随机设计中两个样本是独立的。 (3)两个分类变量的关联性分析,先进行 检验,
然后计算关联系数,分析两分类变量关联的程度。
2
列联表的关联性分析
表12-4 吸烟习惯和慢性支气管炎情况
吸烟习惯 吸烟 不吸烟
列联表的关联性分析
2×2列联表的关联性分析
【案例12-8】 欲研究吸烟与慢性支气管炎的关系, 随机调查了360名45岁以上人的吸烟习惯和慢性 支气管炎情况。见表12-4。
表12-4 吸烟习惯和慢性支气管炎情况
吸烟习惯 吸烟 不吸烟 合计
患病 51 28 79
未患病 116 165 281
合计 167 193 360
图12-2 16名大学一年级男生身高和前臂长散点图
直线相关
r x x y y x x 2 y y 2
没有单位,取值介于-1与1之间 相关方向用正负号表示 相关的密切程度用绝对值表示
直线相关
计算例12-1中身高与前臂长间相关系数 计算基础数据,并列成相关系数计算表
求出 、x 、y 、x2 、y2 (xy见表12-2)
xy
直线相关
r
264
0.924
974 83.75
直线相关
相关系数的假设检验
查表法
根据自由度 n 2 ,查附表14,将所得 r 值与 某概率水平(如0.05)对应的 r 界值相比较,若
r 值小于 r 界值,则P大于相应的概率水平,反
之,P小于相应的概率水平,然后作出推断。
直线相关
相关系数的假设检验
代入公式,求出相关系数 r值。
直线相关
表12-2某医科大学一年级16名男生身高与前臂长相关系数计算表
x 编号
身高cm y前臂长cm x 2(4)=(2)2 y 2 (5)=(3)2 xy (6)=(2)×(3)
(1)
(2)
(3)
1 170
43
2 173
46
3 160
42
4 158
41
5 173
Leabharlann Baidu47
直线相关
进行相关分析时,首先绘制散点图(scatter plot), 初步判断两变量间的关系。
(a) 0< r <1
(b) -1< r <0
(c) r =1
(d) r =-1
直线相关
(e) r =0
(f) r =0
(g) r =0
(h) r =0
直线相关
t检验方法
tr
r0 Sr
Sr
1 r2 n2
n2
直线相关
下面对例12-1所得相关系数进行假设检验 【检验步骤】 1. 建立检验假设,确定检验水准
H0 : 0 H1 : 0
0.05
直线相关
【检验步骤】
2.计算检验统计量 tr 值
r 0
0.924
tr
1 r2
9.041 1 0.9242
直 线 相 关 (1inear correlation) , 又 称 简 单 相 关 (simple correlation),是用来描述具有直线关系的 两变量x、y的相互关系的统计方法。 要求两变量均来自于双变量正态总体的随机变量。
直线相关
相关系数的意义及计算 直线相关系数(linear correlation coefficient)亦称 Pearson积矩相关系数,是定量描述两个变量间直线 关系的方向和密切程度的指标
接受H1,可认为慢性支气管炎有无与吸烟习惯之 间有关联。
列联表的关联性分析
2×2列联表的关联性分析
该 研 究 者 采用2
检 验 进 行 假 设 2 检 1验3.4,33 结
果
,P<0.01,按水准,拒绝H0,接受
H1,可认为慢性支气管炎有无与吸烟习惯之间有
关【联问。题12-8】
(1)该资料属于哪种类型?
(2)该资料设计及目的与完全随机设计有无区 别?
(3)分析两个分类变量的关联性应该采用什么 方法?
T min 167 79 5 360
2=
a
ad bc2 n bc d a cb
d
51
51165 281162 360 1162816551 28116
165
13.433
R 1C 1 2 12 1 1
列联表的关联性分析
【检验步骤】 3.确定P值,做出统计推断
查附表9, 2 13.433 ,P<0.01,按水准,拒绝H0,
患病 51 28
未患病 116 165
合计
79
281
合计 167 193
360
列联表的关联性分析
【检验步骤】 1. 建立检验假设,确定检验水准
H0:吸烟习惯与慢性支气管炎相互独立 H1:吸烟习惯与慢性支气管炎之间有关联
0.05
列联表的关联性分析
【检验步骤】
2.计算检验统计量 2 值
n 360 40
直线相关
【案例12-1】 某医科大学一年级16名男生身高与前臂长资料,见表12-1。
编号
1
9
身高(cm)
170
180 前臂长(cm) 43
47
表12-1 某医科大学一年级16名男生身高与前
2
3
4
5
6
7
8
10
11
12
13
14
15
16
173
160
158
173
186
178
183
165
166
174
168
163
n2
16 2
直线相关
【检验步骤】 3.确定P值,做出统计推断 按自由度 n - 2 16- 2 14 ,查附表4, P 0.001 按水准,拒绝H0,接受H1,可认为该医科大学一 年级男生身高与前臂长呈线性相关关系。
等级相关
等级相关应用范围: (1)不服从双变量正态分布的资料 (2)总体分布类型未知的资料 (3)等级资料 Spearman等级相关系数的取值和意义与Pearson直线相关 系数相同 计算得到的等级相关系数,需对其进行假设检验
28900 29929 25600 24964 29929
1849 2116 1764 1681 2209
7310 7958 6720 6478 8131
15 177
45
16 170
43
合计 2744 x
714
y
31329 28900 471570
x2
2025 1849 31946
y2
7965 7310 122715
177
170
46
42
41
47
49
45
48
43
43
46
44
42
45
43
直线相关
【问题12-1】 该资料属于哪种类型?有何特点? 利用资料分析两变量的关联性时,应采用何种统 计方法?
【分析】 两变量均属于定量资料 。 可以探讨它们之间的相关关系,根据数据
特征采用直线相关分析或等级相关分析。
直线相关
相关分析的概念
列联表的关联性分析
【分析】 (1)该资料是计数资料,是两个定性变量交叉分
类的列联表资料。 (2)完全随机设计中两个样本是独立的。 (3)两个分类变量的关联性分析,先进行 检验,
然后计算关联系数,分析两分类变量关联的程度。
2
列联表的关联性分析
表12-4 吸烟习惯和慢性支气管炎情况
吸烟习惯 吸烟 不吸烟
列联表的关联性分析
2×2列联表的关联性分析
【案例12-8】 欲研究吸烟与慢性支气管炎的关系, 随机调查了360名45岁以上人的吸烟习惯和慢性 支气管炎情况。见表12-4。
表12-4 吸烟习惯和慢性支气管炎情况
吸烟习惯 吸烟 不吸烟 合计
患病 51 28 79
未患病 116 165 281
合计 167 193 360
图12-2 16名大学一年级男生身高和前臂长散点图
直线相关
r x x y y x x 2 y y 2
没有单位,取值介于-1与1之间 相关方向用正负号表示 相关的密切程度用绝对值表示
直线相关
计算例12-1中身高与前臂长间相关系数 计算基础数据,并列成相关系数计算表
求出 、x 、y 、x2 、y2 (xy见表12-2)
xy
直线相关
r
264
0.924
974 83.75
直线相关
相关系数的假设检验
查表法
根据自由度 n 2 ,查附表14,将所得 r 值与 某概率水平(如0.05)对应的 r 界值相比较,若
r 值小于 r 界值,则P大于相应的概率水平,反
之,P小于相应的概率水平,然后作出推断。
直线相关
相关系数的假设检验
代入公式,求出相关系数 r值。
直线相关
表12-2某医科大学一年级16名男生身高与前臂长相关系数计算表
x 编号
身高cm y前臂长cm x 2(4)=(2)2 y 2 (5)=(3)2 xy (6)=(2)×(3)
(1)
(2)
(3)
1 170
43
2 173
46
3 160
42
4 158
41
5 173
Leabharlann Baidu47