医学统计学课件(研究生)8双变量关联性分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

9.041 1 0.9242
n2
16 2
关联分析
16
直线相关
【检验步骤】 3.确定P值,做出统计推断 按自由度 n - 2 16- 2 14 ,查附表4, P 0.001 按水准,拒绝H0,接受H1,可认为该医科大学一 年级男生身高与前臂长呈线性相关关系。
关联分析
17
等级相关
等级相关应用范围: (1)不服从双变量正态分布的资料 (2)总体分布类型未知的资料 (3)等级资料
关联分析
3
直线相关
相关分析的概念
直 线 相 关 (1inear correlation) , 又 称 简 单 相 关 (simple correlation),是用来描述具有直线关系的 两变量x、y的相互关系的统计方法。 要求两变量均来自于双变量正态总体的随机变量。
关联分析
4
直线相关
相关系数的意义及计算
没有单位,取值介于-1与1之间 相关方向用正负号表示 相关的密切程度用绝对值表示
关联分析
9
直线相关
计算例12-1中身高与前臂长间相关系数 • 计算基础数据,并列成相关系数计算表
• 求出 x 、 y 、x2 、 y2 、 xy(见表12-2)
• 代入公式,求出相关系数 r 值。
关联分析
10
直线相关
t检验方法
tr
r0 Sr
n2
Sr
1 r2 n2
关联分析
14
直线相关
下面对例12-1所得相关系数进行假设检验 【检验步骤】 1. 建立检验假设,确定检验水准
H0 : 0 H1 : 0
0.05
关联分析
15
直线相关
【检验步骤】
2.计算检验统计量 tr 值
r 0
0.924
tr
1 r2
0.05
关联分析
23
列联表的关联性分析
【检验步骤】
2.计算检验统计量 2 值
n 360 40
T min 167 79 5 360
2=
a
ad bc2 n bc d a cb
表12-4 吸烟习惯和慢性支气管炎情况
吸烟习惯 吸烟 不吸烟 合计
患病 51 28 79
未患病 116 165 281
合计 167 193 360
关联分析
19
列联表的关联性分析
2×2列联表的关联性分析
该研究者采用 2 检验进行假设检验,结果 2 13.433 ,
P<0.01,按水准,拒绝H0,接受H1,可认为慢性支气管 炎有无与吸烟习惯之间有关联。
直线相关系数(linear correlation coefficient)亦称 Pearson积矩相关系数,是定量描述两个变量间直线 关系的方向和密切程度的指标
总体相关系数用 表示,样本相关系数用r表示
关联分析
5
直线相关
进行相关分析时,首先绘制散点图(scatter plot), 初步判断两变量间的关系。
46
42
41
47
49
45
48
47
43
43
46
44
42
45
43
关联分析
2
直线相关
【问题12-1】 该资料属于哪种类型?有何特点? 利用资料分析两变量的关联性时,应采用何种 统计方法?
【分析】 • 两变量均属于定量资料 。 • 可以探讨它们之间的相关关系,根据数
据特征采用直线相关分析或等级相关分 析。
表12-2某医科大学一年级16名男生身高与前臂长相关系数计算表
x 编号
身高cm y前臂长cm x 2(4)=(2)2 y 2 (5)=(3)2 xy (6)=(2)×(3)
(1)
(2)
(3)
1 170
43
2 173
46
3 160来自百度文库
42
4 158
41
5 173
47
28900 29929 25600 24964 29929
Spearman等级相关系数的取值和意义与Pearson直线相关 系数相同 计算得到的等级相关系数,需对其进行假设检验
关联分析
18
列联表的关联性分析
2×2列联表的关联性分析
【案例12-8】 欲研究吸烟与慢性支气管炎的关系, 随机调查了360名45岁以上人的吸烟习惯和慢性 支气管炎情况。见表12-4。
直线相关
【案例12-1】 某医科大学一年级16名男生身高与前臂长资料,见表12-1。
表12-1 某医科大学一年级16名男生身高与前臂长资料
编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
身高(cm)
170
173
160
158
173
186
178
183
180
165
166
174
168
163
177
170
前臂长(cm) 43
1849 2116 1764 1681 2209
7310 7958 6720 6478 8131
15 177
45
16 170
43
合计 2744 x
714
y
31329 28900 471570
x2
2025 1849 31946
y2
7965 7310 122715
xy
关联分析
11
直线相关
r
264
【问题12-8】
(1)该资料属于哪种类型? (2)该资料设计及目的与完全随机设计有无区别? (3)分析两个分类变量的关联性应该采用什么方法?
关联分析
20
列联表的关联性分析
【分析】 (1)该资料是计数资料,是两个定性变量交叉分
类的列联表资料。 (2)完全随机设计中两个样本是独立的。 (3)两个分类变量的关联性分析,先进行 2 检验,
(a) 0< r <1
关联分析
(b) -1< r <0
(c) r =1
(d) r =-1
6
直线相关
(e) r =0
(f) r =0
(g) r =0
(h) r =0
关联分析
7
直线相关
图12-2 16名大学一年级男生身高和前臂长散点图
关联分析
8
直线相关
r x x y y x x 2 y y 2
0.924
974 83.75
关联分析
12
直线相关
相关系数的假设检验
查表法
根据自由度 n 2 ,查附表14,将所得 r 值与 某概率水平(如0.05)对应的 r 界值相比较,若
r 值小于 r 界值,则P大于相应的概率水平,反
之,P小于相应的概率水平,然后作出推断。
关联分析
13
直线相关 相关系数的假设检验
然后计算关联系数,分析两分类变量关联的程度。
关联分析
21
列联表的关联性分析
表12-4 吸烟习惯和慢性支气管炎情况
吸烟习惯 吸烟 不吸烟
患病 51 28
未患病 116 165
合计
79
281
合计 167 193
360
关联分析
22
列联表的关联性分析
【检验步骤】 1. 建立检验假设,确定检验水准
H0:吸烟习惯与慢性支气管炎相互独立 H1:吸烟习惯与慢性支气管炎之间有关联
相关文档
最新文档