医学统计学课件:双变量关联性分析(研究生)-推荐

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

等级相关(自学内容)
等级相关应用范围: (1)不服从双变量正态分布的资料 (2)总体分布类型未知的资料 (3)等级资料
Spearman等级相关系数的取值和意义与Pearson直线相关 系数相同 计算得到的等级相关系数,需对其进行假设检验
列联表的关联性分析
2×2列联表的关联性分析
【例12-4】 某研究者欲研究幽门螺杆菌感染(HP) 与家庭成员胃病史的关联性,随机抽取599例慢 性胃炎或胃溃疡的患者,分成家庭成员有胃病史 组和家庭成员无胃病史组,结果家庭成员有胃病 史组182例,HP阳性125例;家庭成员无胃病史组 417例,HP阳性198例。
之,P小于相应的概率水平,然后作出推断。
直线相关 相关系数的假设检验
t检验方法
tr
r0 Sr
Sr
1 r2 n2
n2
直线相关
下面对例12-1所得相关系数进行假设检验 【检验步骤】 1. 建立检验假设,确定检验水准
H0 : 0 H1 : 0
0.05
直线相关
【检验步骤】
2.计算检验统计量 tr 值
【分析】 (1)该资料是计数资料,是两个定性变量交叉分
类的列联表资料。 (2)该研究者使用的统计方法是正确的。应用四
格表资料的 2 检验,然后计算列联系数,分析 两分类变量关联的程度。
列联表的关联性分析
表12-4 幽门螺杆菌感染(HP)与家庭成员胃病史的关联性
因素
有胃病史 无胃病史
合计
阳性
阴性
合 计 感染率(%)
直线相关
计算例12-1中体重与胸围间相关系数 • 计算基础数据,并列成相关系数计算表
• 求出 x 、 y 、x2 、 y2 、 xy(见表12-2)
• 代入公式,求出相关系数 r 值。
直线相关
表12-2 2000年某地16名7岁男孩体重与胸围相关系数计算表
x 编号
体重kg
(1)
(2)
y 胸围cm
125(98.14) 198(224.86)
323
57(83.86)
182
219(192.14)
417
276
599
68.68 47.48
53.92
列联表的关联性分析
【检验步骤】 1. 建立检验假设,确定检验水准
H0:HP与家庭成员胃病史之间相互独立 H1:HP与家庭成员胃病史之间有关联
0.05
(a) 0< r <1
(b) -1< r <0
(c) r =1
(d) r =-1
直线相关
(e) r =0
(f) r =0
(g) r =0
(h) r =0
直线相关
图12-2 2000年某地16名7岁男孩体重与胸围散点图
直线相关
r x x y y x x 2 y y 2
没有单位,取值介于-1与1之间 相关方向用正负号表示 相关的密切程度用绝对值表示
析两变量之间的数量依存关系 。
直线相关
相关分析的概念
直 线 相 关 (1inear correlation) , 又 称 简 单 相 关 (simple correlation),是用来描述具有直线关系的 两变量x、y的相互关系的统计方法。 要求两变量均来自于双变量正态总体的随机变量。
直线相关
相关系数的意义及计算
列联表的关联性分析
2×2列联表的关联性分析
该研究者采用检验进行假设检验,结 果 2 22.917 ,P<0.005,差异有统计学意义, 故认为幽门螺杆菌感染(HP)与家庭成员胃病 史有关联性。
【问题12-4】 (1)该资料为何种类型资料? (2)该研究者所用统计方法是否正确?
列联表的关联性分析
列联表的关联性分析
直线相关系数(linear correlation coefficient)亦称 Pearson积矩相关系数,是定量描述两个变量间直线 关系的方向和密切程度的指标
总体相关系数用 表示,样本相关系数用r表示
直线相关
进行相关分析时,首先绘制散点图(scatter plot), 初步判断两变量间的关系。
r0
0.8343
tr
1 r2
5.6623 1 0.83432
n2
16 2
直线相关
【检验步骤】 3.确定P值,做出统计推断 按自由度 n - 2 16- 2 14 ,查附表4,P 0.001 按水准,拒绝H0,接受H1,差异有统计学意义, 可认为2000年该地7岁男孩体重与胸围之间有相 关关系。
xy
直线相关
21332.38 366 926.6
r
16
0.8343
8548.30
3662 16
53813.56
926.6 16
2
直线相关
相关系数的假设检验
查表法
根据自由度 n 2 ,查附表14,将所得 r 值与 某概率水平(如0.05)对应的 r 界值相比较,若
r 值小于 r 界值,则P大于相应的概率水平,反
直线相关
【例12-1】 2000年测得某地16名7岁男孩体重与胸围资料,见表12-1。
表12-1 2000年某地16名7岁男孩体重与胸围资料
编号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
体 重(kg) 24.5
27.0
23.5
28.5
23.0
26.7
26.8
24.6
24.8
19.7
19.5
17.2
20.0
19.0
20.2
21.0
胸 围(cm) 61.0
62.0
60.0
64.0
59.3
58.4
58.6
58.7
58.5
56.0
55.6
54.5
53.0
52.0
58.0
57.0
直线相关
【问题12-1】 该资料有何特点? 该资料应做何种统计分析?步骤如何?
【分析】 • 连续型随机变量,属于定量资料 。 • 可以探讨它们之间的相关关系,还可分
4096.00 1824.00
5 23.0
59.3
529.00
3516.49 1363.90
15 20.2 16 21.0
合计 366.0 x
58.0 57.0 926.6
y
408.04 441.00 8548.30
x2
3364.00 3249.00 53813.56
y2
1171.60 1197.00 21332.38
(3)
x 2(4)=(2)2 y 2 (5)=(3)2 xy (6)=(2)×(3)
1 24.5
61.0
60ቤተ መጻሕፍቲ ባይዱ.25
3721.00 1494.50
2 27.0
62.0
725.00
3844.00 1674.00
3 23.5
60.0
552.25
3600.00 1410.00
4 28.5
64.0
812.25
相关文档
最新文档