统计学:两变量关联性分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.0 0.9
1.0 0.9 1.1 0.9
时间
14
13
18 17
15
15
13
14
16
17
14 16 15
16
14
15 17
© ë £ ¨Ã ä £ ±¼ ª Ê ý Ñ Ä
16 15 14 13 12
0.5
0.7
0.9
ý Ñ Ä ª à ¸ Å ¨¶ È £ ¨º Á É ý £ ©
1.1
1.3
¼ 11-1 ý Í À 11-1Ö Ð Ê ý ¾ Ý É ¢ µ ã Í ¼
浓度x 时间 1.1 14 1.2 13 1.0 15 0.9 15 1.2 13 1.1 14 0.9 16 0.6 17 … … … … … … 0.7 17
开机
mode → 2
→
shift
→
AC
→
1.1
→
xD,yD
→
14
→
DATA
1.2
→ xD,yD → 13
→
DATA
→
…
→
…
→
…
x y x
药物剂量与疗效、污染程度与污染源距离等,相关就是研
究这种两个变量之间关系的统计方法。
一、线性相关的概念及其统计描述
例11-1 随机抽取15名健康人,测定血液的凝血酶浓度(单位/毫升)及凝固时间,
数据如下。据此如何判断这两项指标间有否相关? 受试者 浓度 1 1.1 2 1.2 3 4 5 1.2 6 1.1 7 0.9 8 0.6 9 10 11 12 13 1.1 14 1 15 0.7
i 1 i i i 1
n
n
2 i
y
i 1
n
2 i
x y
i 1 i i 1
n
n
i
kout 调出
shift 调出
2.82
例11-2
就例11-1资料计算相关系数
r
0.404 22.933
0.926
二、相关系数的统计推断
原假设H0: ρ=0 (两变量无直线关系) 检验方法:
(1)t检验
t
r 0 1 r n2
2
,
v n2
例11-3
t
就例11-2所得r =﹣ 0.926 值作显著性检验
0.926 1 0.926 15 2
2
8.874 , v n 2 13
查t界值表, t0.001 / 2,13 4.221 ,
P 0.001
310 426 540
3
4 5 6
+
++ ++
7.0
3.5 9.0 9.0
-4
0.5 -4 -3
16
0.25 16 9
7
8 9 10 11 12 合计
740
1060 1260 1290 1438 2004 —
7
8 9 10 11 12 78
+++ —
3.5
3.5 3.5 3.5 11.5 3.5 78
1 rs 1
4.确定P值作出结论
例11-4
编号 1 2
某地研究2~7岁急性白血病患儿的血小板数与出血症状程度的相关性。
血小板x 121 138 秩次pi 1 2 出血症状y +++ ++ 秩次qi 11.5 9.0 d=p-q -10.5 -7 d2 110.25 49
3
4 5 6
165
拒绝H 0,可认为凝血酶浓度与 凝血时间存在负相关。
(2) r检验
查r 界值表(附表13)
v=n-2
r界值表
三、线性相关应用中注意的问题
1.样本相关系数接近零并不意味着两变量间一定无相关关系。
2.人为选定变量数值时莫做相关
3.出现异常值时慎用相关
4.相关未必真有内在关系
5.分层资料盲目合并易出假象
两变量关联性分析
( analysis correlation of two variable ) 要求:
1.掌握相关的应用条件和pearson相关系数算法
2.了解等级资料秩相关的spearman相关系数算法 3.掌握分类变量的相关性分析的列联系数算法
第一节 线性相关
前面几章主要讨论了单变量(univariate)资料的统计 分析,着重于描述某一变量的统计特征或比较该变量的组 间差别。但是在大量的医学科研与实践中,经常会遇到对 两个变量之间关系的研究,如年龄与血压、体重与身高、
3.5
4.5 5.5 6.5 -0.5 8.5 —
12.25
20.25 30.25 42.25 0.25 72.25 378
本例 n=12
二、 相同秩次较多时rs的校正 1.校正公式rs’
rs, 式中 [(n 3 n) / 6] (Tx Ty ) d i2 [(n 3 n) / 6] 2Tx (t T (或T )
1. 常见的散点图
相关分析也称积差相关分析,是研究两个变量密切程度的统计方法 条件:两个变量x与y均为服从正态分布的随机变量(双变量正态分布)
一.相关概念 正相关:x与y同向(直线)变化 负相关: x与y反向(直线)变化 零相关: x与y无(直线)关系
注意:相关关系不是因果关系
2. .相关系数的意义及计算
若出现相同值按平均秩赋值,当(pi,qi)的相同秩次不多时按下面操作。
2.求每对观察值秩次之差di= pi-qi (i=1~n)
3.计算等级相关系数rs
当 当 n 50时,统计量 rs 1 n 50时,统计量 6
2
di
2
n(n 1)
vn
查附表15
Z rs n 1
2
l xy
yi
x y
i 1
n
2
,
l xx
Biblioteka Baidux
i 1
2 i
l yy
y
i 1
2 i
n yi i 1 n
r也称person系数,其值为-1≤r≤1。 r>0 , 表示正相关 r<0 , 表示负相关 这里的r是总体相关系数ρ 的估计值
计算器计算过程
第二节
秩相关
rank correlation 目的: 用秩和法作直线相关分析
资料条件:
(1)不服从双变量正态分布而不宜作积差相关分析 (2)总体分布类型未知 (3)一个变量数据是等级指标,另一个是连续型指标
一、 Spearman 等级相关
步骤: 1.将两个变量x与y的观察值分别按从小到大编秩,即(xi,yi )→(pi,qi),
相关系数(coefficient of correlation),是描述两个变量的密切程度与方向的指标,用r表示:
r
(x x
i 1 n n i
(x
i
i
x )( yi y )
x) 2
n
(y
n i i 1
i
y)2
i
l xy l xx
n
l yy n xi i 1 n