双变量关联性分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

25
收缩压(kpa)
20
15
10 2.5
3
3.5 体重指数
4
4.5
图13-1 16名中年女性体重指数和收缩压的散点图
•实 例
某地方病研究所调查了 8名正常儿童的尿肌 酐含量(mmol/24h)如表9-1。估计尿肌酐含 量(Y)对其年龄(X)的相关关系。
表14-1 8名正常儿童的年龄 X(岁)与尿肌酐含量 Y(mmol/24h)
又称简单相关(simple correlation)
或 Pearson 相关分析,用于研究具有 直线关系的两个变量间相关关系的密 切程度与相关方向的一种统计分析方 法,用于双变量正态分布资料 (要求两 个变量均服从正态分布)
• 在线性相关分析中,两个变量X 和Y的
值总是成对的出现,记为(X1,Y1)、
3.09
2.48 2.56
81
36 64
9.55
6.15 6.55 11.29 10.11 7.02 72.27
27.81
14.88 20.48 33.60 38.16 18.55 232.61
lYY Y 2
( Y ) 2 n
3.36 100 3.18 144 2.65 49
,可通过线性相关(linear correlation)分析来估计 它们之间可能存在的线性联系的方向与程度。 • 两个随机变量 X 和 Y ,可以是对同一观察单位同时 测量 X 与 Y 的数值,也可以是测量成对观察单位的 同一变量或不同变量的数值,而产生一对观察值。
1/16/2019
6
直线相关(linear correlation)
量间相关关系的密切程度与相关方向的 指标. r 表示样本相关系数,ρ表示总体相 关系数, -1≤ r ≤1 r 的计算结果说明了两个变量X与Y之 间关联的密切程度(绝对值大小)与关联 的性质或方向(正负号)。
相关分析的目的在于通过相关系数r来描述
和度量两变量线性联系的程度和方向。 r>0 正相关 r<0 负相关 r=0 零相关 零相关即两变量间无关。 样本相关系数不等于零,并不表示总体相 关系数不等于零,还要作显著性检验。
( X ,Y )
图14-1
8名儿童的年龄与尿肌酐含量散点图
一、概述
概念
又称简单相关或 Pearson 相关分析,用于研究
具有直线关系的两个变量间相关关系的密切程度
与相关方向的一种统计分析方法
应用条件 要求两个变量均服从正态分布 (双变量正态分布 )
1/16/2019 14
相关系数的意义及计算 又称积差相关系数或 Pearson 相关系数,说 明具有直线关系的两个变量间相关关系的密切程 度与相关方向的指标
n
•其中, • •
l xx 为X 的离均差平方和
lYY 为Y 的离均差平方和 l XY 为X和Y 的离均差积和
编号
1 2
年龄X 肌酐Y
13 11
X2
Y2
12.53 9.06
XY
46.02 33.11
3.54 169 3.01 121
Байду номын сангаасl XX

X2
(

X )2
n
3
4 5 6 7 8 合计
9
6 8 10 12 7 76
r 表示样本相关系数,ρ 表示总体相关系数
1/16/2019
15
r
x x y y x x y y
2
2

lxy lxxl yy
• 没有单位,取值介于-1与1之间 • 相关方向用正负号表示 • 相关的密切程度用绝对值表示
1/16/2019
16
相关系数,说明具有直线关系的两个变
相关关系图示
1/16/2019
19
• r无单位, -1 ≤ r ≤ 1
r 值为正 ——正相关
r 值为负 ——负相关
|r|=1 --- 完全相关 r=0 --- 零相关
1/16/2019
20
相关关系密切程度的判断
r 0.4
0.4 r 0.7
r 0.7
1/16/2019
低度相关
各不相同。这里,体温和脉搏的关系就比产
前检查与婴儿体重之间的关系密切得多,而
体重和身高的关系则介与二者之间。

相关与回归就是用于研究和解释两个变量
之间相互关系的。

相关分析用于分析两变量间相互联系的密
切程度及相关方向。回归分析适用于分析变量
间的依存关系;用一个自变量的值来估计另一
个应变量的值。
• 前面描述性统计及假设检验只涉及到一个变量,
编号 年龄X 尿肌酐含量 Y 1 13 3.54 2 11 3.01 3 9 3.09 4 6 2.48 5 8 2.56 6 10 3.36 7 12 3.18 8 7 2.65
尿肌酐含量(mmol/24h)Y
3.6 3.4 3.2 3.0 2.8 2.6 2.4 4 6 8 10 年龄(岁)X 12 14
第 十 二 章
广东医学院公共卫生学院 流行病与统计学教研室
1/16/2019
1
第一节 直线相关
1/16/2019
2

直线相关 Linear correlation
医学上许多现象之间都有相互联系,例
如:身高与体重、体温与脉搏、产前检查与
婴儿体重、乙肝病毒与乙肝等。在这些有关
系的现象中,它们之间联系的程度和性质也
中度相关
高度相关
21
相关系数的计算:
•X和Y的离均差积和
x x y y xy x y n
•X的离均差平方和
x x x x
2 2
2
n
•y的离均差平方和
y y y y
2 2
2
如体重、红细胞数、血压下降值等,着重于描述某
一变量的统计特征或比较该变量的组间差别。
• 在大量的医学问题研究中常常还要分析两个随机
变量之间的关系,如体重与肺活量、年龄与血压
之间是否存在线性联系,此联系是正向还是负向
以及联系的程度如何?
1/16/2019
5
• 如果两个连续型变量 X和 Y 都随机变动且不分主次
(X2,Y2)…(Xn,Yn),这些观察值
在直角坐标系中形成一幅散点图,这
种散点图可以简单而直观的表示两变
量间的线性关系
•实 例
例如 为研究中年女性体重指数和收 缩压之间的关系,随机测量了16名 40岁以上的女性的体重指数和收缩 压,见表13-1,试绘制散点图。
1. 解:以体重指数为变量X,收缩压为 变量Y作散点图,见下图。可见,体 重指数与收缩压有比较密切的线性相 关关系。
相关文档
最新文档