两变量关联性分析.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
体重 (kg)
2019/3/21
(一)线性相关的统计描述
线性相关系数(Pearson积矩相关系数) 简称为相关系数(correlation coefficient) 它是反映两变量相关关系的方向和密切程度的指标 总体相关系数用ρ表示,样本相关系数用r表示。 相关系数r计算
r
lxy lxx l yy
( x x )( y y )
i 1 2 2 ( x x ) ( y y ) i 1 i 1 n n
n
两变量关联性分析
12
2019/3/21
(一)线性相关的统计描述
线性相关系数 相关系数r计算
用公式计算 用计算器计算(步骤):举例 进入相关回归状态; 清除原有数据; 输入数据; 呼出结果(相关系数r) 用软件计算
(一)线性相关的统计描述
例11-1 在某地一项膳食调查中,随机抽取了14名40~60岁的健康 妇女,测得每人的基础代谢(kJ/day)与体重(kg)数据如下据此判断 这两项指标间有无关联?
两变量关联性分析
9
5800 5300
基础代谢(KJ/day)
4800 4300 3800 3300 2800 30 35 40 45 50 55 60 65 70 75
2
tr
r 0Biblioteka Baidu
0.964
2
12.559
可认为两变量存在线性相关关系
两变量关联性分析 19
2019/3/21
(二)线性相关分析步骤
以例11-1完整演示相关分析步骤
绘制散点图 散点图呈线性趋势时,计算样本相关系数 对样本相关系数进行假设检验
相关系数有统计学意义时,解释相关系数的统计学意义
两变量关联性分析
0 r 0 0
假设检验基本原理 ① 由于抽样误差引起,ρ=0 ② 存在相关关系, ρ≠ 0
两变量关联性分析
17
2019/3/21
(二)线性相关分析步骤
对样本相关系数进行假设检验的方法
查表法
将r作为统计量,直接查自由度ν=n-2的r界值表
相关系数r的t检验
r 0 t Sr
相关分析与回归分析
年龄与血脂、身高与体重
两变量关联性分析
4
2019/3/21
一、线性相关
相关关系分为线性相关关系与非线性相关关系
线性相关关系分为正相关关系与负相关关系 正相关(positive correlation)
身高与体重、体重与体表面积
负相关(negative correlation)
胰岛素与血糖、凝血酶浓度与凝血时间
两变量关联性分析
13
2019/3/21
(一)线性相关的统计描述
线性相关系数
相关系数的特点
相关系数r是个无量纲的统计指标;
取值范围: -1≤r ≤ 1
r的符号说明相关的方向 r>0 正相关;r=0无相关;r <0 负相关
r的绝对值大小说明相关关系的密切程度
|r| 越接近1,相关关系越密切(强) |r| 越接近0,相关关系越弱。
两变量关联性分析
14
2019/3/21
(二)线性相关分析步骤
绘制散点图
散点图呈线性趋势时,计算样本相关系数
对样本相关系数进行假设检验
相关系数有统计学意义时,解释相关系数的统计学意义
两变量关联性分析
16
2019/3/21
(二)线性相关分析步骤
对样本相关系数进行假设检验 由样本的相关系数不为零,推断总体的相关系数是 否为零。
绘制散点图(scatter plot)
将其中一个变量作为X轴变量,另一个变量作为Y 轴变量,以一一对应的(X,Y)绘制散点。
例如:教材195页例11-1(散点图图11-1)
注意观察散点的变化方向和密集程度
医学现象中,常见的散点图见教材196页
正相关、负相关、曲线相关、零相关
两变量关联性分析
8
2019/3/21
作相关分析一定要有实际意义;
分层资料作相关分析应慎重。
两变量关联性分析
22
2019/3/21
二、秩相关
秩相关(rank correlation)
20
2019/3/21
(三)线性相关分析的条件
进行积矩相关分析的条件:双变量正态分布
对于连续型双变量资料
满足双变量正态分布,可进行积矩相关分析;
不满足双变量正态分布,采用秩相关分析。
两变量关联性分析
21
2019/3/21
(四)线性相关应用中应注意的问题
作相关分析或回归分析,首先需绘制散点图;
相关分析的适用条件:双变量正态分布; 总体积矩相关系数为零,不意味两变量一定无相关, 可能存在曲线相关; 一个变量的数值人为选定时不宜作相关; 当出现异常值时慎用相关;
r 1 r2 n2
18
两变量关联性分析
2019/3/21
(二)线性相关分析步骤
对样本相关系数进行假设检验的步骤
建立假设,确定检验水准 计算检验统计量 H0:ρ=0 H1:ρ≠0 =0.05 ①r=0.964
②
1 r 1 (0.964) n2 14 2 确定P值,作出结论 14 2 12 ① 查自由度为12的r界值表,P<0.001 ② 查自由度为12的 t 界值表,P<0.001 P< ,按=0.05水准拒绝H0,接受H1
第十一章
两变量关联性分析
流行病与卫生统计学教研室 曹 明 芹
2019/3/21
两变量关联性分析
之前各章节研究的多为单变量统计分析,实际工作中 常需要对两个或多个随机变量之间的关系进行研究。
两个变量之间是否存在联系及联系的程度如何? 是否可以定量地描述两者的依存关系? 例如:血压与年龄、体温与脉搏、血药浓度与时间
两变量间的线性相关又称为简单相关
两变量关联性分析
5
2019/3/21
一、线性相关
线性相关的统计描述
线性相关分析步骤
线性相关分析的条件
线性相关应用中应注意的问题
两变量关联性分析
6
2019/3/21
(一)线性相关的统计描述
绘制散点图
计算统计指标-相关系数
两变量关联性分析
7
2019/3/21
(一)线性相关的统计描述
两变量关联性分析
2
2019/3/21
两变量关联性分析
线性相关(连续变量间)
秩相关(连续变量或等级变量间) 分类变量的关联性分析(分类变量间)
两变量关联性分析
3
2019/3/21
一、线性相关
确定性关系与非确定性关系
确定性关系:两变量间的函数关系
圆的周长与半径的关系: C=2R
非确定性关系:两变量在宏观上存在关系,但并非 函数关系,而表现为相关关系或回归关系。