双变量关联性分析 ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用直线回归和相关的注意点
4、相关关系不一定是因果关系,也可能 是伴随关系
-
39
如某生春种一植物,不久长出幼苗。恰邻 院盖楼,细心观测,苗长楼增。计算发现, 苗高与楼高具有相关性。
两者是否真有内在联系?
-
40
例:1875~1920,美国年铁制品产量与 英国年出生率相关系数为-0.98
因素:社会、经济、技术
(xx)2 (yy)2 lxxlyy
-
17
相关系数的假设检验
检验r是否来自总体相关系数为零的总体。
常用t检验:
r0 tr Sr
r 1 r2 n2
n2
-
18
Ho: =0,两变量间无直线相关关系
H1=: 0≠.005 两变量间有直线相关关系
0.875
t
6.517
1(0.875)2
15213
-
14
直线相关的计算步骤
绘制散点图:观察散点是否随一变量的 变化而变化,所有散点是否呈直线关系
-
15
双 肾 体 积
(ml) y
体重 (kg) x
图13.1 15名正常成年人体重和双肾体积的散点图
-
16
直线相关的计算步骤
计算样本相关系数(本例r =0.875)
离均差积和
r
(xx)(yy) lxy
Question: r和b的大小有关系吗?r较大, 是否b也较大?
-
31
-
32
联系
2、假设检验等价:r和b的假设检验是等 价的,即对同一样本,两者的t值相等, 检验结果完全一致
-
33
联系
3、用回归解释相关 r的平方称为决定系数
r2 l2xy l2xy lxx SS回
lxxlyy
lyy
SS总
-
-
50
单一样本,按两种属性分级,故称 双向有序列联表
-
36
应用直线回归和相关的注意点
1、作回归和相关分析之前,先绘制散点图 2、据资料的性质正确选用回归和相关 3、用回归方程进行预测的时候,应当谨慎。
X不能偏离实测范围太远,否则偏差太大。
-
37
example
y ˆ81.541.222x
x:20~50妇女年龄 y:血压
x=0时,yˆ 81.54
-
38
-
12
相关系数的意义
相关密切程度:用r的大小表示,r的绝对 值越接近于1,说明相关越密切
相 关 方 向 : 用r的正负号表示
-
13
P164 例13.1
某医师测量了15名正常成年人的体重(kg)与 CT双肾体积(ml)大小,数据如表13.1所示。 据此回答两变量是否有关联?其方向与密 切程度如何?
152
查附表3,t界值表,得p<0.001,,拒绝Ho,可以 认为体重和双肾体积之间有直线相关关系。
-
19
相关分析应用中应注意的问题
-
20
1. 进行相关分析前应先绘制散点图
散点图能使我们直观地看出两变量间有无 线性关系并发现可能的离群点(outlier),当 散点有线性趋势时,才能进行相关分析。
-
21
2. 出现离群点时慎用相关
-
22
3. 分层资料不可盲目合并
-
23
3. 分层资料不可盲目合并
-
24
3. 分层资料不可盲目合并
-
25
3. 分层资料不可盲目合并
-
26
直线回归与直线相关的区别源自文库联系
-
27
区别
1、资料要求不同 回归:y服从正态分布,x没有特别的 要求 相关:x和y服从双变量正态分布
-
47
rs的假设检验
当n≤50时,检验ρs是否为零可用查表法(查 附表15,rs界值表)。
当n>50时,按式(13-4)和(13-5)计算检验统计 量。
-
48
分类变量的关联性分析
-
49
什么是关联性分析?
对一组观察对象, 分别观察其两种分类 变量的表现, 归纳成双向交叉排列的统计 表, 这类统计表用以描述行变量和列变量 之 间 的 关 系 , 亦 称 为 列 联 表 (contingency table)。
(若x数值系人为选定,莫作相关 例 药物的剂量-反应关系)
-
28
区别
2、应用情况不同 回归:反映两变量间的数量关系(b) 相关:反映两变量间互依的程度和方向(r)
-
29
提问方式不同 年龄增加,血压发生什么样的变化? 年龄和血压之间有关系吗?
-
30
联系
1、方向一致:对同一组数据若同时计 算r和b,其正负号是一致的
数用 表示
-
4
相关的种类
-
5
0< r <1
-
6
-1< r <0
-
7
r=1
-
8
r = -1
-
9
r=0
-
10
r=0
-
11
相关的种类
正相关:0< r <1 完全正相关: r =1 负相关:-1< r <0 完全负相关: r =-1 零相关:r =0 相关系数没有单位,其值为-1≤r≤1
34
决定系数r2
表示回归平方和占总平方和的比例,即应 变量y的总变异中由自变量x可以解释的比例。
SS回越接近于SS总,则r2越接近于1,说明引 入相关变量的效果越好
当相关系数较小时,若引入回归,可能由 于减少的误差太少而无实际意义
-
35
example
如 r=0.20,n=100时,P<0.05,r有统 计学意义。但r2=0.04,表示SS回在SS总 中仅占4%,说明两变量相关分析的实 际意义不大。
-
43
秩相关
-
44
秩相关适用条件
原始数据只能以等级表示 总体分布未知 不服从双变量正态分布
-
45
P169 例13.4
某研究者对15例30~50岁成年男子的舒张压 (mmHg)与夜间最低血氧含量分级进行研究, 结果见表13.2,试分析两者的关联性。
-
46
rs的计算
将x及y的秩次直接代入直线相关系数的计算公式 可得到rs 。
-
41
应用直线回归和相关的注意点
5、不能只根据相关系数的绝对值大小来 判断相关的密切程度,应首先作假设 检验
例:r=0.601 n=8 p=0.10~0.20 r=0.401 n=42 p=0.005~0.01
-
42
应用直线回归和相关的注意点
6、 和 为零仅说明没有变量间没有
直线关系,不能说明变量间没有关系
双变量 关联性分析
授课教师:殷菲
-
1
➢ 单变量分析方法(univariate
analysis):t检验、u检验、方差分析
➢ 双变量分析方法(bivariable analysis) :直线回归与相关、秩相 关等
-
2
直线相关
-
3
直线相关的概念
用相关系数描述两变量间直线关系的 密切程度和方向
相关系数又称Pearson 积矩相关系数, 样本相关系数用r表示,总体相关系