双变量关联性分析

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

精选课件
21
2. 出现离群点时慎用相关
精选课件
22
3. 分层资料不可盲目合并
精选课件
23
3. 分层资料不可盲目合并
精选课件
24
3. 分层资料不可盲目合并
精选课件
25
3. 分层资料不可盲目合并
精选课件
26
直线回归与直线相关的区别与联系
精选课件
27
区别
1、资料要求不同 回归:y服从正态分布,x没有特别的 要求 相关:x和y服从双变量正态分布
精选课件
wenku.baidu.com38
应用直线回归和相关的注意点
4、相关关系不一定是因果关系,也可能 是伴随关系
精选课件
39
如某生春种一植物,不久长出幼苗。恰邻 院盖楼,细心观测,苗长楼增。计算发现, 苗高与楼高具有相关性。
两者是否真有内在联系?
精选课件
40
例:1875~1920,美国年铁制品产量与 英国年出生率相关系数为-0.98
精选课件
12
相关系数的意义
相关密切程度:用r的大小表示,r的绝对 值越接近于1,说明相关越密切
相 关 方 向 : 用r的正负号表示
精选课件
13
P164 例13.1
某医师测量了15名正常成年人的体重(kg)与 CT双肾体积(ml)大小,数据如表13.1所示。 据此回答两变量是否有关联?其方向与密 切程度如何?
15213
152
查认附为表体3,重t和界值双表肾,体得积p<之0.0间01,有,直拒线绝相H关o,关可系以。
精选课件
19
相关分析应用中应注意的问题
精选课件
20
1. 进行相关分析前应先绘制散点图
散点图能使我们直观地看出两变量间有无 线性关系并发现可能的离群点(outlier),当 散点有线性趋势时,才能进行相关分析。
精选课件
46
rs的计算
将x及y的秩次直接代入直线相关系数的计算公式 可得到rs 。
精选课件
47
rs的假设检验
当n≤50时,检验ρs是否为零可用查表法(查 附表15,rs界值表)。
当n>50时,按式(13-4)和(13-5)计算检验统计 量。
精选课件
48
分类变量的关联性分析
Question: r和b的大小有关系吗?r较大, 是否b也较大?
精选课件
31
精选课件
32
联系
2、假设检验等价:r和b的假设检验是等 价的,即对同一样本,两者的t值相等, 检验结果完全一致
精选课件
33
联系
3、用回归解释相关 r的平方称为决定系数
r2 l2xy l2xy lxx SS回
lxxlyy
lyy
SS总
精选课件
34
决定系数r2
表示回归平方和占总平方和的比例,即应 变量y的总变异中由自变量x可以解释的比例。
SS回越接近于SS总,则r2越接近于1,说明引 入相关变量的效果越好
当相关系数较小时,若引入回归,可能由 于减少的误差太少而无实际意义
精选课件
35
example
如 r=0.20,n=100时,P<0.05,r有统 计学意义。但r2=0.04,表示SS回在SS总 中仅占4%,说明两变量相关分析的实 际意义不大。
(若x数值系人为选定,莫作相关 例 药物的剂量-反应关系)
精选课件
28
区别
2、应用情况不同 回归:反映两变量间的数量关系(b) 相关:反映两变量间互依的程度和方向(r)
精选课件
29
提问方式不同 年龄增加,血压发生什么样的变化? 年龄和血压之间有关系吗?
精选课件
30
联系
1、方向一致:对同一组数据若同时计 算r和b,其正负号是一致的
精选课件
14
直线相关的计算步骤
绘制散点图:观察散点是否随一变量的 变化而变化,所有散点是否呈直线关系
精选课件
15
双 肾 体 积
(ml) y
体重 (kg) x
图13.1 15名正常成年人体重和双肾体积的散点图
精选课件
16
直线相关的计算步骤
计算样本相关系数(本例r =0.875)
离均差积和
r
精选课件
36
应用直线回归和相关的注意点
1、作回归和相关分析之前,先绘制散点图 2、据资料的性质正确选用回归和相关 3、用回归方程进行预测的时候,应当谨慎。
X不能偏离实测范围太远,否则偏差太大。
精选课件
37
example
y ˆ81.541.222x
x:20~50妇女年龄 y:血压
x=0时,yˆ 81.54
相关系数又称Pearson 积矩相关系数, 样本相关系数用r表示,总体相关系
数用 表示
精选课件
4
相关的种类
精选课件
5
0< r <1
精选课件
6
-1< r <0
精选课件
7
r=1
精选课件
8
r = -1
精选课件
9
r=0
精选课件
10
r=0
精选课件
11
相关的种类
正相关:0< r <1 完全正相关: r =1 负相关:-1< r <0 完全负相关: r =-1 零相关:r =0 相关系数没有单位,其值为-1≤r≤1
直线关系,不能说明变量间没有关系
精选课件
43
秩相关
精选课件
44
秩相关适用条件
原始数据只能以等级表示 总体分布未知 不服从双变量正态分布
精选课件
45
P169 例13.4
某研究者对15例30~50岁成年男子的舒张压 (mmHg)与夜间最低血氧含量分级进行研究, 结果见表13.2,试分析两者的关联性。
(xx)(yy) lxy
(xx)2 (yy)2 lxxlyy
精选课件
17
相关系数的假设检验
检验r是否来自总体相关系数为零的总体。
常用t检验:
tr
r0 Sr
r 1 r2 n2
n2
精选课件
18
Ho: =0,两变量间无直线相关关系
H1=: 0≠.005 两变量间有直线相关关系
t 0.875 6.517 1(0.875)2
因素:社会、经济、技术
精选课件
41
应用直线回归和相关的注意点
5、不能只根据相关系数的绝对值大小来 判断相关的密切程度,应首先作假设 检验
例:r=0.601 n=8 p=0.10~0.20 r=0.401 n=42 p=0.005~0.01
精选课件
42
应用直线回归和相关的注意点
6、 和 为零仅说明没有变量间没有
双变量 关联性分析
授课教师:殷菲
精选课件
1
➢ 单变量分析方法(univariate
analysis):t检验、u检验、方差分析
➢ 双变量分析方法(bivariable analysis) :直线回归与相关、秩相 关等
精选课件
2
直线相关
精选课件
3
直线相关的概念
用相关系数描述两变量间直线关系的 密切程度和方向
相关文档
最新文档