关联性分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4175.6 4435.0
3460.2 4020.8 3987.4 4970.6 5359.7
50.7 53.7
37.1 51.7 47.8 62.8 67.3
8 9
10 11 12 13 14
3970.6 3983.2
5050.1 5355.5 4560.6 4874.4 5029.2
48.6 44.6
表11-3 吸烟习惯与患慢性气管炎
吸烟方式 自卷纸烟 过滤嘴 合计
慢性气管炎
有 22 15 37 无 53 110 163
合计 75 125 200
检验步骤: H0:两种属性之间无关联 H1:两种属性之间有关联
据自由度1查
界值表得:
拒绝H0,可认为两种属性之间有关联,可以说 明吸烟方式不同对患气管炎有影响。
四、相关分析应用时注意事项
1.在作相关分析前,先绘散点图,根据散点分布有直线趋势时才 选线性相关分析; 2.进行线性相关分析时 要求两个变量均服从正态分布 3.作相关相关分析要有实际意义;
4.相关未必有因果联系,样本的相关系数接近零并不意味着两变 量间一定无相关性
5.出现异常值是慎用相关 6.分层资料盲目合并易出现假相关
贫血患儿的血红蛋白(g/dl)与贫血体征
秩次p 1 2 3 4 5 6 7 8 9 10 p2 1 4 9 16 25 36 49 64 81 100
贫血体征 y
秩次q 10 8 6 3 8 8 3 3 3 3
q2 100 64 36 9 64 64 9 9 9 9
pq 10 16 18 12 40 48 21 24 27 30
例11-8 欲探讨职业类型与胃病类型是否有关联,某 医生将收治的310名胃病患者按主要的职业类型与 胃病类型两种属性交叉分类,分析职业类型与胃病 类型是否有关联。
表11-6
310名胃病患者按胃病类型与职业属性
第三节
分类变量的关联性分析
Biblioteka Baidu
一、交叉分类2×2表的关联分析:(四格表的) 公式:可用基本公式或四格表专用公式
例11-6 研究吸烟方式与慢性气管炎 是否有关,某研 究者随机调查了200例年龄相仿的吸烟者,对每个个 体分别观察慢性气管炎 与否和吸烟方式两种属性,结 果如下表,试分析两种属性的关联性。
1
2
3
学习要点
1、掌握基本概念: 直线相关、直线相关分析、相关系数的意义; 2、熟悉直线相关、秩相关分析过程; 3、熟悉分类变量的关联性分析
两变量关联性分析包括:
定量资料的直线相关分析 等级资料的秩相关分析 分类资料的关联性分析
第一节
线性相关
Linear correlation
一、概念 相关: 指两个变量间存在着相互关系,为 相关关系,简称相关。 直线相关: 指两定量变量的数量变化在散点图上 呈直线趋势的相互关系。 直线相关分析:研究两定量正态分布变量有 无关系、方向、密切程度的方法。
例11-1 在某地一项膳食调查中,随机抽取了14名40~60岁的健康妇女, 测得每人的基础代谢与体重数据,据此数据如何判断两项指标间有 无相关?
表11-1 14名中年健康妇女的基础代谢与体重的测量值 基础代谢 基础代谢 体重(Kg) 编号 体重(Kg) (kJ/d) (kJ/d)
编号
1 2
3 4 5 6 7
5/8.6 71.0 59.7 62.1 61.5
5800 5300 4800
基 础 4300 代 谢 (KJ/d) 3800
3300 2800
30
35
40
45
50 55 体重(Kg)
60
65
70
75
图11-1 14名中老年健康妇女基础代谢与体重的关系
8
二、相关系数r意义及计算:
又称积差相关系数或简单相关系数,
+++ ++ + ++ ++ -
合计
-
55
385
-
55
373
246
二、秩相关系数的统计推断: 推断意义同直线相关系数的推断。
1、查表法:
根据n查p487 rs界值表,本例rs=-0.741 n=10,查得
rs0.05(10)=0.648 今 按0.05的水准,拒绝H0 ,认为贫血患儿的血红蛋白含量 与贫血体征间有相关关系,即血红蛋白含量越低贫血体 征越明显。
16
第二节 秩相关 (Rank correlation)
一、秩相关分析(Spearman秩相关)定义:
研究两非正态分布(或未知分布、等级)变量有无 相关、方向、密切程度的相关方法。是一种非参数统计 方法。
二、秩相关系数:
表11-2
编号 1 2 3 4 5 6 7 8 9 10 血红蛋白 x 5.0 5.8 6.1 7.3 8.8 9.1 11.1 12.3 13.5 13.8
表11-5 两种检验方法的结果
甲法
+ — 合计
乙法 +
80 31 111

10 11 21
合计
90 42 132
27
检验步骤: H0:两种检验方法结果之间互相独立 H1:两种检验方法结果之间有关联
据自由度1查
界值表得:p<0.05
拒绝H0,可认为检验方法结果之间有关联。
28
三、R×C表分类资料的关联性分析
相关系数也不等于0,要考虑会不会出现总体上是无相
关关系的,但因抽样误差的原因,使得样本相关系数r
不等于0呢?所以应对相关系数r的进行统计推断。
方法:1、t检验
2、查r表
2、查表法
根据 查r界值表,查得r0.001(12)=0.780 本 例r=0.964 P<0.001 所得结论与t检验一致。 相关程度 >0.7 密切相关 0.4~0.7 中度相关 <0.4 低度相关
是表示两变量有无相关、方向、密切程度的指标。其 波动范围:-1~+1,无单位。 见P196图11-2 0<r<1 正相关 一变量增加,另一变量增加 -1<r<0 负相关 一变量增加,另一变量减少 r=0 零相关 无直线关系
用计算器的SD功能求:
12
三、相关系数r的统计推断(假设检验):
根据样本资料计算的r不等于0,并不能说明总体
两个分类变量的关联程度可用Pearson列联系 数r描述,列联系数r越大关联性越强: 介于0~1间 ,无单位
二、2×2配对资料的关联性分析
问有无关联:四格表专用公式,见204页。 问有无差别:b+c>40
例11-7 有132份食品标本,把每分标本一分为二, 分别用两种检验方法作沙门菌检验,结果见下 表。问两种方法的结果是否存在关联?
相关文档
最新文档