两变量关联性分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
延伸内容
四、两有序分类变量的关联性分析
例10-11(p206) 某研究者欲了解20岁以上成年人研究晶状体浑
浊程度与年龄的相关关系,收集资料见表10-9。 请分析成年人研究晶状体浑浊程度与年龄的关 联性
先加权
方法一 在crosstabs中分析
方法二 在correlate中分析
五、Kappa指数
1、变量设置
输入数据
2、加权
3、分析analyze-descriptive statisticscrosstabs
记录处理情况
甲法 * 乙法
Case Processing Summary
Valid
N
Percent
132 100.0%
C ases
Missing
N
Percent
0
.0%
Total
<0.001, 列联系数(contingency coefficient)
为0.280,近似p值为<0.001, 拒绝H0,接受H1,可以认为大学生专业与
艾滋病知晓程度之间存在关联性。
二、配对资料关联性分析
例10-8(p203) 有132份食品标本,把每份标本一分为二,分
别用两种检测方法做沙门菌检验。试问两 种检测方法的结果是否存在关联?
步骤:1、变量设置
2、输入数据
3、作散点图( Scatter/Dot )
步骤graphs—legacy dialogs—Scatter/Dot
Scatter/Dot对话框: 点击simple(单式散点图)-define
定义散点图(横坐标轴、纵坐标轴)
可双击散点图进行编辑
4、正态性检验
正态性检验结果
----两个分类变量之间的相关性分析
菜单位置:
analyze—correlate—Bivariate(双变量)
第一节 pearson线性相关
例10-1(p194) 在某地一项膳食调查中,调查对象
为14名40~60岁的中年健康妇女,测 得每人的基础代谢(kj/d)与体重 (kg)的数据。据此数据如何判断这 两变量间有无关联?
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
5、相关分析 分析—相关—双变 量
变量相关分析对话框
Options对话框
描述均数、标准差、样本含量
简略结果
Correlations
df
(2-sided)
4
.000
Likelihood Ratio
20.271
4
.000
Linear -by -Linear A sso ciation
16.727
1
.000
N of Valid Cases
310
a. 1 cells (11.1%) hav e expected count less than 5. The minimum expected count is 4.36.
两变量关联性分析
莫景富 卫生统计学教研室
本章内容
一、pearson线性相关 二、Spearman秩相关 三、分类变量的关联性分析
一、相关分析
研究两个事物或现象间的关联性强度。 1.pearson线形相关
----两个连续性正态分布资料之间的相关 2.Spearman秩相关
----两个非正态分布资料(或一个变量不服从 正态分布、或总体分布未知、等级资料)之间的 相关 3.分类变量的关联性分析
联。某医生将收治的310名胃病患者按主要 职业类型与胃病类型两种属性交叉分类, 结果见表10-6.问职业类型与胃病类型间有 无关联?
1.设置变量、输入数据
2、加权
3、分析
选择统计量
记录处理情况
Chi-Square Tests
Pearson Chi-Square
Value 20.838a
Asymp. Sig.
例10-12(p208) 对某大学537名女生先后进行两次
内容相同的营养调查(相隔2个月), 其中食用鸡蛋的情况见表10-11.试对 该调查的质量进行评价。
1、加权
2、在crosstabs中分析
N
Percent
132 100.0%
列联表
C o unt
甲法 Total
甲 法 * 乙 法 Crossta bulati on
乙法
+
-
+
80
10
-
31
11
111
21
Total 90 42
132
Phi系数为0.192, 列联系数为0.189,近似P值为0.027
三、R×C表的关联性分析
例10-9(p 204 ) 欲探讨职业类型与胃病类型是否有关
Interval by interval Pearson’s R 数值变量 Pearson相关系数
Ordinal by ordinal Spearman 有序变量 Spearman相关系数
x2
n
x2
V
, k min(R,C)
n(k 1)
r
x2 x2 n
名义变量phi系数为-0.292,近似p值为
Tests of Normality
Kolmogorov-Smirnova
Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
基础 代谢(kJ/d) .154
14 .200* .933
14 .390
体重 (kg)
.129
14 .200* .981
14 .956
基 础 代 谢 ( kJ/d) 体 重 ( kg)
Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N
基础代谢 ( kJ/d) 体 重 ( kg)
1.000
.964**
.
.000
14
14
.96Baidu Nhomakorabea**
1.000
.000
.
14
14
**. Correlation is significant at the 0.01 lev el (2-tailed).
第二节 秩相关
适用资料: ⑴ 不服从正态分布的资料 ⑵ 总体分布类型未知的资料 ⑶ 原始数据用等级表示的资料
例10-5 (p200) 某研究者观察了10例6个 月~7岁的贫血患儿的血红蛋白含量与贫血 体征,试作秩相关分析。
1、变量设置,数据输入
2、加权,weight cases
3、analyze-descriptive statistics-crosstabs
记录处理情况
列联表
假设检验结果: Pearson 卡方值为42.579,近似概率为<0.001, 拒绝H0,两变量存在关联性。
中文版结果
Nominal by Nominal Contingency Coefficient 名义变量 列联系数
根据两个定性变量交叉分类计数所得的频 数资料(列联表)作关联(association)分析, 即关于两种属性独立性的x2检验。
一、交叉分类2×2表的关联分析
例10-7 (p201) 为了观察大学生专业与艾滋病知
晓程度之间是否有关,某研究者调查 了某大学一年级不同专业的500学生。 试分析大学生专业与艾滋病知晓程度 之间的关联性。
分析 1、x变量(血红蛋白)连续性计量资料 2、y变量(贫血体征)为等级资料 3、选用spearman秩相关分析
步骤:1、变量设置、输入数据
2、spearman分析
秩相关系数为-0.741,近似P值为0.014, 小于0.05,拒绝H0,认为血红蛋白与贫血体征之 间有相关关系。
第三节 分类变量的关联性分析