第五讲 双变量相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
10.441
184.394 200.787
37
4.984
39
F 1.645 1.194
2.095
Sig. .207 .282
.156
表5—7是将年龄作为第一层自变量得到 的方差分析表,Linearity是假设因变量均值 是第一层自变量值的线性函数,Deviation from Linearity是不能由线性模型解释的部分。
HB * SEX
Eta
Eta Squared
.567
.321
表5—6是eta统计量表,η统计量表明因变 量和自变量之间联系的强度,0.567的值处 于中等水平,η2是因变量中不同组间差异所 解释的方差比,是组间平方和与总平方和之 比,即由64.5256除以 200.787得到。
表5—7 按年龄分组的方差分析表
Sum 158.09 105.38 194.32 457.79
表5—3、4是将sex和age一起放在layer 1of 1中,分别 计算男、女(不作年龄分组)。年龄分三组(不作性别 分组)的观测值合计、均数、标准差、方差和个数。
表5—5 方差分析表
ANOVA Tablea
HB * SEX Between Groups (Combined)
图5-6
Test Value: 输入已知的 总体均值, 默认0
One-Sample T Test主对话框
Confidence Interval:输 入置信区间, 一般取90、 95、99等。
图5-7 Options对话框
Missing Values: 在检验变量中含 有缺失值的观测将 不被计算。
在任何一个变量 中含有缺失值的观 测都将不被计算
二、完全窗口分析 按Analyze—Compare Means—Means顺序, 打开Means主对话框(如图5--1)。
该框的变量为因变量,即用于分析的变量。
单击此按钮,
进入下一层, 该框的变量为自
返回则按
变量,必须至少
Previous按钮。 有一个变量
见图5—2
图5—1 Means主对话框
Statistics框:供选择的统计量
• MEANS过程 • 单一样本T检验 (One-Sample
T Test)
• 独立样本T检验 (Independent-
Sample T Test)
• 配对样本T检验 (Paired-
Sample T Test)
• 方差分析(One-Way ANOVA)
MEANS过程
一、 Means过程 该过程实际上更倾向于对样本进行描述,可 以对需要比较的各组计算描述指标,包括均 值、标准差、总和、观测量数、方差等一系 列单变量统计量。
Means打开主对话框。
• 3)单击Option, 打开Options对话框,选择统
计项目。
• 4)单击OK完成。
选hb sex
图5—3 在主对话框选送变量
按Next,进入 layer 2of 2, 选age
图5—4 第二层变量框
选
择
统
复选此2
计
项,第一
项
按此
层次分
目
按钮
组选择
计算方
差分析
和线性
一、单一样本T检验
一、 简介
用于检验单个变量的均值与假设检 验值(给定的常数)之间是否存在差异。
二、完全窗口分析
按Analyze—Compare Means—OneSample T Test顺序,打开One-Sample T Test主对话框(如图5--6)
Test
Variables 框:用于 选取需要 分析的变 量
2、结果分析
表5-9 单个样本统计量
One-Sample Statistics
Std. Std. Error
N
Mean Deviation
Mean
HB
40 11.4448
2.2690
.3588
表5-9 是血红蛋白值的观测量个数、均值、 标准差和均值的标准误等统计量。
表5-10 单个样本检验
One-Sample Test
表5—4 按年龄分组的描述统计量
HB
AGE 16 17 18 Total
Mean 11.2921 10.5380 12.1450 11.4448
血红Re蛋por白t * 年龄
N 14 10 16 40
Std. Deviation
2.4649
1.9421
2.1827
2.2690
Variance 6.076 3.772 4.764 5.148
表5—8 按年龄分组的eta统计量
HB * AGE
Measures of Association
R
R Squared
.172
.030
wk.baidu.comEta
Eta Squared
.286
.082
表5—8是将年龄作为第一层自变量得到的eta 统计量表,R和R2测度线性拟合的良好度, R是观测值与预测值之间的相关系数。
表5—2 分组描述统计量
HB SEX 1
2
Total
AGE 16 17 18 Total 16 17 18 Total 16 17 18 Total
Mean 12.4078 12.4033 12.9811 12.6529
9.2840 9.7386 11.0700 10.1095 11.2921 10.5380 12.1450 11.4448
Test Value = 11.657
95% Confidence
Interval of the
Sig.
Mean
Difference
t
df
(2-tailed) Difference Lower
Upper
HB
-.592
39
.558
R ep o rt
N 9 3 9
21 5 7 7
19 14 10 16 40
Std. Deviation
2.2455 1.8993 2.0933 2.0531 1.3494 1.4036 1.9158 1.6989 2.4649 1.9421 2.1827 2.2690
Variance 5.042 3.607 4.382 4.215 1.821 1.970 3.670 2.886 6.076 3.772 4.764 5.148
同 序 - 异 序 对测量
Pearson 相关 系数
常用相关系数的适用范围
变量层次
相关系数
适用的 变量关系
取值 范围
预测的 基准
定类-定类 (定类-定序)
定序-定序
定类-定距 (定序-定距)
Lambda (λ)
Goodman & Kruskal’s tau-y
(τy)
Gamma (G)
Somers’D (dyx )
HB * AGE
Between Groups
Within Groups Total
(Combined)
Linearity
Deviation from Linearity
ANOVA Table
Sum of Squares
16.394 5.952
10.441
df
Mean Square
2
8.197
1
5.952
Cell Statistics框: 选入的描述统计
量,默认为均值、 样本数、标准差
图5—2 Options 对话框
Statistics for First Layer复选框:
Anova table and eta: 进行分组变量的单 因方差分析并计算 eta 统计量。
Test for linearity:产 生第一层最后一个 变量的R和R2。
7
1 17 14.56 21 2 16 11.36 35 1 18 16.04
8
1 16 12.40 22 1 16 12.78 36 1 18 13.78
9
2 16 8.05 23 1 18 15.09 37 1 17 11.67
10
1 18 14.03 24 2 18 8.67
38 1 17 10.98
Correlation ratio (E2)
对称或 不对称
〔0,1〕
众数
不对称
〔-1,1〕
变量值的 分布比例
对称或不 对称
不对称
〔-1,1〕 〔-1,1〕
变量值 顺序
变量值 顺序
不对称 〔0,1〕
均值
定距-定距
积距相关系数 (Pearson’s r)
对称或 不对称
〔-1,1〕
均值
第一节 平均值分析
表5—3 按性别分组的描述性统计量
HB
SEX 1 2 Total
Mean 12.6529 10.1095 11.4448
血红R蛋epo白rt* 性别
N 21 19 40
Std. Deviation
2.0531 1.6989 2.2690
Variance 4.215 2.886 5.148
Sum 265.71 192.08 457.79
30 1 18 12.35
3
1 16 12.56 17 2 16 8.36
31 1 16 13.65
4
2 17 9.87 18 1 18 11.66 32 2 16 9.87
5
2 17 8.99 19 2 18 8.54
33 2 18 10.09
6
2 17 11.35 20 2 17 7.78
34 2 18 12.55
11
2 18 12.83 25 2 17 8.56
39 2 16 8.78
12
1 16 15.50 26 2 18 12.56 40 1 16 11.35
13
2 18 12.25 27 2 17 11.56
14
2 17 10.06 28 1 16 14.67
1、操作步骤
• 1) 打开数据文件“Means过程.sav” 。 • 2)按顺序Analyze Compare Means
spearman correlation pearson correlation
定距
积矩相关
pearson correlation 回归
regression
双变量关系强度测量的主要指标
定类
定序
定距
定类
卡方类测量 卡方类测量 Eta 系数
定序 定距
Spearman Spearman 相 相关系数 关系数
Sum of Squares
64.526
df
Mean Square
1
64.526
F 17.995
Within Groups
136.261
38
3.586
Total
200.787
39
a. With fewer than three groups, linearity measures for HB * SEX cannot be computed.
Sum 111.67
37.21 116.83 265.71
46.42 68.17 77.49 192.08 158.09 105.38 194.32 457.79
表5—2 分三部分:第一、二部分先按性 别分组,再按年龄分组计算观测值合计、均 数、标准差、方差和个数;第三部分只按年 龄分组,最后一行为合计。
三、例题分析
仍以表5-1的资料来说明。已知另一地区 16-18岁的少年血红蛋白平均值为11.657g%, 检验这一地区16-18岁少年血红蛋白值是否 与另一地区的平均值相等。
1、操作步骤 1)按Analyze—Compare Means—One Sample T Test顺序,打开主对话框。(打开数 据文件“Means过程.sav”。) 2)将变量hb选入 Test Variable框。 3)在Test Value中输入 11.657,后单击OK。
Sig. .000
表5—5是方差分析表,共6列:第一列方 差来源:组间的、组内的、总的方差;第二
列为平方和;第三列为自由度;第四列为均 方;第五列为F值;第六列为F统计量的显 著值,显著值小于0.05,所以性别对血红蛋白 值有显著影响。
表5—6 eta统计量
Measures of Association
检验
图5—5 Options对话框
2. 结果及分析
表5—1 观测量摘要表
HB * SEX * AGE
Case Processing Summary
Included
N
Percent
40 100.0%
Cases
Excluded
N
Percent
0
.0%
Total
N
Percent
40 100.0%
表5—1 是观测量摘要表,观测量总 个数为40,其中有效值为40个、无效值0。
第五讲 双变量关系统计
——相关分析与检验
双变量关系的统计类型
定类
定类
列联
cross-tabulate
定序 列联 cross-tabulate
定距 方差分析(分组平均数)
compare means
定序
列联
积差相关
cross-tabulate 积差相关
spearman correlation 积矩相关
三、例题分析
某医生测得如下血红蛋白值(g%),用 Means过程对其做基本的描述性统计分析。
编号
性 别
年 龄
血红蛋 编 性 白值 号 别
年 龄
血红蛋 编
白值
号
性 年 血红蛋 别 龄 白值
1
1 表158-1血红13.蛋66白值1(5g%)1
16 10.88
29 1 16 7.88
2
1 18 10.57 16 1 18 9.65