第十章相关性测量(下)汇总

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由于有一个变量是定类变量,所以eta系数值(E)介 于0-1之间,没有负值,其平方值( E2 )具有 削减 误差比例的意义。
E2
(Y Y )2
2
(Y Y i )
(Y Y )2
2
2
niY i nY
Y 2 nY 2
E E2
考研真题:
某地的一次社会调查显示,该地老街区、新开发区和
乡村居民的个人现代性测量的平均分数分别为75分
❖ H1:总体中 r≠ 0 ❖ H0: 总体中 r = 0
F
总体的消减误差 总体的剩余误差
r 2 / df1 (1 r 2 ) / df2
练习十二
妇女 教育年期X 劳动小时Y
A
2
B
2
C
3
D
3
E
4
F
4
G
4
5 ❖ 9名女青年受教育年期
4
与参加家务劳动时间
4
的关系是:r = -0.81
3 1 1
❖ 检定总体中女青年受 教育年期与参加家务
(n1=260;s1=6分)、74分(n2=240,s2=8分)和71分 (n3=300,s3=10)。试问,居住地和个人现代性水平有 无关系?(α=0.05,n为人数,s为标准差)
练习十四
❖ 分析20名学生的家庭职业背景(分为干部。 工人、农民三类)对其英文能力的影响。
英 语 成 绩
ni 各组平均值 si
Directional Measures
Nominal
户口 Dependent
by Interval
Eta
存(取)款金额
Dependent
Value .553
❖ 附录C表F:皮尔逊相关系数(r)在0.05和 0.01显著水平(α)上的临界值。
❖ 直接用r值与表中的对应值作比较,不用计 算F值了。如果r大于表中对应临界值,就 否定H0,如果r值小于表中对应临界值,就 接受H0.
使用皮尔逊相关系数的要求
❖ (1)线性相关。要求X与Y之间是线性相关关 系。
❖ (2)定距数据。X与Y要求是定距变量。 ❖ (3)随机抽样。 ❖ (4)正态分布。要求X与Y在总体中都呈正态
0
劳动时间的关系
H
6
0
I
8
0
总数
36
18
❖ F=13.36
❖ df1=k-1=2-1=1
❖ df2=n-k=9-2=7
❖ 在0.01显著度水平上,自由度df1=1; df2=7情况下,F的临界值是12.25,因为 13.36≥12.25,在否定域内,故否定虚 无假设,即总体中这两个变量相关。
相关系数显著性检验的简便方法
50 90 -4 0
0
16
0
∑X= ∑Y= 432 720
SP=100
SSX= SSY= 132 202
A (X X ), B (Y Y )
❖ Pearson(皮尔逊)相关系数:
r
( X X )(Y Y )
(X X )2
(Y
2
Y)
SP
SS X SSY
100
(132)(202)
0.61
干部 78 82 91 90 85 81 83
7 84.29 4.40
工人 52 59 73 61 80 51 64 54 8 61.75 9.64
农民 83 75 82 78 80
5 79.60 2.87
E2
7(84.29)2
8(61.75)2 112834
5(79.6)2 20(74.1)2
3
3.5
4
4.5
log(人均gdp)
bandwidth = .8
四、定类与定距变量
(一)定类-定距变量相关性测量
相关比率(E2)法,又称为Eta平方系数法(简写为E2 ) 以一个定类变量(X)为自变量,以一个定距变量(Y) 为因变量。能够测量出Y(定距)变量值在不同X(定 类)变量值中的差异情况;
❖ 如何检定总体中x与y成直线关系?
❖ 两个定距变量是否为直线关系可以通过散点图 来直观观察判断;
❖ 两个定距变量是否为直线关系可将系数r与系 数E相比较来帮助判断。
散点图
❖ 先通过两个定距变量的散点图看两个变量是 否呈直线关系,如果呈直线关系再求相关系 数 r。
❖ 散点图
Graphs---Scatter
SP XY N X Y
SS X X 2 N X 2
SSY Y 2 NY 2
r
( X X )(Y Y )
(X X )2
(Y
Y
2
)
XY N XY
(
X
2
N
X
2
)(
Y
2
NY
2
)
(二)两个定距变量相关的总体检定
❖ 可以用F检定或者t检定
❖ r是样本的积距相关系数, r2 称为决定系数, 具有消减误差比例的意义。
❖ 1、简单散点图(simple)
❖ 2、重叠散点图(overlay)
❖ 3、矩阵散点图(matrix)
❖ 4、三维散点图(3-D)
80
50 男性平均60预期寿命 70
40
2
2.5百度文库
3
3.5
4
4.5
log(人均gdp)
Lowess smoother
80
50 男性平均60预期寿命 70
40
2
2.5
例题:检验8名儿童样本的身高和体重之间的相关程度
儿童 X Y A B
AB
A2
B2
A
49 81 -5 -9
45
25
81
B
50 88 -4 -2
8
16
4
C
53 87 -1 -3
3
1
9
D
55 99 1 9
9
1
81
E
60 91 6 1
6
36
1
F
55 89 1 -1
-1
1
1
G
60 95 6 5
30
36
25
H
第十章 相关性测量(下)
三、两个定距变量相关测量与检定
❖ (一)两个定距变量相关性的测量 ❖ 皮尔逊(Pearson)相关系数:
(1)测量两个定距变量相关程度的最好尺度; (2)r 本身不表示消减误差比例,r2具有消
减误差比例的意义,称为决定系数,表示 以线性回归方程作为预测工具时所能减少 的误差比例。
20(74.1)2
0.70
E 0.70 0.84 可见,家庭职业背景对学生 的语文成绩有强大的影响。
练习十五:分年龄段子女数量期望
子女 数量 期望
老年人 2 3 3 4 4 5
ni 6
中年人 2 2 2 2 1 4 1 7
青年人 1 1 2 0 1 2 4 7
练习十六
❖ 居民储蓄调查数据(存款)文件中,“户口 ”与“存款金额”的相关系数。
分布。如果是大样本(n≥30),这个要求就 不严格了。
练习十三
❖ 根据SPSS文件“相关回归分析(年人均 消费支出与教育)”,分析居民年人均 消费支出与教育支出的相关性。
❖ 以F分布来检定r值的方法,是假定x与y成直线 关系。如果在总体中x与y的关系其实是非直线, 则上面的方法便有问题了。
相关文档
最新文档