第十二章相关与回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十二章 相关与回归分析
四、名词解释
1.消减误差比例
变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 2. 确定性关系
当一个变量值确定后,另一个变量值夜完全确定了。确定性关系往往表现成函数形式。 3.非确定性关系
在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。 4.因果关系
变量之间的关系满足三个条件,才能断定是因果关系。1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。 5.单相关和复相关
单相关只涉及到两个变量,所以又称为二元相关。三个或三个以上的变量之间的相关关系则称为复相关,又称多元相关。 6.正相关与负相关
正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。 7.散点图
散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X 与Y 的相互关系,即得相关图,又称散点图。 8.皮尔逊相关系数r
皮尔逊相关系数是协方差与两个随机变量X 、Y 的标准差乘积的比率。 9.同序对
在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y Y <,则称这一配对是同序对。
10.异序对
在观察X 序列时,如果看到i j X X <,在Y 中看到的是i j Y >Y ,则称这一配对是异序对。
11.同分对
如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j
Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。
六、计算题
1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。
对于民族音乐的态度(Y)
年岁(X)
Σ老中青
喜欢不喜欢38 38 30 15 33 46
Σ
2.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。
身高(cm)171 167 177 154 169
体重(kg)53 56 64 49 55
身高(cm)175 163 152 172 162
体重(kg)66 52 47 58 50 【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X】
3.假定有不同文化程度的35~45岁育龄妇女100人的生育情况如下表,求文化程度与平均生育数的相关系数r。
序号一二三四五育龄妇女人数20 20 20 20 20
文化程度(年)平均生育数
4.74
6
3.31
9
3.08
12
2.41
16
1.94
4.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。
环境名次 3 9 7 5 12 8 10 2 11 4 1 6
体质名次 5 9 6 7 12 8 11 1 10 3 2 4
【斯皮尔曼相关系数:0.94,肯德尔等级相关系数:0.83】5.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数和肯德尔相关系数τc。
文化程度
婚姻美满
大学中学小学
美满9 16 5
一般8 30 18
不美满 3 4 7
【τc=0.18】6.以下为两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。
参赛人 A B C D E F G H I J
评判员1 评判员2 1
1
2
2
4
3
3
4
5
5
8
6
6
7
7
8
9
9
10
10
【斯皮尔曼相关系数:0.95】
7.某原始资料为:
X 65 73 91 88 76 53 96 67 82 85
Y 5 7 13 13.5 7 4.5 15 6.7 10 11 要求:(1)求回归方程;(2)这是正相关还是负相关;(3)求估计标准误差;
(4)用积差法求相关系数。【Y=-11.48+0.27X】【正相关】【相关系数r=0.95】
8.两变量X、Y之间的关系如下表,
X 2 4 6 8 10 12
Y 14 10 9 7 5 4
(1)求回归方程;(2)求相关系数。【Y=-0.957X+14.867】【r=0.98】
9.试就下表所示资料,计算关于身高和体重的皮尔逊相关系数。
N0身高(厘米)体重(千克)
1
2
3
4
5
6
7
8
9
10 160
161
165
165
167
170
172
174
176
180
51
56
59
66
63
70
69
73
80
65
【r=0.77】
10.青年歌手大奖赛评委会对10名决赛选手的演唱水平(X)和综合素质(Y)进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的肯德尔等级相关系数及斯皮尔曼等级相关系数。