统计学原理 第六章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
r (x x)( y y) (x x)2 (y y)2
或化简为: r
n xy x y
n x2 x2 n y2 y2
(x、y间线性相关关系 的紧密程度)
问题:两组变量(X、Y)之间呈直线关系或
曲线关系,求相关系数 r 的公式一样吗?
相关系数,其完整的名称应该是“简单线性相 关系数”,描述的是两个变量线性相关的程度。
样本数据(xi ,yi),i =1,2,…,13,数据见下表,计算相关系数。
年份
1981 1982 1983 1984 1985 1986 1987
我国人均国民收入与人均消费金额数据
单位:元
人均 国民收入
人均 消费金额
年份
人均
人均
国民收入 消费金额
393.8
249
419.14
267
460.86
289
第六章 相关分析与回归分析
۩ 相关分析 ۩ 一元线性回归分析 ۩ 回归模型的显著性检验
圆的周长与圆半径:
圆周长=2 圆半径
L 2 r
确定性关系
(函数关系)
身高与体重:
非确定性关系
(相关关系)
一般身高越高,则体重越重
一、相关分析
1. 变量关系及相关关系类型 (1)变量关系 (2)相关关系的类型
2. 相关分析的测度
(1)变量关系
1°变量关系——函数关系
是一一对应的确定关系
y
函数关系的例子:
某种商品的销售额(y)与 销售量(x)之间的关系可表示 为 y = p x (p 为单价);
圆的面积(S)与半径(R)
x
之间的关系可表示为S= R2
2°变量关系——相关关系
有某种依存关系,非一对一
y
低,但是也存在伪相关,虽然相关系数很高,但 是它们之间并不存在必然的相关关系,需要进行 检验。
当r =0时,说明X和Y两个变量之间无线性关系
相关系数的绝对 值很小,表明变量间 没有关系?
微相关:0< | r | <0.3 低度相关:0.3≤ | r | <0.5 显著相关:0.5≤ | r | <0.8
是两个变量之间有很微 弱的线性关系
高度相关:0.8≤ | r | <1
问题的提出:
在一定的假设条件下,相关性强的,p 值就
r =-1,完全负相关 (2)r = 0,不存在线性相关关系 (3)-1 r < 0,为负相关 (4)0< r 1,为正相关
完全负相关
无线性相关
完全正相关
-1.0 -0.5
负相关程度增加
0
+0.5 +1.0
r
正相关程度增加
<练习> 当相关系数 r =0时,表明:
A. 现象之间完全无关 B. 相关程度较小 C. 现象之间完全相关 D. 无直线相关关系
13 9156173.99 12827.5 7457
1316073323.77 12827.52 13 5226399 74572
0.9987
∴ 人均国民收入与人均消费金额之间的相关系数为
0.9987
相关系数取值及意义:
相关系数 r 的取值范围为 [-1,1]
r = 1,完全正相关
(1)|r|=1,为完全相关
对两个变量之间线性相关程度的度量称为简单相关系数
总体相关系数
样本相关系数 r(简称为相关系数)
一般无法直接获得两个变量总体的 全部数值,因此ρ通常是未知的。
(2)样本相关系数
s 样本相关系数 r xy
s s xy
sxy : 两个变量的协方差
sx : 变量(x)的标准差 sy : 变量( y)的标准差
人均GDP与人均消费水平相关系数计算表 单位:元
编号
人均GDP
x
1
2662
2
4549
3
4851
4
5444
5
11226
6 n 22460
7
34547
人均消费水平
y
1608 2035 2396 2208 4490 7326 11546
x2
7086244 20693401 23532201 29637136 126023076 504451600 1193495209
8
6
4
2
0
0
2
4
6
8
10
12
正相关
11.2
11
10.8
10.6
10.4
10.2
10
0
2
4
6
8
10
负相关
3° 按相关形式:线性相关、非线性相关
12
10
8
6
4
2
0
0
2
4
6
8
10
12
线性相关
11.2 11
10.8 10.6
10.4 10.2
10
0
2
4
6
8 10
非线性相关
2. 相关分析的测度
(1)工具——相关系数 <对变量之间关系密切程度的度量>
y2
2585664 4141225 5740816 4875264 20160100 53670276 133310116
xy
4280496 9257215 11622996 12020352 50404740 164541960 398879662
合计 85739
31609
1904918867 224483461 651007421
544.11
329
668.29
406
737.73
451
859.97
513
1988
1068.8
643
1989
1169.2
690
1990
1250.7
713
1991
1429.5
803
1992
1725.9
947
1993
2099.5
1148
解:样本相关系数
r
n xy x y
n x2 x2 n y2 y2
相关关系的例子:
商品销售额y与广告费支出 x之间的关系;收入水平y与受
教育程度x之间的关系;父亲身
x
高y与子女身高x之间的关系
(2)相关关系的类型
1° 按相关程度:完全相关(函数关系) 不完全相关 不相关(相互独立)
2° 按相关方向:正相关、负相关 3° 按相关形式:线性相关、非线性相关 4° 按相关变量多少:单相关、复相关、偏相关 5° 按相关性质:真实相关、虚假相关
∑x
∑y
∑x2
∑y2
∑xy
r
n xy x y
n x2 x2 n y2 y2
7 651007421 8573931609
7 1904918867 857392 7 224483461 316092
0.9981
【例】在研究我国人均消费水平的问题中,把全国人均消费
y x 额记为 ,人均国民收入记为 。我们收集到1981~1993年的
1° 按相关程度:完全相关、不完全相关、不相关
12
10
8
Fra Baidu bibliotek
6
4
2
0
0
2
4
6
8
10
12
完全相关
35
30 25 20
15 10 5
0
0
2
4
6
8
10
12
不相关
12
10
8
6
4
2
0
0
2
4
6
8
10
12
11.2
11
10.8
10.6
10.4
10.2
10
0
2
4
6
8
10
不完全相关
2° 按相关方向:正相关、负相关
12
10