线性回归中的相关系数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归中的相关系数 IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】
线性回归中的相关系数
山东胡大波
线性回归问题在生活中应用广泛,求解回归直线方程时,应该先判断两个变量是否是线性相关,若相关再求其直线方程,判断两个变量有无相关关系的一种常用的简便方法是绘制散点图;另外一种方法是量化的检验法,即相关系数法.下面为同学们介绍相关系数法.
一、关于相关系数法
统计中常用相关系数r来衡量两个变量之间的线性相关的强弱,当
x不全为零,y i
i
也不全为零时,则两个变量的相关系数的计算公式是:
r就叫做变量y与x的相关系数(简称相关系数).
说明:(1)对于相关系数r,首先值得注意的是它的符号,当r为正数时,表示变量x,y正相关;当r为负数时,表示两个变量x,y负相关;
(2)另外注意r的大小,如果[]
r∈,,那么正相关很强;如果[]
0.751
r∈--
,,那
10.75
么负相关很强;如果(]
,或[)
r∈,,那么相关性一般;如果
0.300.75
r∈--
0.750.30
[]
r∈-,,那么相关性较弱.
0.250.25
下面我们就用相关系数法来分析身边的问题,确定两个变量是否相关,并且求出两个变量间的回归直线.
二、典型例题剖析
例1测得某国10对父子身高(单位:英寸)如下:
(1)对变量y 与x 进行相关性检验;
(2)如果y 与x 之间具有线性相关关系,求回归直线方程; (3)如果父亲的身高为73英寸,估计儿子身高.
解:(1)66.8x =,67y =,10
21
44794i i x ==∑,10
21
44929.22i i y ==∑,4475.6x y =,
2
4462.24x =,
2
4489y =,10
1
44836.4i i i x y ==∑,
所以10
i i
x y
nx y
r -=
∑
80.4
0.9882.04
≈
≈, 所以y 与x 之间具有线性相关关系.
(2)设回归直线方程为y a bx =+,则10
1102
21
1010i i
i i i x y
xy
b x x
==-=
-∑∑44836.444756
0.46854479444622.4
-=
≈-,
670.468566.835.7042a y bx =-=-⨯=.
故所求的回归直线方程为0.468535.7042y x =+. (3)当73x =英寸时,0.46857335.704269.9047y =⨯+=, 所以当父亲身高为73英寸时,估计儿子的身高约为英寸.
点评:回归直线是对两个变量线性相关关系的定量描述,利用回归直线,可以对一些实际问题进行分析、预测,由一个变量的变化可以推测出另一个变量的变化.这是此类问题常见题型.
例2 10名同学在高一和高二的数学成绩如下表:
其中x 为高一数学成绩,y 为高二数学成绩. (1)y 与x 是否具有相关关系;
(2)如果y 与x 是相关关系,求回归直线方程. 解:(1)由已知表格中的数据,利用计算器进行计算得 101
710i i x ==∑,101
723i i y ==∑,71x =,72.3y =,10
1
51467i i i x y ==∑.
10
21
50520i
i x
==∑,10
21
52541i i y ==∑.
0.78=
≈.
由于0.78r ≈,由0.780.75>知,有很大的把握认为x 与y 之间具有线性相关关系. (2)y 与x 具有线性相关关系,设回归直线方程为y a bx =+,则
10
1102
2
21
1051467107172.3
1.2250520107110i i
i i i x y
x y
b x x
==--⨯⨯=
=
≈-⨯-∑∑,
72.3 1.227114.32a y bx =-=-⨯=-.
所以y 关于x 的回归直线方程为 1.2214.32y x =-.
点评:通过以上两例可以看出,回归方程在生活中应用广泛,要明确这类问题的计算公式、解题步骤,并会通过计算确定两个变量是否具有相关关系.