线性回归中的相关系数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归中的相关系数
山东 胡大波
线性回归问题在生活中应用广泛,求解回归直线方程时,应该先判断两个变量就是否就是线性相关,若相关再求其直线方程,判断两个变量有无相关关系的一种常用的简便方法就是绘制散点图;另外一种方法就是量化的检验法,即相关系数法.下面为同学们介绍相关系数法. 一、关于相关系数法
统计中常用相关系数r 来衡量两个变量之间的线性相关的强弱,当i x 不全为零,y i 也不全为零时,则两个变量的相关系数的计算公式就是:
()()
n
n
i
i i i
x
x y y x y
nx y
r ---=
=
∑∑r 就叫做变量y 与x 的相关系数(简称相关系数).
说明:(1)对于相关系数r ,首先值得注意的就是它的符号,当r 为正数时,表示变量x ,y 正相关;当r 为负数时,表示两个变量x ,y 负相关;
(2)另外注意r 的大小,如果[]0.751r ∈,,那么正相关很强;如果[]10.75r ∈--,,那么负相关很强;如果(]0.750.30r ∈--,
或[)0.300.75r ∈,,那么相关性一般;如果[]0.250.25r ∈-,,那么相关性较弱.
下面我们就用相关系数法来分析身边的问题,确定两个变量就是否相关,并且求出两个变量间的回归直线. 二、典型例题剖析
(1)对变量y 与x 进行相关性检验;
(2)如果y 与x 之间具有线性相关关系,求回归直线方程; (3)如果父亲的身高为73英寸,估计儿子身高.
解:(1)66.8x =,67y =,10
2
1
44794i i x ==∑,10
21
44929.22i i y ==∑,4475.6x y =,2
4462.24x =,
2
4489y =,10
1
44836.4i i i x y ==∑,
所以10
i i
x y
nx y
r -∑
44836.4104475.6
(4479444622.4)(44929.2244890)-⨯=--
80.4
0.9882.04
≈
≈, 所以y 与x 之间具有线性相关关系. (2)设回归直线方程为y a bx =+,则10
1102
21
1010i i
i i i x y
xy
b x x
==-=
-∑∑44836.444756
0.46854479444622.4
-=
≈-,
670.468566.835.7042a y bx =-=-⨯=.
故所求的回归直线方程为0.468535.7042y x =+. (3)当73x =英寸时,0.46857335.704269.9047y =⨯+=, 所以当父亲身高为73英寸时,估计儿子的身高约为69、9英寸.
点评:回归直线就是对两个变量线性相关关系的定量描述,利用回归直线,可以对一些实际问题进行分析、预测,由一个变量的变化可以推测出另一个变量的变化.这就是此类问题常见题型.
例2 10
其中x 为高一数学成绩,y 为高二数学成绩. (1)y 与x 就是否具有相关关系;
(2)如果y 与x 就是相关关系,求回归直线方程. 解:(1)由已知表格中的数据,利用计算器进行计算得 10
1710i
i x
==∑
,10
1
723i i y ==∑,71x =,72.3y =,10
1
51467i i i x y ==∑.
1021
50520i
i x
==∑,10
21
52541i i y ==∑.
10
10i i
x y
x y
r -=
∑
0.78=
≈.
由于0.78r ≈,由0.780.75>知,有很大的把握认为x 与y 之间具有线性相关关系. (2)y 与x 具有线性相关关系,设回归直线方程为y a bx =+,则
10
1102
2
21
1051467107172.3
1.2250520107110i i
i i i x y
x y
b x x
==--⨯⨯=
=
≈-⨯-∑∑,
72.3 1.227114.32a y bx =-=-⨯=-.
所以y 关于x 的回归直线方程为 1.2214.32y x =-.
点评:通过以上两例可以瞧出,回归方程在生活中应用广泛,要明确这类问题的计算公式、解题步骤,并会通过计算确定两个变量就是否具有相关关系.