一元线性回归的F检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一元线性回归效果的显著性检验(F检验法)
前面我们给出了一元回归直线方程的求解即一元线性回归中未知参数的最小二乘估计.那么这条回归直线对观测数据(x i,y i) (i=1,2,…,n) 拟合的程度如何?是否真正体现x、y 之间的这种线性关系,这就需要对回归效果的好坏进行检验.这种检验是评价方程对总体的代表性的所谓线性关系的显著性检验.检验x与y是否具有线性关系,以及它们之间的密切程度,这就是回归直线方程的效果检验所要解决的问题.
由一元线性回归的数学模型可知,一元线性回归的数学模型是
y=a+bx+εε~N(0, σ2)
即随机变量y的数学期望是自变量x的线性函数,然而这样的假设是否合理呢?若在y=a+bx+ε中b=0,说明x的变化对y没有影响,这时回归方程就不能近似地描述变量x与y之间的关系,因此为了判断x与y之间是否存在线性关系,只需检验假设:
H0:b=0
此问题也称为线性回归方程的显著性检验问题.
我们要根据观测数据(x i,y i) (i=1,2,…,n)作出拒绝或接受原假设b=0的判断.拒绝原假设才能确认我们的线性回归模型是合理的,接受原假设表示不能认为x、y之间有线性相关关系.
如何构造统计量来检验这个假设问题呢?我们先把变量y的离差平方和
予以分解.(点击此处看分解过程)
=Q+U
其中是回归值与其平均值的离差平方和,而,可以把
看成是由于x的变化而引起的y值变化,因此称之为回归平方和;
反映的是观测值与回归值之间的离差平方和,它表示除x对y的线性影响之外的一切因素引起的y值的变化,称之为误差平方和或残差平方和.
而
∴
数学上我们可以证明,当H0为真时,统计量
~F(1, n-2).
对于给定的显著性水平α,查自由度为(1,n-2)的F分布临界值表,可得临界值Fα(1, n-2) 使得
.
其拒绝域为W={F>Fα(1, n-2)}.
例在某大学一年级新生体检表中,随机抽取10张,得到10名大学生的身高(x)和体重(y)的数据如下,试求体重关于身高的线性回归方程,并检验回归方程的显著性(α
=0.05)?
身高x i/cm 体重y i/kg 身高x i/cm 体重y i/kg
162 170 166 158 174 51
54
52
47
63
166
167
170
173
168
59
55
60
57
54
解.根据表中数据,列出下列计算表. 回归直线方程的计算步骤(I)
i x i y i x i2y i 2x i y i
1 2 3 4 5 6 7 8 9 10 Σ162
170
166
158
174
166
167
170
173
168
1674
51
54
52
47
63
59
55
60
57
54
552
26244
28900
27556
24964
30276
27556
27889
28900
29929
28224
280438
2601
2916
2704
2209
3969
3481
3025
3600
3249
2916
30670
8262
9180
8632
7426
10962
9794
9185
10200
9861
9072
92574
,
,
,
,
,
∴,
.因此线性回归方程为:
.
下面我们来检验身高x与体重y之间是否具有显著的线性关系.
根据题意,我们作假设
H0: b=0 . n=10 ,
,
,
∴.
对于给定的α=0.05,查F分布临界值表得到临界值:
F0.05(1, 8)=5.32.
显然,F0=19.12> F0.05(1, 8)=5.32,故拒绝H0,即由F检验法可知,身高x与体重y 之间的线性关系是显著的,且它们之间的关系为:
.。