逐步回归分析计算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
前面我们介绍了通过回归的基本思想是将变量逐一引入回归方程,先建立与y相关最密切的一元线性回归方程,然后再找出第二个变量,建立二元线性回归方程,…。在每一步中都要对引入变量的显著性作检验,仅当其显著时才引入,而每引入一个新变量后,对前面已引进的变量又要逐一检验,一旦发现某变量变得不显著了,就要将它剔除。这些步骤反复进行,直到引入的变量都是显著的而没有引入的变量都是不显著的时,就结束挑选变量的工作,利用所选变量建立多元线性回归方程。为实现上述思想,我们必须在解方程组的同时,求出其系数矩阵的逆矩阵。为节约内存,计算过程中在消去x k时用了如下变换公式——求解求逆紧凑变换。
一、求解求逆紧凑变换
求解求逆紧凑变换记作L k,其基本变换关系式为:
(2-3-30) 当对(2-3-27)的增广矩阵
(2-3-31)
依次作L1,L2,…,L m-1变换后,所得矩阵的前m-1列,便是系数矩阵的逆矩阵,最后一列便是(2-3-27)的解,即
求解求逆紧凑变换具有以下性质:
(1) 若对作了L k1, L k2,…,L k L变换,则得如下子方程组
(2-3-32)
的解及相应的系数矩阵的逆矩阵,其中k1,k2,…,k l互不相同,若记
L k1L k2…L k l,则
(2-3-33)
,j=1,2,…,l
(2) L i L j=L j L i,即求解求逆紧凑变换结果与变换顺序无关。
(3) L k L k=
(4) 若,ij=1,2,…,m-1,记
L k1L k2…L k l
则中的元素具有以下性质:
式中上行为对作了变换L i,L j或两个变换均未作过;下行为对作过变换L i和L j之一。
二、逐步回归的计算过程
逐步回归计算过程就是反复对增广矩阵作L k变换,并利用变换性质将选变量与作检验等步骤结合起来。
为了检验方便,对再增加一行,使其变成对称方阵,并记作R(0),即
(2-3-34)
选变量具体步骤如下:
1.选第一个变量
选第一个变量就是从m-1个一元线性回归方程
(i=1,2,…,m-1) (2-3-35)
中找一个回归平方和最大的方程。这里为了符号明确起见,以记作回归系数,上标(1)表示第一步计算。
由变换性质1可知,对R(0)作了L i变换后,有
(2-3-36)
(2-3-37)
因此Z i的偏回归平方和为
(2-3-38)
由第二章偏回归平方和的意义可知,此一元线性回归方程对应的剩余
平方和为
(2-3-39)
从而对Z I的系数作显著性检验的F比是
(2-3-40)
由于是的单调递增函数,故要找i=1,2,…,m-1的最大值,只要找出i=1,2,…,m-1的最大值即可。
设
则只需对V K1(1)计算F k1(1),对给定的α,当F k1(1)>Fα(1,n-2)时,引入变量Z k1。
引入第一个变量的步骤可总结如下:
(1)对i=1,2,…,m-1,计算
(2)令
(3)计算
(4)若F1(1)>Fα(1,n-2),引入变量Z k1,对R(0)作L k1变换,且记
R(1)=L k1R(0)=
2.选第二个变量
这一步相当于从m-2个方程
i=1,2,…,m-1, i≠j (2-3-41) 中去选一个方程出来,使加入的Z i具有最大的偏回归平方和。由变换性质1可知,这时需对R(0)作L k1变换,故不论选那个方程,均需对R(0)作L k1变换,因而引入Z k1后就已作好这一变换。与选第一个变量相似,这一步的计算可如下进行:
(1)对i=1,2,…,m-1,计算
(2)令
(3)计算
(4)当F1(2)>Fα(1,n-3),引进变量Z k2,并对R(1)作变换L k2,且记R(2)= L k2 R(1) =;如果F1(2) 3 .当引入第二个变量Z k2后,需对原已引入的变量Z k1的显著性重新作检验。 由于已对R(0)作了变换L k1, L k2,故从R(2)可直接写出二元线性回归方程: (2-3-44) 此时Z k1的偏回归平方和为 (2-3-45) 此二元线性回归方程的剩余平方和为 (2-3-46) 因而对Z k1作检验的F比为 (2-3-47) 若F2(2)>Fα(1,m-3),则保留,可进一步考虑选入新变量;若F2(2) 综上所述,这一步的步骤是: (1)计算 (2)计算 (3)若F2(2)>Fα(1,n-3),则考虑引入第三个变量;若F2(2) 4.一般地,假设经过l步变换后引人了变量Z k1Z k2…Z kl,紧接着又引入了Z kl+1,其中k1k2…k l+1互不相同,而R(0)经过L k1,L k1,…,L k l+1后变成 接下去我们需对原已引入的变量Z k1,Z k2,…,Z k l重新检验,看有无需剔除的,步骤如下: (1)计算,j=1,2,…l (2-3-48) (2)令; (3)计算(2-3-49) (4)若,则对R(l+1)作变换L k,重新考虑还有无其他变量要剔除;若,则接下去考虑能否引入新变量。 引入新变量步骤如下: (1)计算, (2-3-50) (2)令 (3)计算(2-3-51) (4)若,则对R(l+1)作变换L k,再考虑旧变量是否要剔除;若则结束选变量的工作。 如果选上Z k1,Z k2,…,Z kl变量后,没有变量可剔除,也没有变量