统计系专业技能训练报告

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

天津商业大学理学院

专业技能训练报告

专业班级:

姓名:

学号:

指导教师:

日期: 2016-6-1

实习时间:5月28日-6月1日实习地点:1-608

实习方式:上机报告成绩:

逐步回归多元统计预测模型研究及其程序设计

摘要:多元回归是统计理论中研究变量之间关系的一种重要方法,在工程实际和科学研究中有广泛的应用。本文根据统计理论的基本知识对多元回归预测模型进行了系统的研究;然后根据逐步回归算法的基本思想给出最优回归模型的完整优选过程,并详细分析研究了最优回归模型的检验、评价及其预测全过程;最后采用Delphi7.0语言设计了结构化计算程序,并结合应用实例加以说明。

关键词:统计学;逐步回归;多元统计;预测模型;程序设计基于主成分分析的区域创新能力评价

前言

多元回归分析在工程实际和科学研究中有着广泛的用途,无论是对未来的经济预测还是对结构的健康评估中都经常要用到。建立逐步回归多因子回归方程是基于最小二乘法原理,通过逐步回归剔除对因变量不起作用或作用极小的因子、挑选出显著性因子,最终得到最优回归模型。但最优模型是否适用于预测,还得根据所研究问题的实际情况和要求进行模型的假设性检验才能做出评价;另外,对模型的预测精度也应有一个比较正确的认识,不能要求过高。目前,文献资料主要集中于对逐步回归应用的介绍,还未见有对逐步回归及其预测进行深入研究的文献,为此本文对多元线性模型的逐步回归、最优模型的检验、评价及其预测全过程进行了深入的研究,编制了计算程序,并应用实例加以说明,供实际工作者和科研人员参考。

1 多元回归预测模型的建立

1.1 建立最初的多元回归数学模型

假设已确定出可能影响因变量y的k个自变量因子Xi,可建立如下k 元线性实际回归模型及其预测模型:

y= a0+ a1X1+ a2X2+… + akXk+ e (1)

y^= a0+ a1+ X1+ a2X2+… + akXk(2)

则估计值与观察值的离差为:

e= y-y^ (3)

1.2 逐步回归建立最优回归模型

如果最初回归模型是一元线性的,则可直接采用最小二法求解出拟合系数,不存在逐步回归的问题。但对多元统计模型,就需根据已测数据经过逐步回归、通过显著性检验后才能最终建立回归统计模型。根据统计理论[1~ 3],多元逐步回归分析的基本步骤可归纳如下:

(1)对已知数据进行中心化处理,得A阵

值得注意的是,此处设定的第k+ 1个自变量即为因变量y。

(2)计算偏回归平方和P并求出其中最大值。各自变量(未引入的自

变量)的偏回归平方和按(5)式计算,其中偏回归平方和最大值按(6)式选出。

P[ i] = A[ k+ 1, i]× A[ k+ 1, i] /A[ i, i] (5)

P[ h] = max{P[ i]} (6)

式中: i= 1... k;这里记P[ h]为第h个自变量因子对应P[ i]中最大的值。

(3)检验是否引入第h个自变量因子。按统计理论知识,采用F检验进行检验:

F= P[ h] (n -r-2) /

(A[ k+ 1,k+ 1] -P[ h]) (7)

根据给定的显著性水平α,查F分布分位数表,可查出F1 -α(1, n -r-2)的值。 r为已引入的自变量个数,初值为0,当引入一个自变量因子时r加1,当剔除一个自变量因子时r减1; n为记录总数。

若F≤ F1 -α(1, n -r-2),说明所选的自变量因子均不合适,需另选自变量因子,重新分析该问题;若F> F1 -α(1, n -r-2),则引入该自变量因子,进入下一步骤。

(4)对A阵以(h, h)为枢轴按下式施行消元变换,得一新A阵。

(5)从新的A阵出发,计算偏回归平方和,并从其中选出未引入自变量因子中对应的最大值。

P[ i]= A[ k+ 1, i]×[ k+ 1, i] /A[ i, i] (9)

P[ h]= max{P[ i]} (i≠ h) (10)

其中,式(9)中的i= 1, 2, … , k,式(10)中的i= 1, 2,..., k,且i≠ h, h的含义同式(6),但值已不同;(10)式中的P[ i]取未引入的自变量因子所对应的偏回归平方和。

(6)检验是否引入第h个自变量因子

F= P[ h] (n -r-2) /

(A[ k+ 1,k+ 1] -P[ h]) (11)

r为已引入的自变量个数,含义同前;

若F≤ F1 -α(1, n -r-2),不引入该自变量因子,筛选完毕;若F> F1 -α(1, n -r-2),则引入该自变量因子,进入下一步骤。

(7)对A阵以(h, h)为枢轴按(8)式施行消元变换得新的A阵,并从新的A阵出发按(9)式计算偏回归平方和P[ i],并从其中选出已引入自变量因子中对应的最小值:

P[ h]= min{P[ i]} (12)

式中: P[ i]取已引入的自变量因子所对应的偏回归平方和。

(8)检验是否可剔除自变量因子

F= P[ h] (n -r-1) /

(A[ k+ 1,k+ 1] -P[ h]) (13)

根据给定的显著性水平α,查F分布分位数表可查出F1 -α(1, n -r-1)的值。 r为已引入的自变量个数, n为记录总数。

若F≤ F1 -α(1, n -r-1),剔除该自变量因子,然后返回步骤(7);若F> F1 -α(1, n -r-1),不剔除该自变量因子,然后返回步骤(5)。

重复循环以上(5)~(8)过程,直到筛选完毕,则最优回归模型建立。由分析易知,最终所确定的回归系数可根据下式计算:

值得注意的是,上式中的i均在1, 2,... k中取值,但并非取所有值,只取引入的自变量因子对应的序号值。

1.3 预测模型的检验及评价

回归统计模型建立后,当前回归系数反映了自变量和因变量的变动结构关系,这种变动关系是否可预测未来还须进行检验。对预测模型的检验一般包括以下5个方面。

1.3.1 t检验

相关文档
最新文档