自相关问题建模
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自相关问题的建模处理
实验目的:
对数据模型进行回归分析及自相关性诊断,并用迭代法和差分法进行模型改进与评价。
实验准备:
计算机、SPSS软件、何晓群《实用回归分析》表7.7。
实验内容、步骤与结果:
一、回归分析及自相关性诊断:
1.搜集数据。从何晓群的《实用回归分析》中得到某软件公司月销售额数据,见表1。其中自变量x为总公司的月销售额(万元),因变量y为某分公司的月销售额(万元)。
表1:某软件公司月销售额数据
2.用SPSS软件录入数据,执行“图形、旧对话框、散点点状/散点图”并保存相应的x、y等,得到该软件公司月销售额数据的散点图,由散点图可以看出x 和y呈线性关系变化,见图1。
图1:某软件公司月销售额数据
3.执行“分析、回归、线性估计”保存相应的变量,得到输出结果。由系数表可以得出y对x的回归方程为:
y=—1.453+0.176x
回归系数β
0、β
1
的检验t值分别为—5.903、107.928,各项的P值等于0.000,
说明x对y高度显著,见表2。
表2:系数表
4.由方差分析表可以看出:检验值F=11648.559,F>F0.05(1,118)=4.41,显著性si g≈0.00,表明回归方程高度显著,说明x对y有高度显著的线性影响,见表3。
5.由模型汇总表可知:复相关系数R=0.999,决定系数R2=0.998,由决定系数R2可以看出回归方程高度显著,见表4。
6.由回归未标准化残差散点图可以看出自变量y的残差大概在正负2σ的范围之中变化,说明回归模型满足基本假设,见图2。
图2:回归未标准化残差散点图
7.由相关性表可以看出自变量x与因变量y相关系数r=0.999,显著性p值等于0.000,认为自变量x与因变量y高度相关,见表。
表5:相关性表
二、用迭代法建立回归模型:
1.从上面普通最小二乘估计的分析可知:.0.663DW =,查D.W 表知,在n=20,
k=2,显著性水平α=0.05的条件下, 1.20, 1.41L U d d ==。由.0.663DW
=<1.20知残差序列存在正的自相关,而残差图有明显的趋势变动,表明误差项存在自相关,
自相关系数ρ的估计值ˆ10.5.10.50.6630.67DW ρ=-=-⨯≈。
2.用迭代法建立回归模型,则令:
11,t t t t t t x x x y y y ρρ--''=-=-
执行“分析、回归、线性估计”保存相应的变量,得到新的输出结果。由系数表可以得出y 对x 的回归方程为:
0.2970.173y x =-+
回归系数β0、β1的检验t 值分别为—1.676、49.503,其中常数项的P 值等于0.112最大,且高于1%的显著性水平,见表6。
表6:系数表
3.由方差分析表可以看出:检验值F=2450.512,F>F 0.05(1,17)=
4.45,显著性si g ≈0.00,表明回归方程高度显著,说明x 整体上对y 有高度显著的线性影响,见表7。
4. 由模型汇总表可知:复相关系数R=0.997,决定系数R 2=0.993,由决定系数R 2可以看出回归方程高度显著,见表8。
表8:模型汇总表
5.从第一次迭代回归分析可知:. 1.361DW
=,查D.W 表知,在n=19,k=2,显著性水平α=0.05的条件下, 1.18, 1.40L U d d ==。由于. 1.361 1.18,L DW d =>=且. 1.361 1.40U DW d =<=知残差序列是否存在正的自相关性不能确定,
自相关系数ρ的估计值ˆ10.5.10.5 1.3610.32DW ρ=-=-⨯≈。
6.由于第一步迭代的D.W 落入不能确定是否有自相关性的区域,进而对数据进行第二步迭代,使用和第一次迭代相同的方法,则令:
11,t t t t t t x x x y y y ρρ--''''''''=-=-
从第二次迭代的结果中,由系数表可以得出y 对x 的回归方程为:
0.0720.169y x =-+
回归系数β0、β1的检验t 值分别为—0.466、38.510,其中常数项的P 值等
于0.647最大,且远高于1%的显著性水平,见表9。
表9:系数表
7.由方差分析表可以看出:检验值F=1483.014,F>F 0.05(1,16)=4.49,显著性si g ≈0.00,表明回归方程高度显著,说明x 整体上对y 有高度显著的线性影响,见表10。
8. 由模型汇总表可知:复相关系数R=0.995,决定系数R 2=0.989,由决定系数R 2可以看出回归方程高度显著,见表11。
表11:模型汇总表
9. 从第二次迭代回归分析可知:. 1.697DW
=,查D.W 表知,在n=18,k=2,显著性水平α=0.05的条件下, 1.16, 1.39L U d d ==。由于. 1.697 1.39U DW d =>=且
. 1.69744 1.39 2.61U DW d =<-=-=知残差序列不存在正的相关性。.将
,,,x y x y ''''''回代入原回归方程还原为原始变量的方程:
12120.0720.990.2140.1690.1670.67t t t t t t y y y x x x ----=-+-+--
三、用差分法建立回归模型:
1.用差分法建立回归模型,则令:
11,t t t t t t x x x y y y --∆=-∆=-
执行“分析、回归、线性估计”保存相应的变量,得到新的输出结果。由系数表可以得出y 对x 的回归方程为:
0.0330.161y x =+
回归系数β0、β1的检验t 值分别为1.273、19.528,其中常数项的P 值等于0.220最大,且高于1%的显著性水平,见表12。
表12:系数表
2.由方差分析表可以看出:检验值F=381.342,F>F 0.05(1,17)=4.45,显著性si g ≈0.00,表明回归方程高度显著,说明x 整体上对y 有高度显著的线性影响,见表13。
3. 由模型汇总表可知:复相关系数R=0.978,决定系数R 2=0.957,由决定系数R 2可以看出回归方程高度显著,见表14。