回归模型的残差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

回归模型的残差阐发

令狐采学

山东 胡年夜波

判断回归模型的拟合效果是回归阐发的重要内容,在回归阐发中,通经常使用残差阐发来判断回归模型的拟合效果。下面具体阐发残差阐发的途径及具体例子。

一、残差阐发的两种办法

1、差阐发的基本办法是由回归方程作出残差图,通过观测残差图,以阐发和发明观测数据中可能呈现的毛病以及所选用的回归模型是否恰当;在残差图中,残差点比较均匀地落在水平区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高。

2、可以进一步通过相关指数∑∑==---

=n i i

n

i i i

y y

y y

R 1

2

1

2^

2)()(1来衡量回归模型

的拟合效果,一般规律是2R 越年夜,残差平方和就越小,从而回归模型的拟合效果越好。

二、典例阐发:

例1、某运带动训练次数与运动成果之间的数据关系如下:

试预测该运带动训练47次以及55次的成果。

解答:(1)作出该运带动训练次数x 与成果y 之间的散点图,

如图1所示,由散点图可 知,它们之间具有线性相关关系。 (2)列表计算:

由上表可求得875.40,25.39==y x ,126568

1

2=∑=i i

x ,137318

1

2=∑=i i y ,

13180

8

1

=∑=i

i i y

x ,所以∑∑==---=

8

1

2

8

1

)()

)((i i i i i

x x y y x x

β.0415.1881

2

2

8

1≈--=

∑∑==i i i i

i x

x y

x y

x

00302.0-≈-=x y βα,所以回归直线方程为.00302.00415.1^

-=x y

(3)计算相关系数 将上述数据代入∑∑∑===---=

8

1

8

1

2

2

2

28

1

)

8)(8(8i i i

i

i i

i y y x x

y

x y

x r 得992704.0=r ,查表可知

707.005.0=r ,而05.0r r >,故

y 与x 之间存在显著的相关关系。

(4)残差阐发:

作残差图如图2,由图可知,残差点比较均匀地散布在水平带状区域中,说明选用的模型比较合适。

计算残差的方差得884113.02=σ,说明预报的精度较高。

(5)计算相关指数2R

计算相关指数2R =0.9855.说明该运带动的成果的差别有98.55%是由训练次数引起的。 (6)做出预报

由上述阐发可知,我们可用回归方程.00302.00415.1^

-=x y 作为该运带动成果的预报值。

将x =47和x =55辨别代入该方程可得y =49和y =57, 故预测运带动训练47次和55次的成果辨别为49和57. 点评:一般地,建立回归模型的基本步调为:

(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;

(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);

(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y =bx +a );

(4)按一定规则估计回归方程中的参数(如最小二乘法); (5)得出结果后阐发残差图是否有异常(个别数据对应残差过年夜,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。

例2、某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽取10户进行调查,其结果如下:

试预测人均月收入为1100元和人均月收入为1200元的两个家庭的月人均生活费。

解答:作出散点散布图如图,由图可知,月人均生活费与人均收入之间具有线性相关关系。

通过计算可知4.480,639==y x ,461030010

1

2=∑=i i x ,254052610

1

2=∑=i i y ,

3417560

10

1

=∑=i

i i y

x ,所以=

β.6599.0101010

1

2

2

10

1≈--∑∑==i i i i

i x

x y

x y

x

751.58≈-=x y βα,所以回归直线方程为.751.586599.0^

+=x y

计算相关系数得993136.0=r ,而查表知632.005.0=r ,故月人均收入与月人均生活费之间具有显著相关关系。

作残差图如图,由图可知,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适。

计算相关指数得2R =0.9863,说明城镇居民的月人均生活费的差别有98.63%是由月人均收入引起的。

由以上阐发可知,我们可以利用回归方程.751.586599.0^

+=x y 来作为月生活费的预报值。

将x =1100代入回归方程得y =784.59元;将x =1200代入回

相关文档
最新文档