回归模型的残差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

回归模型的残差分析

山东 胡大波

判断回归模型的拟合效果是回归分析的重要内容,在回归分析中,通常用残差分析来判断回归模型的拟合效果。下面具体分析残差分析的途径及具体例子。

一、 残差分析的两种方法

1、差分析的基本方法是由回归方程作出残差图,通过观测残差图,以分析和发现观测数据中可能出现的错误以及所选用的回归模型是否恰当;在残差图中,残差点比较均匀地落在水平区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高。

2、可以进一步通过相关指数∑∑==---

=n i i

n

i i i

y y

y y

R 1

2

1

2

^

2

)()(1来衡量回归模型的拟合效果,一般

规律是2

R 越大,残差平方和就越小,从而回归模型的拟合效果越好。

二、 典例分析:

例1、某运动员训练次数与运动成绩之间的数据关系如下:

试预测该运动员训练47次以及55次的成绩。

解答:(1)作出该运动员训练次数x 与成绩y 之间的散点图,如图1所示,由散点图可 知,它们之间具有线性相关关系。 (2)列表计算:

由上表可求得875.40,25.39==y x ,

126568

1

2

=∑=i i

x

,137318

1

2=∑=i i y ,

131808

1

=∑=i

i i y

x ,所以∑∑==---=

8

1

2

8

1

)()

)((i i

i i i

x x

y y x x

β.0415.188

1

2

28

1≈--=

∑∑==i i

i i

i x

x

y x y

x

00302.0-≈-=x y βα,所以回归直线方程为.00302.00415.1^

-=x y

(3)计算相关系数

将上述数据代入∑∑∑===---=

8

1

8

1

2

22

2

8

1

)

8)(8(8i i i i i i

i y y x x y

x y

x r 得992704.0=r

,查表可知

707.005.0=r ,而05.0r r >,故y 与x 之间存在显着的相关关系。

(4)残差分析:

作残差图如图2,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适。

计算残差的方差得884113.02

,说明预报的精度较高。

(5)计算相关指数2

R

计算相关指数2

R =0.9855.说明该运动员的成绩的差异有98.55%是由训练次数引起的。 (6)做出预报

由上述分析可知,我们可用回归方程

.00302.00415.1^

-=x y 作为该运动员成绩的预报值。

将x =47和x =55分别代入该方程可得y =49和y =57, 故预测运动员训练47次和55次的成绩分别为49和57. 点评:一般地,建立回归模型的基本步骤为:

(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;

(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);

(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y =bx +a );

(4)按一定规则估计回归方程中的参数(如最小二乘法);

(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。

例2、某城区为研究城镇居民月家庭人均生活费支出和月人均收入的相关关系,随机抽取

试预测人均月收入为1100元和人均月收入为1200元的两个家庭的月人均生活费。 解答:作出散点分布图如图,由图可知,月人均生活费与人均收入之间具有线性相关关

系。

通过计算可知4.480,639==y x ,

461030010

1

2=∑=i i

x

,254052610

1

2=∑=i i y ,

341756010

1

=∑=i

i i y

x ,所以=

β.6599.0101010

1

2

210

1≈--∑∑==i i

i i

i x

x

y x y

x

751.58≈-=x y βα,所以回归直线方程为.751.586599.0^

+=x y

计算相关系数得993136.0=r

,而查表知632.005.0=r ,故月人均收入与月人均生活费

之间具有显着相关关系。

作残差图如图,由图可知,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适。

计算相关指数得2

R =0.9863,说明城镇居民的月人均生活费的差异有98.63%是由月人均收入引起的。

由以上分析可知,我们可以利用回归方程.751.586599.0^

+=x y 来作为月生活费的预报

值。

将x =1100代入回归方程得y =784.59元;将x =1200代入回归方程得y =850.58元。 故预测月人均收入分别为1100元和1200元的两家庭的月人均生活费分别为784.59元和850.58元。

相关文档
最新文档