应用数理统计大作业1——逐步回归法分析终
应用数理统计大作业1——逐步回归法分析终教学提纲
应用数理统计大作业1——逐步回归法分析终应用数理统计多元线性回归分析(第一次作业)学院:机械工程及自动化学院姓名:学号:2014年12月逐步回归法在AMHS物流仿真结果中的应用摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS 数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。
关键词:逐步回归;残差;SPSS;AMHS;物流仿真目录1、引言 (1)2、逐步回归法原理 (4)3、模型建立 (6)3.1确定自变量和因变量 (6)3.2分析数据准备 (6)3.3逐步回归分析 (7)4、结果输出及分析 (9)4.1输入/移去的变量 (9)4.2模型汇总 (10)4.3方差分析 (10)4.4回归系数 (11)4.5已排除的变量 (12)4.6残差统计量 (13)4.7残差分布直方图和观测量累计概率P-P图 (14)5、异常情况说明 (15)5.1异方差检验 (15)5.2残差的独立性检验 (17)5.3多重共线性检验 (17)6、结论 (18)参考文献 (20)1、引言回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。
这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。
逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。
SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。
数理统计-回归分析
国家财政收入的逐步回归分析应用数理统计课程论文2012届材料科学与工程学院学号姓名2012年11月18日摘要财政作为一国政府的活动,是政府职能的具体体现,主要有资源配置、收入再分配和宏观经济调控三大职能。
财政收入是政府部门公共收入,是国民收入分配中用于保证政府行使其公共职能,实施公共政策以及提供公共服务的资金需求。
财政收入的增长状况关系着一个国家经济的发展和社会的进步。
本文选取了我国自1979至2010年间的财政收入数据,并选取了7个可能的影响因素,利用SPSS 统计软件,运用多元线性回归的逐步回归方法建立了国家财政收入的回归模型。
得出了影响国家财政收入的显著性变量,并将所得到的模型给予了合理的经济解释。
关键词:财政收入 SPSS 回归分析目录1.引言 01.1 理论回归方程 ........................................................................ 错误!未定义书签。
1.2研究意义 ................................................................................. 错误!未定义书签。
1.3 研究内容及方法 .................................................................... 错误!未定义书签。
2.数据统计 (1)2.1 数据的收集 (1)2.2 散点图 (2)2.3 逐步回归分析 (3)3. 结论和讨论 (7)3.1 结论 (7)3.2 讨论 (7)参考文献 (8)北京航空航天大学应用数理统计论文2.数据统计2.1 数据的收集本文在进行统计时,查阅《中国统计年鉴2011》中收录的1997年至2010年连续14年的全国财政收入数据,同时,选取了7个可能对国家财政收入产生影响因素,初步选取了这14年的工业总产值、农业总产值、建筑业总产值、社会消费品零售总额、卫生总费用、外汇储备、人口总数为自变量,分析它们与国家财政收入数据之间的联系。
北航数理统计第一次大作业
数理统计第一次课程论文广州恒大队在2015赛季亚冠的进球数的多元线性回归模型学号: SY1527205姓名:郭谢有摘要本赛季亚洲冠军联赛,来自中国的球队广州恒大淘宝队最终在决赛中力克阿联酋的迪拜阿赫利队,三年之内第二次夺得亚冠冠军。
为了研究恒大的夺冠过程,本文选取了恒大该赛季亚冠总共15场比赛中的进球数为因变量,对可能影响进球数的射门数、射正数等7个自变量进行统计,并进一步利用统计软件SPSS对以上数据进行了多元逐步线性回归。
最终确定了进球数与各因素之间关系的“最优”回归方程。
关键词:多元线性回归,逐步回归法,广州恒大,SPSS目录摘要 (1)1.引言 (3)2.符号说明 (3)3.数据的采集和整理 (3)3.1数据的采集 (3)3.2建模 (4)4.数据分析及计算 (4)4.结论 (9)参考文献 (10)致谢 (10)1.引言一场足球比赛的进球数说明了一支球队攻击力的强弱,也是决定比赛胜负的至关因素,综合反映出这支球队的实际水平。
而作为竞技体育,足球场上影响进球数的因素很多,为了研究本赛季恒大在亚冠夺冠过程中的14场比赛中进球数与其他一些因素的关系,本论文从搜达足球和新浪体育数据库中查找了进球数和其他7个主要影响因素的数据,包括射门次数、射正次数、传球次数、传中次数、角球次数、抢断次数。
并进一步采用多元逐步回归分析方法对以上因素进行了显著性分析,从而确定了关于恒大在本赛季亚冠中进球数的最优多元线型回归方程。
2.符号说明3.数据的采集和整理3.1数据的采集本文统计数据时,查阅了搜达足球数据库,确定恒大在亚冠14场比赛中的进球数为因变量,并初步选取这14场比赛中的射门次数、射正次数、传球次数、传中次数、角球次数、抢断次数7因素为自变量,具体数据见下表1。
3.2建模本文选取了恒大在亚冠比赛中的进球数作为因变量y,并选取可能对进球数造成影响的因素为自变量,其中对应关系在符号说明中已经列举。
这里构建模型如下:7⋅X i+εy=β0+∑βii=1其中,其中ε为随机误差项,β0为常数项,βi为待估计的参数。
逐步回归分析
逐步回归分析逐步回归分析1、逐步回归分析的主要思路在实际问题中, ⼈们总是希望从对因变量有影响的诸多变量中选择⼀些变量作为⾃变量, 应⽤多元回归分析的⽅法建⽴“最优”回归⽅程以便对因变量进⾏预报或控制。
所谓“最优”回归⽅程, 主要是指希望在回归⽅程中包含所有对因变量影响显著的⾃变量⽽不包含对影响不显著的⾃变量的回归⽅程。
逐步回归分析正是根据这种原则提出来的⼀种回归分析⽅法。
它的主要思路是在考虑的全部⾃变量中按其对的作⽤⼤⼩, 显著程度⼤⼩或者说贡献⼤⼩, 由⼤到⼩地逐个引⼊回归⽅程, ⽽对那些对作⽤不显著的变量可能始终不被引⼈回归⽅程。
另外, ⼰被引⼈回归⽅程的变量在引⼊新变量后也可能失去重要性, ⽽需要从回归⽅程中剔除出去。
引⼈⼀个变量或者从回归⽅程中剔除⼀个变量都称为逐步回归的⼀步, 每⼀步都要进⾏检验, 以保证在引⼈新变量前回归⽅程中只含有对影响显著的变量, ⽽不显著的变量已被剔除。
逐步回归分析的实施过程是每⼀步都要对已引⼊回归⽅程的变量计算其偏回归平⽅和(即贡献), 然后选⼀个偏回归平⽅和最⼩的变量, 在预先给定的⽔平下进⾏显著性检验, 如果显著则该变量不必从回归⽅程中剔除, 这时⽅程中其它的⼏个变量也都不需要剔除(因为其它的⼏个变量的偏回归平⽅和都⼤于最⼩的⼀个更不需要剔除)。
相反, 如果不显著, 则该变量要剔除, 然后按偏回归平⽅和由⼩到⼤地依次对⽅程中其它变量进⾏检验。
将对影响不显著的变量全部剔除, 保留的都是显著的。
接着再对未引⼈回归⽅程中的变量分别计算其偏回归平⽅和, 并选其中偏回归平⽅和最⼤的⼀个变量, 同样在给定⽔平下作显著性检验, 如果显著则将该变量引⼊回归⽅程, 这⼀过程⼀直继续下去, 直到在回归⽅程中的变量都不能剔除⽽⼜⽆新变量可以引⼊时为⽌, 这时逐步回归过程结束。
2、逐步回归分析的主要计算步骤(1) 确定检验值在进⾏逐步回归计算前要确定检验每个变量是否显若的检验⽔平, 以作为引⼈或剔除变量的标准。
数理统计 北航 大作业
北京市财政收入的逐步回归模型研究摘要:财政收入水平高低是反映一国经济实力的重要标志,关系着一个国家经济的发展和社会的进步。
本文根据北京市2012年度统计年鉴,选取了农林牧渔业总产值、工业总产值、建筑业总产值、常驻总人口数、社会消费品零售总额、入境旅游人数、客运量、货运量、全社会固定资产投资以及第三产业总产值,共10个指标,对北京市财政收入及其可能的影响因素进行了研究。
文中运用逐步线性回归方法建立了多元线性回归模型,分析各因素对该地区财政收入的影响;利用SPSS软件进行求解。
通过分析SPSS软件计算的数据,从相关性检验、多重共线性检验、方差分析以及残差分析四个角度,分别对模型合理性进行了验证。
结果表明,北京市财政收入与建筑业总产值和农林牧渔也总产值呈显著线性关系。
其中与建筑业正相关,与农林牧渔业负相关。
关键字:财政收入,多元,逐步线性回归,SPSS1. 引言财政收入是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而集中的一切资金的综合,包括税收、企事业收入、能源交通重点建设基金收入、债务收入、规费收入、罚没收入等[1]。
财政收入水平高低是反映一国经济实力的重要标志,关系着一个国家经济的发展和社会的进步。
因此,研究财政收入的增长及就显得尤为必要[2]。
一个地区的财政收入可能受到诸多因素的影响,如工业总产值、农业总产值、建筑业总产值、人口数等。
本文以北京市为例,以财政收入为因变量,选取农林牧渔业总产值、工业总产值、建筑业总产值、常驻总人口数、社会消费品零售总额、入境旅游人数、客运量、货运量、全社会固定资产投资以及第三产业总产值这10个指标为自变量,利用SPSS统计软件进行回归分析,建立财政收入影响因素模型,分析影响财政收入的主要因素及其影响程度。
2. 理论概述2.1 多元线性回归[3]在许多实际问题中,影响一个事物的因素常常不止一个,采用多元线性回归分析方法可以找出这些因素与事物之间的数量关系。
数理统计第一次大作业——回归分析
北京市农业经济总产值的逐步回归分析姓名:学号:摘要:农业生产和农村经济是国民经济的基础,影响农村经济总产值的因素有多种,主要包括农林牧渔业。
本文以北京市农业生产和农村经济总产值为对象,首先分析了各种因素的线性相关性,建立回归模型,再利用逐步回归法进行回归分析,得到最符合实际情况的回归模型。
以SPSS 17.0为分析工具,给出了实验结果,并用预测值验证了结论的正确性。
关键词:农业生产和农村经济,线性回归模型,逐步回归分析,SPSS1.引言农林牧渔业统计范围包括辖区内全部农林牧渔业生产单位、非农行业单位附属的农林牧渔业生产活动单位以及农户的农业生产活动。
军委系统的农林牧渔业生产(除军马外)也应包括在内,但不包括农业科学试验机构进行的农业生产。
在近几年中国经济快速增长的带动下,各地区农林牧渔业也得到了突飞猛进的发展。
以北京地区为例,2005年的农业总产值为1993年的6倍。
因此用统计方法研究分析农业总产值对指导国民经济生产,合理有效的进行产业布局,提高生产力等有着重要意义。
表1 北京市农业经济产值及各产品产量统计数据本文以北京市农生产为对象,分析了农业经济总产值与粮食产量、棉花产量、油料产量、蔬菜产量、干鲜果品产量、猪牛羊肉产量、禽蛋产量、水产品产量的关系,并建立农业经济总产值的回归模型。
表1中列出了1999年至2008年间的统计数据(数据来源于北京统计信息网)。
2.线性回归模型的建立2.1 线性回归模型的假设为了研究农业经济总产值与各种农生产量的关系,必须要建立二者之间的数学模型。
数学模型可以有多种形式,比如线性模型,二次模型,指数模型,对数模型等等。
而实际生活中,影响农业经济总产值的因素很多,并且这些因素的影响不能简单的用某一种模型来描述,所以要建立农业经济总产值的数学模型往往是很难的。
但是为了便于研究,我们可以先假定一些前提条件,然后在这些条件下得到简化后的近似模型。
以下我们假定两个前提条件:1) 农产品的价格是不变的。
经典推荐逐步回归分析法及其应用
经典推荐逐步回归分析法及其应用导读:逐步回归分析是多元回归分析中的一种方法,在经济研究建模中发挥着重要的作用。
文章系统介绍了逐步回归分析,并分析了逐步回归分析在经济研究(建模与预测)中的应用步骤与需要注意的问题。
来源 | 统计与决策作者丨游士兵,严研,武汉大学经济与管理学院原文有删减01引言逐步回归分析是多元回归分析中的一种方法。
回归分析是用于研究多个变量之间相互依赖的关系,而逐步回归分析往往用于建立最优或合适的回归模型,从而更加深入地研究变量之间的依赖关系。
目前,逐步回归分析被广泛应用于各个学科领域,如医学、气象学、人文科学、经济学等。
经济现象纷繁复杂并多变,经济问题往往需要研究一个(或多个)变量(如一国的产出)与其他变量(如资本、劳动力、人口、技术等)相互间的关系,从而揭示经济现象背后的经济规律,用于解决现实中的经济问题,制定经济政策等。
因此,多元回归分析在现代经济学,尤其是其分支学科计量经济学中常常得到应用。
随着统计学与计量经济学软件的开发与应用,经济研究者在经济学的实证分析过程中越来越多的采用逐步回归分析的方法来建立多元回归模型。
因此,研究逐步回归分析及其在经济学研究中的应用具有理论与实践意义。
目前,国内外对于逐步回归分析的研究主要停留在理论叙述,不少学者提出了修正逐步回归法的新方法,如类逐步回归法、基于单元步的逐步回归法、“宜取回归方程”的逐步回归法等。
赵希男(1994)提出并在理论上证明可将逐步回归算法从静态系统拓广到其他系统(动态系统、分布参数等系统)。
传统的逐步回归法通常用于静态系统,即自变量为非随机变量时。
当自变量为分布型变量时,基于传统的逐步回归法,由于统计量的分布非常复杂,基于统计量的算法难以实现。
该文运用泛函分析,按照传统逐步回归法一致思想和相似的步骤,加以拓广,以有效性(剩余相关系数)为标准剔除或是引入变量,从而使得逐步回归法应用范围更广。
张华嘉、舒元(1998)提出单元步的概念来修正传统逐步回归法,并以实例证明这种方法的优势。
逐步回归方法
逐步回归方法
逐步回归是一种常用的回归分析方法,它通过逐步调整每个自变量的值来最小化残差平方和(sum of Squared Error,SSE)。
具体来说,逐步回归方法通过迭代计算每个自变量对目标变量的预测贡献,然后逐步调整每个自变量的值,直到
达到最小化SSE的目的。
逐步回归方法的基本原理是,通过逐步调整每个自变量的值,使得预测结果
与实际结果之间的残差平方和最小化。
在具体实现中,逐步回归方法通常包括以下步骤:
1. 确定目标变量和残差平方和的测量方式。
2. 初始化所有自变量的值,并计算每个自变量对目标变量的残差平方和的
贡献。
3. 确定每个自变量的最佳初始值,通常通过最小化残差平方和来寻找最佳值。
4. 逐步调整每个自变量的值,直到残差平方和不再发生变化。
5. 重复步骤3和4,直到所有自变量都被调整完毕。
逐步回归方法可以应用于多种回归分析场景,例如多元线性回归、多项式回归、逻辑回归等。
在实际应用中,逐步回归方法可以帮助研究人员更好地理解模型的结构,并优化模型的预测性能。
除了逐步回归方法,还有其他的回归分析方法,例如岭回归、局部线性回归等。
这些方法各有优缺点,应根据具体情况进行选择。
在回归分析中,还应该考虑数据预处理、特征选择等方法,以提高模型的预测性能和泛化能力。
北航数理统计大作业(逐步回归)
第一次大作业
学号: 姓名: 班级:
? B11 班
2015 年 12 月
民航客运量的多元线性回归分析
摘要:本文为建立以民航客运量为因变量的多元线性回归模型,选取了 1996
年至 2013 年的统计数据,包含国民生产总值,民航航线里程,过夜入境旅游人 数,城镇居民可支配收入等因素,利用统计软件 SPSS 对各因素进行了筛选分析, 采用逐步回归法得到最优多元线性回归模型,并对模型的回归显着性、拟合度以 及随机误差的正态性进行了检验,并采用 2014 年的数据进行检验,得到的结果 达到预期,证明该模型建立是较为成功的。
12123
111764
13827
115583
15968
125656
18576
135670
19251
146193
23052
152451
26769
168145
29316
473104
146192
31896
189337
35397
210597
模型的建立
以民航客运量 y 为因变量,以上 5 种影响因素为自变量 Xi ,构建回归方程:
通过最优回归方程,我们可以发现航空客运量与城镇居民的可支配收入线 性相关十分显着,这是符合常识的,只有居民可支配收入越来越高,才会选择航 空这种昂贵的客运方式。
图7
参考文献:
[1] 2015 年中国统计年鉴 [2] 孙海燕、周梦、李卫国、冯伟. 应用数理统计.北京航空航天大学出版 社,2009
[3] 朱卫卫. 基于偏最 小二乘回归的我国民航客运量影响因素分析[J]. 中国市场. 2010(41): 110-112 精 心搜集整理,只为你的需要
统计学中的多元统计分析和逐步回归法
统计学中的多元统计分析和逐步回归法在现代社会中,数据分析和建模已经成为非常重要的技能。
统计学是一个非常有用的工具,它能够帮助我们从数据中提取有用的信息,帮助我们理解和预测现实世界中的现象。
在统计学中,多元统计分析和逐步回归法是两个非常有用的技术,可以帮助我们处理更加复杂的数据集。
多元统计分析是一种分析多个变量之间关系的技术。
它可以帮助我们识别多个变量之间的相关性和相互作用。
例如,在社会科学研究中,我们可能会对多个因素对个体的生活满意度的影响进行研究。
这些因素可能包括家庭收入、教育水平、健康状况、社会支持等等。
通过多元统计分析,我们可以将这些因素纳入模型中,确定它们之间的关系,以及每个因素对生活满意度的贡献大小。
在多元统计分析中,最常用的技术之一是因子分析。
因子分析是一种将一组变量转化为几个不相关因子的技术。
这个过程可以帮助我们识别出变量中的通用因素,从而简化模型。
例如,在心理学研究中,我们可能会对多个问卷测量结果进行分析,希望确定这些测量结果中的共同因素。
通过因子分析,我们可以将这些测量结果转化为几个因子,这些因子代表了问卷中的共同主题,例如焦虑、压力、幸福感等等。
另一个非常有用的多元统计分析技术是聚类分析。
聚类分析是一种将一组对象分为相似群体的技术。
这个过程可以帮助我们在不需要先验知识的情况下发现数据中的任何模式。
例如,在市场研究中,我们可能会对消费者的购买行为进行分析,以确定他们之间的相似之处。
通过聚类分析,我们可以将消费者划分为不同的群体,这些群体具有相似的购买偏好和行为方式。
这些信息可以帮助我们更好地制定营销策略和调整产品定位。
逐步回归法是另一种统计学中非常有用的技术。
它是一种逐步选择变量的技术,用于建立变量间的线性关系模型。
逐步回归法可以帮助我们确定哪些变量对一个目标变量最有影响力,并排除那些没有贡献的变量。
例如,在经济学研究中,我们可能会对多个因素对国家经济增长的影响进行研究。
这些因素包括人口数量、教育水平、出口数量等等。
数理统计大作业
数理统计大作业-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII应用数理统计(论文)国家财政收入的逐步回归分析指导教师院系名称学号学生姓名2012年11月18日摘要财政收入是国民经济基础,是实现国家职能的财力保证。
本文采用SPSS统计软件中的逐步回归分析方法,得出影响我国财政收入的显著性变量,建立国家财政收入回归模型,并将所得的模型给予合理的经济解释。
关键字:国家财政收入,逐步回归,SPSS1 引言财政收入是指国家财政参与社会产品分配所取得到的收入,是实现国家职能的财力保证。
影响财政收入的因素有很多,包括工业总产值、农业总产值、建筑业总产值、社会商品零售总额、人口数、受灾面积等等。
在经济模型的建立中,其中有些自变量对问题的研究可能并不重要,有些自变量数据的质量可能很差,有些变量可能和其它变量有很大程度的重叠。
如果用回归模型把这些变量都包含进来不但会使模型计算复杂,而且往往会扩大估计方差,降低模型精度,直接影响到回归方程的应用。
另外,选进太多的自变量又会造成共线性的存在。
因此,本文采用线性回归中的逐步回归方法,利用SPSS多元统计软件得出影响我国财政收入的显著性变量,剔除了不显著的变量,并且克服了变量间的多重共线性,得出了一个较合理的财政回归模型。
2初始模型的建立及数据分析2.1 自变量与因变量的提出本模型是研究1997年至2011年国家财政收入与主要影响因素之间的定量关系。
本文选取财政收入Y(亿元)为因变量,自变量选取如下:第一产业国内生产总值X1(亿元),第二产业国内生产总值X2(亿元,第三产业国内生产总值X3(亿元),社会消费品零售总额X4(亿元),人口数X5(万人),受灾面积X6(万公顷)。
根据《中国统计年鉴》获取1997-2011年共十五年的统计数据,见表1。
表11997-2011年财政收入与部分项目的统计数据财政收入(亿元)第一产业国内生产总值(亿元)第二产业国内生产总值(亿元)第三产业国内生产总值(亿元)社会商品零售总额(亿元)人口总数(万人)受灾面积(万公顷)1997 8651.14 14441.89 37543.00 26988.15 31252.90 123626.00 5342.70 1998 9875.95 14817.63 39004.19 30580.47 33378.10 124761.00 5014.50 1999 11444.08 14770.03 41033.58 33873.44 35647.90 125786.00 4998.00 2000 13395.23 14944.72 45555.88 38713.95 39105.70 126743.00 5468.80 2001 16386.04 15781.27 49512.29 44361.61 43055.40 127627.00 5221.50 2002 18903.64 16537.02 53896.77 49898.90 48135.90 128453.00 4694.60 2003 21715.25 17381.72 62436.31 56004.73 52516.30 129227.00 5450.60 2004 26396.47 21412.73 73904.31 64561.29 59501.00 129988.00 3710.60 2005 31649.29 22420.00 87598.09 74919.28 67176.60 130756.00 3881.80 2006 38760.20 24040.00 103719.54 88554.88 76410.00 131448.00 4109.10 2007 51321.78 28627.00 125831.36 111351.95 89210.00 132129.00 4899.20 2008 61330.35 33702.00 149003.44 131339.99 114830.10 132802.00 3999.00 2009 68518.30 35226.00 157638.78 148038.04 132678.40 133450.00 4721.40 2010 83101.51 40533.60 187383.21 173595.98 156998.40 134091.00 3742.60 2011 103874.43 47486.20 220412.80 204982.50 183918.60 134735.00 3247.10 2.2 做散点图,设定理论模型作数据散点图,并进行线性拟合,观察因变量与自变量之间关系是否有线性特点。
逐步回归分析法及其应用
逐步回归分析法及其应用逐步回归分析法是一种广泛应用于统计学和数据分析领域的统计技术,它被用来探索变量之间的关系,以及预测和解释数据的模式。
逐步回归分析法通过逐步添加变量和移除变量,找到最优的变量组合来解释因变量,同时使模型的复杂性最小化。
本文将介绍逐步回归分析法的基本原理、应用场景、案例分析以及需要注意的事项。
逐步回归分析法的基本原理逐步回归分析法基于最小二乘回归,通过向前逐步添加变量和向后逐步移除变量来建立最优的回归模型。
它通过构造一个评价函数,如AIC (Akaike Information Criterion)或BIC (Bayesian Information Criterion),来评估模型的复杂度和拟合度。
逐步回归分析法的目标是找到一个既能解释因变量又能使模型复杂性最小的最优模型。
应用场景逐步回归分析法适用于多种数据分析和统计学应用场景,例如:因果分析:通过逐步回归分析法,可以找出哪些自变量对因变量有显著影响,以及它们的影响程度。
特征选择:在处理高维数据时,逐步回归分析法可以用来选择最重要的特征,以便构建更有效的模型。
时间序列预测:通过逐步回归分析法,可以建立时间序列预测模型,预测未来的趋势和变化。
案例分析以一个实际的例子来说明逐步回归分析法的应用。
假设我们有一个数据集包含了汽车的各项性能指标(如马力、油耗、车重等)和汽车的销售价格。
我们想知道哪些性能指标最能影响汽车的销售价格。
我们使用逐步回归分析法建立一个价格预测模型。
通过向前逐步添加变量和向后逐步移除变量,我们最终找到了一个最优模型,该模型仅包含两个变量:马力(Horsepower)和车重(Weight)。
这个模型告诉我们,汽车的马力越大、车重越轻,销售价格就越高。
接下来,我们使用残差和斜率进一步分析这个模型。
残差是实际值与模型预测值之间的差异,斜率是因变量对自变量的变化率。
通过观察残差和斜率,我们可以得出以下马力对价格的影响比车重更大,因为马力的斜率大于车重的斜率。
(完整word版)北航数理统计大作业1-线性回归分析
应用数理统计作业一学号:姓名:电话:二〇一四年十二月国内生产总值的多元线性回归模型摘要:本文首先选取了选取我国自1978至2012年间的国内生产总值为因变量,并选取了7个主要影响因素,进一步利用统计软件SPSS对以上数据进行了多元逐步线性回归。
从而找到了能反映国内生产总值与各因素之间关系的“最优”回归方程.然后利用多重线性的诊断找出存在共线性的自变量,剔除缺失值较多的因子.再次进行主成份线性回归分析,找出最优回归方程。
所得结论与我国当前形势相印证。
关键词:多元线性回归,逐步回归法,多重共线性诊断,主成份分析目录0符号说明 (1)1 介绍 (2)2 统计分析步骤 (3)2。
1 数据的采集和整理 (3)2。
2采用多重逐步回归分析 (7)2.3进行共线性诊断 (17)2。
4进行主成分分析确定所需主成份 (24)2。
5进行主成分逐步回归分析 (27)3 结论 (30)参考文献 (31)致谢 (32)0符号说明1 介绍文中主要应用逐步回归的主成份分析方法,对数据进行分析处理,最终得出能够反映各个因素对国内生产总值影响的最“优”模型及线性回归方程.国内生产总值是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标.它不但可反映一个国家的经济表现,还可以反映一国的国力与财富。
2012年1月,国家统计局公布2011年重要经济数据,其中GDP增长9.2%,基本符合预期。
2012年10月18日,统计显示,2012年前三季度国内生产总值353480亿元,同比增长7.7%;其中,一季度增长8.1%,二季度增长7。
6%,三季度增长7.4%,三季度增幅创下2009年二季度以来14个季度新低。
中国的GDP核算历史不长,上世纪90年代之前通常用“社会总产值”来衡量经济发展情况。
上世纪80年代初中国开始研究联合国国民经济核算体系的国内生产总值(GDP)指标。
第一讲 逐步回归分析
56 57 58 ┇ 65 66 67
x1,℃
22.1 17.4 20.1 ┇ 13.8 13.0 13.4 17.2 4.1
x2,℃
16.7 12.6 15.7 ┇ 9.4 9.4 10.7 13.3 3.8
x3,℃
13.3 9.0 12.5 ┇ 5.2 6.4 8.3 10.3 4.4
x4,%
58.4 58.6 60.2 ┇ 58.0 60.4 71.2 64.4 7.0
x5
68.6 62.2 66.4 ┇ 57.3 56.7 58.0 62.5 5.6
y,%
70.9 66.7 64.3 ┇ 60.5 60.5 58.9 63.4 3.8
x
s
一、计算相关系数阵
1、计算各变量的平均数(为表1—1) 设自变量x1,x2,…,xm与依变量y存在线性关系,m元线性回归 方程为:
y yk
1 n 1
n
本例计算结果列于表1—1。
2、计算离差阵 自变量平方和ssi,自变量间及其与依变量间的乘积和SPij及SPiy由下式算出:
2 SSi ( xki xi ) 2 xki ( xki ) 2 n 1 n
( 1 —5 ) i、j=1,2,…,m,i≠j (1–6) (1—7)
第一讲 逐步回归分析 STEPWISE REGRESSION ANALYSIS
在多元线性回归分析时,为建立一个较为简化又能准确预测依 变量的最优回归方程,通常是逐个剔除复回归方程中经检验对 y 影 响不显著的所有自变量。这种先全部引入,后逐个剔除的方法,也 是建立最优回归方程的一种分析法。此类分析法还很多,它们多适 用于自变量个数较少,或大多数自变量对 y有显著影响的资料分析。 否则,计算量将大大增加。目前较为常用的逐步回归分析法是按自 变量与 y影响程度的大小,逐个地由大至小将自变量引入回归方程。 而每引入一个自变量,都要对方程中的各个自变量作显著性检验。 检验时先选偏回归平方和最小的自变量进行检验,若为显著,余者 皆为显著;若检验差异不显著,即从方程中剔除,直至留在方程中 的自变量均检验为显著后,再引入另一个与 y 影响最大的变量,并 进行显著性检验。如此反复,直至没有自变量可再被引入,而方程 中所有自变量均与y存在显著的线性关系为止。
(整理)逐步回归分析计算法
前面我们介绍了通过回归的基本思想是将变量逐一引入回归方程,先建立与y相关最密切的一元线性回归方程,然后再找出第二个变量,建立二元线性回归方程,…。
在每一步中都要对引入变量的显著性作检验,仅当其显著时才引入,而每引入一个新变量后,对前面已引进的变量又要逐一检验,一旦发现某变量变得不显著了,就要将它剔除。
这些步骤反复进行,直到引入的变量都是显著的而没有引入的变量都是不显著的时,就结束挑选变量的工作,利用所选变量建立多元线性回归方程。
为实现上述思想,我们必须在解方程组的同时,求出其系数矩阵的逆矩阵。
为节约内存,计算过程中在消去x k时用了如下变换公式——求解求逆紧凑变换。
一、求解求逆紧凑变换求解求逆紧凑变换记作L k,其基本变换关系式为:(2-3-30) 当对(2-3-27)的增广矩阵(2-3-31)依次作L1,L2,…,L m-1变换后,所得矩阵的前m-1列,便是系数矩阵的逆矩阵,最后一列便是(2-3-27)的解,即求解求逆紧凑变换具有以下性质:(1) 若对作了L k1, L k2,…,L k L变换,则得如下子方程组(2-3-32)的解及相应的系数矩阵的逆矩阵,其中k1,k2,…,k l互不相同,若记L k1L k2…L k l,则(2-3-33),j=1,2,…,l(2) L i L j=L j L i,即求解求逆紧凑变换结果与变换顺序无关。
(3) L k L k=(4) 若,ij=1,2,…,m-1,记L k1L k2…L k l则中的元素具有以下性质:式中上行为对作了变换L i,L j或两个变换均未作过;下行为对作过变换L i和L j之一。
二、逐步回归的计算过程逐步回归计算过程就是反复对增广矩阵作L k变换,并利用变换性质将选变量与作检验等步骤结合起来。
为了检验方便,对再增加一行,使其变成对称方阵,并记作R(0),即(2-3-34)选变量具体步骤如下:1.选第一个变量选第一个变量就是从m-1个一元线性回归方程(i=1,2,…,m-1) (2-3-35)中找一个回归平方和最大的方程。
逐步回归分析计算法
逐步回归分析计算法前面我们介绍了通过回归的基本思想是将变量逐一引入回归方程,先建立与y相关最密切的一元线性回归方程,然后再找出第二个变量,建立二元线性回归方程,…。
在每一步中都要对引入变量的显著性作检验,仅当其显著时才引入,而每引入一个新变量后,对前面已引进的变量又要逐一检验,一旦发现某变量变得不显著了,就要将它剔除。
这些步骤反复进行,直到引入的变量都是显著的而没有引入的变量都是不显著的时,就结束挑选变量的工作,利用所选变量建立多元线性回归方程。
为实现上述思想,我们必须在解方程组的同时,求出其系数矩阵的逆矩阵。
为节约内存,计算过程中在消去x k时用了如下变换公式——求解求逆紧凑变换。
一、求解求逆紧凑变换求解求逆紧凑变换记作L k,其基本变换关系式为:(2-3-30) 当对(2-3-27)的增广矩阵(2-3-31)依次作L1,L2,…,L m-1变换后,所得矩阵的前m-1列,便是系数矩阵的逆矩阵,最后一列便是(2-3-27)的解,即求解求逆紧凑变换具有以下性质:(1) 若对作了L k1, L k2,…,L k L变换,则得如下子方程组(2-3-32)的解及相应的系数矩阵的逆矩阵,其中k1,k2,…,k l互不相同,若记L k1L k2…L k l,则(2-3-33),j=1,2,…,l(2) L i L j=L j L i,即求解求逆紧凑变换结果与变换顺序无关。
(3) L k L k=(4) 若,ij=1,2,…,m-1,记L k1L k2…L k l则中的元素具有以下性质:式中上行为对作了变换L i,L j或两个变换均未作过;下行为对作过变换L i和L j之一。
二、逐步回归的计算过程逐步回归计算过程就是反复对增广矩阵作L k变换,并利用变换性质将选变量与作检验等步骤结合起来。
为了检验方便,对再增加一行,使其变成对称方阵,并记作R(0),即(2-3-34)选变量具体步骤如下:1.选第一个变量选第一个变量就是从m-1个一元线性回归方程(i=1,2,…,m-1) (2-3-35)中找一个回归平方和最大的方程。
我们常用到的数理统计方法是回归分析法与相关分析
数理统计方法在大气污染评价中的应用【摘要】本文通过SPSS数理统计软件中的回归分析和聚类分析模块对我国主要城市的工业废气排放量和处理量进行分析,采用了中国统计局网站公布的2010年我国主要城市废气中主要污染物排放情况的数据,依据空气污染的几个重要指标:工业SO2排放量、工业NO X排放量、工业粉尘排放量、生活SO2排放量、生活NO X排放量、生活烟尘的排放量进行聚类分析,得出了影响评价工业废气排放量的几个主要因素和处理情况的简单方法,实证分析的结果与其它方法所得结论一致,并收到较好的效果。
关键词:聚类分析;回归分析;判别分析;空气污染一问题提出与分析空气污染问题已经成为一个全球化问题,尤其是我国正处于一个经济快速发展的时期,工业以及生活带来的空气污染已经严重威胁着我们的生命健康。
作为一个环境领域的科学研究者,我们利用科学的技术手段判断空气中污染因子,检验其含量,监控其含量的变化值,当我们收集整理这些数据时,应该如何分析影响空气质量的主要指标,以及如何分析各变量之间存在着的某种复杂的或者简单的关系。
这里我们采用了多元统计分析方法。
多元统计分析方法在实际数据处理中有着重要的作用。
它不仅可以通过观察值对总体进行参数估计和假设检验,还可以通过相应的方法达到数据化简,分类和研究变量间依赖关系的目的,并能预测变量间关系,提出假设检验等目的。
目前在医学、教育学、社会学、地质学、考古学、环境保护等各个领域有及其广泛的作用。
这里我们主要利用多元统计方法解决环境学与工程科学研究领域中城市空气污染评估问题。
本文主要采用回归分析和聚类分析模型的方法分析我国主要城市工业废气排放及处理情况。
先采用逐步回归的方法进行分析,寻求最优的回归方程,找到影响年运行费用的主要因素和估计的简便方法;再采用系统聚类法对工业SO2排放量、工业NOX排放量、工业粉尘排放量、生活SO2排放量、生活NOX排放量、生活烟尘的排放量进行聚类分析,找到评价工业废气排放及处理情况的简便方法。
应用数理统计大作业1——逐步回归法分析终
应用数理统计多元线性回归分析(第一次作业)学院:机械工程及自动化学院姓名:学号:2014年12月逐步回归法在AMHS物流仿真结果中的应用摘要:本文针对自动化物料搬运系统 (Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS 数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。
关键词:逐步回归;残差;SPSS;AMHS;物流仿真目录1、引言 (1)2、逐步回归法原理 (4)3、模型建立 (5)3.1确定自变量和因变量 (5)3.2分析数据准备 (6)3.3逐步回归分析 (7)4、结果输出及分析 (8)4.1输入/移去的变量 (8)4.2模型汇总 (9)4.3方差分析 (9)4.4回归系数 (10)4.5已排除的变量 (11)4.6残差统计量 (11)4.7残差分布直方图和观测量累计概率P-P图 (12)5、异常情况说明 (13)5.1异方差检验 (13)5.2残差的独立性检验 (14)5.3多重共线性检验 (15)6、结论 (15)参考文献 (17)1、引言回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。
这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。
逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。
SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用数理统计多元线性回归分析(第一次作业)学院:机械工程及自动化学院姓名:学号:2014年12月逐步回归法在AMHS物流仿真结果中的应用摘要:本文针对自动化物料搬运系统(Automatic Material Handling System,AMHS)的仿真结果,根据逐步回归法,使用软件IBM SPSS Statistics 20,对仿真数据进行分析处理,得到多元线性回归方程,建立了工件年产量箱数与EMS数量、周转箱交换周期以及AGC物料交换服务水平之间的数学模型,并对影响年产量箱数的显著性因素进行了分析,介绍了基本假设检验的情况。
关键词:逐步回归;残差;SPSS;AMHS;物流仿真目录1、引言 (1)2、逐步回归法原理 (4)3、模型建立 (5)3.1确定自变量和因变量 (5)3.2分析数据准备 (6)3.3逐步回归分析 (7)4、结果输出及分析 (8)4.1输入/移去的变量 (8)4.2模型汇总 (9)4.3方差分析 (9)4.4回归系数 (10)4.5已排除的变量 (11)4.6残差统计量 (11)4.7残差分布直方图和观测量累计概率P-P图 (12)5、异常情况说明 (13)5.1异方差检验 (13)5.2残差的独立性检验 (14)5.3多重共线性检验 (15)6、结论 (15)参考文献 (17)1、引言回归被用于研究可以测量的变量之间的关系,线性回归则被用于研究一类特殊的关系,即可用直线或多维的直线描述的关系。
这一技术被用于几乎所有的研究领域,包括社会科学、物理、生物、科技、经济和人文科学。
逐步回归是在剔除自变量间相互作用、相互影响的前提下,计算各个自变量x与因变量y之间的相关性,并在此基础上建立对因变量y有最大影响的变量子集的回归方程。
SPSS(Statistical Package for the Social Science社会科学统计软件包)是世界著名的统计软件之一,目前SPSS公司已将它的英文名称更改为Statistical Product and Service Solution,意为“统计产品与服务解决方案”。
SPSS软件不仅具有包括数据管理、统计分析、图表分析、输出管理等在内的基本统计功能,而且用它处理正交试验设计中的数据程序简单,分析结果明了。
基于以上优点,SPSS已经广泛应用于自然科学、社会科学中,其中涉及的领域包括工程技术、应用数学、经济学、商业、金融等等。
本文研究内容主要来源于“庆安集团基于物联网技术的航空柔性精益制造系统”,在庆安集团新建的320厂房建立自动化物料搬运系统(AMHS),使用生产仿真软件EM-Plant对该系统建模并仿真,设计实验因子及各水平如表1-1,则共有3*4*6=72组实验结果,如表所示。
为方便描述,将各因子定义为:X1表示AGC物料交换服务水平,X2表示周转箱交换周期,X3表示EMS数量,Y表示因变量年产量箱数。
本文目的就是建立年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系。
表1-1 三因子多水平实验方案表1-2 实验结果2、逐步回归法原理回归分析是研究因变量和自变量之间变动比例关系的一种方法,最终结果一般是建立某种经验性的回归方程。
回归分析因变量的多少有一元回归和多元回归之分,本文中的回归模型因有3个因变量故为多元回归。
在实际研究中,影响因变量Y的因素有很多,而这些因素之间可能存在多重共线性,特别是在各个解释变量之间有高度的相互依赖性,如温度和雨量、雨量与雨日之间的关系密切,这就给回归系数的估计带来不合理的解释。
为了得到一个可靠的回归模型,需要一种方法能有效地从众多影响Y的因素中挑选出对Y贡献大的变量,在它们和Y的观测数据基础上建立“最优”的回归方程。
逐步回归分析法就是一种自动地从大量可供选择的变量中选择那些对建立回归方程比较重要的变量的方法,它是在多元线性回归基础上派生出来的一种算法技巧。
逐步回归分析法在筛选变量方面较为理想,故目前多采用该方法来组建回归模型。
该方法也是从一个自变量开始,视自变量对Y作用的显著程度,从大到小地依次逐个引入回归方程。
但当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉。
引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步。
对于每一步都要进行F值检验,以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量。
这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。
本文运用IBM SPSS Statistics 20软件的有关功能模块根据上述原理精选出一些配合较好和方差贡献大的自变量,组建回归方程。
当F引=F剔=0时,则所有的变量全部被引入,逐步回归分析结果就和一般的多元线性回归分析结果相同。
当F取值比较大时,理论和实践都表明,在相同的F水平上,用逐步回归筛选出的显著变量个数往往比先引入全部变量后再剔除的办法要少一些。
为了从挑选因子中筛选出尽可能多的因子建立回归预测模型,本系统可以自己给出 F 临界值,计算机默认的F引为0.05,F剔为0.1,如果入选的自变量因子数目不多,可通过人为降低F临界值的水平而筛选出更多的因子。
如此时入选的因子太多,可人为提高F临界值的水平而筛选出有代表性因子来组建回归预测模型。
如最后建立的回归预测模型的复相关系数不大,回归模型的拟合精度不太高,可根据这些入选因子来组建多元非线性回归预测模型。
3、模型建立3.1 确定自变量和因变量根据表1-1可知,本文目标是确定年产量箱数与AGC物料交换服务水平、周转箱交换周期和EMS数量之间的关系,其中AGC物料交换服务水平分为水平1、水平2和水平3,分别表示自动交换、人工交换(积极)和人工交换(消极),周转箱交换周期分为2、4、6和8小时,EMS数量有2、4、6、8、10和12辆。
3.2 分析数据准备打开SPSS软件,在变量视图中定义变量:自变量X1、X2和X3分别表示AGC物料交换服务水平、周转箱交换周期和EMS数量,因变量Y表示年产量箱数,如图3-1所示。
图3-1 定义变量将表1-2中的仿真结果输入到SPSS的数据视图中,如图3-2所示。
图3-2 仿真数据输入3.3 逐步回归分析单击SPSS工具栏中的分析,选择回归→线性,如图3-3所示,打开如图3-4所示的线性回归对话框。
图3-3 线性回归分析图3-4 线性回归对话框在该对话框中选择相应的自变量和因变量,方法中选择逐步,在绘制中选中直方图、正态概率图和产生所有部分图。
图3-5 绘制单击继续后回到线性回归对话框,再单击确定进行回归计算。
4、结果输出及分析逐步回归分析得到的结果为6张表和2幅图,分别为变量引入/剔除方式信息表、模型汇总表、方差分析表、模型回归系数表、被剔除的变量信息表、残差统计表、残差分布直方图和观测量累计概率P-P图。
4.1 输入/移去的变量表4-1显示变量的引入和剔除,以及引入或剔除的标准。
系统在进行逐步回归过程中产生了3个模型,模型1是按照F检验的标准概率值,先将与Y(年产量箱数)最密切的自变量X2(周转箱交换周期)引入模型,建立Y与X2之间的一元线性回归模型,然后再把X3(EMS数量)引入模型,建立了Y与X2,X3之间的二元线性模型,最后把X1(AGC服务水平)引入模型,建立了它们与Y之间的三元线性模型。
4.2 模型汇总表4-2中显示了各模型的拟合情况,回归模型概述表中给出了各模型的相关系数R,用来对生成的模型进行评估,R值越接近于1说明估计的模型对观测值的拟合越好。
从表中可以看出,从模型1到模型3,随着预测变量的增多,相关系数(0.390<0.515<0.584)不断增大,说明模型3是比较好的拟合模型。
4.3 方差分析a. 因变量: 年产量箱数b. 预测变量: (常量),周转箱交换周期。
c. 预测变量: (常量),周转箱交换周期,EMS数量。
d. 预测变量: (常量),周转箱交换周期,EMS数量,AGC服务水平。
表4-3显示各模型的方差分析结果,对模型1:F等于46.449,显著性概率Sig. <0.001;对模型2:F等于38.699,显著性概率Sig. <0.001;对模型3:F等于34.237,显著性概率Sig. <0.001,可以认为Y(年产量箱数)与X2(周转箱交换周期)、X3(EMS数量)和X1(AGC物料服务水平)存在高度显著的线性关系。
4.4 回归系数表4-4 系数a表4-4中显示各模型的偏回归系数,标准化偏回归系数及其对应的检验值。
根据表中数据非标准化系数B的数值可知,逐步回归过程中先后建立的三个模型分别是:模型1:Y = 54823.917-4223.408X2模型2:Y = 43783.242-4223.408X2+1577.239X3模型3:Y = 53678.408-4223.408X2+1577.239X3-4947.583X1t值表示对回归系数的显著性检验,其概率值Sig小于0.05时才可以认为有意义,即自变量对因变量有显著性影响。
在模型中,系数均小于0.05,可认为回归是显著的。
模型3中各因子95%的知置信区间为:常亮——[44486.618,62870.198],周转箱交换周期——[-5244.718,-3202.098],EMS数量——[908.635,2245.844],AGC服务水平——[-7744.556,-2150.611]。
4.5 已排除的变量表4-5中显示逐步回归过程所建立的三个模型中剔除掉的变量信息,包括各变量的Beta值、t统计量值、双尾显著性概率、偏相关系数以及多重共线性统计(Collinearity Statistics)的容差。
对模型来说,它的偏回归系数的P值都大于0.05,接受原假设,即不能把这些变量加入方程中。
模型1中排除了变量X1和X3,表明Y只与X2有显著的线性关系;模型2中排除了变量X1,表明Y只与X2和X3有显著的线性关系。
4.6 残差统计量表4-6 残差统计量a极小值极大值均值标准偏差N 预测值8202.8701 59210.8789 33706.8750 11680.01200 72残差-23164.48633 30799.59961 .00000 9503.62195 72标准预测值-2.184 2.184 .000 1.000 72标准残差-2.385 2.372 .000 .979 72a. 因变量: 年产量箱数表4-6显示了预测值、残差、标准预测值和标准残差的最小值、最大值,均值,标准差以及样本容量。
根据概率的3σ原则,标准化残差的最大值为2.372<3,说明样本中的数据中没有奇异数据。
4.7 残差分布直方图和观测量累计概率P-P图图4-1 残差分布直方图图4-2 观测的累积概率图回归分析中,总假定残差ε服从正态分布,这两张图就是根据样本数据的计算结果显示残差分布的实际状况,然后对残差分布是否服从正态分布的假设做出检验。