回归分析课程设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用回归分析

课程设计指导书

一、课程设计的目的

(1)巩固应用回归分析的理论知识,掌握其思想精髓;

(2)运用回归分析研究方法,加强解决实际问题的能力;

( 3)熟练使用spss 软件对数据进行回归分析。

二、设计名称:研究货运总量y (万吨)与工业总产值x1 (亿元)、农业总产值

x2(亿元)、居民非商品支出x3 (亿元)的关系

三、设计要求

(1)正确运用spss软件对数据进行处理

(2)正确分析数据,尝试选择不同的模型拟合数据

( 3)课程设计中,遇到问题要翻阅课本去努力解决问题

(4)要有耐心,对于模型的显著性和回归系数都要进行检验

( 5 )认真并独立完成

四、设计过程

(1)思考课程设计的目的,寻找来源真实的数据

( 2)上网搜集并整理数据资料

( 3)根据数据确定研究对象

( 4)应用统计软件来处理数据信息

( 5 )选择通过各种检验的线性模型

(6)写出相应的实验报告,并对结果进行分析

五、设计细则

( 1 )搜集数据阶段,数据不能过于繁杂,也不能太少;

(2)做课程设计前,认真看书和笔记,及平时的实验报告,掌握丰富的理论;

( 3)有耐心,不紧不慢;要细心,一丝不苟;

( 4)写报告书时,语言简洁易懂又不失完整,尤其操作过程要正确完整,要

清楚明了。分析结果要正确与实际问题背景相符。

六、说明

(1)书写报告时,有些特殊的数学符号需要利用Mathtype (公式编辑器)这款小软件进行编辑;

(2)有些spss输出表格不整齐,需要导出在Excel中,然后在复制到word文

档里;

( 3) 认真仔细的完成课程设计

课程设计任务书

设计名称:研究货运总量y (万吨)与工业总产值x1 (亿元)、农业总产值

x2(亿元)、居民非商品支出x3 (亿元)的关系

日期:2011年11月13日

(1)设计内容:研究货运总量y (万吨)与工业总产值x1 (亿元)、农业总产值)x3 数据见表如下:

x2(

2)求y关于x1,x2,x3的三元线性回归方程;

(3)对所求的得方程做拟合优度检验;

(4)对回归方程做显著性检验;

(5)对每一个回归系数做显著性检验;

(6)如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验;

(7)求出每一个回归系数的置信水平为95%的置信区间;

8)求标准化方程;

设计目的与要求:

目的:(1)巩固课本上学到的知识,提高处理实际问题的能力;

(2)掌握对多元线性回归问题的模型选择;

(3)对软件输出的结果要学会分析

要求:(1)熟练使用SPSS软件对回归数据进行模型拟合;

(2)认真独立完成

设计环境或器材、原理与说明:

设计环境和器材:计算机,Mini tab软件,课本,笔记

设计原理与说明:

(1)多元回归分析中,检验回归系数是否为0的时候,先用F检验,考虑整体回归系数,再对每个系数是否为零进行t检验

(2)t检验:

原假设:H0: j 0, j 1,2,..., p

A

统计量:t j———

A ( 1 n; 1 n A

其中 ---------- e2j -------------------- (y i yj2为回归标准差

\ n p i i Y n p 1 i i

当原假设H oj:j 0成立时,构造的t j统计量服从自由度为n-p-1的t 分布。给定显著性水平,查出双侧检验的临界值t 2。当t』t 2时拒绝原假设H oj : j

0,认为j显著不为零。自变量X j是对y的线性效果是显著的;当t j t ;时接受原假设H oj:j 0,认为j显著为零。自变量X j是对y的线性效果不显著的

(3)F检验

对线性回归方程显著性的另一种检验是F检验,F检验是根据平方和分解式, 直接从回归效果检验方程的显著性。平方和分解式是

n

(Y i i 1 y)2

nA n

(y i y)2(y i

i 1 i 1

A

y i)2

其中,n

(y i

i 1

y)2称为总平方和,简记为sst 或L yy ,SST表示Sumof Squares

for

Total 。

n A

(y i y)2称为回归平方和,简记为SSR或S回,R表示Regression

i 1

n A

(y i y i)2称为残差平方和,简记为SSE或S残,E表示Error i 1 因此平方和分解式可以简记为SST=SSR+SSE

原假设:H 0 : 1 2... p 0

统计量:F —

SSE/( n p 1)

当原假设H。成立时,构造的F统计量服从自由度为(p,n-p-1 )的F分

布。给定显著性水平。当F值大于临界值F (p, n p 1)时,拒绝原假

设H o,认为回归方程显著。

方差分析表

(4)拟合优度拟合优度用于检验回归方程对样本观测值的拟合优度。在多元线性

回归中,

决定系数为R2-SSR 1 -SSE

SST SST

样本决定系数R2的取值在0,1区间内,R2越近1,表明回归拟合的效果越

好;R2越接近0,表明回归拟合的效果越差。与F检验相比,R2可以清楚直观的反应回归拟合的效果,但是并不能作为严格的显著性检验。

5)复相关系数

称R VR7

\SST

为y关于x1,x2,...,x p的样本复相关系数。。在两个变量的简单相关系数中,相关系数没有正负之分,而复相关系数表示的是因变量y对全体自变量之间的线性关系,它的符号不能由某一个自变量的回归系数的符号来确定,因而复相关系数

都取正号。

6)多重共线性

多元线性回归方程模型中有一个基本假设,就是要求设计矩阵X的秩rank (X)=p+1,即要求X中的列向量之间线性无关,如果存在不全为0的P+1个数

C0,c

1,

…,C p,使得c0 c1x i1 c2x i 2 ■■- C p X jp 0,i 1,2,…,n

则自变量x1,x2,...,x p之间存在着多重共线性。

多重共线性的诊断:(方差扩大因子法)

对自变量做中心标准化,则X X(r ij)为自变量的相关阵。记C (q) (X*X*) 1称其主对角线元素VIF j 5为自变量X j的方差扩大因子(varianee inflation factor ,VIF)。

相关文档
最新文档