回归分析课程设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用回归分析
课程设计指导书
一、课程设计的目的
(1)巩固应用回归分析的理论知识,掌握其思想精髓;
(2)运用回归分析研究方法,加强解决实际问题的能力;
( 3)熟练使用spss 软件对数据进行回归分析。
二、设计名称:研究货运总量y (万吨)与工业总产值x1 (亿元)、农业总产值
x2(亿元)、居民非商品支出x3 (亿元)的关系
三、设计要求
(1)正确运用spss软件对数据进行处理
(2)正确分析数据,尝试选择不同的模型拟合数据
( 3)课程设计中,遇到问题要翻阅课本去努力解决问题
(4)要有耐心,对于模型的显著性和回归系数都要进行检验
( 5 )认真并独立完成
四、设计过程
(1)思考课程设计的目的,寻找来源真实的数据
( 2)上网搜集并整理数据资料
( 3)根据数据确定研究对象
( 4)应用统计软件来处理数据信息
( 5 )选择通过各种检验的线性模型
(6)写出相应的实验报告,并对结果进行分析
五、设计细则
( 1 )搜集数据阶段,数据不能过于繁杂,也不能太少;
(2)做课程设计前,认真看书和笔记,及平时的实验报告,掌握丰富的理论;
( 3)有耐心,不紧不慢;要细心,一丝不苟;
( 4)写报告书时,语言简洁易懂又不失完整,尤其操作过程要正确完整,要
清楚明了。分析结果要正确与实际问题背景相符。
六、说明
(1)书写报告时,有些特殊的数学符号需要利用Mathtype (公式编辑器)这款小软件进行编辑;
(2)有些spss输出表格不整齐,需要导出在Excel中,然后在复制到word文
档里;
( 3) 认真仔细的完成课程设计
课程设计任务书
设计名称:研究货运总量y (万吨)与工业总产值x1 (亿元)、农业总产值
x2(亿元)、居民非商品支出x3 (亿元)的关系
日期:2011年11月13日
(1)设计内容:研究货运总量y (万吨)与工业总产值x1 (亿元)、农业总产值)x3 数据见表如下:
x2(
2)求y关于x1,x2,x3的三元线性回归方程;
(3)对所求的得方程做拟合优度检验;
(4)对回归方程做显著性检验;
(5)对每一个回归系数做显著性检验;
(6)如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验;
(7)求出每一个回归系数的置信水平为95%的置信区间;
8)求标准化方程;
设计目的与要求:
目的:(1)巩固课本上学到的知识,提高处理实际问题的能力;
(2)掌握对多元线性回归问题的模型选择;
(3)对软件输出的结果要学会分析
要求:(1)熟练使用SPSS软件对回归数据进行模型拟合;
(2)认真独立完成
设计环境或器材、原理与说明:
设计环境和器材:计算机,Mini tab软件,课本,笔记
设计原理与说明:
(1)多元回归分析中,检验回归系数是否为0的时候,先用F检验,考虑整体回归系数,再对每个系数是否为零进行t检验
(2)t检验:
原假设:H0: j 0, j 1,2,..., p
A
统计量:t j———
A ( 1 n; 1 n A
其中 ---------- e2j -------------------- (y i yj2为回归标准差
\ n p i i Y n p 1 i i
当原假设H oj:j 0成立时,构造的t j统计量服从自由度为n-p-1的t 分布。给定显著性水平,查出双侧检验的临界值t 2。当t』t 2时拒绝原假设H oj : j
0,认为j显著不为零。自变量X j是对y的线性效果是显著的;当t j t ;时接受原假设H oj:j 0,认为j显著为零。自变量X j是对y的线性效果不显著的
(3)F检验
对线性回归方程显著性的另一种检验是F检验,F检验是根据平方和分解式, 直接从回归效果检验方程的显著性。平方和分解式是
n
(Y i i 1 y)2
nA n
(y i y)2(y i
i 1 i 1
A
y i)2
其中,n
(y i
i 1
y)2称为总平方和,简记为sst 或L yy ,SST表示Sumof Squares
for
Total 。
n A
(y i y)2称为回归平方和,简记为SSR或S回,R表示Regression
i 1
n A
(y i y i)2称为残差平方和,简记为SSE或S残,E表示Error i 1 因此平方和分解式可以简记为SST=SSR+SSE
原假设:H 0 : 1 2... p 0
统计量:F —
SSE/( n p 1)
当原假设H。成立时,构造的F统计量服从自由度为(p,n-p-1 )的F分
布。给定显著性水平。当F值大于临界值F (p, n p 1)时,拒绝原假
设H o,认为回归方程显著。
方差分析表
(4)拟合优度拟合优度用于检验回归方程对样本观测值的拟合优度。在多元线性
回归中,
决定系数为R2-SSR 1 -SSE
SST SST
样本决定系数R2的取值在0,1区间内,R2越近1,表明回归拟合的效果越
好;R2越接近0,表明回归拟合的效果越差。与F检验相比,R2可以清楚直观的反应回归拟合的效果,但是并不能作为严格的显著性检验。
5)复相关系数
称R VR7
\SST
为y关于x1,x2,...,x p的样本复相关系数。。在两个变量的简单相关系数中,相关系数没有正负之分,而复相关系数表示的是因变量y对全体自变量之间的线性关系,它的符号不能由某一个自变量的回归系数的符号来确定,因而复相关系数
都取正号。
6)多重共线性
多元线性回归方程模型中有一个基本假设,就是要求设计矩阵X的秩rank (X)=p+1,即要求X中的列向量之间线性无关,如果存在不全为0的P+1个数
C0,c
1,
…,C p,使得c0 c1x i1 c2x i 2 ■■- C p X jp 0,i 1,2,…,n
则自变量x1,x2,...,x p之间存在着多重共线性。
多重共线性的诊断:(方差扩大因子法)
对自变量做中心标准化,则X X(r ij)为自变量的相关阵。记C (q) (X*X*) 1称其主对角线元素VIF j 5为自变量X j的方差扩大因子(varianee inflation factor ,VIF)。