数理统计大作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究生课程考核试卷
(适用于课程论文、提交报告)
科目:数理统计教师:
姓名:学号:
专业:机械工程类别:学术
上课时间:2015年3月至2015年5月
考生成绩:
卷面成绩平时成绩课程综合成绩阅卷评语:
阅卷教师(签名)
货运总量与工业总产值、农业总产值和居民非商品支出之间多
元线性回归分析
摘要:随着社会的发展,货运总量、工业总产值、农业总产值和居民非商品支出也大幅增加。研究货运总量与工业总产值、农业总产值和居民非商品支出之间的关系从而对货运总量做出初步估计也变得更为重要。借助于数理统计的知识,在实际的数据的基础上,对它们之间进行一个简单的多元线性回归分析。在建立起模型之后,通过显著性检验方法进行检验,以检查结果的正确性。最后并将其用于指导实际工作。
关键词:货运总量;工业总产值;农业总产值;居民非商品支出;多元线性回归分析
一、问题提出及分析
随着我国经济的快速发展,货运总量、工业总产值、农业总产值和居民非商品支出大幅增加。为了研究货运总量、工业总产值、农业总产值和居民非商品支出之间的关系,来估算货运总量,从而能够更好地对各地进行资源配置,如运输工具等,提高利用率,减少不必要的支出。从而本文对货运总量、工业总产值、农业总产值和居民非商品支出之间进行了多元线性回归分析。建立其数学模型,以指导实际工作。
二、数据描述
为研究运总量与工业总产值、农业总产值和居民非商品支出之间的关系,选取了十个地区的相关数据,如表1所示。
(数据来源于《数理统计》,钟波等,高等教育出版社)
三、模型建立
(1)提出假设条件,理清概念,引进参数
假设工业总产值X1、农业总产值X2和居民非商品支出X3为自变量,货运总量Y 为因变量。
为确定三个自变量与因变量是否存在线性关系,故画出三个自变量分别与因变量Y 之间的散点图,分别为图1-图3。
图1 X1与Y 的数据散点图
图2 X2与Y 的数据散点图
图3 X3与Y 的数据散点图
由图1-图3可以看出,X1、X2、X3与Y
基本呈现线性关系,因此,建立三元线
性回归模型:
由线性回归模型可知,若i β越大,y 随i x 的变化趋势就越明显;反之,若
i β越小,y 随i x 的变化就越不明显。特别是,当βi =0时,则表明i x 无论如何变化,y 的值都不受影响,因而y 与i x 之间不存在线性相关关系。当i β≠0时,则认为y 与i x 之间有线性相关关系。于是,问题归结为对统计假设
0H :3,2,
10==,i i β 的检验。若拒绝H 0,就认为y 与i x 之间有线性相关关系,所求的样本回归直线有意义;若接受H 0,则认为y 与i x 之间不存在线性相关关系,它们之间可能存在明显的非线性相关关系,也可能根本就不相关,所求的样本回归直线无意义。
(2)模型构建
类似于一元线性回归模型,用最小二乘法估计多元线性回归模型的参数。假
设T m )ˆ,ˆ,ˆ(ˆ10ββββ
=是T m ),,(10ββββ =的估计,称 m m x x y βββ
ˆˆˆˆ110+++= 为经验线性回归方程。将),,,(21im i i X X X ,( i=1,2, ,n) 代入上式,所得值记为
im m i i x x y βββˆˆˆˆ110+++= 。记)ˆ,,ˆ(ˆ1m y y Y =,则
β
ˆˆX Y = 因此,残差平方和:
()()∑∑==----=
-=n
i im
m i i
n
i i i
x x y
y y Q 1
2
1101
2
ˆˆˆˆ)ˆ(ββββ
βββ
βˆˆˆ2ˆ2
X X X Y Y Y X Y T T T T +-=-= β的最小二乘估计就是残差平方和达到最小的β
ˆ。可以验证βˆ是下列方程组的解 0)ˆ(ˆ=∂∂β
β
Q 该方程又可以简化为正则方程组
⎪⎩
⎪⎨⎧=≠===++++=....,2,1,,,0),(, (2)
1),,0(~,...2,1,2
3322110n j i j i Cov n i N n i x x x y j i i i i i i i εεσεεββββ
β
ˆX X Y X T T = 在矩阵列X 满秩的条件下,可得到上方程组的解,其中
即β的最小二乘估计
Y X X X T T 1)(ˆ-=β
Y X X X X X Y T T 1)(ˆˆ-==β
(3)模型求解
因为
T Y = (160 260 210 265 240 220 275 160 275 250)
故Y X X X T T 1)(ˆ-=β⎪⎪⎪
⎪⎪
⎭
⎫ ⎝⎛=12.4475 7.1007 3.7540 348.2802- 所以,Y 对自变量X1、X2、X3之间的线性回归方程为:
32145.121.775.328.348ˆx x x y +++-=
四、计算方法设计和计算机实现
将数据以以下形式输入到excel 表格。
货运总量
y (万吨) 工业总产值x1(亿
元) 农业总产值x2(亿元)
居民非商品支出x3(亿元)
160 70 35 1 260
75 40
2.4
⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎭
⎫
⎝⎛= 3.0000 42.0000 65.0000 1.0000 3.2000 44.0000 70.0000 1.0000 2.0000 36.0000 66.0000 1.0000 4.0000 42.0000 78.0000 1.0000 1.5000 45.0000 68.0000 1.0000 1.2000 38.0000 72.0000 1.0000 3.0000 42.0000 74.0000 1.0000 2.0000 40.0000 65.0000 1.0000 2.4000 40.0000 75.0000 1.0000 1.0000 35.0000 70.0000 1.0000 X