数理统计----线性回归
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究生课程考核试卷
(适用于课程论文、提交报告)
科目:数理统计教师:
姓名:学号:
专业:类别:
上课时间:
考生成绩:
阅卷评语:
阅卷教师(签名)
重庆大学研究生院制
办公楼类建筑采暖锅炉容量与采暖面积的线性关系分析
摘要:我国是能源消耗大国,在燃料消耗领域,燃煤占有相当大的比重,尤其东北及西北地区燃煤消耗尤为严重,主要消耗方式则是冬季的锅炉采暖。如何根据采暖面积,合理选择燃煤锅炉容量,对于节约能源,提高能源利用率,具有重要意义。本文借助于数理统计的知识,在实际的数据的基础上,对两者之间进行一个简单的一元线性回归分析。在建立起模型之后,通过显著性检验方法进行检验,以检查结果的正确性。并通过模型对办公楼类建筑采暖锅炉的容量作出一个大致的预测,同时对相关结论进行分析,以指导实际工作。
关键词:办公楼;建筑面积;锅炉容量
一、问题提出及分析
锅炉是一种能量转换设备,向锅炉输入的能量有燃料中的化学能、电能、高温烟气的热能等形式,而经过锅炉转换,向外输出具有一定热能的蒸汽、高温水或有机热载体。锅炉中产生的热水或蒸汽可直接为工业生产和人民生活提供所需热能。
对于采暖地区的而言,每年漫长的采暖期都要依靠采暖设备供热维持建筑物内环境温度。大部分地区主要以燃煤供热锅炉为热源,这种供热模式在短期内不会改变。随着城市的发展,供热面积不断增加,耗煤量也逐年提高。近年来由于煤炭价格不断攀升,冬季燃煤采暖的经济压力已成为了影响供热质量及供热企业经济效益的主要问题。在积极贯彻落实国家节能减排政策的形势下,如何在保证供热质量的前提下采取行之有效的措施降低采暖煤耗,已成为迫切希望解决的问题。那么,现行燃煤供热锅炉容量与建筑面积的关系如何,能否通过建筑面积对锅炉容量进行预测?
带着这样的问题,利用现行数据,借助统计学与软件的分析,采用散点图的描绘,可以看到办公楼建筑面积与采暖锅炉容量可能存在一定的线性关系,由此借助数理统计知识,通过一元线性回归的相关知识对该问题进行分析。
二、数据描述
为了研究办公楼建筑面积和采暖锅炉容量的关系,选取建设部工程总结的相关数据,如表1所示:
采暖锅炉容量总结表
三、模型建立
(1)提出假设条件,理清概念,引进参数
假设办公楼总面积为自变量X ,锅炉容量为因变量Y 。且(x i ,y i )(i=1,2,…,8)为取得的一组试验数据,满足如下一元线性回归模型:
⎪⎩
⎪⎨⎧=≠===++=....,2,1,,,0),(, (2)
1),,0(~,...2,1,2
10n j i j i Cov n i N n i x y j i i i i i εεσεεββ
由线性回归模型可知,若1β越大,Y 随X 的变化趋势就越明显;反之,若1
β越小,Y 随X 的变化就越不明显。特别是,当β1=0时,则表明无论X 如何变化Y 的值都不受影响,因而Y 与X 之间不存在线性相关关系。当1β≠0时,则认为Y 与X 之间有线性相关关系。于是,问题归结为对统计假设
0H :0011≠=ββ,
的检验。若拒绝H 0,就认为Y 与X 之间有线性相关关系,所求的样本回归直线有意义;若接受H 0,则认为Y 与X 之间不存在线性相关关系,它们之间可能存在明显的非线性相关关系,也可能根本就不相关,所求的样本回归直线无意义。
(2)模型构建
我们想找的回归方程x y 1
0ˆˆˆββ+=是要使观测值),...,2,1)(,(n i y x i i =从整体上比较靠近它。用数学的话来说就是要求观测值i
y 与其拟合值i
i x y
10ˆˆˆββ+=之间的偏差平方和达到最小。
设给定n 个点),...,2,1)(,(n i y x i i =,x y 10ββ+=为一条直线, 记
[]∑=+-=n
i i i E
x y S 12
102
)(ββ
2E
S 就是误差平方和,它反映全部的观测值与直线的偏离程度。因此,2E S 越小,观测值与直线拟合得越好。所谓的最小二乘法就是使2E S 达到最小的一种估计
10,ββ的方法。
如果0
ˆβ
,1
ˆβ满足 21
102
)(min 1
0∑=--=n
i i i E
x y S ββββ,
那么称0ˆβ,1ˆβ分别是0β,1β的最小二乘估计。 下面来求0β、1β的最小二乘估计。
由于2
E S 是10,ββ的一个非负二元函数,故其极小值一定存在,根据微积分的理
论知道只要求2
E S 对10,ββ的一阶偏导数为0,即
⎪⎪⎩
⎪⎪⎨⎧=---=∂∂=---=∂∂∑∑==n
i i i i E n
i i
i E
x x y S x y S 1101
2
1
10020
)ˆˆ(20)ˆˆ(2ββββββ 整理后得
⎪⎪⎩⎪⎪⎨⎧=+=+∑∑∑∑∑=====n
i i i n i i n i i n
i i n i i y x x x y x n 111201
1
110ˆ)(ˆ)(ˆ
)(ˆββββ 解之得
⎪⎪⎪⎩
⎪⎪⎪⎨⎧---=-=∑∑==n i i n i i i x x y y x x x y 12111
0)())((ˆˆβββ 其中∑==n
i i x n x 1
1,∑==n i i y n y 11。
在具体计算时,常记
∑∑∑===-=-=-=n
i i i n i i n i i xx x x x x n x x x l 112
2
12
)()(
∑∑∑===-=-=-=n
i i i n
i i n
i i yy y y y y n y y y l 1
1
2
2
12
)()(
∑∑∑===-=-=--=n
i i i n i i i n
i i i xy y x x y x n y x y y x x l 1
1
1
)())((
这样,0β,1β的最小二乘估计可以表示为
⎪⎩
⎪
⎨⎧=
-=xx xy
l l x y 11
0ˆˆˆβββ 因此,可得到回归方程为
)(ˆˆˆˆ1
1
x x y x y
-+=+=βββ
(3)模型求解