机组耗水率影响因素的回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
机组耗水率影响因素的回归分析
摘要
数理统计是具有广泛应用的数学分支,在生产过程和科学实验中,总会遇到多个变量,同一过程中的这些变量往往是相互依赖,相互制约的,也就是说他们之间存在相互关系,这种相互关系可以分为确定性关系和相关关系。变量之间的确定性关系和相关关系在一定条件下是可以相互转换的。本来具有函数关系的变量,当存在试验误差时,其函数关系往往以相关的形式表现出来相关关系虽然是不确定的,却是一种统计关系,在大量的观察下,往往会呈现出一定的规律性,这种函数称为回归函数或回归方程[1]。回归分析是一种处理变量之间相关关系最常用的统计方法,用它可以寻找隐藏在随机后面的统计规律。确定回归方程,检验回归方程的可信度等是回归分析的主要内容。按回归模型类型可划分为线性回归分析和非线性回归分析。
本文运用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。首先收集数据并利用MATLAB软件[2]进行数据处理,作出散点图。分析图发现耗水率与出库流量、库水位有明显的线性关系。在此基础上假设并建立模型。对回归参数做点估计及区间估计,并作出显著性检验,发现显著效果良好,然后利用残差图[3]检验回归效果,发现异常点,进而改进模型,最后利用回归方程做点预测和区间预测。
关键词:相互关系;多元线性回归分析;线性回归方程;显著性检测
目录
1 设计目的 (1)
2 设计原理 (1)
2.1 线性回归方程的建立 (1)
2.2 参数估计 (1)
2.3 回归模型的假设检验 (2)
2.4 回归系数的假设检验和区间估计 (3)
2.5 利用回归模型进行预测 (3)
3 设计题目 (4)
4 实现过程 (4)
4.1 回归方程的确立 (4)
4.2 回归方程显著性检验 (6)
4.3 模型改进 (7)
4.4 回归预测 (8)
5 设计总结 (10)
参考文献 (10)
1 设计目的
为了进一步理解概率论与数理统计的基本概念、理论和方法,基本掌握MATLAB 等具有统计分析功能软件的使用,并具备初步的运用计算机完成数据处理的技能,实现理论与实践的结合。
2 设计原理
2.1 线性回归方程的建立
设Y 是一个可观测的随机变量,受到P(P>0)个非随机变量因素P
X X X ,,21和随机因素ε的影响若Y 与P X X X ,,21有如下线性关系:
()1.1.222110ε
ββββ++++=P P X X X Y
其中p ββββ ,,,210是固定的未知参数,称为回归系数,ε服从()
2,0σN ,Y 称为被解释变量,模型(2.1.1)称为多元线性回归模型[4]。
已知 n 个独立观测数据()m n n i x x y im i i >=,,,1,,,1 应满足下式
()2.1.22211022222211021112211101⎪⎪
⎩⎪⎪⎨
⎧+++++=+++++=+++++=n
np p n n n p p p p x x x y x x x y x x x y εββββεββββεββββ
其中),2,1(n i i =ε相互独立,且设),,2,1)(,0(~2n i N i =σε,记
⎪⎪⎪⎪
⎪
⎭⎫
⎝⎛=n y y y Y 21 ⎪⎪
⎪
⎪⎪⎭
⎫
⎝
⎛=nm n n m m x x x
x x x x x x X 212222********* ⎪⎪⎪⎪⎪
⎭⎫ ⎝⎛=m ββββ 10 ⎪⎪⎪⎪
⎪⎭⎫
⎝⎛=n εεεε 21
2.2 参数估计
对模型中参数m βββ,,,10 ,使用最小二乘法进行估计,即应选取估计值j ∧
β,使当m j j j ,,2,1,0, ==∧
ββ时,误差平方和
()()1.2.21
2
1101
2
∑∑==----==n
i im m i i n i i x x y Q βββε
达到最小。为此,令 ()2.2.2,,2,1,0,0n j Q
j
==∂∂β
整理得
()()()3.2.2,,2,1,020
2111011100
⎪⎪⎩⎪⎪⎨⎧==-----=∂∂=-----=∂∂∑∑==m
j x x x y Q x x y Q
ij
n
i im m i i j
n
i im m i i ββββββββ
整理化为正规方程组的矩阵形式
()4.2.2Y
X X X T T =β
当矩阵 X 列满秩时, X X T 为可逆方阵,上式的解为 ()()5.2.21
Y
X X X T T -∧
=β
将∧
β代回原模型得到 y 的估计值 ()6.2.21m
m x x y ∧
∧∧∧+++=βββ
而这组数据的拟合值为∧
∧
=βX Y ,拟合误差 ∧
-=Y Y e 称为残差,可作为随机误差ε的估计,而残差平方和(或剩余平方和)为
()7.2.22
112∑∑=∧
=⎪
⎭⎫ ⎝
⎛
-==n
i i i n
i i y y e Q
2.3 回归模型的假设检验
检验因变量y 与自变量 m x x x ,,21之间是否存在线性关系。显然,如果所
有的()m j j ,,2,1 =∧
β都很小,y 与 m x x x ,,21的线性关系就不明显,所以可令原假设为
()m j H j ,,2,10:0 ==β
当0H 成立时由回归平方和U 和残差平方和Q 满足
()
()
()1.3.21,~1----=
m n m F m n Q m
U F