机组耗水率影响因素的回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

机组耗水率影响因素的回归分析

摘要

数理统计是具有广泛应用的数学分支,在生产过程和科学实验中,总会遇到多个变量,同一过程中的这些变量往往是相互依赖,相互制约的,也就是说他们之间存在相互关系,这种相互关系可以分为确定性关系和相关关系。变量之间的确定性关系和相关关系在一定条件下是可以相互转换的。本来具有函数关系的变量,当存在试验误差时,其函数关系往往以相关的形式表现出来相关关系虽然是不确定的,却是一种统计关系,在大量的观察下,往往会呈现出一定的规律性,这种函数称为回归函数或回归方程[1]。回归分析是一种处理变量之间相关关系最常用的统计方法,用它可以寻找隐藏在随机后面的统计规律。确定回归方程,检验回归方程的可信度等是回归分析的主要内容。按回归模型类型可划分为线性回归分析和非线性回归分析。

本文运用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。首先收集数据并利用MATLAB软件[2]进行数据处理,作出散点图。分析图发现耗水率与出库流量、库水位有明显的线性关系。在此基础上假设并建立模型。对回归参数做点估计及区间估计,并作出显著性检验,发现显著效果良好,然后利用残差图[3]检验回归效果,发现异常点,进而改进模型,最后利用回归方程做点预测和区间预测。

关键词:相互关系;多元线性回归分析;线性回归方程;显著性检测

目录

1 设计目的 (1)

2 设计原理 (1)

2.1 线性回归方程的建立 (1)

2.2 参数估计 (1)

2.3 回归模型的假设检验 (2)

2.4 回归系数的假设检验和区间估计 (3)

2.5 利用回归模型进行预测 (3)

3 设计题目 (4)

4 实现过程 (4)

4.1 回归方程的确立 (4)

4.2 回归方程显著性检验 (6)

4.3 模型改进 (7)

4.4 回归预测 (8)

5 设计总结 (10)

参考文献 (10)

1 设计目的

为了进一步理解概率论与数理统计的基本概念、理论和方法,基本掌握MATLAB 等具有统计分析功能软件的使用,并具备初步的运用计算机完成数据处理的技能,实现理论与实践的结合。

2 设计原理

2.1 线性回归方程的建立

设Y 是一个可观测的随机变量,受到P(P>0)个非随机变量因素P

X X X ,,21和随机因素ε的影响若Y 与P X X X ,,21有如下线性关系:

()1.1.222110ε

ββββ++++=P P X X X Y

其中p ββββ ,,,210是固定的未知参数,称为回归系数,ε服从()

2,0σN ,Y 称为被解释变量,模型(2.1.1)称为多元线性回归模型[4]。

已知 n 个独立观测数据()m n n i x x y im i i >=,,,1,,,1 应满足下式

()2.1.22211022222211021112211101⎪⎪

⎩⎪⎪⎨

⎧+++++=+++++=+++++=n

np p n n n p p p p x x x y x x x y x x x y εββββεββββεββββ

其中),2,1(n i i =ε相互独立,且设),,2,1)(,0(~2n i N i =σε,记

⎪⎪⎪⎪

⎭⎫

⎝⎛=n y y y Y 21 ⎪⎪

⎪⎪⎭

⎛=nm n n m m x x x

x x x x x x X 212222********* ⎪⎪⎪⎪⎪

⎭⎫ ⎝⎛=m ββββ 10 ⎪⎪⎪⎪

⎪⎭⎫

⎝⎛=n εεεε 21

2.2 参数估计

对模型中参数m βββ,,,10 ,使用最小二乘法进行估计,即应选取估计值j ∧

β,使当m j j j ,,2,1,0, ==∧

ββ时,误差平方和

()()1.2.21

2

1101

2

∑∑==----==n

i im m i i n i i x x y Q βββε

达到最小。为此,令 ()2.2.2,,2,1,0,0n j Q

j

==∂∂β

整理得

()()()3.2.2,,2,1,020

2111011100

⎪⎪⎩⎪⎪⎨⎧==-----=∂∂=-----=∂∂∑∑==m

j x x x y Q x x y Q

ij

n

i im m i i j

n

i im m i i ββββββββ

整理化为正规方程组的矩阵形式

()4.2.2Y

X X X T T =β

当矩阵 X 列满秩时, X X T 为可逆方阵,上式的解为 ()()5.2.21

Y

X X X T T -∧

将∧

β代回原模型得到 y 的估计值 ()6.2.21m

m x x y ∧

∧∧∧+++=βββ

而这组数据的拟合值为∧

=βX Y ,拟合误差 ∧

-=Y Y e 称为残差,可作为随机误差ε的估计,而残差平方和(或剩余平方和)为

()7.2.22

112∑∑=∧

=⎪

⎭⎫ ⎝

-==n

i i i n

i i y y e Q

2.3 回归模型的假设检验

检验因变量y 与自变量 m x x x ,,21之间是否存在线性关系。显然,如果所

有的()m j j ,,2,1 =∧

β都很小,y 与 m x x x ,,21的线性关系就不明显,所以可令原假设为

()m j H j ,,2,10:0 ==β

当0H 成立时由回归平方和U 和残差平方和Q 满足

()

()

()1.3.21,~1----=

m n m F m n Q m

U F

相关文档
最新文档