误差理论与数据处理-第八章 回归分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 N
N i 1
xi
N i 1
yi
42.03240
hxx
1 d12
hxx
42
hyy
1 d22
hyy
0.4206483
hxy
1 d1d2
hxy
4.203240
5.计算 b、b0
b
hxy hxx
0.100077
; b0
y
bx
0.00017
j1 i1
(8-24) (8-25) (8-26) (8-27)
显著性检验的步骤:
误差理论
与数据处理
首先用误差平方和 QE 对失拟平方和 QL 进
行F1 检验,作变量
F1
QL QE
vQL vQE
1.F1 F vQL, vQE 的情况
此时认为检验结果显著,失拟误差相对于
测量误差不能忽略。分为以下几种情况:
yˆ b0 bxi 对均值 y 的偏离情况,即 y 随 x 变化 产生的线性变化在总的离差平方和中所起的作
用。Q 称为剩余平方和,反映测量值 y1, y2, , yN
对回归直线的偏离情况,即其他因素引起的 y
的变化在总的离差平方和中所起的作用。
1.回归方程的方差分析(Ⅱ)
误差理论
与数据处理
(1)影响y的因素除x外,至少还有一个不能忽
数c或乘(除)一个常数d。
设 xi 为原始数据,xi为变换后的数据,令
xi d1xi c1, yi d2yi c2
则有
xi
c1
xi d1
,
yi
c2
yi d2
;
x
c1
x d1
,
y
c2
y d2
代入(8-11)、(8-12)、(8-13),有
N
xi yi y xi
i 1 N
i 1 N
xi2 x xi
i 1
xi x yi y
N
xi x 2
hxy hxx
i 1
i 1
i 1
式中,hxy
N i 1
xi
x yi
y
N i 1
xi yi
1 N
N i 1
xi
4.计算 hxx, hyy, hxy
hxx
N i 1
xi2
1 N
N i 1
xi2
42
例8-2(Ⅱ):
误差理论
与数据处理
hyy
N i 1
yi2
1 N
N i 1
2
yi
42.06483
hxy
N i 1
xiyi
i 1
又因为
N
S yi yi 2 hyy
所以
i 1
Q S U hyy bhxy
(8-17)
设 S、U、Q的自由度分别为 vS、vU、vQ ,有
如下关系
vS vU vQ
(8-18)
其中 vS N 1; vU 1; vQ vS vN N 2
1.变量之间大体呈线性关系,设它们满足一元
线性回归方程 yˆ b0 bx
令
xi x(i 即c1 0, d1 1); yi 10 y(i 即c2 0, d2 10)
2.分别计算xi、yi、xi2、yi2、xiyi 的值,填入表8-1中。
3.对个列数据分别求和,列入表8-1的最后一行。
N i 1
yi
(8-11)
N
hxx
i1
xi
x
2
N i1
xi2
1 N
N i1
xi
2
N
hyy
i1
yi
y
2
N i1
yi2
1 N
N i1
2
yi
(8-12) (8-13)
一元线性回归方程的求法(Ⅳ)
表示,记为
N
S yi y2
(8-14)
i 1
N
yi yˆi yˆi y2
i 1
N
N
N
yi yˆi 2 2 yi yˆi yˆi y yˆi y2
i 1
i 1
i 1
1.回归方程的方差分析(Ⅰ)
N0, ,且相互独立,则用最小二乘法估计参
数0, ,设估计量分别为 b0 , b ,那么可得一元 线性回归方程
yˆ b0 bx
式中,b0,b 为常数和回归系数。
(8-2)
一元线性回归方程的求法(Ⅱ)
误差理论
与数据处理
某一观测值 yi 与回归值 yˆi 之差用 vi 表示
vi yi yˆi yi b0 bxi i 1,2, , N
F 0.05 1, N 2 F F 0.01 1, N 2
可认为回归效果是显著的,称为在0.05水平上 显著,即可信赖程度在95%和99%之间;如果
F F 0.10 1, N 2
可认为回归效果不显著,此时y对x的线性关系 不密切。
3.生于方差与剩余标准差
3.61106
例8-3(Ⅱ):
误差理论
与数据处理
(3)根据 vU、vQ 查表
v1 vU 1, v2 vQ 6
在 0.01级表中查得
(4)判别
F 0.01 1,6 13.74
F 3.61106 F 0.01 1,6 13.74
故回归效果高度显著。
先把数据点标在坐标纸上,如图8-1所示, 称为散点图。从散点图上可看出输出电压y与位 移x之间基本呈直线关系。
误差理论
与数据处理
8.1一元线性回归
一、一元线性回归方程的求法
一元线性回归是处理随机变量 和变量 之间线性相关关系的一种方法。
一元线性回归的数学模型为
y 0 x
(8-1)
hxy
i 1
xi x
yi y
1 d1d2
hxy
N
hxx
i 1
xi
x
2
1 d12
hxx
N
hyy
i 1
yi
y
2
1 d22
hxx
例8-2(Ⅰ):
误差理论
与数据处理
用例8-1中大量程式位移传感器的实测数据,
求出输出电压 yi与位移 xi 之间的关系。 解:具体步骤入下
1.回归方程的方差分析(Ⅲ)
误差理论
与数据处理
用S、U、Q 分别除以各自的自由度vS、vU、vQ ,
得
ES2 EU2 EQ2
S
vS U
vU Q
vQ
(8-19)
式中,ES2 可看作各种因素对离差影响的平均效
应;EU2 可看作是自变量的变化对离差影响的平
均效应;EQ2 可看作是其他因素对离差影响的平 均效应。
2.回归方程的显著性检验
误差理论
与数据处理
为定量说明 y 与 x 的线性密切程度,通常
用F检验法,即计算统计量
F
U Q
vU vQ
对一元线性回归,有
F
Q
U N
1
2
计算和检验步骤:
(8-20) (8-21)
(1)由式(8-21)计算出F值。
(2)根据给定的显著性水平 a 1 P,从F分布表
Q QE QL
用误差平方和QE 对失拟平方和QL 进行F检验, 既可以确定回归方程拟合的好坏。
误差理论
与数据处理
各平方和及其相应自由度的 相互关系和计算
设取N个测量点,每个测量点进行重复测
量m次,有 计算式如下
S U QL QE vS vU vQL vQE
(8-22) (8-23)
m N
S
yij y 2, vS Nm 1
j1 i1
N
U m yˆi y2, vU 1 i 1
N
QL m yi yˆi 2, vQL N 2 i 1
m N
QE
yij yi 2, vQE Nm 1
它表示某一点xi, yi 与回归直线的偏离程度。
记
N
N
2N
2
Q vi2 yi yˆi yi b0 bxi
(8-3)
i1
i1
i1
Q 值的大小反映全部观测值与回归直线的偏
离程度,应使 Q 最小。根据最小二乘原理,有
Q
b0
N
2
i 1
解:具体步骤如下 (1)利用 hxy、hxx、hyy、b 求U、Q、S ,则有
S hyy 0.4206483 U bhxy 0.4206476 Q hyy bhxy 0.0000007
(2)计算 vU、vQ、F
vU 1, vQ 8 2 6
F
Q
U1
N 2
(5)求剩余标准差
sQ
Q N 2
0.0000007 6
0.000342
四、利用重复测量数据检验回归
误差理论
方程拟合质量
与数据处理
实际上,剩余平方和 Q 中还包含着x对y的 非线性影响,以及此外那些未加控制的因素的 影响。通过重复测量的方法,把Q 分解为误差 平方和QE 及失拟平方和QL 。QE 反映测量误差的 影响在剩余平方和中所占的比重;QL 反映x对y 的非线性影响和其他因素对y的影响。三者关 系为
yi
b0
bxi
0
Q
b
2
N i 1
yi
b0
bxi
xi
0
(8-4) (8-5)
一元线性回归方程的求法(Ⅲ)
误差理论
与数据处理
由以上两式,经推导整理可得
N
yi
b0
i 1
N
b y bx
N
N
N
b
6.列回归方程 yˆ b0 bx 0.000177 0.100077 x
三、回归方程的方差分析和显著性检
误差理论
验
与数据处理
1.回归方程的方差分析
N个观测值之间的差异(称离差),由两
个因素引起:一是由变量之间的线性依赖关系 引起;二是由其他因素引起。
测量值之间的变化程度可用总离差平方和
误差理论
与数据处理
把 yˆi b0 bxi; yi b0 bx 代入中间项,可推出
N
2yi yˆi yˆi y 0
i 1
则令
N
N
U yˆi y2,Q yi yˆi 2
有
i 1
i 1
S U Q
其中,U 称为回归平方和,反映回归直线
误差理论
与数据处理
剩余方差定义为
sQ2
Q N
2
1 N 2
N i 1
yi
yˆi 2
剩余标准差定义为
sQ
Q N 2
它表明在单次测量中,由线性因素以外的其他 因素引起的y的变化程度。sQ 越小,回归直线的 精度越高。
例8-3(Ⅰ):
误差理论
与数据处理
试对例8-2中求出的回归方程进行显著性检验。
误差理论
与数据处理
至此,可确定一元线性回归方程
yˆ b0 bx
回归直线方程的点斜式
yˆ y bx x
它表明回归直线通过点 x, y ,只须在数 据域任取一点 x0代入回归方程,得到一点x0, yˆ0 ,
则可由这两点绘出回归直线。
二、数据变换及处理
误差理论
与数据处理
常用的变换方法是把数据加(减)一个常
误差理论
与数据处理
第八章 回归分析
回归分析就是通过对一定数量的观测数据
进行统计处理,以找出变量间相互依赖的统计 规律。
例8-1:
误差理论
与数据处理
为获得某大量程电容式位移传感器的输入输出 关系,测的一组实验数据如下
位移x/mm 0
1
2
3
4
5
6
7
输出电压
y/V
0
0.09 0.19 0.299 0.40 0.500 0.60 0.70 989 983 94 008 25 036 039
中查取临界值Fa1, N 2 。
(3)比较计算得到的F值和查得的 Fa 值。若
F Fa1, N 2则回归效果显著,否则效果不显著。
显著性水平等级:
误差理论
与数据处理
通常可分为以下几级:如果
F F 0.01 1, N 2
可认为回归效果高度显著,称为在0.01水平上 显著,即可信赖程度为99%以上;如果
回归平方和 U 相对剩余平方和Q 的大小反
映了回归效果的好坏。为便于计算,可将U如
下形式
N
N
U yˆi y2 b0 bxi bo bx2
i 1
i 1
N
N
b2 xi x2 bxi xyi y bhxy (8-16)
i 1
式中,0, ——待定常数和系数; ——测量的随机误差。
一元线性回归方程的求法(Ⅰ)
误差理论
与数据处理
当 x 的值为 x1, x2 , , xN时,相应有
y1 0 x1 1
y2 yN
0 x2
0 xN
2 N
设测量误差 1,2, , N 服从同ቤተ መጻሕፍቲ ባይዱ正态分布