最小二乘法线性拟合
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y = a + bx
(2-6-1)
要根据测量数据求出最佳的a和b。对满足线性关系的一组等精度测量数据(xi,yi) , 假定自变量xi的误差可以忽略,则在同一xi下,测量点yi和直线上的点a+bxi的偏差di如下:
d1 = y1 − a − bx1 d 2 = y 2 − a − bx 2
M d n = y n − a − bx n
– 26 –
Ⅱ 基本概念与数据处理
4.最小二乘法线性拟合
我们知道,用作图法求出直线的斜率 a 和截据 b,可以确定这条直线所对应的经验 公式,但用作图法拟合直线时,由于作图连线有较大的随意性,尤其在测量数据比较分 散时,对同一组测量数据,不同的人去处理,所得结果有差异,因此是一种粗略的数据 处理方法, 求出的 a 和 b 误差较大。 用最小二乘法拟合直线处理数据时,任何人去处理同 一组数据,只要处理过程没有错误,得到的斜率 a 和截据 b 是唯一的。 最小二乘法就是将一组符合 Y=a+bX 关系的测量数据,用计算的方法求出最佳的 a 和 b。显然,关键是如何求出最佳的 a 和 b。 (1) 求回归直线 设直线方程的表达式为:
n
n
2
n −1
因为
x=
1 n ∑ xi n i =1
Ⅱ 基本概念与数据处理
– 31 –
所以
s=
∑x
i =1
n
2 i
−
(∑ xi ) 2
i =1
n
n
n −1
(只有为xi单变量)
② 操作步骤和方法 (ⅰ) 按[MODE][0]键,计算器进入单变量统计计算状态。屏右上角显示“STAT1” 指示符。 (ⅱ) 清除内存数据:按[INV][ON/C.CE]键。 (ⅲ) 数据输入:依次先键入数值,然后按[DATA]键,每完成一次输入的同时,屏 幕均会显示数据的个数 n 值。 (ⅳ) 数据修正:按[DATA]键之前,要删除错误数据,按[ON/C.CE];按[DATA]键后 要删除错误数据,再次输入该错误值,然后按[INV][DEL]。 (ⅴ) 取分析结果: [INV][ x ]:平均值 [INV][ [INV][
y = R2
x =U
b=
Rs K i R1 d
a = − Rg
数据处理如表 2-6-3: 表 2-6-3
i 1 2
Rs=0.100Ω
3 4
R1=4350.0Ω
5 6 7
d=40.0mm
8 平均值
R2(Ω) U(V)
400.0 2.82 16.00 7.95 11.3
350.0 2.49 12.25 6.20 8.72
1
2
σy
(2-6-9)
σb =
n n∑ x − ( ∑ xi )
i =1 2 i i =1 n n 2
σy =
n( x 2 − x )
2
σy
(2-6-10)
(3)相关系数 相关系数是衡量一组测量数据xi、yi线性相关程度的参量,其定义为:
r=
2
xy − x y ( x − x )( y − y )
2 2 2
i =1 i =1
n
n
(2-6-3)
∑x y
i =1 i
n
i
− a ∑ xi − b∑ xi = 0
2 i =1 i =1
n
n
(2-6-4)
引入平均值: x =
1 n ∑ xi ; n i =1 1 n 2 ∑ xi ; n i =1
y=
1 n ∑ yi ; n i =1
x2 =
则:
xy =
1 n ∑ xi y i n i =1
225.0 1.67125 6.375 3.34625 4.615625
R
2 4 2 2 (10 Ω )
2 2
U (V ) R2U(10 ΩV)
2
中间过程可多取位:
x =1.67125
相关系数
y =225.0
x 2 =3.34625 xy − x y
y 2 =6.375×104
xy =461.5625
ΔK i σ b = =0.81%; K b
σ b =1.257626418
ΔK =0.03×10 A/mm
-9
Rg=(33±2)Ω
ΔR g Rg
-9
=6.1%
电流常数: 回归方程:
K =(3.72±0.03)×10 A/mm R2=155U-33
ΔK i =0.81% K
5.计算器在数据处理中的应用
– 30 –
Ⅱ 基本概念与数据处理
Rs = b =154.6192304 K i Ri d
Ki= 计算标准差为:
Rs -9 =3.7170×10 A/mm bRi d
σ y =2.64561902;
计算不确定度: ΔRg= σ a =2Ω; 测量结果表达式 电流计内阻:
σ a =2.300545589;
n
② 操作步骤和方法: (ⅰ) 按[MODE][.],计算器进入双变量统计计算状态。屏幕右上角显示“STAT2” 指示符。 (ⅱ) 清除内存数据:按[INV][ON/C.CE]键 (ⅲ) 双变量数据输入:先键入 x 的值、 按[a]键, 然后键入 y 的值、 按[b]键, 再按[DATA]键,完成输入。屏幕会同时显示数据的个数,即 n 值。 (ⅳ) 数据修正:同单变量数据输入。 (ⅴ) 取分析结果 [INV][a]:回归直线的截距 [INV][b]:回归直线的斜率
显然最好测量点都在直线上(即d1=d2=……=dn=0) ,求出的a和b是最理想的,但测量 点不可能都在直线上,这样只有考虑d1、d2、……、dn为最小,也就是考虑d1+d2+……+dn 为最小,但因d1、d2、……、dn有正有负,加起来可能相互抵消,因此不可取;而|d1|+ 2 2 2 |d2|+……+ |dn|又不好解方程,因而不可行。现在采取一种等效方法:当d1 +d2 +……+dn 2 2 2 对a和b为最小时,d1、d2、……、dn也为最小。取(d1 +d2 +……+dn )为最小值,求a和b 的方法叫最小二乘法。 令
r=
2
( x − x )( y − y )
2
2
2
= 0.998
查表得知,当n=8 时,r0=0.834,两者比较r>r0,说明x、y(即U、R2)之间线性相关, 可以求回归直线。 求回归方程的系数
b=
xy − x y x2 − x
2
=154.6192304
a = y − bx =-33.4
代换
R g = − a =33.4Ω
在进行一元线性回归之前应先求出 r 值,再与 r 0 比较,若|r|> r 0 ,则 x 和 y 具有 线性关系,可求回归直线;否则反之。
Ⅱ 基本概念与数据处理
– 29 –
例 9:灵敏电流计的电流常数Ki和内阻Rg的测量公式为 R2 =
Rs U − R g 测得的 K i R1 d
数据同例 7,其中间处理过程如下,试用最小二乘法求出Ki和Rg,并写出回归方程的表达 式。 解:测量公式与线性方程表达式 y=a+bx 比较:
y − a − bx = 0
xy − a x − b x 2 = 0
(2-6-5) (2-6-6)
解得:
a = y − bx b= xy − x y x2 − x
2
(2-6-7)
来自百度文库
将 a、b 值带入线性方程 y = a + bx ,即得到回归直线方程。 (2) y、a、b 的标准差 在最小二乘法中,假定自变量误差可以忽略不计,是为了方便推导回归方程。操作 中函数的误差大于自变量的误差即可认为满足假定。实际上两者均是变量,都有误差, 从而导致结果 y、a、b 的标准差(n≥6)如下:
∑ x ]:数据和 ∑ x ]: 数据平方和
2
[INV][S]:测量列的标准偏差 [INV][n]:数据个数 例 10:一组等精度测量值为:83.1、83.3、83.3、83.7、83.9、83.6、83.4、83.4、 83.1、83.2,试求 x 、 解: 按 键 显 ST1 n n n n n n n 示 0 0 1 2 3 4 5 6 7 [MODE][0] [INV][ON/C.CE] 83.1[DATA] 83.3[DATA] 83.3[DATA] 83.7[DATA] 83.9[DATA] 83.6[DATA] 83.4[DATA]
Ⅱ 基本概念与数据处理
– 27 –
再求二阶偏导数为:
∂2D = 2n ; ∂a 2
显然:
n ∂2D = 2 xi2 ∑ 2 ∂b i =1 n ∂2D = 2 xi2 ≥ 0 ∑ 2 ∂b i =1
∂2D = 2n ≥ 0 ; ∂a 2
满足最小值条件,令一阶偏导数为零:
∑ yi − na − b∑ xi = 0
在处理数据时,不同的计算器的编程方式各不相同,下面以震旦 AURORA SC180 型 计算器为例作以介绍。 (1)计算标准偏差 S ① 标准偏差 S 的计算器运行公式:
s=
1 ( xi − x) 2 = ∑ n − 1 i =1
n
∑x
i =1
n
2 i
− 2 x ∑ xi + ∑ x
i =1 i =1
注:当 n≥6 时,认为 σ =S 。 (2)最小二乘法求回归直线 ① 求回归直线参量 a、b、r 的计算器运行公式 由(2-6-6)、(2-6-7)、(2-6-11)式得到以下只含xi、yi两个变量的公式:
a=
n
∑ y i − b∑ xi
i =1 i =1
n
n
n
n n
b=
∑ xi ∑ y i − n ∑ xi y i
i =1 i =1
(∑ xi ) 2 − n∑ xi2
i =1 i =1
n
i =1 n
r=
n∑ xi y i − ∑ xi ∑ y i
i =1 i =1 i =1
n
n
n
[n∑ xi2 − (∑ xi ) 2 ][n∑ y i2 − (∑ y i ) 2 ]
i =1 i =1 i =1 i =1
n
n
n
Ⅱ 基本概念与数据处理
– 33 –
[INV][r]:相关系数 还可以取以下值: [INV][ x ]、[INV][ y ]、[INV][Σx]、[INV][Σx ]、[INV][Σy]、[INV][Σy ]、
2 2
[INV][Σxy], 以便计算 σ y 、 σ a 、 σ b (计算器没有该三项的计算程序)。 例 11: 灵敏电流计实验所测数据如下: RS=0.100Ω R1=4350.0Ω R2(Ω) U(V) 400.0 2.82 350.0 2.49 300.0 2.15 250.0 1.82 d=40.0mm 200.0 1.51 150.0 1.18 100.0 0.84 50.0 0.56
(2-6-11)
r值在 0<|r|≤1 中。 |r|越接近于 1,x 、y
之间线性好;r为正,直线斜率为正,
称为正相关;r为负,直线斜率为负,称为负相关。|r|接近于 0,则测量数据点分散或 xi、yi之间为非线性。不论测量数据好坏都能求出a和b,所以我们必须有一种判断测量 数据好坏的方法,用来判断什么样的测量数据不宜拟合,判断的方法是|r|<r 0 时,测量 数据是非线性的.r 0 称为相关系数的起码值,与测量次数n有关,如下表 2-6-2 表 2-6-2 n 3 4 5 6 7 8 r0 1.000 0.990 0.959 0.917 0.874 0.834 n 9 10 11 12 13 14 相关系数起码值 r 0 r0 0.798 0.765 0.735 0.708 0.684 0.661 n 15 16 17 18 19 20 r0 0.641 0.623 0.606 0.590 0.575 0.561
– 28 –
Ⅱ 基本概念与数据处理
σy =
∑ d i2
i =1
n
n−2
n
=
∑(y
i =1
n
i
− bxi − a) 2 n−2
(2-6-8)
(根式的分母为 n-2,是因为有两个变量)
σa =
∑x
i =1 n i =1 2 i
2 i n 2
n∑ x − (∑ xi )
i =1
σy =
x2 n( x 2 − x )
D = ∑ d i2 = D = ∑ d i2 = ∑ [ y i − a − bi ] 2
i =1
i =1 i =1
n
n
n
(2-6-2)
D 对 a 和 b 分别求一阶偏导数为:
n n ∂D = −2[∑ yi − na − b ∑ xi ] ∂a i =1 i =1 n n n ∂D 2 = −2[∑ xi y i − a ∑ xi − b ∑ xi ] ∂b i =1 i =1 i =1
∑ x 、 ∑ x 、S、n 。
2
– 32 –
Ⅱ 基本概念与数据处理
83.4[DATA] 83.1[DATA] 83.2[DATA] [INV][ x ]
n n n 83.4 834 69556.22
8 9 10
∑x] [INV][ ∑ x ]
[INV][
2
[INV][S] [INV][n]
0.262466929 10
300.0 2.15 9.000 4.62 6.45
250.0 1.82 6.250 3.31 4.55
200.0 1.51 4.000 2.28 3.02
150.0 1.18 2.250 1.39 1.77
100.0 0.84 1.000 0.71 0.84
50.0 0.56 0.250 0.31 0.28