第七讲回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

xi2 ( pi2 )
1
2
2.01
4
2
4
2.98
16
3
5
3.50
25
4
8
5.02
64
5
9
5.07
81
5
28
i 1
18.58
190
1 5
5 i1
5.6
3.716
yi2 (Ti2 )
4.04 8.88 12.25 25.20 25.70
76.07
xi yi ( piTi )
4.02 11.92 17.50 40.16 45.63
y=f(x)(近似的表达式)来大体描述这两个变量y、x间变化的相关规 律。这个函数y=f(x)即是y对x的回归方程。
• 2、利用建立的回归方程式,对客观过程进行分析、预测 和控制。
• 回归分析在试验的数据处理、寻找经验公式、因素分析等 方面有着广泛的用途。
2
(三)回归方程的建立

求解回归方程的过程,又称为曲线拟合。
序号 x
y
x2
y2 x y
1
0.05 0.020 0.0025 0.00040 0.0010
2
0.10 0.046 0.010 0.00212 0.0046
3
0.20 0.100 0.040 0.0100 0.0200
4
0.30 0.120 0.090 0.0144 0.0360
5
0.40 0.140 0.160 0.0195 0.0560
数,为使
Q
值达到极小,根据极值原理,只要将上式对
a,b
求偏导数
Q a
,
Q b

并令其等于零,即可求得 a,b 之值,这就是最小二乘法原理。
以此求出 a、b 值,并建立方程 y=a+bx,其中 b 为回归系数,a 为截距。
a y bx b Lxy
Lxx
(截距)

(斜率)

6
(一)一元线性回归的计算步骤
1) 将实验数据列入一元回归计算表
序号 xi
yi
x i2
y
2 i
xi yi
n
xi i 1
平均
/ n xi
n
yi
i 1
yi
n
xi2
i 1
/
n
yi2
i 1
/
n
xi yi
i 1
xi yi / n
式中
x
1 n
n i 1
xi,
y
1 n
n i 1
yi源自文库
Lxx
n i1
xi2
1( n n i1
xi )2
• 确定性关系与相关关系间没有严格界限,它们彼此相互区别又相 互联系,在一定条件下可相互转化。
• 回归分析是研究变量间相关关系的数学方法。
1
(二)回归分析的主要内容
• 1、以观测数据为依据,建立反映变量间相关关系的定量 表达式(回归方程), 并确定关系式的可信度。
• 回归方程——根据两个变量x,y的n对实验数据 (x1,y1),(x2,y2)……(xn,yn),通过回归分析建立一个确定的函数
6
0.50 0.180 0.250 0.0324 0.0900
x = y = x2 y2 xy
1.55 0.606 0.5525 0.0789 0.208
10
Lxy
xy
1 n
x

y
0.208
1 6
1.55
0.606
0.0514
Lxx
x2 1( n
第三节 数据处理 回归分析
(regression analysis)
• 一、概述
• (一)变量中的两种关系
1、确定性关系 即函数关系,指可以唯一地由一个量来确定另一个量。如 V=IR
2、相关关系 指两个或两个以上的变量间,当一个量唯一地确定以后,另一 个量并不唯一确定,但它又不是毫无规律地任意取值,而是按一 定的概率分布取各种可能值。如身高与体重的关系
Lxy
n i1
xi yi
1( n n i1
n
xi )(
i1
yi )
Lyy
n i1
yi2
1( n n i1
yi )2
2)根据公式计算 a、b,得一元线性回归方程 y a bx 。
b Lxy
a y bx
7
Lxx
(二)一元线性回归分析举例
例 1:为研究某合成物的转化率 T 与实验中的压 强 P 的关系,得到如下试验数据。试利用最小二 乘法确定转化率与压强的经验公式。
即采用某一函数的图线去逼近所有的观测数据,
但不是通过所有的点,而是要求拟合误差达到
最小,从而建立一个确定的函数关系。

步骤:
① 作散点图。
② 根据专业知识及经验,判断图线的类型。
③ 确定函数的形式。
④ 确定所选函数形式中的系数。最常见的确 定系数的方法是最小二乘法。
3
(四)几种主要回归分析类型
• 1、一元回归分析(研究一个因素与试 验指标间相关关系的回归分析)
5
所谓最小二乘法,就是要求实验所测得的 n 个数据的绝对误差的平方和达 到最小,即选择适当的 a 与 b 值,使
n
n
Q ( yi yi )2 [ yi (a bxi )]2 最小值
i1
i 1
其中 xi , yi 是已知试验值,故 n 个数据的绝对误差的平方和 Q 为 a 与 b 的函
119.23
Lxx
n i 1
xi2
1 n
n
(
i 1
xi )2
190
1 282 5
33.2
Lxy
n i 1
xi yi
1( n n i1
n
xi )(
i 1
yi )
119.23 1 2818.58 15.182 5
b Lxy 15.182 0.4573, a y bx 3.716 0.4573 5.6 1.155 Lxx 33.2
• 2、多元回归分析(研究几个因素与试 验指标间相关关系的回归分析)
• 无论是一元回归分析还是多元回归分析,
都可以分为线性回归和非线性回归两种
形式。
4
二、一元线性回归
一元线性回归就是工程上和科研中常遇到的配直 线的问题,即两个变量 x 和 y 存在一定的线性相关关 系,通过实验取得数据后,用最小二乘法求出系数 a 和 b,并建立起回归方程 yˆi a bxi 。
T ~ P关系式为:1.155 0.4573p
9
例 2:已知某污水测定结果如下表,试求 a 和 b。
污染物浓度 x 0.05 0.10 0.20 0.30 0.40 0.50
(mg/l)
吸光度 y
0.020 0.046 0.100 0.120 0.140 0.180
解:将实验数据列入一元回归计算表,并计算。
P/atm 2
4
5
8
9
T/% 2.01 2.98 3.50 5.02 5.07
解:依题意,试验次数 n=5,T~P 为一元线性 关系。为计算方便,将 T~P 关系表示为 y=a+bx, 其中 x 表示压强 p,y 表示转化率 T。
8
根据最小二乘法原理,列计算表如下:
i
xi ( pi )
yi (Ti )
相关文档
最新文档