食品实验设计与数据分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十二章 回归设计
12.1 回归设计的基本概念 12.2 一次回归正交设计 12.3 二次回归的中心组合设计 12.4 二次回归正交设计 12.5 二次回归旋转设计
12.1 回归设计的基本概念 回归设计(也称为响应曲面设计) 目的是寻找试验指标与各因子间的定量规律, 考察的因子都是定量的 。
它是在多元线性回归的基础上用主动收集数据的方法获 得具有较好性质的回归方程的一种试验设计方法。
指标的均值,即
E( y) f (z1, z2 ,, z p )
称z (z1, z2 ,, z p ) 的可能取值的空间为因子空间。我们的
任务便是从因子空间中寻找一个点z0
(z10
,
Biblioteka Baidu
z20
,,
z
0 p
)
使E(y)
满足质量要求。
当f的函数形式已知时,可以通过最优化的方法去寻找z0 。
在许多情况下f的形式并不知道,这时常常用一个多项式去
今后称 A X X 为正规方程组的系数矩阵, B X Y 为正规
方程组的常数项向量,C X X 1 为相关矩阵。
在模型(12.1.5)下,有
b ~ N ( , 2 ( X X )1)
若记 C X X 1 (cij ) ,那么
bj ~ N( j ,cjj 2), j 0,1,2,, p
在通常的回归分析中,由于C非对角阵,所以各回归系数间 是相关的:
Cov(bi ,bj ) cij 2
3.对回归方程的显著性检验
对回归方程的显著性检验是指检验如下假设:
HH01::11, 22, ,
p
p 0
不全为0
检验方法是作方差分析。
记 yˆi b0 b1xi1 bp xip,i 1,2,, n 则有平方和分解式
n
n
n
ST ( yi y)2 ( yi yˆi )2 ( yˆi y)2 S E SR
N mi 。此时残差平方和可进一 i 1
步分解为组内平方和与组间平方和,其中组内平方和就是误
差平方和,记为 S e,组间平方和称为失拟平方和,记为 S Lf ,
若记p+1维向量 X Y B (B j ) ,那么
n
S E ( yi yˆi )2 yi2 b0 B0 b1B1 bp Bp
i
i 1
SR ( yˆi y)2 ST SE
4.失拟检验
当在某些点有重复试验数据的话,可以在检验回归方程显
著性之前,先对y 的期望是否是 x1, x2 ,, x p的线性函数进行检
可以假定 y与 z1, z2 ,, z p 间有如下关系:
y f (z1, z2 ,, z p )
这里f (z1, z2 ,, z p ) 是 z1, z2 ,, z p 的一个函数,常称为响应函 数,其图形也称为响应曲面;
是随机误差,通常假定它服从均值为0,方差为 2 的
正态分布。 在上述假定下,f (z1, z2 ,, z p )可以看作为在给定z1, z2 ,, z p 后
本章主要介绍Box的回归设计方法及其应用,并假定读 者已具有多元线性回归分析的基础知识。为了符号上的统 一 ,在12.1.2中列出了回归分析中的主要公式。
12.1.1 多项式回归模型 在一些试验中希望建立指标y与各定量因子z1, z2 ,, z p
(又称变量) 间相关关系的定量表达式,即回归方程, 以便通过该回归方程找出使指标满足要求的各因子的范 围。
i 1
i 1
i 1
其中
SE ( yi yˆi )2 为残差平方和,自由度为 fE n p 1 i SR (yˆi y)2 为回归平方和,自由度为 fR p
当H0为真时,有
F
SR / SE /
fR fE
~ F ( f R , f E ) F ( p, n p 1)
对于给定的显著性水平 ,拒绝域为 F F1 ( p, n p 1) 。
逼近它,即假定:
y 0
jzj
jj
z
2 j
ij zi z j
(7.1.1)
j
j
i j
这里各0 , j , jj , ij , 为未知参数,也称为回归系数,通
常需要通过收集到的数据对它们进行估计。
若用b0 , b j , b jj , bij , 表示相应的估计,则称
y b0
验,这种检验称为失拟检验,它要检验如下假设:
当在
H0: Ey 0 1x1 p x p H1: Ey 0 1x1 p xp (xi1, xi2 ,, xip )上有重复试验或观察时,将数据记为
(xi1 ,
xi2 ,,
xip
,
yij
),j
1,2,, n
mi
,i
1,2,,
n
其中至少有一个 mi 2 ,记
p xip
i,i
1,2,,
n
(7.1.5)
y1
记随机变量的观察向量为
Y
y2
0
yn
未知参数向量为
1
p
1
不可观察的随机误差向量为
2
结构矩阵
1
X
1
x11
x21
x1p x2p
n
1 xn1 xnp
那么上述模型可以表示为:
Y X ~ Nn (0, 2 I n )
bjzj
b
jj
z
2 j
bij zi z j
j
j
i j
为y关于 z1, z2 ,, z p 的多项式回归方程。
在实际中常用的是如下的一次与二次回归方程(也称一阶 与二阶模型):
yˆ b0 bj z j
j
yˆ b0
bjzj
b jj
z
2 j
bij zi z j
j
j
i j
一般p个自变量的d次回归方程的系数个数为
p
d
d
12.1.2 多元线性回归 (12.1.1)是一个多项式回归模型,在对变量作了变换并重新
命名后也可以看成是一个多元线性回归模型。 1.回归模型 设所收集到的n组数据为
(xi1, xi2 ,, xip , yi ), i 1,2,, n
假定回归模型为:
各yi iiid0
~
1xi1 N (0, 2 )
或 Y ~ N n ( X , 2 I n )
2.回归系数的最小二乘估计 估计回归模型中回归系数的方法是最小二乘法。
记回归系数的最小二乘估计(LSE)为 b (b0 ,b1,,bp ), 应满足如下正规方程组:
X Xb X Y
当 X X 1 存在时,最小二乘估计为
b X X 1 X Y
在求得了最小二乘估计后,可以写出回归方程: yˆ b0 b1x1 bp x p
12.1 回归设计的基本概念 12.2 一次回归正交设计 12.3 二次回归的中心组合设计 12.4 二次回归正交设计 12.5 二次回归旋转设计
12.1 回归设计的基本概念 回归设计(也称为响应曲面设计) 目的是寻找试验指标与各因子间的定量规律, 考察的因子都是定量的 。
它是在多元线性回归的基础上用主动收集数据的方法获 得具有较好性质的回归方程的一种试验设计方法。
指标的均值,即
E( y) f (z1, z2 ,, z p )
称z (z1, z2 ,, z p ) 的可能取值的空间为因子空间。我们的
任务便是从因子空间中寻找一个点z0
(z10
,
Biblioteka Baidu
z20
,,
z
0 p
)
使E(y)
满足质量要求。
当f的函数形式已知时,可以通过最优化的方法去寻找z0 。
在许多情况下f的形式并不知道,这时常常用一个多项式去
今后称 A X X 为正规方程组的系数矩阵, B X Y 为正规
方程组的常数项向量,C X X 1 为相关矩阵。
在模型(12.1.5)下,有
b ~ N ( , 2 ( X X )1)
若记 C X X 1 (cij ) ,那么
bj ~ N( j ,cjj 2), j 0,1,2,, p
在通常的回归分析中,由于C非对角阵,所以各回归系数间 是相关的:
Cov(bi ,bj ) cij 2
3.对回归方程的显著性检验
对回归方程的显著性检验是指检验如下假设:
HH01::11, 22, ,
p
p 0
不全为0
检验方法是作方差分析。
记 yˆi b0 b1xi1 bp xip,i 1,2,, n 则有平方和分解式
n
n
n
ST ( yi y)2 ( yi yˆi )2 ( yˆi y)2 S E SR
N mi 。此时残差平方和可进一 i 1
步分解为组内平方和与组间平方和,其中组内平方和就是误
差平方和,记为 S e,组间平方和称为失拟平方和,记为 S Lf ,
若记p+1维向量 X Y B (B j ) ,那么
n
S E ( yi yˆi )2 yi2 b0 B0 b1B1 bp Bp
i
i 1
SR ( yˆi y)2 ST SE
4.失拟检验
当在某些点有重复试验数据的话,可以在检验回归方程显
著性之前,先对y 的期望是否是 x1, x2 ,, x p的线性函数进行检
可以假定 y与 z1, z2 ,, z p 间有如下关系:
y f (z1, z2 ,, z p )
这里f (z1, z2 ,, z p ) 是 z1, z2 ,, z p 的一个函数,常称为响应函 数,其图形也称为响应曲面;
是随机误差,通常假定它服从均值为0,方差为 2 的
正态分布。 在上述假定下,f (z1, z2 ,, z p )可以看作为在给定z1, z2 ,, z p 后
本章主要介绍Box的回归设计方法及其应用,并假定读 者已具有多元线性回归分析的基础知识。为了符号上的统 一 ,在12.1.2中列出了回归分析中的主要公式。
12.1.1 多项式回归模型 在一些试验中希望建立指标y与各定量因子z1, z2 ,, z p
(又称变量) 间相关关系的定量表达式,即回归方程, 以便通过该回归方程找出使指标满足要求的各因子的范 围。
i 1
i 1
i 1
其中
SE ( yi yˆi )2 为残差平方和,自由度为 fE n p 1 i SR (yˆi y)2 为回归平方和,自由度为 fR p
当H0为真时,有
F
SR / SE /
fR fE
~ F ( f R , f E ) F ( p, n p 1)
对于给定的显著性水平 ,拒绝域为 F F1 ( p, n p 1) 。
逼近它,即假定:
y 0
jzj
jj
z
2 j
ij zi z j
(7.1.1)
j
j
i j
这里各0 , j , jj , ij , 为未知参数,也称为回归系数,通
常需要通过收集到的数据对它们进行估计。
若用b0 , b j , b jj , bij , 表示相应的估计,则称
y b0
验,这种检验称为失拟检验,它要检验如下假设:
当在
H0: Ey 0 1x1 p x p H1: Ey 0 1x1 p xp (xi1, xi2 ,, xip )上有重复试验或观察时,将数据记为
(xi1 ,
xi2 ,,
xip
,
yij
),j
1,2,, n
mi
,i
1,2,,
n
其中至少有一个 mi 2 ,记
p xip
i,i
1,2,,
n
(7.1.5)
y1
记随机变量的观察向量为
Y
y2
0
yn
未知参数向量为
1
p
1
不可观察的随机误差向量为
2
结构矩阵
1
X
1
x11
x21
x1p x2p
n
1 xn1 xnp
那么上述模型可以表示为:
Y X ~ Nn (0, 2 I n )
bjzj
b
jj
z
2 j
bij zi z j
j
j
i j
为y关于 z1, z2 ,, z p 的多项式回归方程。
在实际中常用的是如下的一次与二次回归方程(也称一阶 与二阶模型):
yˆ b0 bj z j
j
yˆ b0
bjzj
b jj
z
2 j
bij zi z j
j
j
i j
一般p个自变量的d次回归方程的系数个数为
p
d
d
12.1.2 多元线性回归 (12.1.1)是一个多项式回归模型,在对变量作了变换并重新
命名后也可以看成是一个多元线性回归模型。 1.回归模型 设所收集到的n组数据为
(xi1, xi2 ,, xip , yi ), i 1,2,, n
假定回归模型为:
各yi iiid0
~
1xi1 N (0, 2 )
或 Y ~ N n ( X , 2 I n )
2.回归系数的最小二乘估计 估计回归模型中回归系数的方法是最小二乘法。
记回归系数的最小二乘估计(LSE)为 b (b0 ,b1,,bp ), 应满足如下正规方程组:
X Xb X Y
当 X X 1 存在时,最小二乘估计为
b X X 1 X Y
在求得了最小二乘估计后,可以写出回归方程: yˆ b0 b1x1 bp x p