第九章_回归的旋转设计解析
第九章 回归分析
How well does a model explain the variation in the dependent variable?
Effectiveness vs Efficiency
Effectiveness: maximises R2
180 160 140 120 100 80 60 40 20 0 0 50 100 Height (cms) 150 200
Weight (kgs)
If 120cm tall, then how heavy?
Simple Regression
How best to summarise the data? Establish equation for the best-fit line:
ˆ ( y y) ( y y)
2 2
即,相关系数的平方等于回归平方和在总平方和中所占的比率。 是两个变量共同变异部分的比率,叫做决定系数 (Coefficient of determination)( R square)。 表示使
用X去预测Y时的预测释力,即Y变量被自变量所解 释的比率。反映了由自变量与因变量所形成的线性 回归模式的契合度(goodness of fit) 此一数值是否具有统计上的意义,反映了此一回归 分析或预测力是否具有统计上的意义,必须通过F检 验来判断
回归方程式Y=bX+a B系数:
第9章-方差分析与线性回归
j1 i1
s j 1
nj i1
[
2
(
j
)2 ]
2
n[ n
2]
s
s
n 2 n 2 2
nj j
n j
2 j
2
n 2
j 1
j 1
s
n j
2 j
n
1
2
j 1
E(SE )
s
E
nj
X ij X • j
2
j1 i1
s
(nj 1) 2 (n s) 2 j 1
s
E(SA ) E(ST SE )
第九章 回归分析和方差分析
关键词: 单因素试验 一元线性回归
方差分析(Analysis of variance, 简 称:ANOVA),是由英国统计学家费歇尔 (Fisher)在20世纪20年代提出的,可用于推 断两个或两个以上总体均值是否有差异 的显著性检验.
§9.1单因素方差分析
例:为了比较三种不同类型日光灯管的寿命 (小时), 现将从每种类型日光灯管中抽取 8 个, 总共 24 个日光灯管进行老化试验,根据 下面经老化试验后测算得出的各个日光灯 管的寿命(小时),试判断三种不同类型日光
检验假设 H0 : 1 2 ... s H1 : 1, 2,..., s不全相等。
记
1 n
概率论 教学课件-第九章 方差分析及回归分析
第九章 方差分析及回归分析
§1单因素试验的方差分析
方差分析是对试验结果所得数据作分析的一种常用的数理统计方法。
在第八章曾讨论过两个正态总体均值21,μμ是否相等的假设检验法,在那里建立了t 检验法,本章要讨论三个或三个以上正态总体的均值是否相等的假设法。
当试验中仅有一个因素在改变,其他保待不变的情形称为单因素试验,因素所处的状态称为水平,例子见书P270例1,2,例3则为多因素试验法。
对例1,数据(表9.1)可看成来自三个不同的总体的样本值,
321,,μμμ为各个总体的均值,需检验假设
。
H H 不全等32113
210,,::μμμμμμ==
一般地,设因素A 有s 个水平s A ,
,A A ......,.21,今考虑这s 个水平对于某总体X 的效应:设在每个水平s i A i <=<=1,下,总体服从
s i N i ....1).,..,(2=σμ,其中2,σμi 均未知。在s i A i <=<=1,下,取得样本为)....1(,,....,21s i X X X i n i i i =并假定这S 组样本相互独立。
(表9.4)水平观测结果A 1 A 2
s j i A A A ..............
11X 12X s j i X X X 111............ 21X 22X s j i X X X 222............ ………..
11
n X 22
n X s j i X X X 11............
样本总和 1*T 2*T ∑==⇒s
第九章 REG-多元线性回归
data quantity; input sales ads expend price@@; cards; 82 50 1.8 7.3 46 45 1.2 5.1 17 15 0.4 4.2 21 15 0.5 3.4 112 70 2.5 10.0 105 75 2.5 9.8 65 60 1.5 7.9 55 40 1.2 5.8 80 60 1.6 7.0 43 25 1.0 4.7 79 50 1.5 6.9 24 20 0.7 3.8 30 30 1.0 5.6 11 5 0.8 2.8 ;
?在回归中自变量可以是连续的也可以是属性变量的回归问题?逻辑斯缔函数与逻辑斯缔回归模型?logistic过程?该过程用于分析只取两个值或有限个值的有序因变量的回归问题logistic?实际工作中常遇到的问题给定家庭年收入食品支出额人口数收入最高者的年龄问该家庭购买住房的可能性有多大信贷过程中银行非常关心一笔贷款是否能按时收回即借款单位是否违约
• 模型选择选项 (1)SELECTION=name;(stepwise,forward, Bakward,maxr,minr,requare,cp,none):规定自变量 选择的方法; (2)NOINT:取消模型中的常数项; (3)SLENTRY(SLE)=value:为forward(缺省0.5) 和stepwise(缺省0.15)选元方法规定变量被选入模 型的显著性水平; (4)SLSTAY(SLS)=value:为backward(缺省0.1) 和stepwise(缺省0.15)选元方法规定变量保留在模 型的显著性水平;
第9章一元线性回归
第九章 一元线性回归
因变量(Y)与自变量(X) (Y)与自变量(X)之间的关系 9.1.1 因变量(Y)与自变量(X)之间的关系
2.统计关系 2.统计关系 即当X值确定后, 值不是唯一确定的, 即当X值确定后,Y值不是唯一确定的, 但大量统计资料表明,这些变量之间还 但大量统计资料表明, 是存在着某种客观的联系。 是存在着某种客观的联系。 例如: 9.1在直角坐标平面上,标出了10 例如:图9.1在直角坐标平面上,标出了10 在直角坐标平面上 个观测点的坐标位置, 个观测点的坐标位置,他们表示以家庭为单 位,某种商品年需求量与该商品价格之间 10对调查数据 对调查数据。 的10对调查数据。
i
∑
n
(X
− X )2 ( ∑ X i )( ∑ Y i ) − (∑ n X i)2 n
i =1
=
∑
i =1
X iY i −
n
(9(9-5)
∑
X
2 i
i =1
b 0 = Y − b1 X
(9(9-6)
第九章 一元线性回归
最小二乘估计量b 9.2.5 最小二乘估计量b0,b1的特性
线性性 b0,b1的特性 无偏性
第九章 一元线性回归
9.5.1 b1的抽样分布
以下可以证明
b1的方差
σ 2 (b1 ) =
σ2
第九章SPSS回归分析
【知识拓展】
在多元回归分析中,“变量选择的目的是回归模型 包含尽量多的自变量,以提高预测的精确度,同时 又要尽量避免作用不显著的自变量进入方程,以减 少计算量和计算误差,降低在建立回归方程后用于 监控或预测的成本。”
(引用温忠麟的《心理与教育统计》第九章第三节 中多元回归方程的论述)
在SPSS中中包括了五种方法:输入、步进、除去、 后退、前进。如何选择合适的回归分析方法,温忠 麟教授的编著中有较为详细的论述(温忠麟,2016 ),包括向后剔除法(后退)、向前选择法(前进 )、逐步回归法(步进),以及人工选择自变量尝 试等探索性回归分析,并认为逐步回归方法(步进 )是较好的一种选择方法。
第八个表:残差统计
第九个:标准化残差的概率图
[分析]:由此图可知,所有的点都比较靠近对角线 ,结合前面第八个表中的标准化残差为0.892,小 于2,因此可以认为残差是正态的。
由于自我效能感、服从领导满意度、同事人际敏感 、工作技能水平、个人信心指数这几个变量的回归 系数所对应的sig值不显著,在回归分析中需要删 除这几个变量,然后再建立回归方程。因此在SPSS 中接着再次进行回归分析。
判断方法1:特征值中前3个或前4个特征值几乎接 近0,可以说明可能存在明显的共线性。
判断方法2:方差比例内存在接近1的数(0.99), 可以说明存在明显的共线性。
在本例中,特征值中前3、4个特征值均大于0,说 明不存在明显的共线性;变异数比例的数值都远远 小于1,也说明不存在明显的共线性。结合前面的 膨胀因子VIF都小于5,小于5说明变量之间不存在 明显的共线性。
应用回归分析第九章部分答案
第9章 非线性回归
9.1 在非线性回归线性化时,对因变量作变换应注意什么问题?
答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。如:
(1) 乘性误差项,模型形式为
e y AK L αβε
=, (2) 加性误差项,模型形式为
y AK L αβε=+。
对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。 一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。
9.2为了研究生产率与废料率之间的关系,记录了如表9.14所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。 表9.14
生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%)
5.2
6.5
6.8
8.1
10.2 10.3 13.0
解:先画出散点图如下图:
5000.00
4000.003000.002000.001000.00x
12.00
10.00
8.006.00
y
从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此
采用二次方程式和指数函数进行曲线回归。 (1)二次曲线 SPSS 输出结果如下:
Mode l Sum mary
.981
.962
.942
.651
R R Square
Adjusted R Square
Std. E rror of the E stim ate
The independent variable is x.
ANOVA
42.571221.28650.160.001
第九章_回归的旋转设计
2
m 1 4 m2 4 m 3 4
2
2
§1 旋转设计的基本原理
为了便于设计,现将 m 个因素不同实施情况下的 γ 值列于表13-24。
表13-24 二次正交旋转组合设计参数表
m
2(全实施) 3(全实施) 4(全实施) 5(全实施) 5(1/2全实施) 6(1/2全实施) 6(1/4全实施) 7(1/2全实施) 7(1/4全实施) 8(1/2全实施) 8(1/4全实施) 8(1/8全实施)
从以上可以看出,正交旋转的好处在于正交性,它是通过增加中
心点的试验次数换来的,但有时并不合算。在某些实际问题中,反倒 不如选用通用旋转设计。因为通用旋转设计,既能在 0<ρ <1 的较 实用区域使方差 D( y )基本不变,又在一定程度上减少了试验次数。
§2 二次正交旋转组合设计及其统计分析
§2 二次正交旋转组合设计及其统计分析
它的结构矩阵为:
1 1 X 1
, 1.其指数 1, 2, m都是偶数或零 , 2, m中至少有1个为奇数 2.其指数 1,
x x x
11 21
x x x
12 22
x x x
13 23
x x x x
11 21
12 22
cov (b ,b ) 2 t N cov (b ,b )=( )t N
第九章 相关与回归分析 《统计学原理》PPT课件
第四节 回归模型的建立与检测
一、 一元线性回归模型是用来进行两个变量间 回归分析的。回归分析的重要内容之一,就 是根据变量观测值构建回归直线方程,对现 象间存在的一般数量关系进行描述。
(一)构建回归模型应具备的条件 1.现象间确实存在数量上的相互依存
关系。 2.现象间存在直线相关关系。 3.具备一定数量的变量观测值。
x
n
(y-y)2 为因变量y数列的标准差
y
n
依相关系数的定义公式可知相关系数的含 义如下:
(1)r的取值范围为-1≤r≤1。因为协方差 的绝对值最小为0,最大为σx和σy的乘积。
(2)r的绝对值越接近于1,表明相关关系越 密切;越接近于0,表明相关关系越不密切。
(3)r=+1或r=-1,表明两现象完全相关。
三、应用相关分析与回归分析应注意的问题
(一)注意定性分析与定量分析的结合
(二)注意客观现象质的规定性
(三)注意社会经济现象的复杂性
(四)注意对相关系数和回归直线方程的
有效性进行检验
返回
单相关是指两个变量间的相关关系,如 自变量x和因变量y的关系。
复相关是指多个自变量与因变量间的相关 关系。
(二)相关关系从表现形态上划分,可分为 直线相关和曲线相关
直线相关是指两个变量的对应取值在坐标 图中大致呈一条直线。
第九章_最小二乘法与回归分析
第九章_最小二乘法与回归分析
最小二乘法与回归分析是统计学中一种重要的方法,可以用于分析变
量之间的关系以及进行预测。本文将详细介绍最小二乘法和回归分析的概念、原理以及应用。
最小二乘法是一种用于估计参数的方法,它通过最小化观测值与估计
值之间的误差平方和来确定最优参数。这种方法可以用来建立变量之间的
线性关系模型,并通过拟合观测数据来估计模型的参数。最小二乘法的核
心思想是找到最接近观测值的模型,并使观测值与模型之间的误差最小化。
回归分析是一种使用最小二乘法的统计方法,用于研究变量之间的关系。它基于一组特征变量(自变量)与一个或多个目标变量(因变量)之
间的观测值,来预测目标变量的值。回归分析可以用于探索和建立变量之
间的线性关系,然后使用这个关系来预测未来的观测值。
在回归分析中,最常用的模型是线性回归模型。线性回归模型假设自
变量和因变量之间存在线性关系,即因变量的值可以通过自变量的线性组
合来表示。该模型的形式可以表示为:Y=β0+β1X1+β2X2+...+βnXn+ε,其中Y是因变量,X1,X2,...,Xn是自变量,β0,β1,β2,...,βn是各个
自变量的系数,ε是随机误差。
使用最小二乘法进行回归分析的步骤如下:
1.收集观测数据:收集自变量和因变量的观测数据,构建数据集。
2.建立回归模型:基于观测数据,选择合适的自变量,并建立回归模型。
3.估计参数:使用最小二乘法估计回归模型中的参数,使得观测值与估计值之间的误差最小化。
4.检验模型:通过检验回归模型的显著性和拟合优度等指标来评估模型的质量。
第九章 回归分析方法
3.回归分析的主要内容
(1)从一组数据出发,确定这些变量(参数) 间的定量关系(回归模型) (2)对模型的可信度进行统计检验 (3)从有关的许多变量中,判断变量的显著性 3 (即哪些是显著的,哪些是不显著的, 显著的保留,不显著的忽略) (4)应用结果对实际问题做出判断 自变量X→回归变量,因变量Y→应变量(响应变量)
(其中 ε i 为第i次试验时随机误差) 该模型关于回归系数 β 1 , β 2 , β m 是线性的,u为 一般向量,若用矩阵形式,(9.4)变为:
y1 Q1(u1) Q2 (u1) y2 = Q1(u2 ) Q2 (u2 ) Y= yn Q1(un ) Q2 (un ) Qm (u1) … Qm (u2 ) Qm (un )
即,共有 N = ∑1 m i 组独立观测数据检验 η(x) = β0 + β1x i= 是否为真. 为建立统计量,考虑相应的残差平方和
n
SS E = ∑∑ ( yij yi )
n i =1 j =1 n mi 2
mi
2
= ∑∑ ( yij yi ) + ∑ mi ( yi yi )
n i =1 j =1 i =1
: β1 = 0是否为真,这就需要建立一个检验的
习题第九章回归正交试验设计 ppt课件
(1)、用一次回归正交试验设计求出回归方程。 (2)、对回归方程和回归系数进行显著性检验。 (3)、失拟性检验。 (4)、确定因素的主次和优方案。
3、若零水平试验次数m0=3,试列出三元二次回归正交组 合设计表。
4、用某种菌生产酯类风味物质,为了寻找最优的发酵工艺 条件,重点考察了葡萄糖用量x1(50~150g/L)和蛋白胨用量 x2(2~10g/L)的影响,试验指标为菌体生长量y(g/L),其 他的发酵条件不变。试验方案和结果如下:
2、某产品的得率与反应温度x1(70~1000C),反应时间x2 (1~4h)及某反应物浓度x3(30%~60%)有关,不考虑 因素间的交互作用,选用正交表 L8 (27 ) 进行一次回归正交 试验,并多安排3次零水平试验,试验结果(得率%)依次 为:12.6,9.8,11.1,8.9,11.1,9.2,10.3,7.6,10.0, 10.5,10.3。
5、为了提高玉米蛋白的提取率,考察了三个因素:液固比 x1(8~12mL/g)、PH值x2(8~9) 、温度x3(40~600C) ,试验指标 y为蛋白质提取率(%)。试验设计了三元二次回归旋转组合 设计,试验方案和试验结果如下:
试验号 x1
x2
x3
1
1
1
1
2
1
1
-1
3
1
-1
1
4
第九章双变量相关与回归分析
SPSS操作分析Leabharlann Baidu骤如下
1、建立数据文件
•建立两个变量: X变量:年龄,数值型 Y变量:尿肌酸含量,数值型
2、统计分析
(1)散点图的制作
graph scatter simple
通过散点图可看出两个变量间有直线趋势,可作两因素线关分析。
(2)相关分析操作
①菜单选择
analyze
correlate
2、统计分析
(1)散点图的制作
graph scatter simple
通过散点图可看出两个变量间不具有直线趋势而是有曲线趋势, 可通过曲线拟合方法来刻画两变量间数量上的依存关系。
(2)曲线拟合的菜单操作
analyze
regression
Curve estimation主对话框
(3)SPSS程序
X Y X X Y Y XY
n
二、直线回归中的统计推断
回归方程的假设检验:有方差分析和t检验方法。 总体回归系数β的可信区间 利用回归方程进行估计和预测
例题
SPSS操作分析步骤如下
1、建立数据文件
•建立两个变量: X变量:年龄,数值型 Y变量:尿肌酸含量,数值型
第六章 双变量相关与回归分析
例如:为了研究微量元素锰在胆固醇合成中的作用, 探讨大鼠肝脏中胆固醇含量和锰含量之间是否存在直 线关系?这种关系为随着锰含量的增加,胆固醇的含 量是增加还是减少呢?——直线相关问题
第九章 时间序列数据的基本回归分析
间t上的自变量集,令X代表在所有时期内全部
自变量集。X是一个 × 的矩阵,第t行是 ,
第j列是个解释变量中的一个变量的集合。
– 假定TS.1与假定MLR.1本质上是相同的。
零条件均值假定
• 假定TS.2(条件均值为零)
y增大了0 + 1 + 2 ,是z的持久性增长引起的y的长期
变化,被称为长期倾向或长期乘数。
Q阶有限分布滞后模型
• = 0 + 0 + 1 −1 + ⋯ + − +
• 包括静态模型作为特例
• 即期倾向是当期z的系数0 ,长期影响是
0 + 1 + ⋯ + 。
自变量的持久变化对因变量的动态影响
= 0 + 0 + 1 −1 + 2 −2 +
• 假设z在时间t之前都是一个等于c的常数,从时间t起,z
永远地增大为c+1。为简单起见,假设误差项为0:
−1 = 0 + 0 + 1 + 2
= 0 + 0 ( + 1) + 1 + 2
分离出来。
• 例:研究美国的最低工资对波多黎各就业的影响
log = 0 + 1 log + 2 log +
回归分析ch9
一、例子: 例 1.产量-密度模型 设 y 表示一株作物的产量,x 表示单位面积种植株数(即密度) ,常用 Holliday 模型:
y = θ1 + θ 2 x + θ 3 x 2
这一模型可以通过变换化为线性的:
:
2)
θ (j l ) − θ (j l −1) < δ,j = 1,2, θ (j l −1)
, p (这是相对误差)
3)
∑ (θ
j =1
p
(l ) j
− θ (j l −1) ) 2 < δ (这是距离)
ˆ = 0.10 (见 p.201)。 ˆ = 0.39,β 例 9.4 最后求得 α
∂S (θ ) =0 α = f 1 ( β ) ∂α 对本例来讲还有一种特殊解法: ⇒ ∂S (θ ) = 0 α = f 2 ( β ) ∂β
(
)
−1
1/ y = θ1 + θ 2 x + θ 3 x 2
( θ 3 > 0 )表示密度过密与过稀产量都不高。 例 2 生长曲线模型 设 y 是随时间 t 的增长量,生长极限为 α ,生长速度为 dy / dt ,生长余量为 y- α 。 (1)假定生长速度与生长余量成正比:
第9章 回归分析
= F
SR ~ F (1, n − 2) , Se /(n − 2)
168
对于给定的显著性水平 α ,拒绝域为 = F
SR ≥ Fα (1, n − 2) . Se /(n − 2)
Se
2
t 检验法: ˆ ~ N (b, 由b
此得到
σ2
lxx
) 知,
ˆ−b b
σ
lxx ~ N (0,1) .又由
σ
ˆ ~ N (b, σ ) , b lxx
2
ˆ 相互独立, ˆ) = 0 且 y 与 b Cov( y , b 1 x2 ˆ ~ N (a, ( + )σ 2 ) , a n lxx
ˆ) = − x σ 2 . ˆ, b Cov(a lxx
(3) σ 的无偏估计
2
平方和= Se
ˆ ) ˆˆ = ) ∑ ( y − a − bx ∑(y − y
(4) = Se 解 (1)
= i 1
= i 1 = i 1= i 1 n
∑ yi 2 − a∑ yi − b∑ xi yi .
ˆˆ − bx ) ∑ ( y − y + bx
i =1 i i
n
n
n
= i 1= i 1
ˆˆ = ∑ ( yi − y i)
ˆ= ∑ (yi − a − bx i)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
2
12 13
11
12
13
x x x x x x x x x x x x 21
22
23
21 22
21 23
22 23
2
2
2
21
22
23
x x x x x x x x x x x x N1
N2
N3
N1 N 2
N1 N3
N2 N3
2 N1
2 N2
2 N
3
§1 旋转设计的基本原理
此外,为了使旋转设计成为可能,还必须使信息矩阵 A 不退化(满秩)。 为此,必须有不等式
这里应该解决的是二次回归正交的旋转性问题。下面以试验设计中常用的 三元二次回归方程来讨论这个问题。
在3个变量情况下,二次回归模型为:
3
3
y
x
x x x x
jj
ij i j
2
ij j
ij
j 1
ij
j 1
y x xx x x x x x x x 即
0
1
2 2
3
3
12 1 2
§1 旋转设计的基本原理
综上所述,为了获得 m 元二次旋转设计方案,就要求既要满足旋转性 条件式 (13-29) ,又要满足非退化条件式 (13-30) 。满足条件式 (13-29)是旋转设计的必要条件,满足非退化条件式 (13-30)是使旋
转性成为可能的充分条件。两者结合起来才能使旋转性设计得以实现。
4 3
j
2 i
2 j
求出 γ 值就行了。
在组合设计下,当 mc=2m (全实施)时,则前式变为
2m2 432m
解此方程,即可建立全实施时 γ 值的计算式,即
m
24
(13-31)
同理
m 2 2 当
c
m1 (1 实施) 2
m1 4
m 2 2 当
c
m2 (1 实施) 4
m2 4
m 2 2 当
c
m3 (1 实施) 8
13 1 3
23 2 3
2 11 1
x x 2 22 2
2
33 3
1,
2,,
N
A的元素分类
1.其指数1, 2, 2.其指数1, 2,
, m都是偶数或零 , m中至少有1个为奇数
它的结构矩阵为:
1
X
1
1
x x x x x x x x x x x x 11
12
13
11 12
11 13
2
§1 旋转设计的基本原理
1.2 正交性的获得
2次旋转组合设计具有同一球面预测值 y 的方差相等的优点,但回归 统计数的计算较繁琐。如果使它获得正交性就能大大简化计算手续。
在2次旋转组合计划中,1次项和交互项的回归系数 bi 和 bij 仍保持正 交,但 b0 与 bij 之间,以及 bii 与 bjj 之间都存在相关,即不具正交性,它 们之间的协方差分别为:
如何才能使试验设计具有旋转性呢?这就需要弄清楚
旋转性对试验设计有什么要求以及获得旋转性必须满足哪
些基本条件。首先必须明确的是:在旋转设计中,试验处
理的预测值
y
的方差仅与因素空间中从试验点到试验中心
的距离 ρ 有关而与方向无关,从而克服了通常因为不知道
最优点在什么方向的缺陷。
§1 旋转设计的基本原理
元素中
x x x x x j
i j
2 0
i j
而它的偶次方元素
x2 i
mc2
2
x4 i
mc2
4
x x m 2 2
i j
c
均不等于零,完全符合式(13-29)的要求。
§1 旋转设计的基本原理
为了获得旋转设计方案,还必须根据旋转性条件式(13-29)确定 γ 值,
x x x 事实上只要
实际操作上主要借助于组合设计来实现。因为组合设计中 N 个试验点
N = mc+mγ +m0 ,分布在3个半径不相等的球面上。即
mc个点分布在半径
c
m 的球面上;
mγ个点分布在半 的球面上;
因此,采m用0个组点合分设布计在选半取径的试0 验 0点的,球完面全上能;够满足非退化条件式(13-
30) ,即信息矩阵 A 不会退化。此外,采用组合设计,其信息矩阵 A 的
y 的方差随试验点在因子空间的位置不同而呈现较大的差异。由于误差的干 扰,就不易根据预测值寻找最优区域。为了克服这个缺点,人们通过进一 步研究,提出了回归的旋转设计(whirly design)。
所谓旋转性是指试验因素空间中与试验中心距离相等的球面上各处理
组合的预测值 y 的方差具有几乎相等的特性,具有这种性质的回归设计称 回归旋转设计。利用具有旋转性的回归方程进行预测时,对于同一球面上 的点可直接比较其预测值的好坏,从而找出预测值较优区域。
cov(b,b jj)2 2 4t 2 N
cov(bii,b jj)=( 22 4)t 2
N
(13-32)
其中 t
1
2
4
(m
2)
4m
2 2
§1 旋转设计的基本原理
对于 m 个因素的二元旋转组合设计,式(13-33)中的m、mc和 γ 都是固
第九章 回归的旋转设计
本章内容:
§1 旋转设计的基本原理 §2 二次正交旋转组合设计及其统计分析 §3 通用旋转组合设计及其统计分析
本章学习目的与要求:
1. 2. 3.
§1 旋转设计的基本原理
1.1 回归设计的旋转性
§1 旋转设计的基本原理
“回归的正交设计” 具有试验处理数比较少,计算简便,消除了回归 系数之间的相关性等优点。但它也存在一定的缺点,即二次回归预测 值
m3 4
§1 旋转设计的基本原理
为了便于设计,现将 m 个因素不同实施情况下的 γ 值列于表13-24。
表13-24 二次正交旋转组合设计参数表
m
mc
mγ
2(全实施)
4
4
3(全实施)
8
6
4(全实施)
16
8
5(全实施)
32
10
5(1/2全实施)
16
10
6(1/2全实施)
32
12
6(1/4全实施)
16
12
7(1/2全实施)
64
14
7(1/4全实施)
32
14
8(1/2全实施)
128
16
8(1/4全实施)
64
16
8(1/8全实施)
32
16
m0
N
8
16
9
23
12
36
17
59
10
36
15
59
8
36
22
100
13
59
33
177百度文库
20
100
11
59
γ
1.414 1.682 2.000 2.378 2.000 2.378 2.000 2.828 2.378 3.364 2.828 2.374
4
2
m m
2
2
(13-30)
式 (13-30) 就是 m 元二次旋转设计的非退化条件。已经证明,只要使 N 个试验点不在同一个球面上,就能满足非退化条件。
最简单的情况是把 N 个试验点分布在 2 个或 3 个半径不等的球面上。如 m0 个点分布在半径为 0 的球面上(即在中心点重复 m0 次试验),另外 m1 =N-m0 个点均匀分布在半径为 ρ (ρ≠0)的球面上。