第九章_回归的旋转设计解析

合集下载

第九章 回归分析

第九章 回归分析

系数:
参数a、b的最小二乘估计
A good
line is one that minimizes the sum of squared differences between the points and the line.
根据推导,
a y bx
( x x )( y y ) b (x x)
Multiple Regression
R2adj - “adjusted R-square”
R2是一个受自变量个数与样本规模之比(k:n)影响的系数,一般是1:10 以上为好。当这个比值小于1:5时,R2倾向于高估实际的拟合的程度。 Takes into account the number of regressors in the model
X的变异
r2
Y的变异
Simple Regression
R2 - “Goodness of fit”
For simple regression, R2 is the square of the correlation coefficient
Reflects variance accounted for in data by the best-fit line
第九章 多元回归分析
浙江师范大学教育学院心理系
徐长江 xucj@
纲要
回归分析的基本原理
一元回归分析 多元回归分析
多元回归分析的方法 多元回归分析的实现
回归分析的目的
设法找出变量间的依存(数量)关系, 用函数 关系式表达出来
Example: Height vs Weight
Takes values between 0 (0%) and 1 (100%) Frequently expressed as percentage, rather than decimal

第九章:回归分析-30页文档

第九章:回归分析-30页文档
Regression Analysis
Chapter 11
Regression and Correlation
Techniques that are used to establish whether there is a mathematical relationship between two or more variables, so that the behavior of one variable can be used to predict the behavior of others. Applicable to “Variables” data only.
run
axis.
b
0
X
A simple linear relationship can be described mathematically by
Y = mX + b
Simple Linear Regression
slope =
rise run
=
(6 - 3)
1
=
(10 - 4)
2
Y
rise
5
run intercept = 1
Rent
Step 1: Scatter plot
2500 2300 2100 1900 1700 1500 1300 1100 900 700 500
500 700 900 1100 1300 1500 1700 1900 2100
Size
Scatter plot suggests that there is a ‘linear’ relationship between Rent and Size
High

第九章时间序列数据的基本回归分析

第九章时间序列数据的基本回归分析

第九章时间序列数据的基本回归分析时间序列数据是指按照时间顺序排列的一系列数据观测值。

在实际应用中,时间序列数据广泛存在于经济学、金融学、气象学等领域,对于了解数据的趋势、季节性等特征具有重要意义。

时间序列数据的基本回归分析是通过建立回归模型,来研究时间序列数据中因变量与自变量之间的关系。

时间序列数据的回归分析可以分为简单回归和多元回归。

其中,简单回归是指只含有一个自变量的回归模型,多元回归是指含有多个自变量的回归模型。

下面将分别介绍这两种回归模型及其应用。

简单回归模型简单回归模型是时间序列数据回归分析中最基础的模型,其形式为:Y_t=α+βX_t+ε_t其中,Y_t表示时间为t时的因变量观测值,X_t表示时间为t时的自变量观测值,α和β分别是回归方程的截距项和斜率项,ε_t是误差项。

简单回归模型常用于分析两个变量之间的关系,并通过计算斜率项β的值来判断两个变量之间的线性相关程度。

如果β的值为正,则表示两个变量之间呈正相关关系;如果β为负,则表示两个变量之间呈负相关关系。

同时,可以通过计算误差项ε_t的方差来评估模型的拟合优度。

多元回归模型当考虑到多个自变量对因变量的影响时,可以使用多元回归模型。

其形式为:Y_t=α+β_1X_1,t+β_2X_2,t+...+β_kX_k,t+ε_t其中,Y_t表示时间为t时的因变量观测值,X_1,t,X_2,t,...,X_k,t表示时间为t时的自变量观测值,α和β_1,β_2,...,β_k分别是回归方程的截距项和各自变量的斜率项,ε_t是误差项。

多元回归模型相较于简单回归模型更能够适用于分析多个自变量与因变量之间的复杂关系。

在建模过程中,可以通过检验回归系数的显著性水平,来判断自变量对因变量的影响是否显著。

此外,还可以通过判断方程残差的波动性来评估模型的拟合优度。

时间序列数据的回归分析在实际应用中具有重要意义。

例如,经济学中常使用时间序列数据回归分析来研究GDP与通货膨胀率之间的关系;金融学中,可以利用时间序列数据回归分析来研究股票收益率与市场因素之间的关系。

回归旋转试验设计dolly

回归旋转试验设计dolly

• 结果显示,x2最不显著,所以考虑剔除此 变量,且x3比较好,变量变为x3,x1*x3, x3*x3。
• • • • • • • • • • • • • • •
data ex; input x1 x2 x3 y; X4=x3*x3;x5=x1*x3; cards; 1.0 13 1.5 0.330 1.4 19 3.0 0.366 1.8 25 1.0 0.294 2.2 10 2.5 0.476 2.6 16 0.5 0.209 3.0 22 2.0 0.451 3.4 28 3.5 0.482 ; proc glm ; model y=x3 x4 x5; run;
• Y=0.315x3-0.759x3*x3+0.026x1*x3
• • • • • • • • • • • • • • •
data ex; input x1 x2 x3 y; X4=x3*x3;x5=x1*x3; cards; 1.0 13 1.5 0.330 1.4 19 3.0 0.366 1.8 25 1.0 0.294 2.2 10 2.5 0.476 2.6 16 0.5 0.209 3.0 22 2.0 0.451 3.4 28 3.5 0.482 ; proc glm ; model y=x3 x4 x5/noint; run;
一.回归旋转设计的步骤
1. 确定参与试验的因素,选定处理水平。 设某试验p个因素,以z1、z2、zp表 示,每个处理因素设上下两个水平, 第j个因素的上水平为z2j,下水平为 z1j,则各处里的零水平为 z0j=( z1j + z2j )/2
2. 计算各因素的变化区间,并对处理水平 编码。 将第j因素的变化区间以Δ j表示, Δ j= ( z2j – z1j )/2,然后对每个因素zj的 处理水平进行编码,即对每个因素的取 值进行线性变换,因素zj与规范变量xj 变换的对应关系是xj=(zj-z0j)/ Δ j, 上、下、零水平的编码值分别为+1、-1、 0。

4、高级实验设计—回归的旋转设计(Regressional Rotary Design)

4、高级实验设计—回归的旋转设计(Regressional Rotary Design)
2 i 2 j
x
i,j =1,2„P;
待定参数
以上为 P 元二次回归旋转设计的旋转性条件。
此外,为了使旋转设计成为可能,还必须使信
息矩阵 A 不退化,为此,必须有不等式:
4 p 2 2 P 2
上式为 P 元二次回归的非退化条件。 已证明,只要使 N 个试验点不在同一个球面上, 就能满足非退化条件。或者说只要使 N 个试验点至少 分布于两个半径不等的球面上,就有可能获得旋转设
P 2 2 ˆ D y P 2 4 PN
4 1 2 P 1 4 P 1 4 1 2 2 4 P 2 4 4
(4.11) 由式(4.11)经研究表明,只有采用恰当的方法 确定 4 ,才能满足通用性的要求。如何确定 4 ?对 4 有什么要求呢?总的来说,它必须使上式中 i处的
ˆ 的 二次旋转组合设计具有同一球面预测值 y
方差相等的优点,但回归统计数的计算较繁琐,
若使它获得正交性就能简化计算手续。
在二次旋转组合计划中,一次项和交互项的 回归系数 bj ,bij 仍保持正交,但 b0 与 bjj 之间,
以及 bii 与 bjj 之间都存在相关,即不具正交性,
它们之间的相关矩分别为:
计方案。
为了获得 P 元二次旋转设计方案,就要求既要
满足非退化条件式,又要满足旋转性条件式。
如何才能满足这两方面的条件呢?这主要借助
于组合设计来实现,因为组合设计中 N 个试验点:
N mc m m0
分布在三个半径不相等的球面上:
mc 个点分布在半径为 P 的球面上; c m 个点分布在半径为 的球面上; m0 个点分布在半径为 0 0 的球面上;

三元二次正交回归旋转通用设计

三元二次正交回归旋转通用设计

三元二次正交回归旋转通用设计引言:在现代科学与技术领域,研究人员经常需要对大量数据进行分析和处理。

其中,回归分析是一种常用的数据分析方法,用于研究变量之间的关系。

然而,传统的回归分析方法在处理高维数据时存在一些问题,例如维度灾难和多重共线性。

因此,三元二次正交回归旋转通用设计被提出,旨在解决这些问题,提高回归分析的准确性和可解释性。

一、维度灾难与多重共线性的问题在传统的回归分析中,当自变量维度较高时,会出现维度灾难的问题。

维度灾难指的是随着自变量维度的增加,样本空间的体积迅速膨胀,导致所需的样本数量呈指数增长。

这使得回归分析在高维数据中变得困难且不可靠。

多重共线性是指自变量之间存在较高的相关性,这会导致回归分析结果不稳定且难以解释。

在传统的回归模型中,多重共线性会导致回归系数的估计不准确,增加了模型的不确定性。

二、三元二次正交回归旋转通用设计的原理为了解决维度灾难和多重共线性的问题,三元二次正交回归旋转通用设计被提出。

该方法的核心思想是通过正交设计和回归旋转的方式来提高回归分析的效果。

通过正交设计的方法,可以使自变量之间的相关性尽可能小。

正交设计是一种特殊的实验设计方法,它通过合理安排实验因素的水平组合,降低了自变量之间的相关性。

这样一来,回归分析中的多重共线性问题就能够得到缓解,提高了模型的稳定性。

通过回归旋转的方式,可以将高维数据转化为低维数据,从而降低了维度灾难的影响。

回归旋转是一种将原始自变量进行线性或非线性变换的方法,使得新的自变量能够更好地解释因变量的变化。

通过回归旋转,可以使自变量的数量减少,同时保留了原始数据的信息。

三、三元二次正交回归旋转通用设计的应用三元二次正交回归旋转通用设计在实际应用中具有广泛的应用价值。

它可以用于多个领域的数据分析,如经济学、医学、环境科学等。

在经济学中,三元二次正交回归旋转通用设计可以用于预测和解释经济变量之间的关系。

通过分析各种经济指标的数据,可以帮助经济学家预测未来的经济发展趋势,为政策制定者提供决策依据。

一次回归正交设计、二次回归正交设计、二次回归旋转设计说明

一次回归正交设计、二次回归正交设计、二次回归旋转设计说明

一次回归正交设计、二次回归正交设计、二次回归旋转设计说

一次回归正交设计是一种广泛应用于实验设计中的设计方式,该设计最基本的特点是每一个自变量只考虑一次。

这种设计方法可以通过排列组合的方式得到各种不同的设计方案,使得实验者可以通过设计来达到用最少的实验次数获取尽可能多的信息的目的。

一次回归正交设计在实验设计中被广泛使用,尤其在化学制药、工业生产等领域得到了广泛运用。

二次回归正交设计是一种基于一次回归正交设计的设计方式,这种设计方式可以进一步增加实验信息的获取。

在二次回归正交设计中,依然按照一次正交设计的方式来设计实验,但是在每个单独的自变量上,提高对其的测量次数,使得对这些自变量的测量更加准确。

同时,在某些需要深入探究的因素上,可以通过将这些因素的实验次数进一步提高,来获取相关信息。

二次回归旋转设计是一种在二次回归正交设计的基础上发展而来的设计方式。

在二次回归旋转设计中,实验者可以通过旋转矩阵来达到实验变量间的协方差为0的目的。

这样可以在保证基本信息获取的同时,增加获取高阶信息的可能性。

旋转设计特别适合于需要同时考虑多个变量的实验设计,可以使各个变量之间更加独立,减少不必要的干扰。

总的来说,在实验设计领域中,三种设计方法各自有着各自的优势。

对于需要更精准的信息获取的实验,应该选择更高阶的设计方法,在更基础的实验中则可以选择更为简单的设计方法。

另外,在选择设计方法的过程中,还应该根据实验具体情况灵活选择,使得实验设计更加科学合理。

旋转设计的原理有哪些方面

旋转设计的原理有哪些方面

旋转设计的原理有哪些方面
旋转设计的原理有以下几个方面:
1. 转动力学原理:旋转设计要考虑物体在旋转过程中的动力学性质,即物体受到力矩的作用而产生角加速度,进而引起旋转运动。

2. 旋转平衡原理:在旋转设计中,要考虑物体的平衡问题,包括静态平衡和动态平衡。

静态平衡要求物体的重心与旋转轴重合,动态平衡要求物体在旋转过程中保持平衡。

3. 质量分布原理:物体的质量分布会影响旋转过程中的转动惯量和动力学性能。

质量集中在旋转轴附近会使转动惯量变小,有利于快速旋转;而质量离散或分布不均匀则会增大转动惯量,使旋转速度降低。

4. 惯性原理:旋转设计中要考虑物体的惯性特性,包括转动惯量和惯性矩。

转动惯量描述了物体抵抗转动的能力,惯性矩则描述了物体在外力作用下产生的转动效应。

5. 稳定性原理:旋转设计中要考虑物体的稳定性,即物体在旋转过程中是否能够保持平衡。

稳定性受到物体形状、质量分布、动力学特性等因素的影响。

总之,旋转设计涉及到转动力学、平衡原理、质量分布、惯性特性和稳定性等多
个方面的原理。

这些原理相互影响、相互制约,需要综合考虑和分析,才能设计出稳定、高效的旋转装置或机构。

应用回归分析_第9章课后习题答案

应用回归分析_第9章课后习题答案

第9章 含定性变量的回归模型思考与练习参考答案9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0-1型自变量,用SPSS 软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。

出现这种情况的原因是什么?答:假如这个含有季节定性自变量的回归模型为:t t t t kt k t t D D D X X Y μαααβββ++++++=332211110其中含有k 个定量变量,记为x i 。

对春夏秋冬四个季节引入4个0-1型自变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为:⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=000110010110001010010010100011)(616515414313212111k k k k k k X X X X X X X X X X X X D X,显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。

这就是所谓的“虚拟变量陷井”,应避免。

当某自变量x j 对其余p-1个自变量的复判定系数2j R 超过一定界限时,SPSS 软件将拒绝这个自变量x j 进入回归模型。

称Tol j =1-2j R 为自变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0.0001。

也就是说,当2j R >0.9999时,自变量x j 将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。

⎪⎪⎪⎪⎪⎭⎫⎝⎛=k βββ 10β⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=4321ααααα而在这个模型中出现了完全共线性,所以SPSS软件计算的结果中总是自动删除了其中的一个定性自变量。

9.2对自变量中含有定性变量的问题,为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型?答:原因有两个,以例9.1说明。

一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计;二是对于其他统计推断,用一个带有虚拟变量的回归模型来进行也会更加准确,这是均方误差的自由度更多。

第九章 相关与回归分析 《统计学原理》PPT课件

第九章  相关与回归分析  《统计学原理》PPT课件

[公式9—4]
r xy n • xy
x y
[公式9—5]
返回到内容提要
第三节 回归分析的一般问题
一、回归分析的概念与特点
(一)回归分析的概念
现象之间的相关关系,虽然不是严格 的函数关系,但现象之间的一般关系值, 可以通过函数关系的近似表达式来反映, 这种表达式根据相关现象的实际对应资料, 运用数学的方法来建立,这类数学方法称 回归分析。
单相关是指两个变量间的相关关系,如 自变量x和因变量y的关系。
复相关是指多个自变量与因变量间的相关 关系。
(二)相关关系从表现形态上划分,可分为 直线相关和曲线相关
直线相关是指两个变量的对应取值在坐标 图中大致呈一条直线。
曲线相关是指两个变量的对应取值在坐 标图中大致呈一条曲线,如抛物线、指数曲线、 双曲线等。
0.578
a y b x 80 0.578 185 3.844
n
n7
7
yˆ 3.844 0.578x
二、估计标准误差 (一)估计标准误差的概念与计算 估计标准误差是用来说明回归直线方程 代表性大小的统计分析指标。其计算公式为:
Syx
y yˆ 2
n
[公式9—8]
实践中,在已知直线回归方程的情况下, 通常用下面的简便公式计算估计标准误差:
[例9—2] 根据相关系数的简捷公式计算有:
r
n xy x y
n x2 x2 n y2 y2
7 218018580
0.978
7 5003 1852 7 954 802
再求回归直线方程:
yˆ a bx
b
n xy x y
n x2 x2
7 2180 18580 7 50031852

第九章回归旋转试验设计

第九章回归旋转试验设计

9回归旋转试验设计本章要点:主要介绍了回归旋转设计的基本原理、实现条件、组合设计的步骤和统计分析方法,并给出二次回归正交旋转试验设计的计算案例。

重点:回归正交旋转设计的实现条件、组合设计的方法、方程的建立及显著性检验。

难点:回归正交旋转设计正交和旋转的实现条件及其统计分析。

9.1回归旋转试验设计的基本原理前面所介绍的“回归正交设计”,具有试验处理数比较少,计算简便、消除回归系数之间的相关性等优点。

但它也存在一定的缺点,即二次回归预测值的方差随试验点在因子空间的位置不同而呈现较大的差异。

由于误差的干扰,就不易根据预测值寻找最优区域。

为了克服这个缺点,人们通过进一步研究,提出了回归旋转设计(whirly design )。

所谓旋转性是指试验因素空间中与试验中心距离相等的球面上各处理组合的预测值的方差具有几乎相等的特性,具有这种性质的回归设计称回归旋转设计。

这种设计的意 义在于可以直接比较各处理组合预测值的好坏,从而找出预测值相对优良的区域。

9.1.1回归设计旋转性条件旋转设计包括一次、二次和三次旋转设计,但研究中最常见的设计是二次回归旋转设计。

下面以三元二次回归方程来讨论回归正交的旋转性问题。

二次正交多项式方程的估计值为: 如果以三因素二次回归正交设计的数学模型为例:因此其信息矩阵A 为:T A=x x=ˆy ˆy332011ˆj j ij i j jj jj i jj y b b x b x x b x ===+++∑∑∑2220112233121213132323111222333ˆy b b x b x b x b x x b x x b x x b x b x b x =+++++++++1231213231231121312131231121322222232a a a a a a a a a a a aa a a a a a a a a a a a a a a a a n x x x x x x x x x x x x x x x x x x x x x x x x x x x x x ∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑223121232312223312313231322222322222a a a a a a a a a a a a a a a a a a a a a a a a a x x x x x x x x x x x x x x x x x x x x x x x x x ∑∑∑∑∑∑∑∑∑∑∑∑∑ 对233121231231212123232222332a a a a a a a a a a a a a a a a a a x x x x x x x x x x x x x x x x x x∑∑∑∑∑∑∑∑∑称13123131231323123232322232322233a a a a a a a a a a a a a a a a a a a a a x x x x x x x x x x x x x x x x x x x x x ∑∑∑∑∑∑∑∑∑ 1121342222a a a a a x x x x x ∑∑∑ 部223422a a a x x x ∑∑ 分34a x ⎛⎫ ⎪ ⎪ ⎪ ⎪⎪ ⎪⎪⎪ ⎪ ⎪ ⎪⎪ ⎪⎪ ⎪⎪⎪ ⎝⎭∑上述信息矩阵中的各个元素可用一般形式表达为: ,其中x 的指数1Q 、2Q 、3Q 分别可取0、1、2、3、4等非负整数。

回归通用旋转设计的几个问题_卢恩双

回归通用旋转设计的几个问题_卢恩双

-
1 20 23- 3 B 0+ B 22+ ( B 11+ B 22 )。 10 160 160 除了回归系数计算不一样以外 , 回归方程及回
归系数的显著性检验也不同。 在回归正交设计和正 交旋转设计中都是直接先求回归平方和 , 然后求剩
剩 = SS T - U , S ST 为总平方和 ) , 而在通 余平方和 ( Q n p
- 1 2
112
2
西北农林科技大学学报 (自然科学版 )
第 30卷
播种 , 小区面积为 13. 34 m , 锄地 4 次 , 1991-10-10 收 获 , 单收 单 打 , 风 干称 重 , 大 豆 生 育 期降 雨 390. 3 mm , 前期降雨偏多 , 后期旱象严重 ,生育期积
温为 3 349 ℃ , 试验 安 排及 试 验结 果 见参 考 文 献 [ 3 ]。
第 5期 z0 1 1 1 1 1 X 2= 1 1 1 1 1 1 1 1
n
卢恩双等 : 回归通用旋转设计的几个问题 z1 1 1 - 1 - 1 1. 414 - 1. 414 0 0 0 0 0 0 0 z2 1 - 1 - 1 1 0 0 1. 414 - 1. 414 0 0 0 0 0 z 1z 2 1 - 1 - 1 1 0 0 0 0 0 0 0 0 0 z1 1 1 1 1 2 2 0 0 0 0 0 0 0

z2

1 2 3 4
0. 5 0. 5 0. 5 0. 5 1. 5 1. 5 - 0. 5 - 0. 5
0. 5 0. 5 0. 5 0. 5
- 0. 5 5 - 0. 5 6 1. 5 1. 5 7 8
- 0. 5 - 0. 5 9 - 0. 5 - 0. 5 10 - 0. 5 - 0. 5 11 - 0. 5 - 0. 5 12 - 0. 5 - 0. 5 13 - 0. 5 - 0. 5 14 - 0. 5 - 0. 5 15 - 0. 5 - 0. 5 16

概率论与数理统计第九章方差分析与回归分析

概率论与数理统计第九章方差分析与回归分析

版权所有 BY 张学毅
10
方差分析的基本思想
7.若不同水平对试验指标值没有影响,则组间误差中只 包含随机误差,没有系统误差。这时,组间误差与 组内误差经过平均后的数值就应该很接近,它们的 比值就会接近1;
8.若不同水平对试验指标值有影响,则在组间误差中除 了包含随机误差外,还会包含有系统误差,这时组 间误差平均后的数值就会大于组内误差平均后的数 值,它们之间的比值就会大于1;
3)该平方和反映的是随机误差的大小。
计算公式为 :
nj s
2
SE
Xij X.j
i1 j1
三个离差平方和的关系
nj s
2s
2 kn
2
XijX nj X.jX XijX.j
i1j1
j1
i1j1
STSASE
总离差平方和=组间平方和+组内平方和
即 EMSE2
2) M S A 是否是总体方差 2 的无偏估计量,与原假设 成立与否有关 。当且仅当原假设成立时,M S A 才是 总体方差 2 的无偏估计量。
EMSA2s1 1js1njj2
2020/3/1
版权所有 BY 张学毅
17
八、方差分析表
通常将上述计算过程列成一张表格,称为方差分析表。
9.当这个比值大到某种程度时,就可以说不同水平之间 存在着显著差异,也就是自变量对因变量有影响。
2020/3/1
版权所有 BY 张学毅
11
六、离差平方和与自由度的分解
总离差平方和 S T ( sum of squares for total)
1)全部观察值 X
与总均值
ij
X
的离差平方和;

第9章含定性变量的回归模型

第9章含定性变量的回归模型
其中y为上一年家庭储蓄增加额, x1为上一年家庭总收入, x2表示家庭学历,
高学历家庭x2=1,低学历家庭x2=0。
§9.2 自变量定性变量回归模型的应用
回归模型(9.8)式可以分解为对高学历和对低学历家庭 的两个线性回归模型,分别为:
高学历家庭x2=1, yi=β0+β1xi1+β2+β3xi1+εi =(β0+β2)+(β1+β3)xi1+εi
t Sig. 9.757 .000 -2.65 .045 -1.69 .153
§9.2 自变量定性变量回归模型的应用
对β2的显著性检验的显著性概率Sig=0.153,β2没有通 过显著性检验,不能认为β2非零。用y对x做一元线性回归, 计算结果为:
Coeffi ci ents
(C onstant ) X
x((((
图9.1 单位成本对批量散点图
§9.2 自变量定性变量回归模型的应用
由图9.1可看出数据在生产批量xp=500时发生较大变化, 即批量大于500时成本明显下降。我们考虑由两段构成的分 段线性回归,这可以通过引入一个0-1型虚拟自变量实现。 假定回归直线的斜率在xp=500 yi=β0+β1xi+β2(xi-500)Di+εi
对一般情况,一个定性变量有k类可能的取值 时,需要引入k-1个0-1型自变量。当k=2时,只需要引 入一个0-1型自变量即可。
§9.2 自变量定性变量回归模型的应用
一、分段回归
例9.2 表9.3给出某工厂生产批量xi与单位成本yi(美元)的 数据。试用分段回归建立回归模型。
序号 1 2 3 4 5 6 7 8
§9.1 自变量中含有定性变量的回归模型
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

cov(b,b jj)2 2 4t 2 N
cov(bii,b jj)=( 22 4)t 2
N
(13-32)
其中 t
1
2
4
(m
2)
4m
2 2
§1 旋转设计的基本原理
对于 m 个因素的二元旋转组合设计,式(13-33)中的m、mc和 γ 都是固
如何才能使试验设计具有旋转性呢?这就需要弄清楚
旋转性对试验设计有什么要求以及获得旋转性必须满足哪
些基本条件。首先必须明确的是:在旋转设计中,试验处
理的预测值
y
的方差仅与因素空间中从试验点到试验中心
的距离 ρ 有关而与方向无关,从而克服了通常因为不知道
最优点在什么方向的缺陷。
§1 旋转设计的基本原理
4
2
m m
2
2
(13-30)
式 (13-30) 就是 m 元二次旋转设计的非退化条件。已经证明,只要使 N 个试验点不在同一个球面上,就能满足非退化条件。
最简单的情况是把 N 个试验点分布在 2 个或 3 个半径不等的球面上。如 m0 个点分布在半径为 0 的球面上(即在中心点重复 m0 次试验),另外 m1 =N-m0 个点均匀分布在半径为 ρ (ρ≠0)的球面上。
元素中
x x x x x j
i j
2 0
i j
而它的偶次方元素
x2 i
mc2
2
x4 i
mc2
4
x x m 2 2
i j
c
均不等于零,完全符合式(13-29)的要求。
§1 旋转设计的基本原理
为了获得旋转设计方案,还必须根据旋转性条件式(13-29)确定 γ 值,
x x x 事实上只要
第九章 回归的旋转设计
本章内容:
§1 旋转设计的基本原理 §2 二次正交旋转组合设计及其统计分析 §3 通用旋转组合设计及其统计分析
本章学习目的与要求:
1. 2. 3.
§1 旋转设计的基本原理
1.1 回归设计的旋转性
§1 旋转设计的基本原理
“回归的正交设计” 具有试验处理数比较少,计算简便,消除了回归 系数之间的相关性等优点。但它也存在一定的缺点,即二次回归预测 值
13 1 3
23 2 3
2 11 1
x x 2 22 2
2
33 3
1,
2,,
N
A的元素分类
1.其指数1, 2, 2.其指数1, 2,
, m都是偶数或零 , m中至少有1个为奇数
它的结构矩阵为:
1
X
1
1
x x x x x x x x x x x x 11
12
Байду номын сангаас13
11 12
11 13
2
§1 旋转设计的基本原理
1.2 正交性的获得
2次旋转组合设计具有同一球面预测值 y 的方差相等的优点,但回归 统计数的计算较繁琐。如果使它获得正交性就能大大简化计算手续。
在2次旋转组合计划中,1次项和交互项的回归系数 bi 和 bij 仍保持正 交,但 b0 与 bij 之间,以及 bii 与 bjj 之间都存在相关,即不具正交性,它 们之间的协方差分别为:
2
2
12 13
11
12
13
x x x x x x x x x x x x 21
22
23
21 22
21 23
22 23
2
2
2
21
22
23
x x x x x x x x x x x x N1
N2
N3
N1 N 2
N1 N3
N2 N3
2 N1
2 N2
2 N
3
§1 旋转设计的基本原理
此外,为了使旋转设计成为可能,还必须使信息矩阵 A 不退化(满秩)。 为此,必须有不等式
4 3
j
2 i
2 j
求出 γ 值就行了。
在组合设计下,当 mc=2m (全实施)时,则前式变为
2m2 432m
解此方程,即可建立全实施时 γ 值的计算式,即
m
24
(13-31)
同理
m 2 2 当
c
m1 (1 实施) 2
m1 4
m 2 2 当
c
m2 (1 实施) 4
m2 4
m 2 2 当
c
m3 (1 实施) 8
12
7(1/2全实施)
64
14
7(1/4全实施)
32
14
8(1/2全实施)
128
16
8(1/4全实施)
64
16
8(1/8全实施)
32
16
m0
N
8
16
9
23
12
36
17
59
10
36
15
59
8
36
22
100
13
59
33
177
20
100
11
59
γ
1.414 1.682 2.000 2.378 2.000 2.378 2.000 2.828 2.378 3.364 2.828 2.374
m3 4
§1 旋转设计的基本原理
为了便于设计,现将 m 个因素不同实施情况下的 γ 值列于表13-24。
表13-24 二次正交旋转组合设计参数表
m
mc

2(全实施)
4
4
3(全实施)
8
6
4(全实施)
16
8
5(全实施)
32
10
5(1/2全实施)
16
10
6(1/2全实施)
32
12
6(1/4全实施)
16
这里应该解决的是二次回归正交的旋转性问题。下面以试验设计中常用的 三元二次回归方程来讨论这个问题。
在3个变量情况下,二次回归模型为:
3
3
y
x
x x x x
jj
ij i j
2
ij j
ij
j 1
ij
j 1
y x xx x x x x x x x 即
0
1
2 2
3
3
12 1 2
实际操作上主要借助于组合设计来实现。因为组合设计中 N 个试验点
N = mc+mγ +m0 ,分布在3个半径不相等的球面上。即
mc个点分布在半径
c
m 的球面上;
mγ个点分布在半 的球面上;
因此,采m用0个组点合分设布计在选半取径的试0 验 0点的,球完面全上能;够满足非退化条件式(13-
30) ,即信息矩阵 A 不会退化。此外,采用组合设计,其信息矩阵 A 的
y 的方差随试验点在因子空间的位置不同而呈现较大的差异。由于误差的干 扰,就不易根据预测值寻找最优区域。为了克服这个缺点,人们通过进一 步研究,提出了回归的旋转设计(whirly design)。
所谓旋转性是指试验因素空间中与试验中心距离相等的球面上各处理
组合的预测值 y 的方差具有几乎相等的特性,具有这种性质的回归设计称 回归旋转设计。利用具有旋转性的回归方程进行预测时,对于同一球面上 的点可直接比较其预测值的好坏,从而找出预测值较优区域。
§1 旋转设计的基本原理
综上所述,为了获得 m 元二次旋转设计方案,就要求既要满足旋转性 条件式 (13-29) ,又要满足非退化条件式 (13-30) 。满足条件式 (13-29)是旋转设计的必要条件,满足非退化条件式 (13-30)是使旋
转性成为可能的充分条件。两者结合起来才能使旋转性设计得以实现。
相关文档
最新文档