方差分析建模
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
yij = µ + δ i + ε ij a (3.2) ∑ niδ i = 0 i =1 ε ~ N (0, σ 2 ), i = 1,..., a, j = 1,..., n i ij
2. 单因素方差分析的 单因素方差分析的Matlab实现 实现 [p,c,s]=anova1(X) %比较 各列数据的均值是否相等 比较X各列数据的均值是否相等 比较 输出p是零假设成立时概率,对给定的α 输出 是零假设成立时概率,对给定的α,若p<α,则 是零假设成立时概率 α 有显著差异; 是方差分析表 是方差分析表, 用于多重比较的输入 用于多重比较的输入. 有显著差异;c是方差分析表,s用于多重比较的输入 输入X各列的元素相同,即各总体的样本大小相等, 输入 各列的元素相同,即各总体的样本大小相等, 各列的元素相同 称为均衡数据的方差分析, 称为均衡数据的方差分析,不均衡时用下面的命令 [p,c,s]=anova1(X,group) 输入: 是一个向量 从第一个总体的样本到第r个总 是一个向量, 输入:X是一个向量,从第一个总体的样本到第 个总 体的样本依次排列, 是与X有相同长度的向量 体的样本依次排列,group是与 有相同长度的向量, 是与 有相同长度的向量, 表示X中的元素是如何分组的 中的元素是如何分组的. 中某元素等于i,表 表示 中的元素是如何分组的 group中某元素等于 表 中某元素等于 中这个位置的数据来自第i个总体 因此group中分 示X中这个位置的数据来自第 个总体 因此 中这个位置的数据来自第 个总体.因此 中分 量必须取正整数, 直到r. 量必须取正整数,从1直到 直到
饲料
A1 A2 A3 A4
31.9 24.8 22.1 27.0
鱼的增重(xij) 鱼的增重( 27.9 31.8 28.4 25.7 26.8 27.9 23.6 27.3 24.9 30.8 29.0 24.5
35.9 26.2 25.8 28.5
四种不同饲料对鱼的增重效果是否显著 ?
解:这是单因素均衡数据的方差分析,Matlab程序 这是单因素均衡数据的方差分析, 程序 如下: 如下: A=[31.9 27.9 31.8 28.4 35.9 24.8 25.7 26.8 27.9 26.2 22.1 23.6 27.3 24.9 25.8 27.0 30.8 29.0 24.5 28.5]; %原始数据输入 原始数据输入 B=A'; % 将矩阵转置 将矩阵转置,Matlab中要求各列为不同水平 中要求各列为不同水平 [p,c,s]=anova1(B) 运行后得到一表一图,表是方差分析表(重要); 运行后得到一表一图,表是方差分析表(重要); 图是各列数据的盒子图, 图是各列数据的盒子图,离盒子图中心线较远的对应于 较大的F值 较小的概率p. 较大的 值,较小的概率
因为p=0.0029<0.01,故不同饲料对鱼的增重效 , 因为 果极为显著 .
四种不同饲料对鱼的增重效果极为显著 ,那么 哪一种最好呢? 哪一种最好呢?请看下图
Baidu Nhomakorabea35 Values
30
25
1
2 3 Column Number
4
此时, 此时,第一个图对应第一种饲料且离盒子图中 心线较远,效果最突出。 心线较远,效果最突出。如果从原始数据中去掉第 一种饲料的试验数据, 一种饲料的试验数据,得到的结果为各种饲料之间 对鱼的增重效果不显著 .
group=[ones(1,8),2*ones(1,4),3*ones(1,7)]; p=anova1(A, group)
方差分析表
280 260 240 Values 220 200 180 160 1 2 3
均值盒子图 由于概率p=0.1863比较大,故认为三种食料没有 比较大, 由于概率 比较大 显著差异. 显著差异
b=a’; % MATLAB只对各列进行分析 只对各列进行分析 [p,c,s]=anova1(b); % 方差分析 c=multcompare(s) % 多重比较
从方差分析表可知:四个实验室生产有差异,那么 从方差分析表可知:四个实验室生产有差异, 如何比较?软件输出c如下所示 如下所示: 列表示比较的 如何比较?软件输出 如下所示:1,2列表示比较的 实验室号码, , 实验室号码,3,5 列分别为置信区间左右端点 , 列是均值差的统计量观测值. 第4 列是均值差的统计量观测值
表3-2 饲喂不同食谱鼠的增重
食谱 体重增加量 164 190 203 205 206 214 228 257 甲 185 197 201 231 乙 187 212 215 220 248 265 281 丙 解:这是单因素非均衡数据的方差分析 A=[164 190 203 205 206 214 228 257 185 197 201 231 187 212 215 220 248 265 281];
3. 多重比较的 多重比较的MATLAB实现 实现 为方便找到具有显著差异的方案, 为方便找到具有显著差异的方案,我们给出 多重比较的MATLAB命令。 命令。 多重比较的 命令 C=multcompare(s) 其中输入s,由[p,c,s]=anova1(b);得到输出的结果; 得到输出的结果; 其中输入 , 得到输出的结果 输出C共有 共有5列 其中前两列给出样本编号, 输出 共有 列,其中前两列给出样本编号,后三列分 别为两个样本均值差的置信区间与估计量. 别为两个样本均值差的置信区间与估计量 练习:对于例 ,利用多重比较命令进行分析, 练习:对于例3.1,利用多重比较命令进行分析, 关键理解输出的含义。 关键理解输出的含义。
四个实验室试制同一型号纸张, 例3.3 四个实验室试制同一型号纸张,为了比较光 滑度每个实验室测量了8张纸 张纸, 滑度每个实验室测量了 张纸,进行方差分析
表3.3 纸张光滑度数据
实验室 A1 A2 A3 A4 38.7 39.2 34 34 41.5 39.3 35 34.8 43.8 39.7 39 34.8
若置信区间包含原点则无显著差异,可见只有 实 若置信区间包含原点则无显著差异,可见只有1,4实 验室有显著差异. 验室有显著差异
另外,软件输出一幅图形,告知 , 有显著差异 有显著差异. 另外,软件输出一幅图形,告知1,4有显著差异
Click on the group you want to test 1 2 3 4
34
36 38 40 42 44 46 48 The means of groups 1 and 4 are significantly different
50
内蒙古网络挑战赛C题 例3.4 内蒙古网络挑战赛 题,就可以用方差分析 比如,考虑承保车辆的车龄统计数据, 比如,考虑承保车辆的车龄统计数据,从2010年9 年 月到2011年3月共有 个月统计数据,我们看成 个 月共有7个月统计数据 月到 年 月共有 个月统计数据,我们看成7个 水平.根据表 分析到期车辆续保率有无差异? 根据表3-4分析到期车辆续保率有无差异 水平 根据表 分析到期车辆续保率有无差异?
纸张光滑度
44.5 41.4 40 35.4 45.5 41.8 43 37.2 46 42.9 43 37.8 47.7 43.3 44 41.2 58 45.8 45 42.8
解:
a=[38.7,41.5,43.8,44.5,45.5,46,47.7,58 39.2,39.3,39.7,41.4,41.8,42.9,43.3,45.8 34,35,39,40,43,43,44,45 34,34.8,34.8,35.4,37.2,37.8,41.2,42.8]; %输入数据 输入数据
例3.1. 某水产研究所为了比较四种不同配合饲料 对鱼的饲喂效果,选取了条件基本相同的鱼20尾 对鱼的饲喂效果,选取了条件基本相同的鱼 尾, 随机分成四组,投喂不同饲料, 随机分成四组,投喂不同饲料,经一个月试验以 各组鱼的增重结果列于下表。 后,各组鱼的增重结果列于下表。
饲喂不同饲料的鱼的增(单位: 表3-1 饲喂不同饲料的鱼的增(单位:10g) )
表中所列出的各项意义如下: 表中所列出的各项意义如下:
Source 方差来源 Columns 因素A组间) (因素A组间) Error误差 Error误差 组内) (组内) Total 总和 SS 平方和 SSA SSE SST df 自由度 r-1 n-r n-1 MS均方差 MS均方差 SS/(r-1) SS/(rSS/(nSS/(n-r) F统计量 7.14 P值 0.0029
1.0000 1.0000 1.0000 2.0000 2.0000 3.0000 2.0000 3.0000 4.0000 3.0000 4.0000 4.0000 -1.4753 4.0375 9.5503 -0.1753 5.3375 10.8503 2.9497 8.4625 13.9753 -4.2128 1.3000 6.8128 -1.0878 4.4250 9.9378 -2.3878 3.1250 8.6378
将每次试验结果 yij 分解为
yij = µ + δ i + ε ij
i =1
其中µ表示总的均值, 其中µ表示总的均值, a δi=µi- µ是水平 i对指标的效应 满足∑ niδ i = 0 是水平A 对指标的效应,满足 是相互独立的随机误差,服从正态分布N(0,σ2). εij是相互独立的随机误差,服从正态分布 σ 建立方差分析模型如下: 建立方差分析模型如下:
p=anova1(B(:,2:4))
30 28 Values 26 24 22 1 2 Column Number 3
为比较同一类型的三种不同食谱的营养效果, 例3.2 为比较同一类型的三种不同食谱的营养效果, 支幼鼠随机分为三组, 将19支幼鼠随机分为三组,各采用三种食谱喂养 12周 支幼鼠随机分为三组 各采用三种食谱喂养. 周 后测得体重,三种食谱营养效果是否有显著差异? 后测得体重,三种食谱营养效果是否有显著差异?
H 0 : µ1 = ... = µa , H1 : µ1 ,..., µa
单因素方差分析 1单因素方差分析模型 单因素方差分析模型 设指标变量为Y,因素为 因素为A, 设指标变量为 因素为 ,它可以取几个不同 的水平,记为A 在水平A 上作若干次试验, 的水平,记为 1,…,Aa, 在水平 i上作若干次试验, 试验结果为y 需要考虑因素A对指标的影响 试验结果为 i1,…,yini,需要考虑因素 对指标的影响 需要考虑因素 是否显著. 是否显著 A在某个水平下的试验结果看成一个随机变量 将A在某个水平下的试验结果看成一个随机变量 (总体 ,因此考虑 取不同水平时的指标有无显著差 总体), 总体 因此考虑A取不同水平时的指标有无显著差 就是检验几个总体的均值是否相等.假定在水平 异,就是检验几个总体的均值是否相等 假定在水平 Ai下的总体服从正态分布,他们可以有不同的均值µi, 下的总体服从正态分布,他们可以有不同的均值µ 但有相同的方差σ 需要检验假设: 但有相同的方差σ2,需要检验假设: 不全相等(3.1) 不全相等
方差分析建模 方差分析作为分析试验数据的一种重要工具, 方差分析作为分析试验数据的一种重要工具,是 基本方法之一.方差 数理统计的 基本方法之一 方差 分析是研究一些因素 自变量)对某个指标(因变量)的相关关系, (自变量)对某个指标(因变量)的相关关系,研 究哪些因素对指标的影响是显著的, 究哪些因素对指标的影响是显著的,哪些因素对指 标的影响不显著,最终找到有力的试验条件. 标的影响不显著,最终找到有力的试验条件. 当试验中考察的因素只有一个时, 当试验中考察的因素只有一个时,称为单因素试 验;若同时研究两个或两个以上的因素对试验指标的 影响时,则称为两因素或多因素试验。通常方差分析 影响时,则称为两因素或多因素试验。 简称为ANOVA(Analysis of Variance) 简称为