数学建模优秀方法之方差分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、构造检验的统计量
(计算全部观察值的总均值 )
1. 全部观察值的总和除以观察值的总个数
2. 计算公式为
k ni
k
xij
ni xi
x i1 j1 i1
n
n
式中:n n1 n2 nk
二、构造检验的统计量
(前例计算结果 )
表5-2 四种颜色饮料的销售量及均值
超市
水平A ( i )
完全窗口分析 按AnalyzeCompared Means One-Way Anova顺序单击。
打开 One-Way Anova主对话框,如图
选入因变量, 可有多个变量
选入分组变量,必须满足 只取有限个水平的条件。
见图 5--2 见图 5--3
One-Way Anova主对话框
见图 5--4
对组间平方和 进行分解并检 验。
▪ SST 的自由度为n-1,其中n为全部观察值的个数 ▪ SSA的自由度为k-1,其中k为因素水平(总体)的个
数
▪ SSE 的自由度为n-k
二、构造检验的统计量
(计算均方 MS)
1. SSA的均方也称组间方差,记为MSA,计算
公式为
MSA SSA 前例的计算结果:MSA 76.8455 25.6152
如果只包括第一与第二组的均值,则第三、第四个可不输入。 可同时建多个多项式,输入一组后按Next按钮;如果要修改则 按Previous按钮,修改后按Change按钮,删除按Remove按钮。
见图 5—2 多项式比较对话框
在此对话框中选择进行两两比较的方法
1.用t检验完成组间成对均值的比较,对多重比较错误率不
i 1 j 1
i 1
▪ 前例的计算结果:SSA = 76.8455
二、构造检验的统计量
(三个平方和的关系)
▪ 总离差平方和(SST)、误差项离差平方和
(SSE)、水平项离差平方和 (SSA) 之间的关系
k
ni
xij x 2
k
来自百度文库ni
k
xij x 2 ni xi x 2
i1 j 1
2. 设平的4为均假1绿为销设色无售饮色量料饮,的料3平为的均橘平销黄均售色销量饮售料,量的也,平就2粉是均色销检饮售验料下量的面,
▪ H0: 1 2 3 4 ▪ H1: 1 , 2 , 3 , 4 不全相等
3. 检验上述假设所采用的方法就是方差分析
二、方差分析基本概念
1. 因素或因子 ▪ 所要检验的对象称为因子 ▪ 要分析饮料的颜色对销售量是否有影响,颜色是要检
验的因素或因子
2. 水平
▪ 因素的具体表现称为水平 ▪ A1、A2、A3、 A4四种颜色就是因素的水平
3. 观察值
▪ 在每个因素水平下得到的样本值 ▪ 每种颜色饮料的销售量就是观察值
1. 试验
▪ 这里只涉及一个因素,因此称为单因素水平的试
验
2. 总体
▪ 因素的每一个水平可以看作是一个总体 ▪ 比体如A1、A2、A3、 A4四种颜色可以看作是四个总
率,而是给所有检验的误差率设定一个临界值
1.用t检验进行配对比较, 2.用Studentized 最大系数进行配对比较检验 3.同上,这种方法有时比较自由 4.用Studentized Range统计量进行配对比较检验
11.用Studentized最大系数进行比较检验和范围检验 12.用Studentized最大系数进行配对比较检验
二、构造检验的统计量
(计算水平项平方和 SSA)
1. 各水平均值 x i (i 1,2, , k )与总平均值 x的离差
平方和
2. 反映各水平的样本均值之间的差异程度,又称组
间平方和
3. 该平方和既包括随机误差,也包括系统误差
4. 计算公式为
k
SSA
ni
k
xi x 2 ni xi x 2
i1 j 1
i 1
SST = SSE + SSA
二、构造检验的统计量
(三个平方和的作用)
1. SST反映全部观察值的差异状况;SSE反映每个样本
各观察值的差异状况;SSA反映各水平的样本均值之间
的差异程度
2. 如果原假设成立,即1 = 2 =…= k为真,则表明
SSA很小,SSE很大。
3. 判断因素的水平是否对其观察值有影响,实际上就
进行调整
2.同上,但通过设置每个检验的误差率来控制整个误差率
3.用t检验完成多重配对比较,为多重比较调整显著值,但
比2的界限要小
4.对所有可能的组合进行同步进入的均值配对比较
5.用F检验进行多重比较
6.在Studentized Range分布下进行多重比较
7.用Studentized Range分布进行所有各组均值间的配对比
2. 对前面的例子
▪ H0: 1 = 2 = 3 = 4
• 颜色对销售量没有影响
▪ H0: 1 ,2 ,3, 4不全相等
• 颜色对销售量有影响
二、构造检验的统计量
1. 为检验H0是否成立,需确定检验的统计量 2. 构造统计量需要计算
▪ 水平的均值 ▪ 全部观察值的总均值 ▪ 离差平方和 ▪ 均方(MS)
=115.9295
二、构造检验的统计量
(计算误差项平方和 SSE)
1. 每个水平的各样本数据与该水平均值的离差平方
和
2. 反映每个样本各观察值的差异状况,又称组内离
差平方和
3. 该平方和反映的是随机误差的大小
4. 计算公式为
k ni
SSE
xij xi 2
i1 j 1
▪ 前例的计算结果:SSE = 39.084
k 1
4 1
2. SSE的均方也称组内方差,记为MSE,计算公 式为
MSE SSE 前例的计算结果:MSE 39.084 2.4428
nk
20 4
二、构造检验的统计量
(计算检验的统计量 F )
1. 将MSA和MSE进行对比,即得到所需要的检
验统计量F
2. 当H0为真时,二者的比值服从分子自由度为
显示每组系 数的总和。
进行军制的多项式
比较,并在其后的 参数框中选定阶数 。
如一阶:Linear, 二阶:Quadratic, 三阶:Cubic…….最 高可达五阶
输入多项式各组均值的系数,输入一个系数单击Add按钮。系数 进入下面方框..依次输入各组均值的系数。
如果多项式中只包括第一与第四组的均值的系数,必须把第二、 第三个系数输入为0。
较
8.用Studentized Range统计量进行所有组间均值的配对比
较,
用所有配对比较集合的误差率作为试验误差率
9.同8,但,其临界值是TUKEY和S-N-K的相应值的平均值 10.进行配对比较时,使用的逐步顺序与Student-Newman-
Keuls检验的顺序一样,但并不是给每个检验设定一个误 差
是比较组间方差与组内方差之间差异的大小
4. 为检验这种差异,需要构造一个用于检验的统计量
二、构造检验的统计量
(计算均方 MS)
1. 各离差平方和的大小与观察值的多少有关,为
了消除观察值多少对离差平方和大小的影响, 需要将其平均,这就是均方差。
2. 计算方法是用离差平方和除以相应的自由度
3. 三个平方和的自由度分别是
二、构造检验的统计量
(计算水平的均值 )
1. 假定从第i个总体中抽取一个容量为ni的简单
随机样本,第i个总体的样本均值为该样本的
全部观察值总和除以观察值的个数
2. 计算公式为
ni
xij
xi
j 1
ni
(i 1,2,, k )
式中: ni为第 i 个总体的样本观察值个数
xij 为第 i 个总体的第 j 个观察值
(j)
无色(A1) 粉色(A2) 橘黄色(A3) 绿色(A4)
1
26.5
31.2
27.9
30.8
2
28.7
28.3
25.1
29.6
3
25.1
30.8
28.5
32.4
4
29.1
27.9
24.2
31.7
5
27.2
29.6
26.5
32.8
合计
136.6
147.8
132.2
157.3
573.9
水平均值 x1 =27.32 x2=29.56 x3=26.44 x4=31.46 总均值
观察值 ( j )
1 2 : : n
水平A1
x11 x21
: : xn1
因素(A) i
水平A2
…
x12
…
x22
…
:
:
:
:
xn2
…
水平Ak
x1k x2k : : xnk
单因素方差分析的原理步骤
• 提出假设 • 构造检验统计量 • 统计决策
一、提出假设
1. 一般提法
▪ H0: 1 = 2 =…= k (因素有k个水平) ▪ H1: 1 ,2 ,… ,k不全相等
2.某高原研究组将籍贯相同、年龄相同、身高 体重接近的30名新战士随机分为三组,甲组为 对照组,按常规训练,乙组为锻炼组,每天除 常规训练外,接受中速长跑与健身操锻炼,丙 组为药物组,除常规训练外,服用抗疲劳药物, 一月后测定第一秒用力肺活量(L),结果见表。 试比较三组第一秒用力肺活量有无差别。
k-1、分母自由度为 n-k 的 F 分布,即
F MSA ~ F (k 1, n k ) MSE
前例的计算结果: F 25.6152 10.486 2.4428
三、统计决策
▪ 将统计量的值F与给定的显著性水平的临
界的决值策F进行比较,作出接受或拒绝原假设H0
▪ 根据给定的显著性水平,在F分布表中查找与
3. 样本数据
▪ 上面的数据可以看作是从这四个总体中抽取的样
本数据
第二节 单因素方差分析
• 单因素方差分析是检验由单一因素影响 的多组样本某因变量的均值是否有显著 差异的问题。如果各组之间有显著差异, 说明这个因素(分类变量)对因变量是 有显著影响的,因素的不同水平会影响 到因变量的取值。
单因素方差分析的数据结构
多重比较检验 LSD方法 最小显著性差异法,最小显著性差异法的字面就体现了其 检验敏感性高的特点,即水平间的均值只要存在一定程度 的微小差异就可能被检验出来
1.某企业在制定某商品的广告策略时, 收集了该商品在不同地区采用不同的 广告形式促销后的销售额数据,希望 对广告形式和地区是否对销售额产生 影响进行分析。
方差分析
主要内容:
• 一、方差分析简介
• 二、单因素方差分析
• 三、多因素方差分析
方差分析简介
• 一、为什么要做方差分析 • T检验法适用于样本均值与总体均值及两
样本均值间的差异显著性检验,但在生 产和科学研究中经常会遇到多个水平比
较问题,即需要检验多个总体均值是否 相等。
(引例)
某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘 黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、 包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模 相仿的五家超级市场上收集了前一时期该饮料的销售情况,见表5-1。试 分析饮料的颜色是否对销售量产生影响。
第临一界自值由F度df1=k-1、第二自由度df2=n-k 相应的
▪ 若差F异>是F显,著则的拒,绝所原检假验设的H因0 素,(表A)对明观均察值值之有间显的
著影响
▪ 若的因F素F(A,)对则观不察能值拒没绝有原显假著设影H响0 ,表明所检验
单方差分析的进一步分析
方差齐性检验 控制变量的不同水平下各观测变量总体是否相等进行分析
图 5—4 Options对话框
输 出 均 值 分 布 图
选择缺失值的处置方式: 在检验变量中含有缺失值的观测将不被计算 在任何一个变量中含有缺失值的观测都将不被计算
第三节 双因素方差分析
• 单因变量的双因素方差分析是对观察的现象 (因变量)受两个因素或变量的影响进行分析, 检验不同水平组合之间对因变量的影响是否显 著。双因素方差分析的应用范围很广,如粮食 产量受到气候、温度因素的影响;某生物产品 的生产过程不仅受催化剂多少的影响、还受温 度高低的影响等,甚至两因素变量之间的交互 作用对因变量也有一定的影响。要分清楚哪个 因素的影响作用比较大,就可以应用双因素方 差分析的方法来解决。
规定显著性水平,默认为0.05
13.用Studentized最大系数进行比较检验,使用贝叶斯逼近.
14.用t检验进行配对比较.
5—3 Post Hoc对话框
规定输出的统计量: 输出描述统计量,包括观测量数
目,均值,最小值,最大值,标准差,标 准误差,各组中每个因变量的95% 的置信区间
用Levene检验进行方差一致性 检验
表5-1 该饮料在五家超市的销售情况 超市 无色 粉色 橘黄色 绿色
1
26.5
31.2
27.9
30.8
2
28.7
28.3
25.1
29.6
3
25.1
30.8
28.5
32.4
4
29.1
27.9
24.2
31.7
5
27.2
29.6
26.5
32.8
1. 检验饮料的颜色对销售量是否有影响,也就 是检验四种颜色饮料的平均销售量是否相同
观察值个数 n1=5
n2=5
n3=5
n4=5 x =28.695
二、构造检验的统计量
(计算总离差平方和 SST)
1. 全部观察值 xij与总平均值 x 的离差平方和 2. 反映全部观察值的差异状况
3. 其计算公式为
k
SST
ni
xij x 2
i1 j 1
▪ 前例的计算结果:
SST = (26.5-28.695)2+(28.7-28.695)2+…+(32.8-28.695)2