第九章方差分析 20161201

合集下载

spss第九章方差分析PPT课件

19
多重比较方法
LSD法：实际上就是t检验的变形，只是在变异和自由度的计算上利用了整个样本信息，因此仍然存在放大一类错误的问题
Scheffe法：当各水平个案数不相等，或者想进行复杂的比较时，用此法较为稳妥。但它相对比较保守
S-N-K法：是运用最广泛的一种两两比较方法。它采用Student Range 分布进行所有各组均值间的配对比较。该方法保证在H0真正成立时总的α 水准等于实际设定值，即控制了一类错误。
2
二，分析目的
方差分析是从数据间的差异入手，分析哪些因素是影响数据差异的众多因素中的主要因素.
例如：影响某农作物亩产量的因素(品种、施肥量、气候
等) 影响推销某种商品的推销额(不同的推销策略、价
格、包装方式、推销人员的形象等)
3
三，涉及的概念 (1)观察因素: 观测变量 (2)影响因素：
上述统计量一般十分相近 Pillai最保守，也较稳健，常用
50
应用举例
不同类型地区的居民收入和教育差异分析 பைடு நூலகம்多元单因素方差分析 •总体有差异，单个无差异 •通过Options进行直观比较
51
52
53
54
2020/1/11
55
43
SPSS调用程序： Analyze - General Linear Model -
Univariate
44
Part Seven 3 协方差分析
(1)目的:将无法或很难控制的因素作为协变量,在排除协变量影响的条件下更精确地分析控制变量对观察变量的影响.
45
(2)基本思路:
Sum of Squares
df

概率论与数理统计第九章方差分析

第九章方差分析在生产过程和科学实验中，我们经常遇到这样的问题：影响产品产量、质量的因素很多.例如，在化工生产中，影响结果的因素有：配方、设备、温度、压力、催化剂、操作人员等.我们需要通过观察或试验来判断哪些因素对产品的产量、质量有显著的影响.方差分析(Analysis of variance)就是用来解决这类问题的一种有效方法.它是在20世纪20年代由英国统计学家费舍尔首先使用到农业试验上去的.后来发现这种方法的应用范围十分广阔，可以成功地应用在试验工作的很多方面.第一节单因素试验的方差分析在试验中，我们将要考察的指标称为试验指标，影响试验指标的条件称为因素.因素可分为两类，一类是人们可以控制的；一类是人们不能控制的.例如，原料成分、反应温度、溶液浓度等是可以控制的，而测量误差、气象条件等一般是难以控制的.以下我们所说的因素都是可控因素，因素所处的状态称为该因素的水平.如果在一项试验中只有一个因素在改变，这样的试验称为单因素试验，如果多于一个因素在改变，就称为多因素试验.本节通过实例来讨论单因素试验.1.数学模型例9.1某试验室对钢锭模进行选材试验.其方法是将试件加热到700℃后，投入到20℃的水中急冷，这样反复进行到试件断裂为止，试验次数越多，试件质量越好.试验结果如表9-1.表9-1试验的目的是确定4种生铁试件的抗热疲劳性能是否有显著差异.这里，试验的指标是钢锭模的热疲劳值，钢锭模的材质是因素，4种不同的材质表示钢锭模的4个水平，这项试验叫做4水平单因素试验.例9.2考察一种人造纤维在不同温度的水中浸泡后的缩水率，在40℃，50℃, (90)的水中分别进行4次试验.得到该种纤维在每次试验中的缩水率如表92.试问浸泡水的温度对缩水率有无显著的影响？表9-2 （%）单因素试验的一般数学模型为：因素A 有s 个水平A 1，A 2，…，A s ,在水平A j (j =1,2,…,s )下进行n j (n j ≥2)次独立试验，得到如表9-3的结果：表9-3x 11 x 12 … x 1s x 21 x 22 … x 2s … … … … 11n x 22n x … s n s xT ·1 T ·2 … T ·s1x • 2x • … s x •μ1 μ2 … μs假定：各水平A j (j =1,2,…,s )下的样本x ij ~N (j ,),i =1,2,…,n j ,j =1,2,…,s ,且相互独立. 故x ij -μj 可看成随机误差，它们是试验中无法控制的各种因素所引起的，记x ij -μj =εij ,则⎪⎩⎪⎨⎧==+=.,),0(~,,,2,1;,,2,1,2相互独立各ij ij j ij j ij N s j n i x εσεεμ (9.1) 其中μj 与σ2均为未知参数.（9.1）式称为单因素试验方差分析的数学模型.方差分析的任务是对于模型（9.1），检验s 个总体N (μ１，σ2),…,N (μs ,σ2)的均值是否相等，即检验假设012112:;:,,,s s H H μμμσσσ===⎧⎨⎩不全相等. (9.2) 为将问题（9.2）写成便于讨论的形式，采用记号μ=11sj j j n n μ=∑，其中n =1sjj n=∑，μ表示μ１，μ2,…,μs 的加权平均，μ称为总平均.δj =μj -μ, j =1,2,…,s ，δj 表示水平Aj 下的总体平均值与总平均的差异.习惯上将δj 称为水平A j 的效应.利用这些记号，模型（9.1）可改写成：x ij =μ+δj +εij ,x ij 可分解成总平均、水平A j 的效应及随机误差三部分之和120,~(0,),.1,2,,;1,2,,.sj j j ijij j n N i n j s δεσε=⎧=⎪⎨⎪==⎩∑各相互独立 (9.1)′假设（9.2）等价于假设012112:0;:,,,s s H H δδδδδδ====⎧⎨⎩不全零.（9.2）′ 2.平方和分解我们寻找适当的统计量，对参数作假设检验.下面从平方和的分解着手，导出假设检验（9.2）′的检验统计量.记S T =211()jn sijj i xx ==-∑∑， (9.3)这里111jns ij j i x x n ===∑∑，S T 能反应全部试验数据之间的差异.又称为总变差.A j 下的样本均值 11jn j iji jx xn •==∑. (9.4)注意到2222()()()()2()()ij ij j j ij j j ij j j x x x x x x x x x x x x x x ••••••-=-+-=-+-+--，而 1111()()()()jj n n ssij j j j ij j j i j i x x x x x x x x ••••====⎡⎤--=--⎢⎥⎣⎦∑∑∑∑=11()0.j n sj ij j j j i x x x n x ••==⎛⎫--= ⎪ ⎪⎝⎭∑∑记 S E =211()jn sijj j i xx •==-∑∑，（9.5）S E 称为误差平方和;记 S A =22111()()jn ssjj j j i j xx n x x ••===-=-∑∑∑，（9.6）S A 称为因素A 的效应平方和.于是S T =S E +S A . （9.7）利用εij 可更清楚地看到S E ,S A 的含义，记111jns ij j i n εε===∑∑为随机误差的总平均,11jn j iji jn εε•==∑, j =1,2,…,s .于是S E =221111()()jjn n ssijj ij j j i j i xx εε••====-=-∑∑∑∑; (9.8)S A =2211()()ssj jj j j j j n xx n δεε••==-=+-∑∑. (9.9)平方和的分解公式（9.7）说明.总平方和分解成误差平方和与因素A 的效应平方和.（9.8）式说明S E 完全是由随机波动引起的.而（9.9）式说明S A 除随机误差外还含有各水平的效应δj ，当δj 不全为零时，S A 主要反映了这些效应的差异.若H 0成立，各水平的效应为零，S A 中也只含随机误差，因而S A 与S E 相比较相对于某一显著性水平来说不应太大.方差分析的目的是研究S A 相对于S E 有多大，若S A 比S E 显著地大，这表明各水平对指标的影响有显著差异.故需研究与S A /S E 有关的统计量.3.假设检验问题当H 0成立时，设x ij ~N (μ,σ2)(i =1,2,…,n j ；j =1,2,…,s )且相互独立，利用抽样分布的有关定理，我们有22~(1)AS s χσ-, (9.10) 22~()ES n s χσ-, (9.11)F =()(1)AEn s S s S -- ~F (s -1,n -s ). (9.12)于是，对于给定的显著性水平α(0<α<1),由于P {F ≥F α(s -1,n -s )}=α, (9.13)由此得检验问题（9.2）′的拒绝域为F ≥F α(s -1,n -s ).（9.14）由样本值计算F 的值，若F ≥F α,则拒绝H 0，即认为水平的改变对指标有显著性的影响；若F <F α,则接受原假设H 0，即认为水平的改变对指标无显著影响. 上面的分析结果可排成表9-4的形式，称为方差分析表.当F ≥F 0.05(s -1,n -s )时，称为显著，当F ≥F 0.01(s -1,n -s )时，称为高度显著.在实际中，我们可以按以下较简便的公式来计算S T ，S A 和S E .记T ·j =1jn iji x=∑, j =1,2,…,s ,T ··=11jn sijj i x==∑∑，即有22221111222211,,.j jn n s s T ij ij j i j i s s j A j j j j j E T AT S x nx x n T T S n x nx n n S S S ••====••••==⎧=-=-⎪⎪⎪⎪=-=-⎨⎪⎪=-⎪⎪⎩∑∑∑∑∑∑ (9.15) 例9.3 如上所述，在例9.1中需检验假设H 0:μ1=μ2=μ3=μ4；H 1:μ1,μ2,μ3,μ4不全相等.给定α=0.05,完成这一假设检验.解 s =4,n 1=7,n 2=5,n 3=8,n 4=6,n =26.S T =22211(4257)69895926jn sij j i T x n ••==-=-∑∑=1957.12， S A =2221(4257)697445.4926sj j j T T n n •••=-=-∑=443.61， S E =S T -S A =1513.51.得方差分析表9-5.表9-5因 F (3,22)=2.15<F 0.05(3,22)=3.05. 则接受H 0，即认为4种生铁试样的热疲劳性无显著差异.例9.4 如上所述，在例9.2中需检验假设H 0:μ1=μ2=…=μ6； H 1:μ1,μ2,…,μ6不全相等.试取α=0.05,α=0.01，完成这一假设检验.解 s =6, n 1=n 2=…=n 6=4,n =24.S T =2211jn sij j i T x n ••==-∑∑=112.27,S A =221sj j j T T n n•••=-∑=56,S E=S T-S A=56.27.得方差分析表9-6.0.050.01由于 4.25=F0.01(5,18)>F A=3.583>F0.05(5,18)=2.77,故浸泡水的温度对缩水率有显著影响，但不能说有高度显著的影响.本节的方差分析是在这两项假设下，检验各个正态总体均值是否相等.一是正态性假设，假定数据服从正态分布；二是等方差性假设，假定各正态总体方差相等.由大数定律及中心极限定理，以及多年来的方差分析应用，知正态性和等方差性这两项假设是合理的.第二节双因素试验的方差分析进行某一项试验，当影响指标的因素不是一个而是多个时，要分析各因素的作用是否显著，就要用到多因素的方差分析.本节就两个因素的方差分析作一简介.当有两个因素时，除每个因素的影响之外，还有这两个因素的搭配问题.如表9-7中的两组试验结果，都有两个因素A和B，每个因素取两个水平.表9-7(b)表9-7（a）中，无论B在什么水平（B1还是B2），水平A2下的结果总比A1下的高20；同样地，无论A是什么水平，B2下的结果总比B1下的高40.这说明A和B单独地各自影响结果，互相之间没有作用.表9-7(b)中，当B为B1时，A2下的结果比A1的高，而且当B为B2时，A1下的结果比A2的高；类似地，当A为A1时，B2下的结果比B1的高70，而A为A2时，B2下的结果比B1的高30.这表明A的作用与B所取的水平有关，而B的作用也与A所取的水平有关.即A 和B不仅各自对结果有影响，而且它们的搭配方式也有影响.我们把这种影响称作因素A和B的交互作用，记作A×B.在双因素试验的方差分析中，我们不仅要检验水平A和B的作用，还要检验它们的交互作用.1.双因素等重复试验的方差分析设有两个因素A，B作用于试验的指标，因素A有r个水平A1,A2,…,Ar,因素B有s个水平B1,B2,…,B s,现对因素A，B的水平的每对组合(A i,B j),i=1,2,…,r；j=1,2,…,s都作t(t≥2)次试验（称为等重复试验），得到如表9-8的结果：表9-8设x ijk ~N (ij ,), i =1,2,…,r ； j =1,2,…,s ； k =1,2,…,t ,各x ijk 独立.这里ij ,均为未知参数.或写为⎪⎩⎪⎨⎧===+=.,,,2,1),,0(~,,,2,1;,,2,1,2相互独立各ijkijk ijk ij ijk t k N s j r j x εσεεμ (9.16) 记μ=111,r s ij i j rs μ==∑∑, 11si ij j s μμ•==∑, i =1,2,…,r ,11rj ij i r μμ•==∑, j =1,2,…,s ,,i i αμμ•=-, i =1,2,…,r , j j βμμ•=-, j =1,2,…,s ,ij ij i j γμμμμ••=--+.于是 μij =μ+αi +βj +γij . (9.17)称μ为总平均，αi 为水平A i 的效应，βj 为水平B j 的效应，γij 为水平A i 和水平B j 的交互效应，这是由A i ,B j 搭配起来联合作用而引起的.易知1rii α=∑=0,1sjj β=∑=0，1riji γ=∑=0, j =1,2,…,s ,1sijj γ=∑=0, i =1,2,…,r ，这样（9.16）式可写成⎪⎪⎪⎩⎪⎪⎪⎨⎧=======++++=∑∑∑∑====.,,,2,1;,,2,1;,,2,1),,0(~,0,0,0,0,21111相互独立各ijkijk s j ij r i ij s j j r i i ijk ij j i ijk t k s j r i N x εσεγγβαεγβαμ (9.18) 其中μ,αi ,βj ,γij 及σ2都为未知参数.（9.18）式就是我们所要研究的双因素试验方差分析的数学模型.我们要检验因素A ，B 及交互作用A ×B 是否显著.要检验以下3个假设：⎩⎨⎧=====.,,:,0:21112101不全为零r r H H αααααα ⎩⎨⎧=====.,,:,0:21122102不全为零s s H H ββββββ ⎩⎨⎧=====.,,:,0:121113121103不全为零rs rs H H γγγγγγ 类似于单因素情况，对这些问题的检验方法也是建立在平方和分解上的.记1111r s tijk i j k x x rst ====∑∑∑, 11tij ijk k x x t •==∑, i =1,2,…,r ； j =1,2,…,s ，111s ti ijk j k x x st ••===∑∑, i =1,2,…,r ， 111r tj ijk i k x x rt ••===∑∑, j =1,2,…,s ， S T =2111()rstijk i j k x x ===-∑∑∑. 不难验证,,,i j ij x x x x •••••分别是μ,μi ·,μ·j ,μij 的无偏估计.由 ()()()()ijk ijk ij i j ij i j x x x x x x x x x x x x ••••••••••-=-+-+-+--+，1≤i ≤r ,1≤j ≤s ,1≤k ≤t得平方和的分解式：S T =S E ＋S A ＋S B ＋S A ×B ， (9.19)其中S E =2111()rstijkij i j k xx •===-∑∑∑，S A =1()2ri i stxx ••=-∑，S B =21()sj j rtxx ••=-∑，S A ×B =211()rsij i j i j txx x x •••••==--+∑∑.S E 称为误差平方和，S A ，S B 分别称为因素A ，B 的效应平方和，SA ×B 称为A ，B 交互效应平方和.当H 01:α1=α2=…=αr =0为真时，F A =[](1)(1)A ES S r rs t -- ~F (r -1,rs (t -1))；当假设H 02为真时，F B =[](1)(1)BES S s rs t --~F (s -1,rs (t -1))；当假设H 03为真时，F A ×B =[](1)(1)(1)A BES S r s rs t ⨯--- ~F ((r -1)(s -1),rs (t -1)).当给定显著性水平α后，假设H 01，H 02，H 03的拒绝域分别为：(1,(1));(1,(1));(1)(1),(1)).A B A BF F r rs t F F s rs t F F r s rs t ααα⨯≥--⎧⎪≥--⎨⎪≥---⎩ (9.20) 经过上面的分析和计算，可得出双因素试验的方差分析表9-9.在实际中，与单因素方差分析类似可按以下较简便的公式来计算S T ，S A ，S B ，S A ×B ,S E . 记 T ···=111r s tijki j k x===∑∑∑，T ij ·=1tijkk x=∑, i =1,2,…,r ; j =1,2,…,s ，T i ··=11stijkj k x==∑∑, i =1,2,…,r ,T ·j ·=11r tijki k x==∑∑, j =1,2,…,s ,即有221112212212211,1,1,1,.r s tT ijk i j k r A i i s B j j r s A B ij A B i j E T A B A B T S x rst T S T st rst T S T rt rst T S T S S t rst S S S S S •••===•••••=•••••=•••⨯•==⨯⎧=-⎪⎪⎪=-⎪⎪⎪⎨=-⎪⎪⎪=---⎪⎪⎪=---⎩∑∑∑∑∑∑∑ (9.21) 例9.5 用不同的生产方法（不同的硫化时间和不同的加速剂）制造的硬橡胶的抗牵拉强度（以kg ·cm -2为单位）的观察数据如表9-10所示.试在显著水平0.10下分析不同的硫化时间（A ），加速剂（B ）以及它们的交互作用（A ×B ）对抗牵拉强度有无显著影响.表9-10010203r =s =3, t =2， T ···,T ij ·,T i ··,T ·j ·的计算如表9-11.表9-11S T =22111,r s tijki j k T xrst•••===-∑∑∑=178.44， S A =2211r i i T T st rst•••••=-∑=15.44，S B =2211s j j T T rt rst •••••=-∑=30.11，S A ×B =22111r s ij A B i j T T S S t rst••••==---∑∑ =2.89，S E =S T -S A -S B -S A ×B =130，得方差分析表9-12.由于F 0.10(2,9)=3.01>F A ,F 0.10(2,9)>F B ,F 0.10(4,9)=2.69>F A ×B ,因而接受假设H 01,H 02,H 03,即硫化时间、加速剂以及它们的交互作用对硬橡胶的抗牵拉强度的影响不显著.2.双因素无重复试验的方差分析在双因素试验中，如果对每一对水平的组合（A i ,B j ）只做一次试验，即不重复试验，所得结果如表9-13.这时ij x •=x ijk ,S E =0,S E 的自由度为0，故不能利用双因素等重复试验中的公式进行方差分析.但是，如果我们认为A ，B 两因素无交互作用，或已知交互作用对试验指标影响很小，则可将S A ×B 取作S E ，仍可利用等重复的双因素试验对因素A ，B 进行方差分析.对这种情况下的数学模型及统计分析表示如下：由（9.18）式,112,0,0,~(0,),1,2,,;1,2,,,.ij i j ij r si j i j ij ijk x N i r j s μαβεαβεσε===+++⎧⎪⎪==⎪⎨⎪==⎪⎪⎩∑∑各相互独立 (9.22)要检验的假设有以下两个：⎩⎨⎧=====.,,:,0:21112101不全为零r r H H αααααα ⎩⎨⎧=====.,,:,0:21122102不全为零s s H H ββββββ 记 1111111,,,r s s rij i ij j ij i j j i x x x x x x rs s r ••=======∑∑∑∑平方和分解公式为：S T =S A +S B +S E ， (9.23)其中 22111(),(),rssT ijA i i j j S xx S s x x •====-=-∑∑∑22111(),(),srsB j E ij i j j i j S r x x S x x x x •••====-=--+∑∑∑分别为总平方和、因素A ，B 的效应平方和和误差平方和.取显著性水平为α,当H 01成立时，F A =(1)AEs S S - ~F ((r -1),(r -1)(s -1))， H 01拒绝域为F A ≥F α((r -1),(r -1)(s -1)). (9.24)当H 02成立时，F B =(1)BEr S S - ~F ((s -1),(r -1)(s -1))， H 02拒绝域为F B ≥F α((s -1),(r -1)(s -1)). (9.25)得方差分析表9-14.例9.6 测试某种钢不同含铜量在各种温度下的冲击值（单位：kg ·m ·cm ），表9-15列出了试验的数据（冲击值），问试验温度、含铜量对钢的冲击值的影响是否显著？（α=0.01）解由已知，r =4,s =3,需检验假设H 01,H 02，经计算得方差分析表9-16.0.01A 01F 0.01（2,6）=10.92<F B ,拒绝H 02.检验结果表明，试验温度、含铜量对钢冲击值的影响是显著的.第三节正交试验设计及其方差分析在工农业生产和科学实验中，为改革旧工艺，寻求最优生产条件等，经常要做许多试验，而影响这些试验结果的因素很多，我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验（即每一个因素的各种水平的相互搭配都要进行试验），多因素试验由于要考虑的因素较多，当每个因素的水平数较大时，若进行全面试验，则试验次数将会更大.因此，对于多因素试验，存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法，它利用一套现存规格化的表——正交表，来安排试验，通过少量的试验，获得满意的试验结果.1.正交试验设计的基本方法正交试验设计包含两个内容：（1）怎样安排试验方案；（2）如何分析试验结果.先介绍正交表.正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交，它的3个数字有3种不同的含义：(1) L4（23）表的结构：有4行、3列，表中出现2个反映水平的数码1，2.列数↓L4 （23）↑↑行数水平数（2）L4（23）表的用法：做4次试验，最多可安排2水平的因素3个.最多能安排的因素数↓L4(23)↑↑试验次数水平数(3) L4（23）表的效率：3个2水平的因素.它的全面试验数为23=8次，使用正交表只需从8次试验中选出4次来做试验，效率是高的.L4(23)↑↑实际试验数理论上的试验数正交表的特点：（1）表中任一列，不同数字出现的次数相同.如正交表L4(23)中，数字1，2在每列中均出现2次.（2）表中任两列，其横向形成的有序数对出现的次数相同.如表L4（23）中任意两列，数字1，2间的搭配是均衡的.凡满足上述两性质的表都称为正交表(Orthogonal table).常用的正交表有L9（34），L8（27），L16（45）等，见附表.用正交表来安排试验的方法，就叫正交试验设计.一般正交表L p（n m）中，p=m(n-1)+1.下面通过实例来说明如何用正交表来安排试验.例9.7 提高某化工产品转化率的试验.某种化工产品的转化率可能与反应温度A，反应时间B，某两种原料之配比C和真空度D有关.为了寻找最优的生产条件，因此考虑对A，B，C，D这4个因素进行试验.根据以往的经验，确定各个因素的3个不同水平，如表9-18所示.表9-18分析各因素对产品的转化率是否产生显著影响，并指出最好生产条件.解本题是4因素3水平，选用正交表L9（34）.将各因素的诸水平所表示的实际状态或条件代入正交表中，得到9个试验方案，如表9-20所示.表9-20从表9-20看出，第一行是1号试验，其试验条件是：反应温度为60℃，反应时间为2.5小时，原料配比为1.1∶1，真空度为500毫米汞柱，记作A1B1C1D1.依此类推，第9号试验条件是A3B3C2D1.由此可见，因素和水平可以任意排，但一经排定，试验条件也就完全确定.按正交试验表9-20安排试验，试验的结果依次记于试验方案右侧，见表9-21.2.试验结果的直观分析正交试验设计的直观分析就是要通过计算，将各因素、水平对试验结果指标的影响大小，通过极差分析，综合比较，以确定最优化试验方案的方法.有时也称为极差分析法.例9.7中试验结果转化率列在表9-21中，在9次试验中，以第9次试验的指标86为最高，其生产条件是A 3B 3C 2D 1.由于全面搭配试验有81种，现只做了9次.9次试验中最好的结果是否一定是全面搭配试验中最好的结果呢？还需进一步分析. （1）极差计算在代表因素A 的表9-21的第1列中，将与水平“1”相对应的第1，2，3号3个试验结果相加，记作T 11，求得T 11=151.同样，将第1列中与水平“2”对应的第4，5，6号试验结果相加，记作T 21，求得T 21=183.一般地，定义T ij 为表9-21的第j 列中，与水平i 对应的各次试验结果之和(i =1,2,3; j =1,2,3,4).记T 为9次试验结果的总和，R j 为第j 列的3个T ij 中最大值与最小值之差，称为极差.显然T =31iji T=∑，j =1,2,3,4.此处T 11大致反映了A 1对试验结果的影响，T 21大致反映了A 2对试验结果的影响， T 31大致反映了A 3对试验结果的影响，T 12，T 22和T 32分别反映了B 1，B 2，B 3对试验结果的影响， T 13，T 23和T 33分别反映了C 1，C 2，C 3对试验结果的影响， T 14，T 24和T 34分别反映了D 1，D 2，D 3对试验结果的影响.R j 反映了第j 列因素的水平改变对试验结果的影响大小，R j 越大反映第j 列因素影响越大.上述结果列表9-22.(2) 极差分析(Analysis of range)由极差大小顺序排出因素的主次顺序：主→次 B ；A 、D ；C这里，R j 值相近的两因素间用“、”号隔开，而R j 值相差较大的两因素间用“；”号隔开.由此看出，特别要求在生产过程中控制好因素B ，即反应时间.其次是要考虑因素A 和D ，即要控制好反应温度和真空度.至于原料配比就不那么重要了.选择较好的因素水平搭配与所要求的指标有关.若要求指标越大越好，则应选取指标大的水平.反之，若希望指标越小越好，应选取指标小的水平.例9.7中，希望转化率越高越好，所以应在第1列选最大的T 31=185；即取水平A 3，同理可选B 3C 1D 3.故例9.7中较好的因素水平搭配是A 3B 3C 1D 3.例9.8 某试验被考察的因素有5个：A ，B ，C ，D ，E .每个因素有两个水平.选用正交表L 8(27)，现分别把A ，B ，C ，D ，E 安排在表L 8(27)的第1，2，4，5，7列上，空出第3，6列仿例9.7做法，按方案试验.记下试验结果，进行极差计算，得表9-23.试验目的要找出试验结果最小的工艺条件及因素影响的主次顺序.从表9-23的极差R j的大小顺序排出因素的主次顺序为主 → 次 A 、B ；D ；C 、E最优工艺条件为A 2B 1C 1D 2E 1.表9-23中因没有安排因素而空出了第3，6列.从理论上说，这两列的极差R j 应为0，但因存有随机误差，这两个空列的极差值实际上是相当小的.3.方差分析正交试验设计的极差分析简便易行，计算量小，也较直观，但极差分析精度较差，判断因素的作用时缺乏一个定量的标准.这些问题要用方差分析解决.设有一试验，使用正交表L p (n m ),试验的p 个结果为y 1,y 2,…,y p ,记T =1pi i y =∑, y =11p i i Ty p p ==∑，S T =21()pii yy =-∑为试验的p 个结果的总变差；S j =222111nn ij ij i i T T T r T r p r p ==⎛⎫-=- ⎪⎝⎭∑∑ 为第j 列上安排因素的变差平方和，其中r =p/n .可证明S T =1mij S=∑即总变差为各列变差平方和之和，且S T 的自由度为p -1，S j 的自由度为n -1.当正交表的所有列没被排满因素时，即有空列时，所有空列的S j 之和就是误差的变差平方和S e ，这时S e 的自由度f e 也为这些空列自由度之和.当正交表的所有列都排有因素时，即无空列时，取S j 中的最小值作为误差的变差平方和S e .从以上分析知，在使用正交表L p (n m )的正交试验方差分析中，对正交表所安排的因素选用的统计量为：F =1jeeS S n f -.当因素作用不显著时，F ~F (n -1,f e ),其中第j 列安排的是被检因素.在实际应用时，先求出各列的S j /(n -1)及S e /f e ,若某个S j /(n -1)比S e /f e 还小时，则这第j 列就可当作误差列并入S e 中去，这样使误差S e 的自由度增大，在作F 检验时会更灵敏，将所有可当作误差列的S j 全并入S e 后得新的误差变差平方和，记为S e Δ,其相应的自由度为f e Δ,这时选用统计量F =1je eS S n f - ~F (n -1,f e Δ).例9.9 对例9.8的表9-23作方差分析.解由表9-23的最后一行的极差值R j ，利用公式S j =2211n ij i T T r p=-∑,得表9-24.表9-24表9-24中第3，6列为空列，因此S e =S 3+S 6=1.250,其中f e =1+1=2,所以S e /f e =0.625,而第7列的S 7=0.125，S 7/f 7=0.1251=0.125比S e /f e 小，故将它并入误差. S e Δ=S e +S 7=1.375,f e Δ=3.整理成方差分析表9-25.eeS fC 3.125 1 3.125 6.818D 6.125 1 6.125 13.364E Δ 0.125 1 0.125 e 1.1250 2 0.625 e Δ 1.37530.458由于F 0.05(1,3)=10.13, F 0.01(1,3)=34.12,故因素A ，B 作用高度显著，因素C 作用不显著，因素D 作用显著，这与前面极差分析的结果是一致的.F 检验法要求选取S e ，且希望f e 要大，故在安排试验时，适当留出些空列会有好处的.前面的方差分析中，讨论因素A 和B 的交互作用A ×B .这类交互作用在正交试验设计中同样有表现，即一个因素A 的水平对试验结果指标的影响同另一个因素B 的水平选取有关.当试验考虑交互作用时，也可用前面讲的基本方法来处理.本章就不再介绍了.小结本章介绍了数理统计的基本方法之一：方差分析.在生产实践中，试验结果往往要受到一种或多种因素的影响.方差分析就是通过对试验数据进行分析，检验方差相同的多个正态总体的均值是否相等，用以判断各因素对试验结果的影响是否显著.方差分析按影响试验结果的因素的个数分为单因素方差分析、双因素方差分析和多因素方差分析.1. 单因素方差分析的情况.试验数据总是参差不齐，我们用总偏差平方和S T =211()jn sijj i xx ==-∑∑来度量数据间的离散程度.将S T 分解为试验随机误差的平方和(S E )与因素A 的偏差平方和（S A ）之和.若S A 比S E 大得较多，则有理由认为因素的各个水平对应的试验结果有显著差异，从而拒绝因素各水平对应的正态总体的均值相等这一原假设.这就是单因素方差分析法的基本思想.2. 双因素方差分析的基本思想类似于单因素方差分析.但双因素试验的方差分析中，我们不仅要检验因素A 和B 各自的作用，还要检验它们之间的交互作用.3. 正交试验设计及其方差分析.根据因素的个数及各个因素的水平个数，选取适当的正交表并按表进行试验.我们通过对这少数的试验数据进行分析，推断出各因素对试验结果影响的大小.对正交试验结果的分析，通常采用两种方法，一种是直观分析法（极差分析法）,它通过对各因素极差R j 的排序来确定各因素对试验结果影响的大小.一种是方差分析法，它的基本思想类似于双因素的方差分析. 重要术语及主题单因素试验方差分析的数学模型 S T =S E +S A单因素方差分析表双因素方差分析表正交试验表极差分析表习题九1.灯泡厂用4种不同的材料制成灯丝，检验灯线材料这一因素对灯泡寿命的影响.若灯泡寿命服从正态分布，不同材料的灯丝制成的灯泡寿命的方差相同，试根据表中试验结果记录，在显著性水平0.05下检验灯泡寿命是否因灯丝材料不同而有显著差异？2.一个年级有三个小班，他们进行了一次数学考试，现从各个班级随机地抽取了一些学生，试在显著性水平0.05下检验各班级的平均分数有无显著差异.设各个总体服从正态分布，且方差相等.4.为了解3种不同配比的饲料对仔猪生长影响的差异，对3种不同品种的猪各选3头进行试验，分别测得其3个月间体重增加量如下表所示，取显著性水平α=0.05，试分析不同饲料与不同品种对猪的生长有无显著影响？假定其体重增长量服从正态分布，且各种配比的方5.研究氯乙醇胶在各种硫化系统下的性能（油体膨胀绝对值越小越好）需要考察补强剂（A）、防老剂（B）、硫化系统（C）3个因素（各取3个水平），根据专业理论经验，交互4(2) 给定α=0.05,作方差分析与(1)比较.6.某农科站进行早稻品种试验（产量越高越好），需考察品种（A），施氮肥量（B），氮、磷、钾肥比例（C），插植规格（D）4个因素，根据专业理论和经验，交互作用全忽略，早(1) 试作出最优生产条件的直观分析，并对4因素排出主次关系.(2) 给定α=0.05,作方差分析，与(1)比较.。

第九章方差分析

二、随机区组设Βιβλιοθήκη 的方差分析◦ 考虑到个体差异对结果的影响，根据已有数据或经验，
把被试按视觉反应的快慢分成不同的组，这每组被试也称之为一个“区组”。同一区组中的被试随机地接受某一种色光的反应时实验。这种实验设计叫做随机区组设计（randomized block design)

该实验设计采用随机区组是成功的、必要的〈相对
于完全随机设计〉。若区组效应不显著时 , 说明主试在划分区组时没有成功或者所取的被试本来就基本同质没必要再划分区组。
作业：

让4名被试先后做3套认识率相同而汉字不同的组词测验,其结果如下表,问3套测验是不是平均数相等的复本测验?

从小学新生中随机抽取20人，并随机地分为四组进行识字教学法的实验，每组分别用一种方法。学期结束时对学习效果进行统一测试，结果如下。试问四种识

例：
2. 自由度的计算
3、方差（均方）的计算
（三）F检验
（四）制作方差分析表
四、方差分析的基本条件

正态性同质性

可加性
五、方差齐性检验（一）意义
定义：检验各总体方差是否一致的统计方法。目的：保证样本组的同质性假设：
Ho： σ12=σ22 =…=σk2 H1：至少两个总体方差有显著差异。

区组内：同质区组间：异质每一区组的被试数目
◦ 一个个体：X
◦ 实验处理数的整倍数：X
◦ 团体单位： X
（一）方差分析

1. 原理
2. 分析过程

应该指出无论区组效应显著还是不显著 ,对实验目的而言,并没有什么重要意义，也就是说，区组变异与组间变异是彼此独立的。当区组效应显著时，说明

第九章方差分析ppt课件

SSW/dW f MW S 14.71/5 1 9410 .4111
（3）计算F值。
精选PPT课件
18
（4）确定显著性水平和F临界值取α=0.05，查F分布表得 F0.05(3,14) 3.34。由于计
算的F=3.52> F0.05(3,14) 3.34，P<0.05，所以拒绝原假
设，接受备择假设，认为各组平均数中至少有一对不
精选PPT课件
25
计算自由度： dBfk 14 13；
dW fk n k4 5 4 1；6
df T df B df W =16+3=19
求均方：
MS B
SS B df B
370122.3 3
，
MSW
SSW dfW
35622.25 16
（3）计算F值：
FMBS12.325.50 MW S 22.25
1、提出假设 2、计算平方和与自由度 3、计算F值 4、确定显著性水平并查F临界值表 5、列方差分析总表
精选PPT课件
3
一、方差分析的逻辑思想
1、方差分析是一种综合的检验方法
方差分析是对引起方差变化的各种因素进行统计分析，检验引起各样本差异的主要原因（或因素），并与理论值比较，以判断其显著性。
首先将总体变异分解成样本组间变异和由抽样误差等其它原因产生的组内变异，然后分析变异各组成部分的关系。
如果样本组间变异比抽样误差等其它原因产生的变异显著地大，则认为样本组间有本质性的差异，否则，认为样本组间无本质差异。
精选PPT课件
6
在方差分析中，观测值之间的差异情况用离差平方和表示，符号为SS。方差分析首先是把总体平方和分解为组间平方和和组内平方和，即：

方差分析法PPT课件

计算各样本平均数 y 如i 下:
表 6－2
型号
ABCDE F
yi
9.4 5.5 7.9 5.4 7.5 8.8
•5
引言方差分析的基本概念和原理
两个总体平均值比较的检验法把样本平均数两两组成对:
y 1与 y ,2 与y 1 ,…y 3 与 y ,1 与y 6 ,…y ,2 与y 3 ,共有y (5
6.3 显著性检验
利用(6-17)式来检验原假设H0是否成立.对于给定的显著水
平,可以从F分布表查出临界值
A的值.
F(k1,k(再m根1)据),样本观测值算出F
当 FAF(k1,时k(m ,拒1绝))H0,
当 FAF(k1,,时k(m ,接1 受))H0。
即：如果H0成立，F应等于1；相反应大于1，而且因素的影响越大， F值也越大
m
km
T Tj Yij
•38
j1
作统计假设：6种型号的生产线平均维修时数无显著差异，即
H0： i=0（i=1,2,…,6）,H1:i不全为零
•37
6.3 显著性检验
计算SA及SE
k
SA
k
m
i1
(Yi
Y)2
Ti2
i1
m
T2 km
k
km
km
Ti2
SE i1
(Yij Yi)2
j1
i1
j1Yij2i1m
m
Ti Yij
j 1
相当于检验假设
H0 : i 0 (i=1,2,…,k) , H1 : αi不全为零
•29
6.3 显著性检验
可以证明当H0为真时,
ST
2
~2(k

医学统计学第九章方差分析课件PPT

ni
Xi
)
Si
18.4176(S²)
列举存在的变异及意义
1.全部的60个实验数据之间大小不等，存在变异（总变异） 2.各个组间存在变异：反映处理因素之间的作用，以及随机误差。 3.各个组内个体间数据不同：反映了观察值的随机误差。
思考：各种变异的表示方法？
1.总变异: 所有测量值之间总的变异程度
24.52
17.14 14.77
19.26
13.77 14.37
26.13
12.50 24.75
16.99
20.40 12.73
18.89
20.30 17.25
18.46
19.38 19.09
20.87
23.11 16.79
17.51
12.67 17.19
13.12
23.02 19.32
11.75
24.36 19.59
ni
Xi
)
Si
18.4176(S²)
知识引入
不能……原因有二：
脱离了原先的实验设计，将多个样本均数同时比较转变为两个均数的多次比较。
多次重复使用 t 检验，会使犯第一类错误的概率增大。
知识引入
多组间的两两比较为什么不能用 t 检验？
进行一次假设检验，犯第一类错误的概率： 3个样本,两两组合为3次, 用 t 检验做3次比较，且每次比较α=0.05，则不犯Ⅰ类错误的概率为（1－0.05）， 3次不犯错概率(1－0.05)3，而总水准为1-(1－0.05)3 =0.14
7.42 8.65 16.52 X 18.61 120
S=4.37
一、方差分析的几个名词和符号
实验研究因素水平

PPT教学课件方差分析

现实主义诗人
现实主义诗人：杜甫
杜甫生活在安史之乱前后由盛转衰的时代，一生贫困失意，颠沛流离，因而他的诗揭露了统治阶级政治昏庸、生活腐朽，反映了下层人民在战乱前后的悲惨境遇，表现了对劳动人民的同情和对国事的关怀。他的诗风深沉浓郁，跌宕有致；语言上的功力非常深厚，“为人性僻耽佳句，语不惊人死不休”，后人称他为“诗圣”。
– 政治：开明的政治及文化政策和科举“以诗取士”，不仅使文人思想开放、活跃，直接刺激了诗歌创作的迅猛发展。
– 经济：国家的统一和国力的强盛，为诗歌的发展准备了必要的物质条件；
– 文化：南北、中外的文化交流也提供了深厚的文化基础
时期初唐盛唐
中唐晚唐
唐诗
代表人物
王勃陈子昂
（边塞诗人）高适岑参（山水诗人）孟浩然王维
4. 将处理平均数由大到小排序，并依次求出各处理之间的差值，将各差值与相应秩次距下的Rα相比较，作出差异显著性判断。同样有：
相应秩次距的 R0.01 > 平均数差值 ≥ 相应秩次距的R0.05，则两处理平均数间差异为显著；
平均数差值 ≥相应秩次距的 R0.01 ，则两处理平均数间差异为极显著；相应秩次距的R0.05 > 平均数差值，则两处理平均数间差异为不显著。可将此方法求出的Rα以表表示更为清楚方便，见表9-2。
代表作：“三吏” “三别” 石壕吏杜甫
暮投石壕村，有吏夜捉人。老翁逾墙走，老妇出门看。
吏呼一何怒，妇啼一何苦。听妇前致词：“三男邺城戍。
一男附书至，二男新战死。存者且偷生，死者长已矣。
室中更无人，惟有乳下孙。有孙母未去，出入无完裙。
老妪力虽衰，请从吏夜归。急应河阳役，犹得备晨炊。
夜久语声绝，如闻泣幽咽。天明登前途，独与老翁别。

第九章----方差分析

若组间变异明显大于组内变异, 则不能认为组间变异仅反映随机误差的大小, 处理因素也在起作用。根据计算出的检验统计量F值, 查界值表得到相应的P值, 按所取检验水准α作出统计推断结论。
检验统计量F值服从F分布。
F<Fα,(ν组间, ν组内),则P > α, 不拒绝H0, 还不能认为各样本所来自的总体均数不同;
1、各样本是相互独立的随机样本, 且来自正态分布的总体;
2、相互比较的各样本的总体方差相等, 即具有方差齐性。独立性、随机性、正态性、方差齐性
五、方差分析的用途
1、用于进行两个或多个样本均数的比较; 2、分析两因素或多因素间的交互作用; 3、用于回归方程的线性假设检验。
六、方差分析的优点
1、不受比较组数的限制,可比较多组均数; 2、可同时分析多个因素的作用; 3、可分析因素间的交互作用.
一、多个样本均数间的比较能否用 t 检验或 u 检验？为什么？
原因:
五个样本均数进行比较, 每次两个均数作一次 t 检验, 共需作10（C52=10）次 t 检验。若每次比较的检验水准α＝0.05, 则每次比较不犯Ⅰ型错误的概率为（1-α）＝0.95。当这些检验独立进行时, 则10次比较均不犯Ⅰ型错误的概率为0.9510＝ 0.5987, 此时犯Ⅰ型错误的概率, 即总的检验水准 α变为1-0.5987＝0.4013比0.05大的多。犯Ⅰ型错误的概率增大, 可能将原本无差别的两个总体推断为有差别, 误判为有统计意义。因此多重比较不宜用的 t 检验或 u检验作两两比较。
已知各组均数、标准差和样本含量时F值的简便计算方法。
当原始数据未知, 只知各组均数、标准差和样本含量时, 可进行如下计算, 分两种情况: 1、各组样本含量ni相等; 2、各组样本含量ni不等。

方差分析 (共72张PPT)

2.总体变异的构成
总体变异组间变异：组内变异：组内变异理论上要求齐性，实际计算取其均值
3.方差的基本公式
一般总体方差称方差，样本方差称均方能使变量发生变异的原因很多，这些原因我们都将其称为变异
因素或变异来源。
方差分析就是发现各类变异因素相对重要性的一种方法
方差分析的思路就是：把整个试验（设有 k 个总体）的样本资料作为一个整体来考虑。
原理是变异的可加性。
即每一个数据与数据的总体平均数差的平方和，可以分解为每一组数据各自的离差平方和与由各组数据的平均数组成的一组数据的
离差平方和两部分。前者表达的是组内差异，即每组数据中各个数据之间的差异，也就是个体差异，表达的是抽样误差或随机误差程度；后者表达的是组间差异，即各组平均数之间的差异，表达的是实验操纵的差异程度，实验操纵即指自变量的操纵，这两部分差异之间相互独立。
3、这种两两比较会随着样本组数的增加而加大犯Ⅰ型错的差异显著性检验，若两两比较推断正确的概率为95%,则所有比较都正确的概率为6=0.74,则降低
了推断的可靠性。
• 几个常用术语:
1、试验指标(experimental index) 为衡量试验结果的好坏或处理效应的高低，在试验中具体测
(1).计算平方和：
组间平方和
SB SX n2X n2 71 .5 6 65 8 .1 7 8 20 8 .47
¨ 组内平方和
SW SX 2X n2 7 6 7 41 4 .5 6 4 45 7 .5 7 8
¨ 总平方和
SS T X 2X n2
764414252 876.396
23
(2)．计算自由度
因此，方差分析可以帮助我们抓住试验的主要矛盾和技术关键，发现主要的变异来源，从而抓住主要的、实质性的东西。

第九章方差分析-PPT精选文档60页

§1 单因子方差分析
§1.1 基本概念
为了考察某个因素 A 对试验指标(即随机变量 X)
的影响,在试验时,保持其他因素不变,而仅让因素 A
改变,这种试验称为单因子(单因素)试验. 设试验结
果如下表:
水平
观测值
A1
x11
x12
...
x1n1
A2
x21
x22
…
x2n2
…
…
…
…
…
Ar
xr1
xr2
…
xrnr
• 为了今后方便起见,把参数的形式改变一下,并
记

1 n
r i1
nii
r
nni i1
i i , i 1,2,...,r,
称μ为一般平均,αi为因子A的第i 个水平的效应.
• 在这样的改变下,单因子方差分析模型中的数据结构式可以写成:
X i j i i,j i 1 ,2 ,.r ;.j .1 ,2 ,,.n i..,
SA
2
~
2(r 1)
且SA与SE相互独立.
由于SA反映的是因子不同水均平值之间的差
异程度,故当假设H0 :1 2 ...r 0为真时,
SA的值不应太大 ,从而
F SA /(r 1) SE /(nr)
也不应太大,当F值过大时,可以认为假设 H0不真.
§1.4 检验过程
由此,可当H0知 :12...n0为真 , 时
(X i jX i.2 ) (X i. X ) 2 2 (X i jX i.(X )i. X )
i 1j 1
i 1j 1
i 1j 1
r ni

方差分析PPT课件

方差分析的用途
1. 用于多个样本平均数的比较 2. 分析多个因素间的交互作用 3. 回归方程的假设检验 4. 方差的同质性检验
为了规范事业单位聘用关系，建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度，保障用人单位和职工的合法权益
第一节方差分析的基本问题
▪ 一、方差分析问题的提出问题：为了探索简便易行的发展大学生心血管系统机能水平的方法，在某年级各项身体发育水平基本相同，同年龄女生中抽取36人随机分为三组，用三种不同的方法进行训练，三个月后，测得哈佛台阶指数如表 1 ，试分析三种不同的训练方法对女大学生心血管系统的影响有无显著性差异。
结果的好坏和处理效应的高低，实际中具体测定的性状或观测的项目称为试验指标。常用的试验指标例如有：身高、体重、日增重、酶活性、DNA含量等等。
影响因素（ experimental factor）：观测中所
研究的影响观测指标的定性变量称之为因素。当考察的因素只有一个时，称为单因素试验；若同时研究两个或两个以上因素的影响时，则称为两因素或多因素试验。
N (3, 2)
A3
61.31 60.00
┆ 67.26 69.05
为了规范事业单位聘用关系，建立和完善适应社会主义市场经济体制的事业单位工作人员聘用制度，保障用人单位和职工的合法权益
分析
根据研究目的，这里有三个正态总体 N (1, 2)，N (2, 2 )， N (3 , a2 ) 。三组数据分别为来自三个总体的样本，问题是推断 1 ,2 和 3 之间有无显著差异。由 x1, x2, x3不相等，不能直接得出1, 2, 3不尽相等的结论，原因是：造成 x1, x2, x3不相等可能有两个方面因素：一是 1, 2, 3 不等，二是1 2 3，但由于抽样误差，造成 x1, x2, x3 之间有差异。现在的任务是通过样本推断1, 2, 3之间有无显著性差异。

第九章方差分析实习指导(定)

第九章方差分析[教学要求]了解：方差齐性检验和变量变换。

熟悉：方差分析的前提条件；多个样本均数的两两比较。

掌握：方差分析的基本思想；各种设计方案(完全随机设计、随机区组设计、析因设计、重复测量设计等)变异和自由度的分解方法。

[重点难点]第一节完全随机设计资料的方差分析一、方差分析的基本思想方差分析的基本思想就是把全部观察值间的变异——总变异按设计和需要分解成两个或多个组成部分，总自由度也分解成相应的几个部分，再作分析。

分解的每一部分代表不同的含义，其中至少有一部分代表各均数间的变异情况，另一部分代表误差。

全部试验数据大小不同，这种变异称为总变异，该变异既包括了随机误差(含个体差异和测量误差)，也包括了处理效应的作用。

各处理组样本均数各不相同，与总均数也不相同，这种变异称为组间变异(variation between groups)，它反映了处理的影响，同时也包括了随机误差(含个体差异和测量误差)。

各处理组内部观察值大小不同，这种变异称为组内变异(variation within groups)，组内变异仅反映随机误差(含个体差异和测量误差)。

一般地，S S S S S S =+总组间组内ννν=+总组间组内(9-1)二、完全随机设计资料方差分析的基本步骤完全随机设计资料的方差分析用于成组设计多个样本均数的比较，属单向(因素)方差分析(one-way ANOV A)，它将数据按一个方向(即同一处理的不同水平或不同处理)进行分组整理。

方差分析的基本步骤同其它假设检验，也分为三步。

(1)建立检验假设，确定检验水准H0：多个总体均数全相等；H 1：多个总体均数不全相等，即至少有两个总体均数不等。

α=0.05(2) 计算检验统计量表9-1 完全随机设计方差分析的计算公式变异来源 SS df MSF组间(处理组间)2()iiin XX -∑k –1 1SS k -组间MS MS 组间组内组内(误差)2(1)i i in S -∑N –kSS N k-组内总22()X XN-∑∑N –11SS N -总(3) 确定P 值，作出推断结论以求F 值时分子的自由度ν1=ν组间、分母的自由度ν2=ν组内查F 界值表得P 值，P 和α比较得出推断结论。

方差分析课件-PPT

、、、增重表就是选用S-N-K法作均数多重两两比较得结果
增重表就是选用S-N-K法作均数多重两两比较得结果:
本例按a=0、05水准,将无显著性差异得数归为一类 (Subset for alpha=0、05)。可见
品种5、2、3得样本均数位于同一个子集( Subset )内,说明品种5、品种2、品种3得样本均数两两之间无显著差异; 品种3、4、1位于同一个Subset内,她们之间无显著差异;而品种5、2与品种4、1得样本均数有显著差异。
即三组均数间差异极显著,即不同时期切痂对大鼠肝脏 ATP含量有影响。
LSD法多重比较:
“*”显著性标注两组均数得差
•S-N-K法:本例按0、5水平,将无显著差异得均数归为一类。
•第一组与第三组为一类,无显著差异,它们与第二组之间均数差异显著。
•LSD与S-N-K法,不同得两两比较法会有不同。
如欲了解就是否达到极显著差异,需要将显著水平框中得值输入0、01。
例、为了研究烫伤后不同时间切痂对大鼠肝脏 ATP得影响,现将30只雄性大鼠随机分成3组,每组 10只:A组为烫伤对照组,B组为烫伤后24小时切痂组,C组为烫伤后96小时切痂组。全部大鼠在烫伤 168小时候处死并测量器肝脏ATP含量,结果如下。问试验3组大鼠肝脏ATP总数均数就是否相同。
该12个观察值得总得均值为91、5,标准差为34、 48。
上图为品系、剂量间均值得方差分析(F检验)结果
由表中可知,品系得F=23、771,P=0、001<0、01,差异极显著;
剂量得F=33、537,P=0、001<0、01,差异极显著。说明不同品系与不同雌激素剂量对大鼠子宫得发育均有极显著影响,故有必要进一步对品系、雌激素剂量两因素不同水平得均值进行多重比较。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

MS B F 1, MS B MSW MSW
表明数据的总变异基本上是有实验误差和个体误差造成的，与不同的实验处理关系不大（不同的实验处理间不存在显著差异）。
二、方差分析的基本假设 1．总体正态分布 2．各实验处理是随机的且相互独立（一般情况下都能满足）
3．各实验处理内方差一致（需要进行检验）
体测定的性状或观测的项目称为试验指标。由于试验目
的不同，选择的试验指标也不相同。
• 2、试验因素(experimental factor) 试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时，称为单因素试验；若同时研究两个或两个以上的因素对试验指标的影响时，则称为两因素或多因素试验。试验因素常用大写字母A、 B、C、…等表示。
（1）不同实验处理人数相同时
每组自由度n1-1，n2-1，n3-1…nk-1 组内自由度n1-1+n2-1+n3-1+…nk-1，因为n1=n2=n3=…nk，所以为K（n1）（2）不同实验处理人数不相同时每组自由度n1-1，n2-1，n3-1…nk-1 组内自由度 n1-1+n2-1+n3-1+…nk-1
治疗方案
X1 30 900 X2 X3 X4 88 7744 78 6084 60 3600
50 2500 18 324
74 5476 38 1444 56 3136 46 2116 66 4356 34 1156
4
5 6 7
58 3364 62 3844 24 576
62 3844 44 1936 66 4356 38 1444 58 3364 52 2704 80 6400
7、方差分析
方差之间的差异分析用F检验，因此，组间与组内方差的
分析也用F检验。方差分析关注的是组间均方是否显著大于组内均方。因此，常用作单侧检验。
MS B F MSW
MSB F 1, 且MSB显著 MSW MSW
表明数据的总变异基本上是有不同的实验处理
造成的（不同的实验处理间存在显著差异） kj
4.平方和的剖分
• SS（ sum of squares ）表示平方和 • SST（the sum of squares total）总平方和，一个试验中的总变异。 • SSB（ sum of squares between groups）组间平方和，表示由于不同的实验处理而造成的变异。（主试） • SSW（ sum of squares within group）试验误差造成的变异。（被试）
一、各实验处理组样本容量相同
例题：从五所中学同一个年级随机抽取3名学生进行统一数学测验，结果如下，问五所学校数学成绩之间有无显著差异？ A B C D E
1
2
76
73
78
81
86
84
3.77*
P<0.05
总变异 7636.9
第二节完全随机设计的方差分析
单因素完全随机设计的方差分析
(complete randomized design) 把从同一个总体中随机抽取的被试随机地分配为几个实验组，每个实验组分别接受某一因素的不
同水平的操纵，检验这几个独立样本平均数之间是
否存在显著差异
3、这种两两比较会随着样本组数的增加而加大犯Ⅰ型错误的概率用t 检验法进行4个处理平均数间的差异显著性检验，若两两比较推断正确的概率为95%,则所有比较都正确的概率为0.956=0.74,则降低了推断的可靠性。
• 几个常用术语: 1、试验指标(experimental index) 为衡量试验结果的好坏或处理效应的高低，在试验中具
2
SSW SST SSB X
( X ) n
2
• （一）．提出假设 • （二）．选择检验统计量并计算 1．分解平方和
总平方和SST
组间平方和SSB 组内平方和SSW
2．分解自由度df
总自由度：dfT=nk-1 组间自由度：dfB=k-1
组内自由度：dfW=nk-k
组内自由度的计算
现代心理与教育统计学
广州大学心理学系 2016/12/01
1
第九章方差分析（ANOVA）
方差分析又称为变异分析（analysis of
variance，ANOVA），是由斯内德克（George Waddel Snedecor）提出的一种方法。方差分析通过对多组平均数的差异进行显著性检验，分析实验数据中不同来源的变异对总变异影响的大小。
SSW 4786 .5 MSW 251 .9 dfW 19

组内方差
(4)．计算Ｆ值
MS B 950 .1 F 3.77 MSW 251 .9
3．做统计决断,列方差分析表
表9－3 四组记录数据的完全随机设计方差分析表变异来源组间变异组内变异平方和 2850.4 4786.5 自由度 3 19 22 方差 950.1 251.9 F 值概率
2.总体变异的构成
总体变异组间变异：组内变异：组内变异理论上要求齐性，实际计算取其均值
3.方差的基本公式
一般总体方差称方差，样本方差称均方
能使变量发生变异的原因很多，这些原因我们都将其称
为变异因素或变异来源。
方差分析就是发现各类变异因素相对重要性的一种方法
方差分析的思路就是：把整个试验（设有 k 个总体）的样本资料作为一个整体来考虑。

n
71657 .5 68807 .1 2850 .4
组内平方和
SSW

2 X X 2
n
76444 71657 .5 4786 .5
2 1258 76444
总平方和
SST
2 X X 2
n
23
7636 .9
• SST= SSB+ SSW • 总变异=组间变异+组内变异 • 总变异（SST）是将所有被试的数值作为一个整体考虑到的结果，是用所有被试的因变量的值计算出来的。 • 组间变异（ SSB ）主要是因为接受不同的实验处理而造成的各组之间的变异。用两个平均数的离差表示。 • 组内变异（SSW）指组内各被试因变量的差异范围。
把整个试验的总变异按照变异的来源分解成不同因素的变异。由于方差等于平方和除以自由度，因此总方差分解成各因素的方差，就是将形成总方差的平方和和自由度分解为各因素的平方和和自由度。然后对各个因素的方差作出数量上的估计，从而发现各个因素的方差的相对重要程度。
从总方差中除去各可控因素所引起的方差后，剩余方差又可以准确地估计试验误差，作为统计假设检验的依据因此，方差分析可以帮助我们抓住试验的主要矛盾和技术关键，发现主要的变异来源，从而抓住主要的、实质性的东西。
• t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验，但在生产和科学研究中经常会遇到比较多个处理优劣的问题，即需进行多个平均数间的差异显著性检验(K≥3)。这时，若仍采用t检验法就不适宜了。这是因为：
1、检验过程烦琐 • 例如，一试验包含5个处理，采用t检验法要进行10次两
（df）
F
p
dfB=k-1 dfW=nk-k dfT=nk-1
F
p
例：研究人员采用四种不同的心理治疗方案，对每个志愿参加治疗的患者进行心理治疗。他们用录音机记录了每个被试在一段时间中所讲的词数。由于录音的困难每种方案记录的人数各不相同，原始数据见表1。问这几种方案是否有差异？
计算表1
序号 1 2 3
最为重要的假定
三、方差齐性检验 1.哈特莱最大F比率法找出要比较的组内方差的最大值与最小值。最大方差与最小方差无显著差异即为方差齐性。
S F S
2 max 2 min
四、方差分析的基本步骤
SST X 2
( X ) 2 nk
SSB
( X ) 2 n

( X ) 2 nk
5.组间方差（组间均方）与组内方差（组内均方）
6.自由度的分解 • 在计算处理间平方和时，各处理均数要受这一条件的约束，故处理间自由度为处理数减1，即k-1。处理间自由度记为dfB，即dfB=k-1。 • 在计算处理内平方和时，每组自由度为n-1,共有k组，故处理内自由度k(n-1), 处理内自由度记为dfW，即 dfW=k(n-1) =kn-k。
(2)．计算自由度

组间自由度
dfB k 1 4 1 3

组内自由度
dfW n k 23 4 19

总自由度
dfT n 1 23 1 22
(3)．计算方差

组间方差
2850 .4 SSB 950 .1 MS B 3 dfB
两平均数的差异显著性检验；若有k个处理，则要作
k(k-1)/2次类似的检验。
2、无统一的试验误差，误差估计的精确性和检验的灵敏性低对同一试验的多个处理进行比较时，应该有一个统一的试验误差的估计值。若用 t 检验法作两两比较，由于每次比较需计算一个s，故使得各次比较误差的估计不统一，同时没有充分利用资料所提供的信息而使误差估计的精确性降低，从而降低检验的灵敏性。
76 5776
• 1．提出假设 H0：μ1＝μ2＝μ3＝μ4
H1：至少有两个总体平均数不等 • 2．选择检验统计量并计算假定四组记录数据是从四个正态总体中抽出的独立样本，对多个独立样本平均数的差异进行显著性检验，应采用完全随机设计的方差分析。
(1).计算平方和：

组间平方和
SSB

2 2 X X
（二）方差的可分解性（可加性）
1.可加性