试验设计与数据分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.方差分析在科学研究中有何意义?如何进行平方和与自由度的分解?如何进行F检验和
多重比较?
(1)方差分析的意义
方差分析,又称变量分析,其实质是关于观察值变异原因的数量分析,是科学研究的重要工具。方差分析得最大公用在于:a. 它能将引起变异的多种因素的各自作用一一剖析出来,做出量的估计,进而辨明哪些因素起主要作用,哪些因素起次要作用。b. 它能充分利用资料提供的信息将试验中由于偶然因素造成的随机误差无偏地估计出来,从而大大提高了对实验结果分析的精确性,为统计假设的可靠性提供了科学的理论依据。
(2)平方和及自由度的分解
方差分析之所以能将试验数据的总变异分解成各种因素所引起的相应变异,是根据总平方和与总自由度的可分解性而实现的。
(3)F检验和多重比较
①F检验的目的在于,推断处理间的差异是否存在,检验某项变异原因的效应方差是否为零。实际进行F检验时,是将由试验资料算得的F值与根据df1=df t(分子均方的自由度)、df2=df e(分母均方的自由度)查附表4(F值表)所得的临界F值(F0.05(df1,df2)和F0.01(df1,df2))相比较做出统计判断。若F< F0.05(df1,df2),即P>0.05,不能否定H0,可认为各处理间差异不显著;若F0.05(df1,df2)≤F<F0.01(df1,df2),即0.01
②多重比较,统计学中把多个平均数两两间的比较称为多重比较,其方法有很多。
a.最小显著差数法,简称LSD法。其步骤是:列出平均数的多重比较表,比较表中各处
理按其平均数从大到小至上而下排列;计算最小显著差数LSD0.05和LSD0.01;将平均数多重比较表中两两平均数的差数与LSD0.05、LSD0.01比较,做出统计推断。
b.最小显著极差法,简称LSR法。常用的LSR法有q检验和新复极差法
i.q检验法:列出平均数多重比较表;由自由度df e、秩次矩K查临界q值,计算最
小显著极差LSR0.05,K,LSR0.01,K;将平均数多重比较表中的各极差与相应的最小显著
极差LSR0.05,K,LSR0.01,K比较,做出统计推断。
ii.新复极差法,与q检验法的步骤相同,唯一不同的是计算最小显著极差时需要查SSR表(附表6)。
2.方差分析有哪些基本假定?为什么有些数据资料需经过数据转换才能作方差分析?常
用的转换方法有哪几种?各在什么条件下应用?
(1)方差分析的基本假定包括,效应的可加性、分布的正态性、方差的同质性。
(2)对于不符合基本假定的试验资料应采用适当的方法给予改善。如果发现有异常的观察值、处理或单位组,只要不属于研究对象本身的原因,在不影响分析正确性的条件下加以删除。但有些资料就其性质来说就不符合方差分析的基本假定。对这类资料不能直接进行方差分析,而因考虑采用非参数方法分析或进行适当数据转换后作方差分析。
(3)常用的数据准换方法有以下一些。
a.平方根转换,适用于各组方差与其平均数之间有某种比例关系的资料,尤其适用于
总体呈Poisson分布的资料。它可以使Poisson分布的计数资料或轻度偏态的资料正态化。
b.对数转换,适用于当各组数据的标准差、全距与其平均数大体成比例或变异系数CV
接近一个常数时,采用对数转换可获得同质性的方差;能使服从对数正态分布的变
量正态化。
c.反正弦转换,常用于服从二项分布的率或百分比的资料,如产品的合格率。
d.倒数转换,适用于当各组数据的标准差与其平均数的平方成正比时。
3.在提取大豆蛋白的科研过程中,为研究浸泡温度(A)对大豆蛋白提取率的影响,将其
他因素固定,取因素A的5个水平反别为A1(40℃)、A2(50℃)、A3(60℃)、A4(70℃)、A5(80℃),每个水平重复3次,由3个试验人员共同完成。测定结果如表3-1,B1、B2、B3分别为3个试验人员的测定结果。试分析A因素和B因素的作用是否显著,并确定A 的适宜水平。
表3-1 不同浸泡温度对蛋白质提取率的影响单位%
在SPSS中打开EXCEL文件得到图3-1。
图3-1
由表3-2可知,每个实验员在不同浸泡温度下对蛋白质的提取率的均值和标准偏差。
由表3-3可知,因素实验员的平方和、自由度、均方、F值和Sig.值分别为1.516、2、0.758、0.108和0.899;因素温度的平方和、自由度、均方、F值和Sig.值分别为2453.044、4、613.261、87.198和0.000。因素实验员的Sig.>0.05,说明3个实验员的检验技术没有显著差异。温度的Sig.<0.01,说明不同温度下对蛋白质的提取率有极显著差异。
表3-2 描述性统计量
因变量:提取率
实验员B 温度均值标准偏差N
1 A1 20.300000 . 1
A2 32.500000 . 1
A3 43.700000 . 1
A4 52.600000 . 1
A5 50.800000 . 1
总计39.980000 13.5409379 5
2 A1 16.400000 . 1
A2 31.200000 . 1
A3 44.100000 . 1
A4 49.300000 . 1
A5 55.200000 . 1
总计39.240000 15.5390798 5
3 A1 22.100000 . 1
A2 29.300000 . 1
A3 40.500000 . 1
A4 55.200000 . 1
A5 52.000000 . 1
总计39.820000 14.2304954 5 总计A1 19.600000 2.9137605 3
A2 31.000000 1.6093477 3
A3 42.766667 1.9731531 3
A4 52.366667 2.9569128 3
A5 52.666667 2.2744963 3
总计39.680000 13.3919592 15
表3-3 主体间效应的检验
因变量:提取率
源III 型平方
和df 均方 F Sig.
校正模型2454.560a 6 409.093 58.168 .000 截距23617.536 1 23617.536 3358.103 .000 实验员B 1.516 2 .758 .108 .899 温度2453.044 4 613.261 87.198 .000 误差56.264 8 7.033
总计26128.360 15
校正的总计2510.824 14
a. R 方 = .978(调整 R 方 = .961)