试验设计与数据分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
试验设计与数据分析
1.方差分析在科学研究中有何意义?如何进行平方和与自由度的分解?如何进行F检验和多重比较?
(1)方差分析的意义
方差分析,又称变量分析,其实质是关于观察值变异原因的数量分析,是科学研究的重要工具。方差分析得最大公用在于:a. 它能将引起变异的多种因素的各自作用一一剖析出来,做出量的估计,进而辨明哪些因素起主要作用,哪些因素起次要作用。 b. 它能充分利用资料提供的信息将试验中由于偶然因素造成的随机误差无偏地估计出来,从而大大提高了对实验结果分析的精确性,为统计假设的可靠性提供了科学的理论依据。
(2)平方和及自由度的分解
方差分析之所以能将试验数据的总变异分解成各种因素所引起的相应变异,是根据总平方和与总自由度的可分解性而实现的。
(3)F检验和多重比较
① F检验的目的在于,推断处理间的差异是否存在,检验某项变异原因的效应方差是否为零。实际进行F检验时,是将由试验资料算得
的F 值与根据df 1=df t (分子均方的自由度)、df 2=df e (分母均方的自由度)查附表4(F 值表)所得的临界F 值(F 0.05(df1,df2)和F 0.01(df1,df2))相比较做出统计判断。若F< F 0.05(df1,df2),即P>0.05,不能否定H 0,可认为各处理间差异不显著;若F 0.05(df1,df2)≤F <F 0.01(df1,df2),即0.01
② 多重比较,统计学中把多个平均数两两间的比较称为多重比较,其方法有很多。 a. 最小显著差数法,简称LSD 法。其步骤是: 列出平均数的多重比较表,比较表中各处理按其平均数从大到小至上而下排列;计算最小显著差数LSD 0.05和LSD 0.01;将平均数多重比较表中两两平均数的差数与LSD 0.05、LSD 0.01比较,做出统计推断。
b. 最小显著极差法,简称LSR 法。常用的LSR 法有q 检验和新复极差法
i. q 检验法:列出平均数多重比较表;由自由度
df e 、秩次矩K 查临界q 值,计算最小显著极差
LSR
0.05,K ,LSR
0.01,K
;将平均数多重比较表中的各
极差与相应的最小显著极差LSR
0.05,K ,LSR
0.01,K
比较,做出统计推断。
ii.新复极差法,与q检验法的步骤相同,唯一不同的是计算最小显著极差时需要查SSR表(附
表6)。
2.方差分析有哪些基本假定?为什么有些数据
资料需经过数据转换才能作方差分析?常用
的转换方法有哪几种?各在什么条件下应
用?
(1)方差分析的基本假定包括,效应的可加
性、分布的正态性、方差的同质性。
(2)对于不符合基本假定的试验资料应采用
适当的方法给予改善。如果发现有异常的观察
值、处理或单位组,只要不属于研究对象本身
的原因,在不影响分析正确性的条件下加以删
除。但有些资料就其性质来说就不符合方差分
析的基本假定。对这类资料不能直接进行方差
分析,而因考虑采用非参数方法分析或进行适
当数据转换后作方差分析。
(3)常用的数据准换方法有以下一些。
a. 平方根转换,适用于各组方差与其平均数之间有某种比例关系的资料,尤其适用于总体呈Poisson 分布的资料。它可以使Poisson 分布的计数资料或轻度偏态的资料正态化。
b. 对数转换,适用于当各组数据的标准差、全距与其平均数大体成比例或变异系数CV 接近一个常数时,采用对数转换可获得同质性的方差;能使服从对数正态分布的变量正态化。
c. 反正弦转换,常用于服从二项分布的率或百分比的资料,如产品的合格率。
d. 倒数转换,适用于当各组数据的标准差与其平均数的平方成正比时。
3. 在提取大豆蛋白的科研过程中,为研究浸泡温度(A )对大豆蛋白提取率的影响,将其他因素固定,取因素A 的5个水平反别为A 1(40℃)、A 2(50℃)、A 3(60℃)、A 4(70℃)、A 5(80℃),每个水平重复3次,由3个试验人员共同完成。测定结果如表3-1,B 1、B 2、B 3分别为3个试验人员的测定结果。试分析A 因素和B 因素的作用是否显著,并确定A 的适宜水平。
表3-1 不同浸泡温度对蛋白质提取率的影响
单位%
在SPSS中打开EXCEL文件得到图3-1。
图3-1
由表3-2可知,每个实验员在不同浸泡温度下对蛋白质的提取率的均值和标准偏差。
由表3-3可知,因素实验员的平方和、自由度、均方、F值和Sig.值分别为1.516、
2、0.758、0.108和0.899;因素温度的平方和、自由度、均方、F值和Sig.值分别为2453.044、4、613.261、87.198和0.000。因素实验员的Sig.>0.05,说明3个实验员的检验技术没有显著差异。温度的Sig.<0.01,说明不同温度下对蛋白质的提取
温度2453.044 4 613.261 87.198 .000 误差56.264 8 7.033
总计26128.360 15
校正的总计2510.824 14
a. R 方 = .978(调整 R 方 = .961)
表3-4 提取率
Duncan a,b
温度N
子集
1 2 3 4
A1 3 19.600000
A2 3 31.000000
A3 3 42.766667
A4 3 52.366667
A5 3 52.666667
Sig. 1.000 1.000 1.000 .893
已显示同类子集中的组均值。
基于观测到的均值。
误差项为均值方 (错误) = 7.033。
a. 使用调和均值样本大小 = 3.000。
b. Alpha = .05。
由表3-4可知,在显著水平为0.05时,A4(70℃)、A5(80℃)浸泡温度下两个水平蛋白质提取率间无显著差异,提取率最高,适合作为蛋白质提取率的温度。
4.随机区组试验设计有什么特点,应用随机区组试验设计方法时应注意什么?