浙大生物统计实验报告3
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课程名称:生物统计与实验设计*名:**
学院:农业与生物技术学院系:应用生物科学
专业:应用生物科学
学号:**********
指导教师:朱军、徐海明
2016年6 月6日
实验报告
课程名称: 生物统计与实验设计 指导老师: 徐海明 成绩:_______________ 实验名称: 协方差分析和混合线性模型分析 实验类型: 综合实验 一、 实验目的和要求
1. 掌握协方差分析、混合线性模型的原理。
2. 学会用协方差分析和混合线性模型对大数据进行分析。
3. 了解协方差分析与二因素析因分析的差异。
4. 比较SAS 软件和QTModel 软件的分析效益。
5. QTLNetwork 软件分析控制仿真群体表现型值的QTL 定位数据。
6. 比较回归分析、相关分析、方差分析、MCIM 的定位分析的优缺点。 二、 实验内容和原理
1. 协方差分析是建立在方差分析和回归分析基础之上的一种统计分析方法。 方差分
析是从质量因子的角度探讨因素不同水平对实验指标影响的差异。一般说来,质量因子是可以人为控制的。 回归分析是从数量因子的角度出发,通过建立回归方程来研究实验指标与一个(或几个)因子之间的数量关系。但大多数情况下,数量因子是不可以人为加以控制的。
2. 混合线性模型(mixed linear model)一种方差分量模型。在方差分量模型中,把既含
有固定效应,又含有随机效应的模型,称为混合线性模型。
三、 主要仪器设备
SAS 软件、QTModel 软件、QTLNetwork 软件 四、 操作方法和实验步骤
1. 二因素协方差分析
以2个品种2个水分水平的鲜花产量为依变量,重复6次:
a) 以小区面积为x 变量,进行二因素协方差分析,分析品种、水分对鲜花产量的
影响,对显著的效应进行适当的比较;
b) 比较协方差分析与二因素析因分析结果之间的差异。 2. 水稻品种区域试验分析
水稻五个品种在二年和四个试点三个区组的品种区域试验数据(删除了二个异常值)储存在数据文件(RiceTrial-2.txt)中。
a) 采用SAS 软件的Proc GLM, Proc Mixed 和Proc VarCom 分析该数据,并对品
种的表现作适宜的推断;
b) 采用QTModel 软件分析该数据,对品种的表现作适宜的推断;比较SAS 软件
和QTModel 软件的分析效益。
3. QTL 定位分析
采用QTLNetwork 软件分析控制仿真群体表现型值的QTL 定位数据(DHSim.map 和DHSim.txt )。
a) 估算QTL 的位置和遗传效应,对群体的QTL 位置和遗传效应作统计推断; b) 把QTL 定位结果和实验一的分析结果都与仿真的参数真值作比较,比较所采
用的四种分析方法(回归分析、相关分析、方差分析、MCIM 的定位分析)用于推断群体基因定位的可靠性及统计方法的优缺点。
五、 实验数据记录和处理
专业: 应用生物科学 姓名: 赵应
学号: 3140100080 日期: 2016年4月11日 地点:紫金港西1-106(多)
1、二因素协方差分析
a)析因分析结果
b)协方差分析结果
2、水稻品种区域试验分析
a)用GLM模块分析结果
b)用MIXED模块分析结果
c)用Varcomp 模块分析结果
d)用QTModel 分析结果
3、QTL定位分析
用SAS做回归分析结果:
用SAS做相关分析结果:用SAS做方差分析结果:
此处略去m3到m33标记的方差分析结果。
六、实验结果与分析
1、二因素协方差分析
由析因分析结果可知,模型的Pr>F值=0.2266>0.05且R-Square=0.191113,故
模型不显著;并且,无论是主因素A、B还是两者的互做效应,对Y(鲜花产
量)都没有显著性的影响。因此,用析因分析模型来分析该实验数据不是太合
适。然后用协方差模型进行分析,模型的Pr<0.0001,模型极显著。由变量显
著性分析可知,主因素X(小区面积)、A(品种)和B(水分)对Y(鲜花产量)具
有显著性影响,而A(品种)和B(水分)的互作对Y(鲜花产量)的影响不显著,
所以可以对单独的因素进行分析。因此,可以用协方差模型分析次实验数据。
对于品种因素单一分析,LP品种产量均比WB品种产量高;对于水分因素单
一分析,Low水平产量均比High水平产量高。两种分析方法结果的不同显示
出:协方差分析将协变量对因变量的影响从自变量中分离出去,可以进一步提
高实验精确度和统计检验灵敏度。
2、水稻品种区域试验分析
a)GLM模块分析结果表明:模型的Pr>F值<0.0001且R-Square=0.955918,故
模型显著,yield与Gen、Year、Loc、Year*Loc、Gen*Year Gen*Loc、
Gen*Loc*Year、Block(Year*Loc)存在显著的线性关系,且各因素主效应、互做
效应均显著。各效应中只有主效应year(年份效应)、Block(区组效应)和互
作效应gen*year*loc(品种*年份*地点)三互作显著,对Y(产量)有显著性
影响,其余各效应均不显著。Alpha=0.05时,只有4-1、4-2、5-1、5-2、3-2五
组中,两个品种间差异显著,其余各品种间差异不显著。Mixed模块分析结果
表明:Mixed分析结果表中列出了模型中变量的协方差参数估计,但没有给出
相应的标准误和对应的P value,故无法直接判断各因素的显著性情况。固定
效应Gen的第三类估计方法得到的P value=0.3552>0.05,表明品种效应对
产量的影响并不显著。对于固定效应品种(Gen),在其他条件相同时,Gen5
的产量最高。虽然不同品种的产量不同,但是各品种间无显著性差异。VarComp