浙大生物统计实验报告1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、计算仿真群体各分子标记位点的基因型95%置信区间,检验分子标记基因型频率是否符合1:1的分离比例
标记型A的95%置信区间:0.493939±0.009403,因0.5属于其中,故符合1:1比例
3、对二个环境表现型值的线性回归关系进行评价:
两个环境的表现型值的R2=0.0136,由此可知两者之间基本上不存在线性回归关系。
105.8939576
143.58902
212.91719
环境2
96.83224
99.54540
78.49477
116.39390
表4离散变量的统计分析
均值
方差
标准误
A的频率
0.493939
0.00034
0.003211
B的频率
0.506061
0.00034
0.003211
以环境一的表现型值为依变量,以环境二的表现型值为自变量,运行sas程序,得到:
-0.09094
-0.09902
-0.08927
环境2
-0.66838
-0.65725
-0.47147
-0.42518
-0.38046
-0.3616
六、实验结果与分析
1、检验群体均值和方差与零是否存在显著差异
用二尾检验:H0:u=0H1:u≠0均值用t检验,得出环境1、2均值都存在显著差异
H0:σ2=0 H1:σ2≠0方差用卡方检验,得出环境1、2方差存在显著差异
Interaction
QTL-i
QTL-j
AA
AAE1
AAE2
1
1
2
3.20
0.00
0.00
2
1
3
0.00
-4.20
4.20
3
2
4
-3.00
3.16
-3.16
2、实验数据的分析:采用Excel软件整理数据,采用Excel对样本资料进行简单的统计分析和简单回归分析,如下:
a)连续变量的统计分析:采用Excel分别计算仿真群体的表现型数据的样本均值、样本方差、标准误。
课程名称:
生物统计与实验设计
姓 名:
赵应
学 院:
农业与生物技术学院
系:
应用生物科学
专 业:
应用生物科学
学 号:
3140100080
指导教师:
朱军、徐海明
2016年4月11日
实验报告
课程名称:生物统计与实验设计指导老师:徐海明成绩:________________
实验名称:简单统计分析和简单线性回归实验类型:综合实验
五、实验数据记录和处理
表3连续变量的统计分析
表现型方差
表现型标准差
表现型标准误
环境1
173.1435977
13.15840407
0.930439675
环境2
94.65116171
9.72888286
0.687935904
均值95%下限
均值95%上限
方差95%下限
方差95%上限
环境1
102.2243844
b)离散变量的统计分析:对各分子标记位点,采用Excel计算仿真群体的分子标记基因型频率、样本频率的方差、标准误。
c)简单回归模型的统计分析方法;采用Excel以环境一的数据为依变量,以环境二的数据为自变量,计算简单线性回归系数的估计值及其标准误、计算各项变异的自由度、平方和、均方。采用Excel分别以二个环境的表现型数据为依变量,分子标记为自变量,计算仿真群体表现型数据与分子标记的简单相关系数。
表1参数设置
QTL
Chromosome
Marker
Interval
Distance
(cM)
A
AE1
AE2
1
1
3
3.0
4.70
4.47
-4.47
2
1
7
8.0
0.00
0.00
0.00
3
2
4
5.0
-4.10
0.00
0.00
4
3
6
2.0
0.00
0.00
0.00
5
3
3
1.0
3.50
-3.16
3.16
表2参数设置
-0.01162
-0.06373
-0.17677
-0.14065
环境2
0.271575
0.260455
0.194454
0.15109
-0.33
-0.32322
-0.39922
-0.49479
-0.56993
Mk28
Mk29
Mk30
Mk31
Mk32
Mk33
环境1
-0.1258
-0.11172
-0.10073
表5仿真群体表现型数据与分子标记的简单相关系数
Mk1
Mk2
Mk3
Mk4
Mk5
Mk6
Mk7
Mk8
Mk9
环境1
-0.40929
-0.51972
-0.67318
-0.616
-0.53924
-0.40714
-0.35012
-wenku.baidu.com.29228
-0.27644
环境2
-0.06068
-0.0452
-0.01516
0.076456
4、 以二个环境的表现型值为依变量,以分子标记为自变量,进行多元回归分析:在SAS中对环境1的表现型值与分子标记进行逐步回归(slstay和slentry均取0.01)如下:
对环境1的表现型值与分子标记进行逐步回归(slstay和slentry均取0.01)如下:
由此推断:环境1的数量性状基因在Mk3、Mk15、Mk5附近;环境2的数量性状基因在Mk28、Mk15、Mk29附近。
0.113036
0.079987
0.045066
0.045995
-0.02191
Mk10
Mk11
Mk12
Mk13
Mk14
Mk15
Mk16
Mk17
Mk18
环境1
-0.19791
-0.20039
0.190274
0.19426
0.273134
0.324983
0.272791
0.217011
0.188191
七、讨论、心得
1、通过本次实验,我初步了解了Excel软件的数据分析功能,掌握了连续变量和离散变量的样本资料简单统计分析的方法,以及简单回归模型的分析方法;
2、对于大量数据的分析统计,SAS使用起来更方便,但是命令太多,需要一定时间熟悉各种命令;
3、实验数据是通过程序产生的,对于实际的生物学研究没有太大联系,但是其中所用到的数据处理分析方法却是生物学研究必不可少的。
同组学生姓名:无
一、实验目的和要求
初步了解Excel软件的数据分析功能,掌握连续变量和离散变量的样本资料简单统计分析的方法,掌握简单回归模型的分析方法。
二、实验内容和原理
1、连续变量的统计分析方法;
2、离散变量的分析方法;
3、简单回归模型的统计分析方法。
三、主要仪器设备
一台装有excel和SAS软件的PC
环境2
-0.05579
-0.07573
0.217489
0.253964
0.290337
0.399782
0.368053
0.257015
0.238907
Mk19
Mk20
Mk21
Mk22
Mk23
Mk24
Mk25
Mk26
Mk17
环境1
0.12431
0.071319
0.062918
0.040391
0.005624
四、操作方法和实验步骤
1、实验数据的生成:本实验所用的数据需要基于设置的参数,运行计算机模拟软件(QTLSimulation.exe)产生。先打开参数设置文件SimPar.txt,用自己的学号替换第一设置行“The seed for initilizing the rand() = *******”中的随机数发生器的种子“*******”。然后重新保存设置文件。运行模拟软件时需要输入参数设置文件名。模拟软件产生三个文件,DHSim.Par是基因数目、位置、效应的参数文件,DHSim.Map是分子标记遗传图谱的文件,DHSim.Txt是基因定位遗传群体(样本数n =200)的分子标记和二个环境模拟性状的表现型值的文件。以DHSimuData.xls文件的格式,整理可分析的数据文件。计算机模拟的参数设置如下:
标记型A的95%置信区间:0.493939±0.009403,因0.5属于其中,故符合1:1比例
3、对二个环境表现型值的线性回归关系进行评价:
两个环境的表现型值的R2=0.0136,由此可知两者之间基本上不存在线性回归关系。
105.8939576
143.58902
212.91719
环境2
96.83224
99.54540
78.49477
116.39390
表4离散变量的统计分析
均值
方差
标准误
A的频率
0.493939
0.00034
0.003211
B的频率
0.506061
0.00034
0.003211
以环境一的表现型值为依变量,以环境二的表现型值为自变量,运行sas程序,得到:
-0.09094
-0.09902
-0.08927
环境2
-0.66838
-0.65725
-0.47147
-0.42518
-0.38046
-0.3616
六、实验结果与分析
1、检验群体均值和方差与零是否存在显著差异
用二尾检验:H0:u=0H1:u≠0均值用t检验,得出环境1、2均值都存在显著差异
H0:σ2=0 H1:σ2≠0方差用卡方检验,得出环境1、2方差存在显著差异
Interaction
QTL-i
QTL-j
AA
AAE1
AAE2
1
1
2
3.20
0.00
0.00
2
1
3
0.00
-4.20
4.20
3
2
4
-3.00
3.16
-3.16
2、实验数据的分析:采用Excel软件整理数据,采用Excel对样本资料进行简单的统计分析和简单回归分析,如下:
a)连续变量的统计分析:采用Excel分别计算仿真群体的表现型数据的样本均值、样本方差、标准误。
课程名称:
生物统计与实验设计
姓 名:
赵应
学 院:
农业与生物技术学院
系:
应用生物科学
专 业:
应用生物科学
学 号:
3140100080
指导教师:
朱军、徐海明
2016年4月11日
实验报告
课程名称:生物统计与实验设计指导老师:徐海明成绩:________________
实验名称:简单统计分析和简单线性回归实验类型:综合实验
五、实验数据记录和处理
表3连续变量的统计分析
表现型方差
表现型标准差
表现型标准误
环境1
173.1435977
13.15840407
0.930439675
环境2
94.65116171
9.72888286
0.687935904
均值95%下限
均值95%上限
方差95%下限
方差95%上限
环境1
102.2243844
b)离散变量的统计分析:对各分子标记位点,采用Excel计算仿真群体的分子标记基因型频率、样本频率的方差、标准误。
c)简单回归模型的统计分析方法;采用Excel以环境一的数据为依变量,以环境二的数据为自变量,计算简单线性回归系数的估计值及其标准误、计算各项变异的自由度、平方和、均方。采用Excel分别以二个环境的表现型数据为依变量,分子标记为自变量,计算仿真群体表现型数据与分子标记的简单相关系数。
表1参数设置
QTL
Chromosome
Marker
Interval
Distance
(cM)
A
AE1
AE2
1
1
3
3.0
4.70
4.47
-4.47
2
1
7
8.0
0.00
0.00
0.00
3
2
4
5.0
-4.10
0.00
0.00
4
3
6
2.0
0.00
0.00
0.00
5
3
3
1.0
3.50
-3.16
3.16
表2参数设置
-0.01162
-0.06373
-0.17677
-0.14065
环境2
0.271575
0.260455
0.194454
0.15109
-0.33
-0.32322
-0.39922
-0.49479
-0.56993
Mk28
Mk29
Mk30
Mk31
Mk32
Mk33
环境1
-0.1258
-0.11172
-0.10073
表5仿真群体表现型数据与分子标记的简单相关系数
Mk1
Mk2
Mk3
Mk4
Mk5
Mk6
Mk7
Mk8
Mk9
环境1
-0.40929
-0.51972
-0.67318
-0.616
-0.53924
-0.40714
-0.35012
-wenku.baidu.com.29228
-0.27644
环境2
-0.06068
-0.0452
-0.01516
0.076456
4、 以二个环境的表现型值为依变量,以分子标记为自变量,进行多元回归分析:在SAS中对环境1的表现型值与分子标记进行逐步回归(slstay和slentry均取0.01)如下:
对环境1的表现型值与分子标记进行逐步回归(slstay和slentry均取0.01)如下:
由此推断:环境1的数量性状基因在Mk3、Mk15、Mk5附近;环境2的数量性状基因在Mk28、Mk15、Mk29附近。
0.113036
0.079987
0.045066
0.045995
-0.02191
Mk10
Mk11
Mk12
Mk13
Mk14
Mk15
Mk16
Mk17
Mk18
环境1
-0.19791
-0.20039
0.190274
0.19426
0.273134
0.324983
0.272791
0.217011
0.188191
七、讨论、心得
1、通过本次实验,我初步了解了Excel软件的数据分析功能,掌握了连续变量和离散变量的样本资料简单统计分析的方法,以及简单回归模型的分析方法;
2、对于大量数据的分析统计,SAS使用起来更方便,但是命令太多,需要一定时间熟悉各种命令;
3、实验数据是通过程序产生的,对于实际的生物学研究没有太大联系,但是其中所用到的数据处理分析方法却是生物学研究必不可少的。
同组学生姓名:无
一、实验目的和要求
初步了解Excel软件的数据分析功能,掌握连续变量和离散变量的样本资料简单统计分析的方法,掌握简单回归模型的分析方法。
二、实验内容和原理
1、连续变量的统计分析方法;
2、离散变量的分析方法;
3、简单回归模型的统计分析方法。
三、主要仪器设备
一台装有excel和SAS软件的PC
环境2
-0.05579
-0.07573
0.217489
0.253964
0.290337
0.399782
0.368053
0.257015
0.238907
Mk19
Mk20
Mk21
Mk22
Mk23
Mk24
Mk25
Mk26
Mk17
环境1
0.12431
0.071319
0.062918
0.040391
0.005624
四、操作方法和实验步骤
1、实验数据的生成:本实验所用的数据需要基于设置的参数,运行计算机模拟软件(QTLSimulation.exe)产生。先打开参数设置文件SimPar.txt,用自己的学号替换第一设置行“The seed for initilizing the rand() = *******”中的随机数发生器的种子“*******”。然后重新保存设置文件。运行模拟软件时需要输入参数设置文件名。模拟软件产生三个文件,DHSim.Par是基因数目、位置、效应的参数文件,DHSim.Map是分子标记遗传图谱的文件,DHSim.Txt是基因定位遗传群体(样本数n =200)的分子标记和二个环境模拟性状的表现型值的文件。以DHSimuData.xls文件的格式,整理可分析的数据文件。计算机模拟的参数设置如下: