生物统计学 第一章 绪论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/3/3
8
第二节 试验方案
一、试验因素与水平 二、试验指标与效应 三、制订试验方案的要点
2020/3/3
9
一、试验因素与水平
1、因素(factor)
试验方案是根据试验目的和要求所拟进行比较的一组 试验处理(treatment)的总称。
农业与生物学研究中,不论农作物还是微生物,其生 长、发育以及最终所表现的产量受多种因素的影响,其 中有些属自然的因素,如光、温、湿、气、土、病、虫 等,有些是属于栽培条件的,如肥料、水分、生长素、 农药、除草剂等。
将每次所取样品测定的结果称为一个观 察值(observation),以y表示。理论值或 真值,以 表示,则 y ,即观察值=
真值+误差,每一观察值都有一误差 ,可
正,可负, y 。
2020/3/3
32
注意
总体:用希腊字母表示(p395)。 样本:用英文字母表示。
9. Yates、Yule等发展了一系列的试验设计包括后来的 混杂设计和不完全区组设计等;
10.英国Rothamsted试验场在生物统计和田间试验设计 方面卓有贡献;
11.Neyman和E.S. Pearson建立了统计推断的理论;
2020/3/3
44
生物统计学----biostatistics
是数理统计在生物学研究中的应用,它是 用数理统计的原理和方法来分析和解释生物 界各种现象和试验调查资料的科学。
2020/3/3
36
a、准确性和精确性都好 b、准确性差、精确性甚佳
试验数据的误差和精确性
c、准确性和精确性都很差 d、有一定的准确性,但 精确性很差
2020/3/3
37
二、试验误差的来源
系统误差是一种有原因的偏差,因而在 试验过程中要防止这种偏差的出现。可以 通过试验条件及试验过程的仔细操作而控 制。
试验统计方法
Methods of Experimental Statistic
2020/3/3
1
教材:面向21世纪课程教材 主编:盖钧镒
南京农业大学 国家大豆改良 中心
2020/3/3
2
第一章
绪论----
科学试验及其误差控制
2020/3/3
3
本章主要内容
第一节 科学研究与科学试验 第二节 试验方案 第三节 试验误差及其控制 第四节 试验统计学的发展和本课程的主要内容
2020/3/3
24
【例如】有一水稻品种的施肥试验,单施5kg氮 增产50kg,单施4kg磷增产25kg;
假定在施5kg氮的同时又施4kg磷: 若增产恰为75kg,则氮与磷没有交互作用; 若增产高于75kg,则氮与磷有正的交互作用; 若增产低于75kg,则氮与磷有负的交互作用。
2020/3/3
25
则: 单施氮的简单效应= N-O
在施磷的基础来自百度文库氮的简单效应= NP-P
氮的主效= (N O) (NP P)
2
同理,可计算磷肥的简单效应和主效;
2020/3/3
23
互作(interaction effect)
❖两个因素简单效应间的平均差异称为交互作 用,简称互作。 ❖它反映一个因素的各水平在另一个因素的不 同水平下反应不一致的现象。
表1.1 2×2试验数据(解释各种效应)
P1水平下的N的简单效应
NP的互作效应
因素 N
P
水平
N1
P1
10
P2
18
平均
14
P2-P1
8
N2
平均 N2-N1
16
13
6
24
21
6
20
6
8
8
0,0/2
N1水平下的P的简单效应
2020/3/3
N的主要效应 P的主要效应
26
表1.1 2×2试验数据(解释各种效应)
1. 根据本人的观察形成一种认识或假说;
2. 根据假说所涉及的内容安排相斥性的试验或抽 样调查;
3. 根据试验或调查所获的资料进行推理,肯定或 否定或修改假说,从而形成结论。
形成假说
实验验证
结论
2020/3/3
7
(二)科学研究的基本方法
1.选题 2.文献 3.假说 4.假说的检验 5.试验的规划与设计
2020/3/3
33
试验中发生的误差有两种:
系统误差(systematic error)
具有一定原因的偏差(bias)
比如由于在观测中因仪器不准,工作者的习 惯和偏向等原因所引起的观察值偏大或偏小的 差异。
2020/3/3
34
偶然误差(random error)
完全偶然性的,找不出确切原因的。
随机误差是偶然性的,随机误差不可 能避免,但可以减少。
2020/3/3
38
三、随机误差的规律性
以大豆品种蛋白质含量的测定为例,若从一批 种子中抽取1000份样品,分别进行蛋白质含量的 测定,若无系统偏差的干扰,则所获1000个数据,
将其平均数当作理论真值 ,ˆ
2020/3/3
39
根据 y ˆ 可计算出1000个误差值。这1000个误差值有 “+”有“-”,平均起来正负相抵消等于0。若将其画成 坐标图,接近于一个对称的钟形图,在靠近0的+、-范围 内出现的误差次数多,越远离0出现的次数越少。
试验 因素 N
ⅡP
水平 N1
N2
平均 N2-N1
P1
10
16 13
6
P2
18
28 23
10
平均 14
22
8
P2-P1 8
12
10
4,4/2=2
2020/3/3
27
试验 因素 N
Ⅲ
P
水平 N1 N2
P1
10 16
P2
18 20
平均 14 18
P2-P1 8
4
Ⅳ
P
水平 N1 N2
P1
10 16
P2
18 14
0
n1
p2
Ⅱ
p1
n2
Ⅳ
p1 p2
n2
29
三、制订试验方案的要点
1. 拟订试验方案前应通过回顾以往研究的进展、调 查交流、文献检索等明确试验的目的,形成对所 研究主题及其外延的设想,使待拟订的试验方案 能针对主题确切而有效地解决问题。
2. 根据试验目的确定供试因素及其水平。
3. 试验方案中应包括有对照水平或处理 ,简称对照 (check,符号CK)。
产量、抗性、耐逆性等。 单指标,多指标,综合指标。
2020/3/3
18
2、试验效应(effect)
试验因素对试验指标所起的增加或 者减少的作用。
【例如】对某水稻品种进行施肥试验,每 667m2施氮10kg,667m2产量为350kg,每 667m2施氮15kg,667m2产量为450kg。则在每 667m2施氮10kg的基础上增施5kg的效应即为 450-350=100kg/667m2。
二、本课程的主要内容
第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章
绪论 田间试验的设计与实施 次数分布和平均数、变异数 理论分布和抽样分布 统计假设测验 方差分析 卡平方(χ2)测验 直线回归和相关分析
2020/3/3
46
学习的功用
①提供整理和描述数据的科学方法; ②提供由样本推论总体的科学方法; ③提供由误差分析以鉴定处理效应的科学方
平均 14 15
P2-P1 8
-2
2020/3/3
平均 13 19
6 平均 13 16
3
N2-N1 6 2 4 -4,-4/2=-2 N2-N1 6 -4 2 -10,-10/2=-5
28
30
20
Ⅰ
10
0
n1
30
Ⅲ 20
10
0
n1
2020/3/3
p2 p1
n2
p2 p1 n2
30
20
10
0
n1
30 20 10
f(e)
68.27%
95.45%
-3
-2
-1
0
1
2
3
2020/3/3
图1.3 随机误差的分布模式
40
四、随机误差的层次性 五、试验误差的控制
2020/3/3
41
第四节 试验统计学的发展和本课程 的主要内容
一、试验统计学的发展
二、本课程的主要内容
2020/3/3
42
1. 17世纪Pascal 和Fermat的概率论; 2. 18世纪De Moivre、Laplace和Gauss的正态分布理论; 3. 19世纪达尔文应用统计方法研究生物界的连续性变异; 4. 孟德尔应用统计方法发现显性、分离、独立分配等遗传定
【例如】有一氮、磷肥肥效试验,其处理有: P(只施磷肥);NP(同时施氮肥和磷肥); 则:氮肥的简单效应=NP产量-P产量=NPP
2020/3/3
21
主效(main effect)
一个因素内各简单效应的平均数称为 平均效应,也称做主要效应或主效。
2020/3/3
22
【例如】有一氮、磷肥肥效试验的结果,其处理有: O(既不施氮,又不施磷);N(只施氮肥);P(只施 磷肥);NP(同时施氮肥和磷肥);
该试验就会有六种水平组合(处理): A1B1、A1B2、 A2B1、A2B2、
A3B1、A3B2
❖ 统计上,只研究一个处理因素的试 验称为单因素试验;
❖统计上,包含两个或两个以上的处 理因素的试验称为多因素试验。
2020/3/3
14
试验方案按其供试因子数的多少 可以区分为以下3类
①单因素试验(single-factor experiment) 单因素试验 是指整个试验中只变更、比较一个试验因素的不 同水平,其他作为试验条件的因素均严格控制一 致的试验。
2020/3/3
11
试验因素水平可以是定性的,如供试 的不同品种,具有质的区别,称为质量水 平;也可以是定量的,如喷施生长素的不 同浓度,具有量的差异,称为数量水平。 数量水平不同级别间的差异可以等间距, 也可以不等间距。
2020/3/3
12
【例如】研究不同品种在不同氮肥施用量下 的产量表现: 品种: A1、A2、 A3 施氮等级: B1、B2
主要由于试验地的土壤差异所引起,这是田 间试验误差中最有影响也是最难以控制的;其它 因素如病虫害侵袭、人畜践踏、风雨影响等也会 引起偶然误差。
2020/3/3
35
系统误差影响了数据的准确性,准确性是 指观测值与其理论真值间的符合程度;
而偶然误差影响了数据的精确性,精确性 是指观测值间的符合程度。
2020/3/3
10
进行科学试验时,必须在固定大多数因素的条件下才能研 究一个或几个因素的作用,从变动这一个或几个因子的不 同处理中比较鉴别出最佳的一个或几个处理。
被变动并设有待比较的一组处理的因子称为试验因素,简 称因素或因子(factor)。
试验因素的量的不同级别或质的不同状态称为水平 (level)。
2020/3/3
16
二、试验指标与效应
1. 试验指标(experimental indicator) 2.试验效应(experimental effect) 3. 主效 4. 互作
2020/3/3
17
1、试验指标
用于衡量试验效果的指示性状称试验指标 (experimental indicator)
2020/3/3
19
简单效应:在同一因素内两种水平间 试验指标的相差。
【例如】有一氮肥肥效试验,其处理有: O(不施氮肥);N(施氮肥)。
则:氮的简单效应=N产量-O产量=N-O
2020/3/3
20
❖ 在多因素试验中,一个因素的相同水平下, 另一因素不同水平间的产量(或其它性状)差 异仍称为简单效应。
律; 5. Karl Pearson用统计方法研究进化问题,并创建了
Biometrika杂志; 6. Galton研究了亲子身高的回归问题; 7. 20世纪以来Gosset用实验方法发现了t分布;
2020/3/3
43
8. Fisher提出了方差分析,建立了试验设计的三大原理, 并提出了随机区组、拉丁方等试验设计,还将统计方 法用之于研究数量性状的基因效应;
2020/3/3
4
第一节 科学研究与科学试验
一、农业和生物学领域的科学研究
自然科学
理论科学:推理、演绎、归纳等 实验科学:周密设计实验
2020/3/3
5
农业和生物学领域的包括:
农学、园艺、 草业、植保、生物技术、
农业资源与环境
抽样调查 科学试验
2020/3/3
6
二、科学研究的基本过程和方法
(一) 科学研究的基本过程
②多因素试验(multiple-factor or factorial experiment) 多因素试验是指在同一试验方案中包 含2个或2个以上的试验因素,各个因素都分为不 同水平,其他试验条件均应严格控制一致的试验。
2020/3/3
15
③综合性试验(comprehensive experiment) 综合性试验中各因素的各水平不构成平衡 的处理组合,而是将若干因素的某些水平 结合在一起形成少数几个处理组合。
2020/3/3
30
4. 试验方案中应注意比较间的唯一差异原则 ,以便 正确地解析出试验因素的效应。
5.拟订试验方案时必须正确处理试验因素及试验条 件间的关系。
6. 多因素试验提供了比单因素试验更多的效应估计 , 具有单因素试验无可比拟的优越性。
2020/3/3
31
第三节 试验误差及其控制
一、 试验数据的误差和精确性