Accuracy准确度与精确度
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A B C D E
B C D E A
C D E A B
D E A B C
E A B C D
4. 裂区设计(split-plot design) 是多因素试验的一 种设计形式。先按一个因素设计主处理小区(main plot),然后在这个主处理小区内引进第二个因素的 各个处理的小区(副区或裂区,split-plot)。
二、次数分布表
将试验所得到的大量未加整理的数据,按观察值大小 或数据类别进行分组,制成关于观察值不同组别或不同分 类单位的次数分布表,就可以看出资料中不同表现的观察 值与其频率间的规律性,从而对资料有一个初步概念。
1. 间断性资料的整理 参见 P13 例2。 2. 连续性资料的整理 参加 P14 例3。
小麦基本苗数、菌落数、 穗数、分孽数等等
病斑长度、作物产量、 株高、土壤水分含量等等
2. 质量性状资料(qualitative trait) 观察而不能量 测性状,如菌落的颜色、麦穗有无芒等等。 统计次数法 给分法
统计具有某个性状的个 体数目及具有不同性状的 个体数目,按类别计其 次数或相对次数
给予每类性状以相对数 量的方法,如小麦籽粒有 红白两种颜色,可用0 表示白色,用1表示红色
正交设计(orthogonal design):
两个重要的特点:
(1)每列中因素各水平数字出现的次数相等,即整 齐可比性;
(2)任两列放在一起,他们的行构成一个有序数对, 这样的数对出现的次数也相等。或者说任两列之间的 所有可能的水平组合都出现,且出现的次数均等。即 均衡分散性。
具有这样特点的数表称为正交表。正交表是正交 拉丁方的推广。一般用LN(mk)表示正交表,N为试 验次数;k为所能容纳的最多因素数;m为每个因素 的水平数。如L8(27)。
因素 列号
A 1
B 2
AB 3
C 4
AC 5
BC 6
e 7
第二节
描述性统计
一、试验资料的性质与分类 1. 数量性状资料(quantitative trait) 采用计数和 量测两种方式所得到的数据。 间断性变数 Discontinuous or discrete variable 连续性变数
continuous variable
2. 间比法设计(interval contrast design) 常用处理试 验单元较多的试验,要求不高,但用随机区组排列有 困难的试验。其试验单元排列特点是第一个小区和末 尾小区一定是对照,每二个对照之间排列相同数目的 处理小区,通常是4或9个,重复2-4次。
CK 1 2 3 4 CK 5 6 7
基本概念(Basic Concepts)
1. 总体(population): 具有共同性质的个体所组成的集团。 分为有限总体和无限总体。 2. 样本(Sample):从总体中抽出的若干个个体组成样本。
3. 观察值(Observed Value):每一个体的某一性状、特性 的测定数值。
4. 变数(Variable):凡表现出变异的观察值称为变数。 5. 参数(Parameter):由总体的全部观察值而计算得到的 总体特征数,如总体平均数等。 6. 统计数(Statistic):测定样本中的各个体而得到的特征 数,如样本平均数等。
1 2 3 4 5 6 7 8
1 1 1 1 1 2 2 2 2
2 1 1 2 2 1 1 2 2
3 1 1 2 2 2 2 1 1
4 1 2 1 2 1 2 1 2
5 1 2 1 21
7 1 2 2 1 2 1 1 2
表头设计: 首先将A、B放在第1,2列上,查交互作用表,他们 的交互作用AB在第3列,因此,C因素不能放在第3列上, 应放在第4列上,AC放在第5列上,BC放在第6列上, ABC放在第7列上,真正安排时只用1,2,4列。若ABC不 存在,则第7列可作为误差e,这样就得到了表头设计如 下:
●● ● ● ●
● ● ● ● ●
即准确又精确
准确而不精确
● ● ●
● ● ● ● ● ● ●
精确而不准确
即不准确又不精确
试验模型
随机干扰
输入 处理 供试体
输出 试验指标
Fig. 1 General model of experiment
U
x f (u, )
x
Fig. 1 Mathematical model of experiment
3. 属性变数资料的整理
在整理前,将资料按各种质量性状进行分类,分类数等 于组数,然后根据各个体在质量属性上的具体表现,分 别归入相应的组中,即可以得到属性分布的规律性认识。
三、次数分图
条形图(bar diagram)
适合于间断性 变数和属性资料
3月 120.0 100.0 80.0 60.0 40.0 20.0 0.0 1 2 3 4 5 6 7 3月
1、田间试验设计
随机化排列
重 复 I
重 复 II
ck g c f a d b ck2 e
a f
e h
ck2 b
b e d
c
f ck
ck a
g c
d g
利用查表或产生随机数的方法进行设计
a
b
c
d
e
f
g
h
ck
1、田间试验设计
五、局部控制
d
ck b f c a e
随机化排列
设置重复
局部控制
消除系统误差, 无偏试验误差估计
7. 随机样本(Random Sample):从总体中随机抽取的样本。
• • 水平(Level):因素内设置的不同处理级别。 处理(Treatment):几个因素不同水平的组合。
•
• •
准确度(Accuracy):同一处理的观察值与其真实值的接 近程度。
精确度(Precision):同一处理的重复观察值间彼此接近 程度。 试验单元(Experimental Unit):是指接受某种处理的最 小的一个独立的试验材料单位。如一张叶片、一个果实、 一个枝条、一个植株等。
I
II
III
IV
7 1 3 4 2 5 8 6
肥力梯度:
4 3 6 8 1 2 7 5
2 1 8 7 6 4 5 3
1 7 5 3 4 8 6 2
8个品种4次重复的随机区组排列
3. 拉丁方设计(latin square design) 将各个处理从 纵横两个方向排列为区组(或重复),使每一个处理 在每一列和每一行中出现的次数相等(通常一次)。 所以它比随机区组多一个方向进行局部控制的随机排 列设计。拉丁方设计具有双向控制土壤差异的作用, 有较高的精确度,但缺乏伸缩性,适应于4-8个处理 的试验设计。
13. 误差(Error):观察值与处理真实值间的偏离程度。 14. 系统误差(Systematic Error):观察值与处理真实值间 出现有一定方向的系统偏离,如供试材料的遗传背景、仪 器等方面存在的可辨识的差别所造成的误差。 15. 随机误差(Random Error):观察值与处理真实值间出 现的大小、方向不同的微小差异。如在试验单元、管理方 法、操作方法等方面存在的不可辨识的差别所造成的误差。 16. 样本含量(Sample Size/Capacity):样本中所包含的个 体数目。
I II
1 6 6 1 2 1
5 3
高
2 4 3 2 6 5
5 3 2 4 5 4
4 6
低
1 2 1 5 2 1
2 6 1 2 1 6
4 5
中
3 1 3 4 2 3
5 4
低
3 6
中
6 5
高
III
4 3
高
3 6
中
4 5
低
5. 再裂区设计(split-split plot design) 若在裂区试 验中需要引进第三个因素时,可以进一步裂区,将第 三个因素的各个处理随机排列在裂区内。
离散的测定几个点,采用统计学的方法经验的估计 x=f(U) (如上图所示),显然观测点未必都在曲线上。如果估计出了 x=f(U),我们就掌握了x随U而变化的规律,就可以进行预 测和控制。
三、处理设计
田间试验按试验小区大小、试验年份、试验地点等可分为 若干类,但最基本的是根据试验因素可将田间试验分为: 单因素试验(Single-factor experiment)仅研究某一 个问题,如施肥对产量的影响,可以包含肥料的不同等级。 优点:试验简单,容易分析、但是不能了解各因素之间的 关系。 多因素试验(Multiple-factor experiment)中包含了不 同因素及不同水平的组合。优点:便于了解各因素之间的 相互关系,试验复杂,设计不妥时不便于分析。 综合试验(Comprehensive experiment)是在进行多因 素研究之后,将重要因素重新组合,进行试验分析,各因 素的水平不需要构成平衡处理。
估计和降低 随机误差
与随机化结合 分离系统误差 降低随机误差
提高准确度和精确度 保证统计推断的可靠性
试验类型(二)
试验设计可以归纳为全面实施试验和部分实施试 验两种类型。 全面实施试验分为顺序排列的试验设计和随 机排列的试验设计两大类。前者常用在处理数量
大、精确度要求不高、不须作统计推断的预备试
验,容易发生系统误差;后者强调有合理的试验
假设我们要做一个三因素二水平的试验,若已知不需要考虑任何 交互作用,可以用L4(23)表,但在这种情况下,误差项Sse分离不出 来,无法作统计检验,只能直观比较哪个水平好。若存在交互作用,就 会迭加在其它列上,从而得到错误的结果。因此,若不能排除存在交互 作用的可能,则应利用L8(27)表。
Col Row
四、试验单元的排列方式
试验设计的目的是避免系统误差,缩小随机误差,以保证 试验的准确度和精确度。 x x 试验设计的三个基本原理:
/ n
1.重复(Replication):重复的作用(1)若试验中没有系统误 差存在,只有随机误差,则可用处理多次重复观察值间的参差 不弃程度来估计随机误差。只有1次重复就无法估计随机误差 (2)同一处理多次观察值的平均值是处理真值的最好估计。 2.随机化(Randomization):通过试验单元的随机化排列来 消除试验单元间的系统误差。 3.局部控制(Local control):将整个试验空间分成若干个各 自相对均匀的局部(区组),所以的区组构成区组因素。作用 (1)可将系统误差分离出来增加准确度;(2)区组内保证试 验单元的一致性,增加精确度。
8 CK 9 10 11 12 CK
12个小麦品种的间比法排列
二、随机排列的试验设计 1. 完全随机设计(completely random design) 将各 个处理随机分配到各个试验单元(或小区)中,每一 个处理的重复数可以相等或不相等。这种设计灵活机 动,单因素和多因素均可使用。 2. 随机区组设计(randomized blocks design)亦称完全 随机区组设计(random complete block design) 根据 局部控制的原则将试验地划分为等于重复次数的区组, 一个区组安排一个重复,区组内各处理都独立随机排 列。主要特点(1)简单;(2)适应性广;(3)能 提供无偏的误差估计,降低误差;(4)对试验地形 要求不严格;(5)试验的处理数目一般不要超过20。
6. 条区设计(strip blocks design) 条区设计是裂区设 计的一种衍生设计,当要研究的两个因素都需要较大 的小区面积,且为了便于观察和管理,将每个区组划 分为纵向长条形小区,安排第一个因素的各个处理, 再将各个区组划分为若干个横向长条形小区,安排第 二个因素的各个处理。
部分实施试验(部分因子试验)
第一节
试验设计
experiment design
试验和实验 试验是在人为控制条件下有目的地进行的一种实践活动。
一、试验类型(一)
1. 田间试验
2. 温室试验 3. 实验室试验 4. 皿内试验 5. 人工气候室内试验等等
二、试验的基本要求:
精确度 1. 目的明确 2. 结果可靠 3. 试验条件有代表性 4. 试验结果能够重复 准确度
误差估计,常用于对精确度要求较高的试验。
全面实施试验(全因子试验)
一、顺序排列的试验设计 1. 对比法设计(contrast design) 常用于少数处理试 验及示范性试验,其试验单元排列特点是处理单元直 接排列在对照区旁边,使每一小区可与其邻旁的对照 区直接比较。 I II III 1 7 5 CK CK CK 2 8 6 3 1 7 CK 4 CK 2 CK 8 5 CK 6 3 CK 4 1 CK 2 7 CK 8 5 CK 6 3 CK 4