Accuracy准确度与精确度

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

A B C D E
B C D E A
C D E A B
D E A B C
E A B C D
4. 裂区设计（split-plot design）是多因素试验的一种设计形式。先按一个因素设计主处理小区（main plot），然后在这个主处理小区内引进第二个因素的各个处理的小区（副区或裂区，split-plot）。
二、次数分布表
将试验所得到的大量未加整理的数据，按观察值大小或数据类别进行分组，制成关于观察值不同组别或不同分类单位的次数分布表，就可以看出资料中不同表现的观察值与其频率间的规律性，从而对资料有一个初步概念。
1. 间断性资料的整理参见 P13 例2。 2. 连续性资料的整理参加 P14 例3。
小麦基本苗数、菌落数、穗数、分孽数等等
病斑长度、作物产量、株高、土壤水分含量等等
2. 质量性状资料（qualitative trait）观察而不能量测性状，如菌落的颜色、麦穗有无芒等等。统计次数法给分法
统计具有某个性状的个体数目及具有不同性状的个体数目，按类别计其次数或相对次数
给予每类性状以相对数量的方法，如小麦籽粒有红白两种颜色，可用0 表示白色，用1表示红色
正交设计（orthogonal design）：
两个重要的特点：
（1）每列中因素各水平数字出现的次数相等，即整齐可比性；
（2）任两列放在一起，他们的行构成一个有序数对，这样的数对出现的次数也相等。或者说任两列之间的所有可能的水平组合都出现，且出现的次数均等。即均衡分散性。
具有这样特点的数表称为正交表。正交表是正交拉丁方的推广。一般用LN（mk）表示正交表，N为试验次数；k为所能容纳的最多因素数；m为每个因素的水平数。如L8（27）。
因素列号
A 1
B 2
AB 3
C 4
AC 5
BC 6
e 7
第二节
描述性统计
一、试验资料的性质与分类 1. 数量性状资料（quantitative trait）采用计数和量测两种方式所得到的数据。间断性变数 Discontinuous or discrete variable 连续性变数
continuous variable
2. 间比法设计（interval contrast design）常用处理试验单元较多的试验，要求不高，但用随机区组排列有困难的试验。其试验单元排列特点是第一个小区和末尾小区一定是对照，每二个对照之间排列相同数目的处理小区，通常是4或9个，重复2－4次。
CK 1 2 3 4 CK 5 6 7
基本概念（Basic Concepts）
1. 总体（population）: 具有共同性质的个体所组成的集团。分为有限总体和无限总体。 2. 样本（Sample）：从总体中抽出的若干个个体组成样本。
3. 观察值（Observed Value）：每一个体的某一性状、特性的测定数值。
4. 变数（Variable）：凡表现出变异的观察值称为变数。 5. 参数（Parameter）：由总体的全部观察值而计算得到的总体特征数，如总体平均数等。 6. 统计数（Statistic）：测定样本中的各个体而得到的特征数，如样本平均数等。
1 2 3 4 5 6 7 8
1 1 1 1 1 2 2 2 2
2 1 1 2 2 1 1 2 2
3 1 1 2 2 2 2 1 1
4 1 2 1 2 1 2 1 2
5 1 2 1 21
7 1 2 2 1 2 1 1 2
表头设计：首先将A、B放在第1，2列上，查交互作用表，他们的交互作用AB在第3列，因此，C因素不能放在第3列上，应放在第4列上，AC放在第5列上，BC放在第6列上， ABC放在第7列上,真正安排时只用1，2，4列。若ABC不存在，则第7列可作为误差e，这样就得到了表头设计如下：
●● ● ● ●
● ● ● ● ●
即准确又精确
准确而不精确
● ● ●
● ● ● ● ● ● ●
精确而不准确
即不准确又不精确
试验模型
随机干扰
输入处理供试体
输出试验指标
Fig. 1 General model of experiment

U
x f (u, )
x
Fig. 1 Mathematical model of experiment
3. 属性变数资料的整理
在整理前，将资料按各种质量性状进行分类，分类数等于组数，然后根据各个体在质量属性上的具体表现，分别归入相应的组中，即可以得到属性分布的规律性认识。
三、次数分图
条形图（bar diagram）
适合于间断性变数和属性资料
3月 120.0 100.0 80.0 60.0 40.0 20.0 0.0 1 2 3 4 5 6 7 3月
1、田间试验设计
随机化排列
重复 I
重复 II
ck g c f a d b ck2 e
a f
e h
ck2 b
b e d
c
f ck
ck a
g c
d g
利用查表或产生随机数的方法进行设计
a
b
c
d
e
f
g
h
ck
1、田间试验设计
五、局部控制
d
ck b f c a e
随机化排列
设置重复
局部控制
消除系统误差，无偏试验误差估计
7. 随机样本（Random Sample）：从总体中随机抽取的样本。
• • 水平（Level）：因素内设置的不同处理级别。处理（Treatment）：几个因素不同水平的组合。
•
• •
准确度（Accuracy）：同一处理的观察值与其真实值的接近程度。
精确度（Precision）：同一处理的重复观察值间彼此接近程度。试验单元（Experimental Unit）：是指接受某种处理的最小的一个独立的试验材料单位。如一张叶片、一个果实、一个枝条、一个植株等。
I
II
III
IV
7 1 3 4 2 5 8 6
肥力梯度：
4 3 6 8 1 2 7 5
2 1 8 7 6 4 5 3
1 7 5 3 4 8 6 2
8个品种4次重复的随机区组排列
3. 拉丁方设计（latin square design）将各个处理从纵横两个方向排列为区组（或重复），使每一个处理在每一列和每一行中出现的次数相等（通常一次）。所以它比随机区组多一个方向进行局部控制的随机排列设计。拉丁方设计具有双向控制土壤差异的作用，有较高的精确度，但缺乏伸缩性，适应于4－8个处理的试验设计。
13. 误差（Error）：观察值与处理真实值间的偏离程度。 14. 系统误差（Systematic Error）：观察值与处理真实值间出现有一定方向的系统偏离，如供试材料的遗传背景、仪器等方面存在的可辨识的差别所造成的误差。 15. 随机误差（Random Error）：观察值与处理真实值间出现的大小、方向不同的微小差异。如在试验单元、管理方法、操作方法等方面存在的不可辨识的差别所造成的误差。 16. 样本含量（Sample Size/Capacity）：样本中所包含的个体数目。
I II
1 6 6 1 2 1
5 3
高
2 4 3 2 6 5
5 3 2 4 5 4
4 6
低
1 2 1 5 2 1
2 6 1 2 1 6
4 5
中
3 1 3 4 2 3
5 4
低
3 6
中
6 5
高
III
4 3
高
3 6
中
4 5
低
5. 再裂区设计（split-split plot design）若在裂区试验中需要引进第三个因素时，可以进一步裂区，将第三个因素的各个处理随机排列在裂区内。
离散的测定几个点，采用统计学的方法经验的估计 x＝f（U）（如上图所示），显然观测点未必都在曲线上。如果估计出了 x＝f（U），我们就掌握了x随U而变化的规律，就可以进行预测和控制。
三、处理设计
田间试验按试验小区大小、试验年份、试验地点等可分为若干类，但最基本的是根据试验因素可将田间试验分为：单因素试验（Single－factor experiment）仅研究某一个问题，如施肥对产量的影响，可以包含肥料的不同等级。优点：试验简单，容易分析、但是不能了解各因素之间的关系。多因素试验（Multiple-factor experiment）中包含了不同因素及不同水平的组合。优点：便于了解各因素之间的相互关系，试验复杂，设计不妥时不便于分析。综合试验（Comprehensive experiment）是在进行多因素研究之后，将重要因素重新组合，进行试验分析，各因素的水平不需要构成平衡处理。
估计和降低随机误差
与随机化结合分离系统误差降低随机误差
提高准确度和精确度保证统计推断的可靠性
试验类型（二）
试验设计可以归纳为全面实施试验和部分实施试验两种类型。全面实施试验分为顺序排列的试验设计和随机排列的试验设计两大类。前者常用在处理数量
大、精确度要求不高、不须作统计推断的预备试
验，容易发生系统误差；后者强调有合理的试验
假设我们要做一个三因素二水平的试验，若已知不需要考虑任何交互作用，可以用L4（23）表，但在这种情况下，误差项Sse分离不出来，无法作统计检验，只能直观比较哪个水平好。若存在交互作用，就会迭加在其它列上，从而得到错误的结果。因此，若不能排除存在交互作用的可能，则应利用L8（27）表。
Col Row
四、试验单元的排列方式
试验设计的目的是避免系统误差，缩小随机误差，以保证试验的准确度和精确度。 x x 试验设计的三个基本原理：
/ n
1.重复（Replication）：重复的作用（1）若试验中没有系统误差存在，只有随机误差，则可用处理多次重复观察值间的参差不弃程度来估计随机误差。只有1次重复就无法估计随机误差（2）同一处理多次观察值的平均值是处理真值的最好估计。 2.随机化（Randomization）：通过试验单元的随机化排列来消除试验单元间的系统误差。 3.局部控制（Local control）：将整个试验空间分成若干个各自相对均匀的局部（区组），所以的区组构成区组因素。作用（1）可将系统误差分离出来增加准确度；（2）区组内保证试验单元的一致性，增加精确度。
8 CK 9 10 11 12 CK
12个小麦品种的间比法排列
二、随机排列的试验设计 1. 完全随机设计（completely random design）将各个处理随机分配到各个试验单元（或小区）中，每一个处理的重复数可以相等或不相等。这种设计灵活机动，单因素和多因素均可使用。 2. 随机区组设计（randomized blocks design）亦称完全随机区组设计（random complete block design）根据局部控制的原则将试验地划分为等于重复次数的区组，一个区组安排一个重复，区组内各处理都独立随机排列。主要特点（1）简单；（2）适应性广；（3）能提供无偏的误差估计，降低误差；（4）对试验地形要求不严格；（5）试验的处理数目一般不要超过20。
6. 条区设计（strip blocks design）条区设计是裂区设计的一种衍生设计，当要研究的两个因素都需要较大的小区面积，且为了便于观察和管理，将每个区组划分为纵向长条形小区，安排第一个因素的各个处理，再将各个区组划分为若干个横向长条形小区，安排第二个因素的各个处理。
部分实施试验（部分因子试验）
第一节
试验设计
experiment design
试验和实验试验是在人为控制条件下有目的地进行的一种实践活动。
一、试验类型（一）
1. 田间试验
2. 温室试验 3. 实验室试验 4. 皿内试验 5. 人工气候室内试验等等
二、试验的基本要求：
精确度 1. 目的明确 2. 结果可靠 3. 试验条件有代表性 4. 试验结果能够重复准确度
误差估计，常用于对精确度要求较高的试验。
全面实施试验（全因子试验）
一、顺序排列的试验设计 1. 对比法设计（contrast design）常用于少数处理试验及示范性试验，其试验单元排列特点是处理单元直接排列在对照区旁边，使每一小区可与其邻旁的对照区直接比较。 I II III 1 7 5 CK CK CK 2 8 6 3 1 7 CK 4 CK 2 CK 8 5 CK 6 3 CK 4 1 CK 2 7 CK 8 5 CK 6 3 CK 4