生物统计名词解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、田间试验
1.田间试验:是指在田间土壤、自然气候等环境条件下栽培作物,并进行与作物有关的各种科学研究的试验。
4.准确性:也称准确度,指某一试验指标或性状的观测值与该实验指标或性状观测值总体平均数接近的程度(实验的系统误差影响准确性大小)。
5.精确性:也称精确度,指同一试验指标或性状的重复观测值彼此接近程度(实验的随机误差影响精确性大小)。
6.试验指标:用来衡量实验结果好坏或处理效应高低、在试验中具有测定的性状或观测的项目称为试验指标。
7.试验因素:试验中人为控制的、影响试验指标的原因或条件称为试验因素。
8.试验水平:对试验因素所设定的质的不同状态或量的不同级别称为试验水平,简称水平。
9.试验处理:事先设计好的实施在试验单位上的具体项目称为实验处理简称处理。
10.实验小区:实施一个实验处理的一小块长方形土地称为实验小区,简称小区。
11.试验单位:实施试验处理的材料单位称为试验单位,亦称试验单元。
12.总体与个体:根据研究目的确定的研究对象的全体称为总体,其中的一个研究对象称为个体。
13.样本:从总体中抽取的一部分个体组成的集合。
14.样本容量:样本所包含的个体数目,常记为n。
15.试验误差:由于受到试验因素以外各种内在的、外在的非试验因素的影响使观测值与试验处理观测值总体平均数之间产生的差异,简称误差。
16.系统误差:在一定试验条件下,由某种原因所引起的使观测值发生方向性的误差,又称偏性。
17.随机误差:由多种偶然的、无法控制的因素引起的误差。
21.边际效应:指小区两边或两端植株的生长环境与小区中间植株的生长环境不一致而表现出的差异。
22.小区形状:指小区长宽比例。(小区形状一般为长方形,狭长小区使各小区更紧密相邻,减少了小区之间的土壤差异)
23.区组:将一个重复全部小区安排与土壤非礼等环境条件相对均匀一致的小块土地上,成为一个区组(田间试验一般设置3-4次重复,即设置3-4个区组。每个区组阿奶全部处理的称为完全区组,当处理数较多时,每个区组安排部分处理的称为不完全区组)。
二、资料的整理与描述
1.数量性状资料
(1)数量性状:能够以量测或计数的方式表示其数量特征的性状。
(2)计量资料:也称连续性变量资料,用度、量、衡等计量工具以量测方式直接获得的数量性状资料。
(3)计数资料:也称不连续性变量资料或间断性变量资料,是指用计数方式获得的数量性状资料。计数资料的观测值只能以整数表示。
2.质量性状资料
(1)质量性状:又称属性性状,指能观测到而不能直接测量的性状。
(2)统计次数资料:在一定的总体或样本内,根据某一质量性状类别统计其次数,以次数作为质量性状的数量。
(3)定级评分法:用不同数字表示某种现象在某种程度上的差别。
3.资料的检查与核对目的:确保原始资料的完整性和正确性
(1)完整性:是指原始资料无缺失或重复。
(2)正确性:是指原始资料的测量和记载无差错,或未进行不合理的归并。5.资料的集中程度描述——平均数
(1)算术平均数:资料中各观测值的总和除以观测值的个数所得的商,简称平均数或均数,样本平均数记为
c.总体平均数包含N个个体的有限总体的平均数,用μ表示。
(4)几何平均数:n个观测值相乘之积开n次方所得的n次根,记为G。
(5)调和平均数:资料中n个观测值倒数的算术平均数的倒数,记为H,
自由度离均差平方和的自由度简称自由度记为df。
(3)变异系数样本标准差与样本平均数的比值,以百分数表示,记为CV,
三、常用概率分布
1.事件(1)基本事件:不能再分的事件
(2)复合事件:有若干个基本事件组合而成的事件
(3)必然事件:在一定条件下进行一项实验,必然会发生的事件,用Ω表示(4)不可能事件:在一定条件下进行一项实验,不可能发生的事件,用Φ表示2.小概率事件不可能性原理:小概率事件不是不可能事件,但在一次试验中发生的可能性很小,不发生的可能性很大,以至于实际上可以看成是不可能发生的。
3.随机变量
(1)离散型随机变量:如果表示实验结果的变量x的可能取值之多为可列个,且以各种确定的概率取这些不同的值,则称变量x为离散型随机变量。
(2)连续型随机变量:如果表示实验结果的变量x的可能取值为某范围内的数值,且变量x在其取值范围内的任一区间内取值的概率是确定的,则称变量x为连续型随机变量。
4.二项分布x~B(n,p)
(1)二项总体:非此即彼的两项构成的总体
(2)标准正态分布:平均数μ=0、方差σ2=1的正态分布,记为u~N(0,1)。(3)中心极限定理若随机变量x服从平均数是μ、方差是σ2的分布(不是正态分布);x1,x2,…,x n是由此总体得来的随机样本,则当n相当大时,样本平均
数的概率分布逼近正态分布
7.标准误:平均数抽样总体的标准差的大小反映样本平均数抽样误差
的大小,即精确性的高低。
四、假设检验(又称显著性检验)
1.假设检验的目的:判断实验的表面差异除包含试验误差外是否还
包含实验的真实差异。
3.显著水平:用来推断无效假设否定与否的概率标准称为显著水平
(1)非配对设计:将试验单位完全随机地分为两组,然后再随机地对两组分别实施两个不同处理的实验设计。
(2)两个样本的总体方差未知,且为小样本,当两个方差相等时采用t检验,当两个方差不相等时采用近似t检验。
(1)配对设计:先根据配对的要求将实验单位两两配对,然后将配成对子的两个试验单位随机实施某一处理的实验设计。
(1)区间估计:在一定概率保证下给出总体参数的可能范围,所给出的可能范围称为置信区间,给出的概率保证称为置信度或置信概率。
五、方差分析的基本原理与步骤
1.方差分析法:一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术。
多重比较:多个处理平均数的两两比较
(3)最小显著极差法(LSR法)根据极差范围内所包含的处理数(称为秩次距)k的不同采用检验尺度,以弥补LSD法的不足。
标记符号法也称三角形法,根据多重比较结果在平均数多重比较表中各个差数的右上方标记符号“ns”(或不标记符号)表示该差数不显著、标记“*”表示该差数显著、标记“**”表示该差数极显著。
优点是简便直观,缺点是占用篇幅较大。
8.简单效应:甲因素的某一水平与乙因素的某两个水平组成的两个水平组合平均数之差称为乙因素在甲因素某一水平上的简单效应。
9.主效应:某因素两个水平平均数之差称为该因素的主效应。
10.互作效应:指由于两个试验因素的交互作用产生的效应。
11.系统分组(多层分组):也称套设计、窝设计,将A因素分为a个水平,然后再A因素的每个水平下将B因素分为b个水平,再在B因素的每个水平下将C因素分为c个水平……这样得到各因素水平组合的方式称为系统分组或多层分组。
12.方差分量:方差分量是指方差的组成成分。
适合性检验:根据属性类别的次数资料判断属性类别分配是否符合已知属性类别分配理论或学说的假设检验。
独立性检验:根据某一质量性状的各个属性类别与某一因素的各个水平利用统计次数法得来的次数资料判断某一质量性状的各个属性类别的构成比与某一因素是否有关的假设检验。
(3)离回归标准误:离回归均方的平方根,记为S yx,
(2)相关系数表示相关变量x与y直线相关的程度和性质的统计数