生物统计学名词解释
生物统计(完整总结版)
生物统计学一.名词解释1. 总体:根据研究目的确定的研究对象的全体。
2. 个体:其中的一个研究单位。
3. 样本:总体的一部分。
4. 样本含量:样本中所包含的个体数目。
5. 参数:总体计算的特征数。
6. 统计数:样本计算的特征数。
7. 抽样:从总体中获得样本的过程。
8. 随机抽样:总体中每一个个体都有同样的机会被抽取组成样本。
9. 随机样本:通过随机抽样方式获得的样本。
1. 数量性状:能够以量测或计数的方式表示其特征的性状。
2. 质量性状:能观察到而不能直接测量的性状。
3. 计数资料:用量测方式获得的数量性状资料。
4. 计量资料:用计数方式获得的数量性状资料。
5. 半定量资料:将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单 位的次数而得的资料。
6. 全距:资料中最大值与最小值之差。
7. 组限:各组的最大值与最小值。
8. 组中值:每一组的中点值=(下限+上限)/2=上限-组距/2。
1. 中位数:将资料内所有观测值从小到大依次排列,当观测值的个数是奇数时,位于中间的那个观察值,或当观测值的个数是偶数时,位于中间的两个观测值的平均数。
2.众数:资料中出现次数最多的那个观测值或次数最多一组的组中值。
3. 离均差:各个观测值与平均数之差。
(X-X )。
4. 自由度:独立观测值的个数。
5. 样本方差:统计数∑--)1/(2n X X )(。
MS6. 样本标准差:统计学上把样本方差S 2的平方根。
S=Nx x ∑-2)(7. 变异系数:标准差于平均数的比值。
C ·V 8. 均方:统计数∑--)1/(2n X X )(。
MS 1. 必然现象:在保持条件不变的情况下,重复进行试验,其结果总是确定的,必然发生。
2. 随机现象:在一次观察或试验中其结果呈现偶然性的现象。
3. 试验:指通过选择有代表性的试验单位在一定条件下进行的带有探索性地研究工作。
4. 随机试验:通常我们把根据某一研究目的,在一定投条件下对自然现象所进行的观察或试验统称。
生物统计学名词解释
1.样本: 样本从总体中抽出的若干个体所构成的集合称为样本。
2.总体: 总体指具有相同性质的个体所组成的集合称为总体。
3.连续变量:表示在不变量范围内可抽出某一范围的所有值。
4.非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
数量性状资料:指一般是由计数和测量或度量得到的。
质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
计数资料;指由计数得到的数据。
计量资料:有测量或度量得到的数据。
普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
方差:指用样本容量n 来除离均差平方和,得到平均的平方和。
标准差:指方差的平方根和。
变异系数:指将样本标准差除以样本平均数得出的百分比。
概率:指某事件 A 在n 次重复试验中,发生了几次,当试验次数n 不断增大时,事件 A 发生的频率W(A)概率就越来越接近某一确定值P,于是则定P 为事件 A 发生的概率.和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件A 和事件 B 的事件。
生物统计学名词解释
样本: 样本从总体中抽出的若干个体所构成的集合称为样本。
总体: 总体指具有相同性质的个体所组成的集合称为总体。
连续变量:表示在不变量范围内可抽出某一范围的所有值。
非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
数量性状资料:指一般是由计数和测量或度量得到的。
质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
计数资料;指由计数得到的数据。
计量资料:有测量或度量得到的数据。
普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。
标准差:指方差的平方根和。
变异系数:指将样本标准差除以样本平均数得出的百分比。
概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n 不断增大时,事件 A 发生的频率 W(A)概率就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率.和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件B 的事件。
生物统计学名词解释
1.样本: 样本从总体中抽出的若干个体所构成的集合称为样本。
2.总体: 总体指具有相同性质的个体所组成的集合称为总体。
3.连续变量:表示在不变量范围内可抽出某一范围的所有值。
4.非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
5.准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
6.精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
7.资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
8.数量性状资料:指一般是由计数和测量或度量得到的。
9.质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
10.计数资料;指由计数得到的数据。
11.计量资料:有测量或度量得到的数据。
12.普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
13.抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
14.全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
15.算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
16.中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
17.众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
18.几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
19.方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。
20.标准差:指方差的平方根和。
21.变异系数:指将样本标准差除以样本平均数得出的百分比。
22.概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n不断增大时,事件 A 发生的频率 W(A)概率就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率.23.和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件 B 的事件。
生物统计名词解释和简答
名词解释1、总体:指我们研究的全部对象,指性质相同的所有个体的集合,包括有限总体和无限总体。
2、样本:总体的一部分,样本内包含的个体数目称为样本含量。
3、随机抽样:随机抽样要求总体中的任何个体都有同等机会被抽到和抽样时不受任何主观因素的影响。
4、随机变量:在随机试验中,被测定的量是可取不同值的变量,而且它究竟取何值具有随机性,这样的量为随机变量。
5、统计量:由样本计算的数,是总体参数的估计值,受抽样变动的影响。
6、参数:由总体计算的数。
是一个真值,没有抽样变动的影响。
7、数学期望:所谓X或X的函数的数学期望,即它们的理论平均值。
8、中心极限定理:假设被研究的随机变量X,可以表示为许多相互独立的随机变量Xi的和。
那么,如果Xi的数量很大,而且每一个别的Xi对于X所起的作用很小,则可以被认为X 服从或近似地服从正态分布。
9、统计假设检验:先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验。
10、小概率原理:在一次试验中几乎是不会发生的。
若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。
11、点估计:用由样本数据所计算出来的单个数值,对总体参数所作的估计称为点估计。
12、区间估计:对总体平均数更合理的估计,是在一定概率保证下,给出总体平均数和标准差的可能范围,这种估计方法叫区间估计。
13、置信区间:区间估计中所给出的可能范围叫置信区间。
14、拟合优度检验:是用来检验实际观测数与依照某种假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型是否与观测数相配合。
15、方差分析:是一类特定情况下的统计假设检验,是平均数差异显著性检验—成组数据t 检验的一种引伸。
t检验可以判断两组数据平均数间的差异显著性,而方差分析则可以同时判断多组数据平均数之间的差异显著性。
16、抽样分布:从一个已知的总体中,独立随机的抽取含量为n的样本,研究所得的样本的各种统计量的概率分布,称为抽样分布。
生物统计名词解释
生物统计名词解释生物统计是一种应用数学于生物学研究的方法,通过收集,整理和分析生物学数据,来解释和揭示生物学现象和问题。
以下是一些常见的生物统计学名词和概念的解释:1. 总体(Population):指研究对象的全体个体。
2. 样本(Sample):指从总体中选出的部分个体。
3. 参数(Parameter):指总体的某一特征的度量。
4. 统计量(Statistic):指样本的某一特征的度量。
5. 随机变量(Random Variable):指用数字来表示随机试验的结果的变量。
6. 数据(Data):指研究中获得的实际观测结果或测量值。
7. 描述统计学(Descriptive Statistics):指对数据进行总结、描述和分析的方法。
8. 推论统计学(Inferential Statistics):指基于样本数据对总体进行推断和判断的方法。
9. 假设检验(Hypothesis Testing):指对某一假设进行验证的统计推断方法。
10. 显著性水平(Significance Level):指在假设检验中,拒绝零假设的标准。
11. P值(P-value):指在假设检验中,观察到的数据或更极端情况下出现的概率。
12. 置信区间(Confidence Interval):指对参数的估计范围。
13. 误差(Error):指由于采样误差、测量误差等原因造成的数据与真实值之间的差异。
14. 偏差(Bias):指由于研究设计或收集方法的不准确性引起的系统误差。
15. 方差(Variance):指数据的分散程度,反映了各个观测值与平均值之间的差异。
16. 标准差(Standard Deviation):指方差的平方根,用来描述数据的离散程度。
17. 正态分布(Normal Distribution):指符合正态分布模式的概率分布,常用于表示随机变量的分布。
18. T检验(Student's t-test):指用于比较两个样本均值是否有显著差异的假设检验方法。
生物统计学名词解释
样本: 从总体中抽出的若干个体所构成的集合称为样本。
总体: 指具有相同性质的个体所组成的集合称为总体。
连续变量:表示在不变量范围内可抽出某一范围的所有值。
非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
数量性状资料:指一般是由计数和测量或度量得到的。
质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
计数资料;指由计数得到的数据。
计量资料:有测量或度量得到的数据。
普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
方差:指用样本容量n来除离均差平方和,得到平均的平方和。
标准差:指方差的平方根和。
变异系数:指将样本标准差除以样本平均数得出的百分比。
概率:指某事件A在n次重复试验中,发生了几次,当试验次数n不断增大时,事件A发生的频率W(A)就越来越接近某一确定值P,于是则定P为事件A发生的概率:P(A)=P和事件:指事件A和事件B至少有一件发生而构成的新事件称为事件A和事件B的事件。
积事件:指事件A和事件B同时发生而构成的新事件,称为事件A和事件B的积事件。
生物统计学名词解释
1. 总体(population):研究对象的全体,由具有共同性质的个体所组成。
2. 样本(sample):从总体中抽取一部分个体所组成的集团。
3. 参数(parameter):由总体全部观察值计算得到的用来描述总体特征的数。
4. 统计数(statistic):由样本全部观察值计算得到的用来描述样本特征和估计总体特征的数5. 平均数(average):根据统计方法求得的一种常用特征数,作为一个资料集中性的代表值,反映资料中各观察值集中较多的中心位置。
6. 变异数(variant):反映资料的变异性的代表值,常用的变异数有极差、方差、标准差、标准误和变异系数。
7. 概率的古典定义:在随机试验中,如果基本事件的总数n为有限多个,且每个基本事件的发生是等可能的,时间A 由其中m个基本事件所组成,则事件A的概率为(P)=A中包含的基本事件数/基本事件数=m/n8. 概率的统计定义:在相同条件下,重复某一试验n次,事件A发生的频率随着n的不断增大而在某个常数值p附近摆动,则称频率的稳定值p为事件A发生的频率,记为P(A) =p≈m/n9. 随机变量(random variant):设E为一随机试验,Ω为样本空间。
如果对于Ω中的每个样本点ш,都有一个确定的实数X(ш)与之对应,则称X(ш)为随机变量,简称为X10. 伯努利试验(Bernoulli trials):随机变量X只有两个可能结果的实验11. 统计推断(statistical inference):利用研究获得的样本信息和假定的模型对总体特征做出概率性的推断。
12. 假设检验(test of hypothesis):根据样本信息判断总体是否具有制定的特征13. 参数估计(parametric estimation):用样本统计数估计总体参数。
14. 抽样分布(sampling distribution):统计量g(X1,X2,…,Xn)作为随机变量,也有自己的概率分布,则统计量的概率分布则称为抽样分布15. 零假设(null hypothesis)和备择假设(alternative hypothesis)零假设:指进行统计检验时预先建立的假设。
生物统计学名词解释完整版
生物统计学名词解释 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】1.样本:样本从总体中抽出的若干个体所构成的集合称为样本。
2.总体: 总体指具有相同性质的个体所组成的集合称为总体。
3.连续变量:表示在不变量范围内可抽出某一范围的所有值。
4.非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
5.准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
6.精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
7.资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
8.数量性状资料:指一般是由计数和测量或度量得到的。
9.质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
10.计数资料;指由计数得到的数据。
11.计量资料:有测量或度量得到的数据。
12.普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
13.抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
14.全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
15.算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
16.中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
17.众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
18.几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
19.方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。
20.标准差:指方差的平方根和。
21.变异系数:指将样本标准差除以样本平均数得出的百分比。
生物统计学-名词解释
第一章绪论与第二章概率论基础1总体:指研究对象的全体,它是由研究对象中的所有单元组成的。
总体中包含单元的数目称作总体容量(或大小)用N表示。
2个体:3样本:是指按照抽样规则所抽中的那部分单元所组成的集合。
4样本含量:样本所包含的单位数用 n表示,称为样本含量。
5随机样本:总体是唯一的、确定的,而样本是不确定的、可变的、随机的。
6参数:反映总体数量特征的综合指标称为总体参数。
常见的总体参数主要有:总体总和;总体均值;总体比率;总体比例等。
7统计量:反映样本数量特征的综合指标称之为统计量。
统计量是n元样本的一个实值函数,是一个随机变量,统计量的一个具体取值即为统计值。
主要样本统计量有:样本总和、样本均值、样本比率、样本比例等。
8准确性9精确性10必然现象11随机现象:带有随机性、偶然性的现象.12随机试验:如果每次试验的可能结果不止一个,且事先不能肯定会出现哪一个结果,这样的试验称为随机试验.13随机事件:在一次试验中可能发生也可能不发生的事件称为随机事件,简称事件.14概率的统计定义:验后概率,在相同条件下随机试验n次,某事件A出现m次(m<n),则比值称为事件A发生频率。
15小概率原理16随机变量:在随机试验中所得到的取值具有随机性的量,称为随机变量。
17 离散型随机变量:所有取值可以逐个一一列举18连续型随机变量:全部可能取值不仅无穷多,而且还不能一一列举,而是充满一个区间. 19标准正态分布: μ=0,σ=0的正态分布20标准正态变量21双侧概率(两尾概率):把随机变量X落在平均数μ加减不同倍数标准差σ区间之外的概率称为两尾概率,记做α。
22单侧概率(一尾概率):随机变量X小于μ-kσ或者大于μ+kσ的概率,称为一尾概率,记做α/2.23贝努利试验:二项试验,满足下列条件:一次试验只有两个可能结果,即“成功”和“失败”,“成功”是指我们感兴趣的某种特征;试验是相互独立的,并可以重复进行n次,在n 次试验中,“成功”的次数对应一个离散型随机变量X。
生物统计学名词解释
1.样本: 样本从总体中抽出的若干个体所构成的集合称为样本。
2.总体: 总体指具有相同性质的个体所组成的集合称为总体。
3.连续变量:表示在不变量范围内可抽出某一范围的所有值。
4.非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
5.准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
6.精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
7.资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
8.数量性状资料:指一般是由计数和测量或度量得到的。
9.质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
10.计数资料;指由计数得到的数据。
11.计量资料:有测量或度量得到的数据。
12.普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
13.抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
14.全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
15.算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
16.中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
17.众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
18.几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
19.方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。
20.标准差:指方差的平方根和。
21.变异系数:指将样本标准差除以样本平均数得出的百分比。
22.概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n不断增大时,事件 A 发生的频率 W(A)概率就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率.23.和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件 B 的事件。
生物统计学名词解释大全
生物统计学名词解释大全1.样本: 样本从总体中抽出的若干个体所构成的集合称为样本。
2.总体: 总体指具有相同性质的个体所组成的集合称为总体。
3.连续变量:表示在不变量范围内可抽出某一范围的所有值。
4.非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
数量性状资料:指一般是由计数和测量或度量得到的。
质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
计数资料;指由计数得到的数据。
计量资料:有测量或度量得到的数据。
普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
方差:指用样本容量n 来除离均差平方和,得到平均的平方和。
标准差:指方差的平方根和。
变异系数:指将样本标准差除以样本平均数得出的百分比。
概率:指某事件 A 在n 次重复试验中,发生了几次,当试验次数n 不断增大时,事件A 发生的频率W(A)概率就越来越接近某一确定值P,于是则定P 为事件 A 发生的概率.和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件 B 的事件。
八十个生物统计学名词解释
1.生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科2.参数:对总体特征的度量,常用希腊字母表示。
3.统计数:由样本计算所得的样本特征的数值,它是描述样本特征的数量,常用英文字母表示。
4.实验误差:实验误差是实验测量值(包括直接和间接测量值)与真值(客观存在的准确值)之差。
5.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差。
6.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。
7.准确性:在试验或调查中某一试验指标或性状的观测值与其真值接近的程度。
8.精确性:在试验或调查中同一试验指标或性状的重复观测值彼此接近的程度。
9.全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
10.算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
特性:(1)样本中各观测值与平均数之差-离均差-的总和等于零(2)样本中各观测值与其平均数之差平方的总和,比各观测值与任一数值离均差的平方和小,即离均差平方和最小11.中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
12.众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
13.方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。
14.标准差:指方差的平方根和。
15.变异系数:指将样本标准差除以样本平均数得出的百分比。
16.概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n 不断增大时,事件 A 发生的频率 W(A)概率就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率.17.中心极限定律:是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
生物统计学名词解释大全
1.样本: 样本从总体中抽出的若干个体所构成的集合称为样本.2.总体: 总体指具有相同性质的个体所组成的集合称为总体.3.连续变量:表示在不变量范围内可抽出某一范围的所有值.4.非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数.5.准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度.6.精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小.7.资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果.8.数量性状资料:指一般是由计数和测量或度量得到的.9.质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料.10.计数资料;指由计数得到的数据.11.计量资料:有测量或度量得到的数据.12.普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查.13.抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断.14.全距极差:是指样本数据资料中最大观测值与最小观测值的差值.组中值:是指两个组限下线和上限的中间值.15.算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商.16.中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值.17.众数:资料中出现次数最多的那个观测值或次数最多一组的中点值.18.几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值.19.方差:指用样本容量 n 来除离均差平方和,得到平均的平方和.20.标准差:指方差的平方根和.21.变异系数:指将样本标准差除以样本平均数得出的百分比.22.概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n 不断增大时,事件 A 发生的频率 WA 概率就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率.23.和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件 B 的事件.24.积事件:指事件 A 和事件 B 同时发生而构成的新事件,称为事件 A 和事件B 的积事件.25.互斥事件:指事件 A 和事件 B 不能同时发生,称为事件 A 和事件 B 互斥.26.对立事件:指事件 A 和事件 B 必有一个事件发生,但两者不能同时发生.27.独立事件:指事件 A 的发生与事件 B 的发生毫无关系.28.完全事件系:指如果多个事件 A1、A2、、、、、、An 两两相斥,且每次试验结果必然发生其一,则称事件 A1、完全事件系 A2、、、、、、An 为一个完全事件系.29.概率加法定理:指互斥事件 A 和 B 的和事件的概率等于事件 A 和事件 B的概率之和, PA+B=PA+PB.30.概率乘法定理:指事件 A 和事件 B 为独立事件,则事件 A 与 B 同时发生的概率等于事件 A 和事件 B 各自概率乘法定理的乘积,即:PAB=PAPB.31.伯努利大数定律:设 M 是 n 次独立试验中事件 A 出现的次数,而不是事件A 在每次试验中出现的概率,则对于任意小的正数ε ,有如下关系:limp{m/n-p< ε }=132.辛钦大数定律:是用来说明为什么可以用算术平均数来推断总体平均数 m的.33.统计推断:指从样本的统计数对总体参数做出的推断,包括参数估计和假设检验.34.假设检验:指根据总体理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后有样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断.35.参数估计:指由样本结果对总体参数在一定概率水平下所作出的估计.点估计是用样本统计量直接给出总体相应参数的估计值,由于抽样误差存在,X拔不同的样本将会得到不同的点估计值,点估计缺乏明确的精度概念,而区间估计在一定程度上可以弥补这个不足36.小概率原理:指如果假设一些条件,并在假设的条件下能够准确地算出事件 A出现的概率 a 为很小,则在假设条件下的 n 次独立重复试验中时按预定的概率发生,而在有一次试验中则几乎不可能独立.37.显着水平:指在无效假设和备择假设后,要确定一个否定 H0 的概率标准,这个概率称为显着水平.38.方差同质性:就是指各个总体的方差是相同的.39.α 错误 :H0 是真实的,假设检验却否定了它,就烦了一个否定真实假设的错误,称为α 错误.40.β 错误:指如果H0 不是真实的,假设检验时却接受了 H0,否定了 HA 这样就犯了接受不真实假设的错误,称为β 错误.41.适合性检验:指比较观测值与理论值是否符合的假设检验交适合性检验.42.独立性检验:指研究两个或两个以上因子彼此之间是相互独立的还是相互影响的一类统计方法.43.相关分析:是研究现象之间是否存在某种依存关系, 并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量间的相关关系的一种统计方法.44.回归分析:是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法.45.回归系数:y^=a+bx,自变量 x 改变一个单位,依变量 y 平均增加或减少的单位数,即回归直线的斜率 b.46.回归截距:y^=a+bx,a 是当 x=0 时的 Y^值,即直线在 y 轴上的截距,称为回归截距.47.离回归平方和:它反映除去 x 与 y 相关程度和性质的统计数.48.回归平方和:它反映在 y 的总体变异种由于 x 与 y 的直线关系而产生 y变异减小的部分.49.相关系数:是指通过计算表示 x 和 y 相关程度和性质的统计数.50.决定系数:是变量 x 引起 y 变异的回归平方和与 y 变异总平方和的比率.51.转换:指估计总体相关系数 p 的置信区间时,需要将 r 转换成 z.52.试验设计:广义的指整个研究课题的设计,包括实验方案的拟订,试验方案的拟订,试验单位的选择,分组的排列,实验过程中试验指标的现象记载,试验资料的整理,分析等内容.53.试验结果重演:是指在相同的条件下,在进行实验或实践,应能重复获得与原试验结果相近的结果.54.处理因素:一般指对受试对象给予的某种外部干预.55.主效应:多因素中试验中引起实验结果发生变化的主要.56.互作:因素之间的交互作用.57.受试对象:是处理因素的客体,实际上就是根据研究目的而确立的观测总体.58.处理效应:是处理因素作用于受试对象的反应,是研究最终体现59.误差:在试验中受偶然影响或者说非处理因素影响使观测值偏离试验处理真值的差异.60.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差.61.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差62.重复:在试验中,同一处理设置的试验单位数.63.随机:是指一个重复的某一处理或处理组合被安排在哪一个试验单位,不要有主观成见.64.均积:是 x 与 y 的平均的离均差的乘积和,简称均积.65.协方差:与均积相应的总体参数.66.协方差分析:把回归分析与方差分析结合.67.试验控制:要提高试验的精确度和灵敏度,必须严格控制试验条件的均匀性,使各处里处于尽可能一致的条件下.68.统计控制:是试验控制的一种辅助手段,是用统计方法来矫正因自变量的不同而对依变量所产生的影响.69.估计量:估计总体参数的统计量70.无偏估计量:如果一个统计量的理论平均数即数学期望等于总体参数,这个统计量就叫无偏估计量71.矩估计:用样本矩作为总体矩的估计值72.矩估计法数字特征法、矩法用样本矩作为相应总体矩的估计量,也可以用样本数字特征作为相应的总体数字特征的估计量.用矩法获得的估计值,叫据估计值.据发的思想实质是用样本去替换总体矩的原则,称之为替换原则73.有效估计量:设a1,a2是A的两个无偏估计量,若vara1<vara2,则a1为有效估计量74.抽样误差:由抽样引起的样本值与总体值之间的差异成为抽样误差,直接原因:总体中各个体之间存在差异,或重复试验中一些服从某种分布的偶然误差的存在75.标注误差标准误:描述样本平均数波动情况的统计量,就是X拔的方差或标准差,计均数抽样误差为西格玛X拔,=西格玛/根号n,西格玛X拔就是标准误差76.估计样本平均数方差:SX拔平方,=S平方/n77.估计标准误:SX拔,=S/根号n78.置信区间:达到某一置信度如95%时,预报量可能出现的范围如Ey±1.96西格玛,这里西格玛是标准差置信区间的意义是:反复抽样多次,每次的样本容量相等,每次的样本值确定一个区间a1,a2,这个区间包含a的概率是1001-阿尔法%,不包含a的概率是100阿尔法%79.置信水平置信度,置信系数,可靠度是指总体参数值落在样本统计值某一区内的概率;而是指在某一置信水平下,样本统计值与总体参数值间误差范围.置信区间越大,置信水平越高.80.拟合优度检验:对总体分布类型的检验,包括检验观测数与理论书之间的一致性,通过检验观测数与理论书之间的一致性来判断事件之间的独立性81.皮尔逊定理:若n充分大,则不论总体服从什么分布,卡平方总是近似服从自由度为m-a-1的卡平方分布82.方差分析:能同时判断多组数据平均数之间的差异显着性,能把随机变异从混杂状态中分离开来,从而为判断因素对实验结果有无确实的影响提供依据83.方差分析的前提条件:等方差,正态性、独立性84.固定因素:若因素的a个水平是经过特意选择的,则该因素为固定因素.发差分析所得到的结论只适合于选定的几个水平,并不能将其结论扩展到未加考虑的水平上85.固定效应模型:处理固定因素所用的模型称为固定效应模型或固定模型86.随机因素:若因素的a个水平,是从该因素水平总体中随机抽出的样本,则该因素称为随机因素,从随机因素a个水平所得到的结论,可以推广到这个因素的所有水平上87.处理随机因素所用的模型称为随机效应模型88.多重比较:对各对均值之间的差异的显着性检验89.LSD法在统计推断时犯第一类错误的概率大,而Duncan法犯第一类错误的概率小.90.多个方差齐性检验bartlett检验,巴特氏卡平方检验:当a个随机样本是从独立正态总体中抽取时,可以计算出统计量K平方,当n=minnj充分大时,K平方的抽样分布非常接近于a-1自由度的卡方分布.由此可对多个总体进行卡平方检验.91.两因素之间交互作用产生新效应的现象为交互作用92.由因素水平的改变而造成的因素效应的改变称为该因素的主效应93.交叉分组设计:假设A药物有a水平,B药物有b水平,共有ab个剂量组合,每一组重复n次.共有abn名病人参加实验,这样的实验设计称为交叉分组设计94.相关:设有两个随机变量X和Y,对于任一随机变量的每一个可能的值,另一个随机变量都有一个确定的分布与之相对应,则称这两个随机变量之间存在相关关系95.如果变量之间的关系可以用函数关系来表达,就称它们之间的关系为确定性关系96.回归关系、相关关系:统计学上把变量之间的非确定性关系称为相关关系,也成为回归关系97.如果对于一个普通变量x的每一个可能的值xj都有随机变量Y的一个分布与之对应,则称随见变量Y的一个分布与之对应,则称随机变量Y对x存在回归关系98.具有回归关系的两变量之间对于任一xi都不会有一个确切的yi与之对应,但为了描述两变量之间的数量关系,可选当x=xi时Y的平均数谬角标Y乘X=xi 与之相对应,则称谬角标Y乘X是Y的条件平均数99.Y1,y2…yn这n个数据的离差平方和,记作SYY,称为总离差平方和,反映了n个yi折的离散程度100.回归平方和y折-y拔平方求和,几座SSR.是n个yi折的离差平方和,反映了n个yi折的离散程度101.剩余平方和残差平方和yi-yi拔平方求和,记作SSe,是除了x对Y的线性影响之外的其他剩余因素造成的平方和,这些因素中包括x对Y的非线性影响及试验误差,观察误差等随机因素102.相关分析是对两个或两个以上随见变量之间相互关联程度进行分析的统计学方法103.存在于两个随机变量之间的相关关系称为简单相关或单相关,存在于三个或三个以上变量之间的相关关系为多重相关或复相关在一元回归中,回归的显着程度,可以用相关系数来表示,同样,在多元回归问题中,回归的显着程度可以用复相关系数表示104.统计学上把衡量变量之间关系密切程度的统计量称为相关系数105.消除了其他变量的影响后两个变量之间的相关关系称为偏相关纯相关.为了反映两变量间的真正关系,就要保证在其他变量都保持不变的情况下,计算它们的相关系数,这时的相关系数称为偏相关系数或纯相关系数106.样本平均数作为总体平均数估计值的优良:无偏均值等于总体平均数、有效方差小雨其他估计值、一致性总体平均数为极限值107.概率论中有关论证随机变量的和的分布服从正态分布的一类定理称为中心极限定理108.若X为一随机变量,则Fx=PX<=x为X的分布函数。
生物统计学
生物统计学名词解释:1.生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。
2.总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全体;3.个体:组成总体的基本单元称为个体;4.样本:从总体中抽出若干个体所构成的集合称为样本;5.集中性:资料中的观测值从某一数值为中心而分布的性质。
6.离散性:是变量有差离中心分散变异的性质。
7.变量(变数):指相同性质的事物间表现差异性或差异特征的数据。
8.常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。
9.参数:描述总体特征的数量称为参数,也称参量。
常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差;10.统计数:描述样本特征的数量称为统计数,也称统计量。
常用拉丁字母表示统计数,例如用x表示样本平均数,用S表示样本标准差。
11.效应:通过施加试验处理,引起试验差异的作用称为效应。
效应是一个相对量,而非绝对量,表现为施加处理前后的差异。
效应有正效应与负效应之分。
12.互作(连应):是指两个或两个以上处理因素间相互作用产生的效应。
互作也有正效应(协同作用)与负效应(拮抗作用)之分。
13.准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。
14.精确性:也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。
15.随机误差:也叫抽样误差。
这是由于试验中无法控制的内在和外在的偶然因素所造成。
随机误差越小,试验精确性越高。
16.系统误差:也叫片面误差,这是由于试验条件控制不一致、测量仪器不准、试剂配制不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。
系统误差影响试验的准确性。
只要以认真负责的态度和细心的工作作风是完全可以避免的。
17.数量性状:是指能够以计数和测量或度量的方式表示其特征的性状。
生物统计学名词解释
1.样本: 样本从总体中抽出的若干个体所构成的集合称为样本。
2.总体: 总体指具有相同性质的个体所组成的集合称为总体。
3.连续变量:表示在不变量范围内可抽出某一范围的所有值。
4.非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
5.准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。
6.精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。
7.资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。
8.数量性状资料:指一般是由计数和测量或度量得到的。
9.质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。
10.计数资料;指由计数得到的数据。
11.计量资料:有测量或度量得到的数据。
12.普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。
13.抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
14.全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。
组中值:是指两个组限下线和上限的中间值。
15.算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。
16.中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。
17.众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。
18.几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。
19.方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。
20.标准差:指方差的平方根和。
21.变异系数:指将样本标准差除以样本平均数得出的百分比。
22.概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n不断增大时,事件 A 发生的频率 W(A)概率就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率.23.和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件 B 的事件。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物统计学
1、参数与统计量
参数,是指从总体中计算所得的用以描述总体特征的数值,是反映总体基本情况的特征数。
如:总体平均数、总体标准差。
统计量,是指从样本中计算所得的数值称为统计量,是反映样本基本情况的特征数,一定程度上是对总体参数的估计值。
如:样本平均数、样本标准差。
2、标准差与变异系数
标准差和变异系数都是反映离散性的特征数即变异数中的一种。
标准差有总体标准差和样本标准差之分:б=N x 2)
(∑-μ、S=1)(2--∑n x x 。
标准差的大小受多个变量影响,若各变量间差异大标准差也大。
标准差的值较大时,x 的代表性受到削弱。
要用标准差比较两个或两个以上样本间的变异程度时,必须满足:标准差相近似,且单位相同。
变异系数是度量数据资料变异程度的常用指标。
变异系数CV=x s
×100%,是样本变量的相对差异量,是为不带单位的纯数。
变异系数CV 可比较多个样本的变异系数。
3、精确性与准确性
准确性也称准确度,是指测定值与真值的符合程度大小。
精确性也称精确度,是指多次测定值的变异程度。
4、单侧检验与双侧检验
双侧检验是指进行假设检验时将拒绝性概率分置于理论分布的两侧。
备择假设为
HA :0μμ≠(或21μμ≠)。
单侧检验是指进行假设检验时将拒绝性概率分置于理论分布的一侧。
备择假设为HA :0μμ> (0μμ<),或:21μμ>(21μμ<)
5、假设检验的两类错误
若H0是真实的,经过假设检验却否定了它,则犯了一个否定真实假设的错误—即第一类(Ⅰ类)错误,亦称“弃真”。
犯第一类错误(“弃真”)的概率即为显著性水平α。
若H0不是真实的,经过假设检验却接受了它,则犯了一个接受非真实假设的错误—即第二类(Ⅱ类)错误,亦称“纳伪”。
犯第二类错误(“纳伪”)的概率为β。
当样本含量相同时,显著性水平α↓,则β↑;反之,β↓,则α↑。
6、比较五个样本平均数的差异显著性时,检验用什么方法,为什么? 若用t 检验对四个样本进行平均数差异显著性检验时,分别对两个样本进行差异显著性检验,结果会产生较大误差,提高了犯第一类错误的概率。
假设每次比较所确定的检验水准α=0.05,则每次检验拒绝H0不犯第一类错误的概率为
1-0.05=0.95。
比如对五个样本进行t 检验,需比较1025=C 次,那么10次检验都不
犯第一类错误的概率为(1-0.05)10=0.5990,而都拒绝H0时犯第一类错误的概率为401.0)05.0(11=P 10=--。
故比较多个样本平均数时不适用于t 检验,而用方差分析可有效地控制第一类错误。
用方差分析比较四个样本的平均数差异显著性检验时,按照变异原因的不同,将测量数据资料的总变异分解成处理效应和试验误差,通过比较各种原因在总变异中所占的重要程度,并作出其数量估计。
方差分析比t 检验运算简便,也比t 检验更为精确。
7、独立事件和概率的乘法原则
独立事件,是指两事件A与B中任一事件的发生不影响另一事件发生的概率。
乘法原则,指两个独立事件积的概率等于此两事件概率的积。
即:P(A×B)= P (A)×P(B)。
乘法原则的几何意义指两个独立事件A与B同时发生的概率。
8、成组数据与成对数据
对两个样本进行平均数的假设检验时,其数据分成组数据与成对数据两类。
成组数据,是指两样本的各变量是从各自总体中抽取的,两变量彼此独立,没有任何关联。
成组数据中两个的样本容量可以相同也可以不同。
但即使n1=n2=n,也不能将其视为“成对数据”进行检验。
因为,成组数据中每组的每一个变量都是独立的,没有配对的基础。
成对数据,是指两样本间配偶成对,每对除随机地给予不同处理外,其他试验条件尽量一致。
成对数据中两个样本对象供以试验的条件非常接近,且n1=n2=n。
而不同配对间的条件差异可以经过配对间的差数而予以消除,故可以控制实验误差,具有较高的精确度。
1、非放回式抽样与放回式抽样
为了解总体的基本情况和规律,从总体中随机抽出来的若干个个体的过程,称为随机抽样。
根据是否放回总体,随机抽样即可分为非放回式抽样与放回式抽样。
因为生物领域中许多研究对象的珍贵性和不可补偿性,随机抽样时常用放回式抽样。
而针对生物领域中研究对象的来源丰富和反复补偿性,随机抽样时常用非放回式抽样。
2、总体与个体
总体是指同质研究对象的全体,也就是我们所指事件的全体。
个体=构成总体的基本单元。
按照总体单位的数目分为有限总体和无限总体。
样本是指在实际工作中,研究总体时被随机抽出的若干个体组成的单元称为样本。
样本个体数目的大小为样本含量。
分小样本和大样本。
3、置信水平与显著性水平
生物统计学将拒绝H0的概率称为显著性水平,也即拒绝H0的界限。
α常取0.05,0.01。
置信水平指对总体参数进行区间估计时的概率水平,置信水平等于p=1-α。
显著性水平与置信水平之和等于100%。
4、互不相容事件和概率的加法原则
互不相容事件,是指在一次随机试验中,事件A与事件B不可能同时发生。
加法原则,指两个互不相容事件A与B和事件的概率等于此两事件概率之和。
即:P(A+B)=P(A)+ P(B)。
概率加法原则几何意义指两个互不相容事件A 与B至少有一个发生的概率。
5、正态分布的特征
正态分布属于连续型随机变量的理想分布。
分布状态为中间多、两头少、左右对称。
正态分布的特征为:①正态分布是以μ为中心的分布曲线;②正态分布是(以μ为中心)两侧对称的分布曲线;③μ确定曲线位置,σ确定正态分布的形状,σ愈大,曲线图像则愈扁平;④正态分布的概率密度曲线与渐近线、x轴三者所围成的全部面积必等于1,左右各半为0.5;⑤正态分布是一个曲线系统。
6、小概率原则
小概率原则是指:一个小概率事件在一次随机试验中出现是几乎不可能的。
小概率原则是假设检验所依据的基础。
假设检验是分析在H0条件下,随机抽样误差出现的概率有多大,是否会出现小概率事件。
若出现小概率事件,则拒绝
H0,接受HA ;若不出现小概率事件,则接受H0,拒绝HA 。
小概率α常取0.05,0.01。
7、假设检验
假设检验,是指建立在对总体的统计假设和小概率原则的基础上,根据样本确定接受(肯定)还是拒绝(否定)统计假设的推断方法。
统计假设是一对对立假设:H0、HA 。
H0(零假设):样本是来自某假设总体参数值的一个随机样本。
而HA (备择假设)是处理作用所致。
3、算术平均数与中位数
平均数是指反映同类数据变量的平均水平和集中趋势的统计指标,是反映数据资料集中性的代表值。
包括算术平均数、中位数、众数等。
算术平均数等于:x =n X n
i i ∑=1=n X X X n +++...21=∑∑f fX i
中位数Md 指数据变量依大小顺序排列后,处在中间位置的观测值。
8、变量间的因果关系与平行关系
变量间的相关关系可分为两类:即因果关系与平行关系。
因果关系,是指一个变量的变化受另一个变量或几个变量的制约。
如微生物的繁殖受温度、湿度、光照等因素影响。
此时一般使用回归来研究。
平行关系,是指两个以上变量之间共同受到另外因素的影响。
如人的身高与体重之间的关系,兄弟身高之间的关系等等。
此时只能使用相关来研究。
用回归时,表明两变量间关系属于因素关系,自变量无随机误差,应变量有随机误差。
用相关时,表明两变量为平行关系,只能用相关来进行研究。
1、频率与概率
频率是指某事件A 在n 次重复试验中发生m 次。
频率W (A )=m/n ,有(0≤W
(A )≤1)。
概率是指某事件A 在n 次重复试验中发生m 次,当实验次数n 不断增大时,事件A 发生的频率W (A )就越来越接近于某一确定值p ,则(定义)p 为事件A 发生的概率。
记为P (A )=P 。
概率性质为:0≤P (A )≤1;必然事件的概率:P (A )=1;不可能事件的概率:P (A )=0。
2、标准正态分布和正态分布的区别和联系
正态分布记为)N(2σμ,。
标准正态分布是正态分布中的一种,具备所有正态分
布的特征。
标准正态分布中:令σμ-=x U (或
s x
x -=u )。
标准正态分布为10==σμ、的正态分布,计为N(0,1)。
面对正态分布的统计数据时,常常将正态分布的统计数据转化成标准正态分布的统计数据后进行计算和分析。
3、F 检验与t 检验的区别
t 检验和F 检验均是平均数的差异显著性检验的两种方法,但前种方法仅是两个平均数的差异显著性检验,而后者是多个平均数差异显著性检验。
4、总体的标准差与样本的标准差
标准差是反映数据资料离散性的特征数。
总体的标准差:S=
1)
(2--∑n x x 样本的标准差:б=N x 2)(∑-μ。