生物统计学复习资料(整理)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物统计学复习资料
第一章
1.生物统计学的基本作用:
1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。
2)判断试验结果的可靠性
3)提供由样本推断总体的方法
4)提供试验设计的一些重要原则
2.统计学发展过程:
古典记录统计学近代描述统计学现代推断统计学
3.总体:具有相同性质的个体所组成的集合
4.个体:组成整体的基本单元
5.样本:从总体中抽出的若干个体所构成的集合
6.变量:相同性质的事物间表现差异性的某项特征。按其性质分为连续变量和非连续变量。变量可以是定量的,也可以是定性的。
7.连续变量:表示在变量范围内可抽出某一范围的所有值
8.非连续变量:也称离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
9.常数:是不能给予不同数值的变量,它代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。
10.参数:对总体特征的度量
11.统计数:由测定样本的全部重复观测值算得的描述样本的特征的数。
12.效应:试验因素相对独立的作用
13.误差:是试验中不可控因素所引起的观测值偏离真值的差异
14.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异,不可避免。
15.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差,可避免。
16.错误:是指在试验过程中,人为因素所引起的差错。
17.准确性:在调查或试验中某一试验指标或性状的观测值与真实值接近程度
18.精确性:指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章
1.次数分布:在不同区间内变量出现的次数所构成的分布。
2.资料根据生物的形状特性,可分为数量性状和质量性状
3.间断性变数:指用计数方法获得的数据,其各个观测值必须以整数表示,在两个相邻整数间不允许带有小数的值存在。
4.连续性变数:指称量、度量或测量方法所得到得数据,其各个观测值并不限制于整数,在两个数值之间可以有微量数值差异的第三个数值存在
5.质量性状资料的方法:统计次数法,评分法
统计次数法:于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别及其次数或相对次数
给分法:给予每类性状以相对数量的方法。
6.试验资料搜集方法:调查和试验
7.资料调查方法:普查和抽样调查
抽样调查:根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
8.随机抽样满足条件:1)总体中每个个体被抽中的机会均相等;2)总体中任意一个个体是否被抽中是相互独立的
9.统计表要求:1)标题:简明扼要,准确地说明表的内容,有时须注明时间、地点
2)标目:分横纵两项,横列在表的左侧,纵列表上端,须注明计算单位
3)数字:一律用阿拉伯数字,以小数点对齐,无数字用“/”表示
4)线条:多用三线条。上下两条边路略粗
10.统计图绘制的要求:
1)标题简明扼要,列于图的下方
2)横纵坐标两轴有刻度,注明单位
3)横轴从左至右,纵轴由下而上,数值由小至大,图形长宽约为5.4或6.5
4)图中要不同颜色或线条代表不同的事物时,应有图例说明
11.计数资料基本采用单项式分组法进行整理
12.计量资料的整理一般采用组距式分组法
13.次数分布图分类:条形图、饼图、直方图、多边形图、散点图
14.变量的基本特征:
1)集中性:变量在趋势上有着向某一中心聚集,或者说以某一数值为中心而分布的性质。
特征数是平均值
2)离散性:变量有着离中分散变异的性质。特征数是变异数,常用的指标是极差、方差、标准差和变异系数
15.平均数的种类:算术平均数、中位数、纵数、几何平均数
17.标准差的作用;
1)表示变量分布的离散度
2)利用标准差的大小,可以概括的估计出变量的次数分布及各类观测值在总体中所占有的
比例
3)估计平均数的标准误
4)进行平均数的区间估计和变异系数的计算
18.组距:根据极差分成若干组,每组的距离相等,称为组距。组距=极差/组数
19.自由度:样本内独立且能自由变动的离均差的个数。
20.变异系数:样本的标准差除以平均数的百分比
21.平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。
平均数的特征:①离均差之和为零;②离均差平方和为最小。
21.标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S内的观测值个数占总个数的68.26%,X-+2s内的观测值个数占总个数的95.49%,x-+3s 内的观测值个数占总个数的99.73%。
标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。
22.比较总体和样本的平均数、标准差:
总体平均数µ=∑x/N,式中分母为总体观察个数N ; 样本平均数x=∑x/n ,公式中n 是样本容量; 样本平均数是总体平均数的无偏估计值。
总体和样本标准差都等于离均差的平方和除以样本容量; 而总体标准差σ= ,分母
上是总体观测值个数N; 而样本标准差是s= 1n x x 2
-∑-)
( ,分母上是样本自由度
n-1. 样本标准差s 是总体标准差σ的无偏估计值。
第三章:
1.事件:一种事物常存在几种可能出现的情况,每种情况都为一次事件。
2.随机事件:在一定条件下,可能出现,也可能不出现的事件。
3.随机现象:在原本条件不变的条件下,重复进行观察,其结果未必相同的现象。 随机现象三个特征:
1) 试验可以在相同条件下多次重复且相互独立;
2) 给定条件下每次试验结果不只一个;
3) 每次试验不能预料出现那种结果,但可以大概预知。
4.常见的理论分布:离散型随机变量的二项分布、泊松分布、连续型随机变量的正态分布
5.事件的相互关系:
1) 和事件:事件A 和事件B 至少有一件发生而构成的新事件
2) 积事件:事件A 和事件B 同时发生而构成的新事件
3) 互斥事件:事件A 和事件B 不能同时发生
4) 对立事件:事件A 和事件B 必有一个发生,但二者不能同时发生
5) 独立事件:事件A 的发生或事件B 的发生毫无关系
6) 完全事件:如果多个事件A1、A2…两两互斥,切每次试验结果必然发生其一
6.加法定理是互斥事件A 和B 的和事件的概率等于事件A 和事件B 的概率之和
7.乘法定理是独立事件的概率的乘积
8.大数定理:样本容量越大,样本统计数与总体参数之差越小
9.二项分布、泊松分布与正态分布的关系:如果n 相当大或p 与q 基本接近时,二项分布接近于正态分布;当λ较大时,泊松分布也接近正态分布。
10.正态分布的特征:
1) 当x=u 是,f(x)有最大值πσ21
2) 当x-u 的绝对值相等时,f (x )值也相等,正态分布是以u 为中心向左右两侧对称分布
3) (X-u)/σ的绝对值越大,f (x )值也越小,但f (x )永不会等于0,所以正态分布以x 轴为渐近线
4)正态分布的曲线完全由参数u 和σ决定,u 确定正态分布曲线在x 轴上的中心位置,减小,曲线左移,增大曲线右移。σ确定正态分布曲线的展开程度,越小,曲线展开程度越小,曲线越陡高,反之亦然
5)正态分布曲线在x=u+σ处各有一个拐点,曲线通过拐点是改变弯曲的方向
6)正态分布的概率密度曲线与渐近线X 轴所围成的全部面积必然等于1