生物统计学复习资料(整理).

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物统计学复习资料 第一章 1.生物统计学的基本作用: 1)提供整理和描述数据资料的科学方法,确 定某些性状和特征的数量特征。 2)判断试验结果的可靠性 3)提供由样本推断总体的方法 4)提供试验设计的一些重要原则
3.总体:具有相同性质的个体所组成的集合 4.个体:组成整体的基本单元 5.样本:从总体中抽出的若干个体所构成的集 合 6.变量:相同性质的事物间表现差异性的某项 特征。按其性质分为连续变量和非连续变量。 变量可以是定量的,也可以是定性的。 7.连续变量:表示在变量范围内可抽出某一范 围的所有值 8.非连续变量:也称离散型变量,表示在变量 数列中,仅能取得固定数值,并且通常是整数。 9.常数:是不能给予不同数值的变量,它代表 事物特征和性质的数值,通常由变量计算而 来,在一定过程中是不变的。 10.参数:对总体特征的度量 11.统计数:由测定样本的全部重复观测值算 得的描述样本的特征的数。 12.效应:试验因素相对独立的作用 13.误差:是试验中不可控因素所引起的观测 值偏离真值的差异 14.随机误差:由于试验中许多无法控制的偶 然因素所造成的试验结果与真实结果之间的 差异,不可避免。 15.系统误差:由于试验处理以外的其他条件 明显不一致所产生的带有倾向性或定向性的 偏差,可避免。 16.错误:是指在试验过程中,人为因素所引
20.变异系数:样本的标准差除以平均数的百 分比 21. 平均数的用处:①平均数指出了一组数据 的中心位置,标志着资料所代表性状的数量水 平和质量水平; ②作为样本或资料的代表数 据与其他资料进行比较。 平均数的特征:①离均差之和为零; ②离均 差平方和为最小。 21.标准差的用处: ①标准差的大小,受实验 后调查资料中的多个观测值的影响,如果观测 值之间的差异大,离均差就越大; ②在计算 标准差是如果对观察值加上一个或减去一个 a,标准差不变;如果给各观测值乘以或除以 一个常数 a,所得的标准差就扩大或缩小 a 倍; ③在正态分布中,X+-S 内的观测值个数占总个 数的 68.26%,X-+2s 内的观测值个数占总个数 的 95.49%,x-+3s 内的观测值个数占总个数的 99.73%。 标准差的特征: ①表示变量分布的离散程度; ②标准差的大小可以估计出变量的次数分布 及各类观测值在总体中所占的比例; ③估计 平均数的标准差; ④进行平均数区间估计和 变异数的计算。
2)标目:分横纵两项,横列在表的左侧,纵 列表上端,须注计算单位 3)数字:一律用阿拉伯数字,以小数点对齐, 无数字用“/”表示 4)线条:多用三线条。上下两条边路略粗 10.统计图绘制的要求: 1)标题简明扼要,列于图的下方 2)横纵坐标两轴有刻度,注明单位 3)横轴从左至右,纵轴由下而上,数值由小
Βιβλιοθήκη Baidu
起的差错。 17.准确性:在调查或试验中某一试验指标或 性状的观测值与真实值接近程度 18.精确性:指调查或试验中同一试验指标或 性状的重复观测值彼此接近程度的大小。
第二章 1.次数分布:在不同区间内变量出现的次数 所构成的分布。 2.资料根据生物的形状特性,可分为数量性状 和质量性状 3.间断性变数:指用计数方法获得的数据, 其各个观测值必须以整数表示,在两个相邻整 数间不允许带有小数的值存在。 4.连续性变数:指称量、度量或测量方法所得 到得数据,其各个观测值并不限制于整数,在 两个数值之间可以有微量数值差异的第三个 数值存在 5.质量性状资料的方法:统计次数法,评分法 统计次数法:于一定总体或样本内,统计其具 有某个性状的个体数目及具有不同性状的个 体数目,按类别及其次数或相对次数 给分法:给予每类性状以相对数量的方法。
立; 2)给定条件下每次试验结果不只一个; 3)每次试验不能预料出现那种结果,但可以
大概预知。 4.常见的理论分布:离散型随机变量的二项分 布、泊松分布、连续型随机变量的正态分布 5.事件的相互关系: 1)和事件:事件 A 和事件 B 至少有一件发生
而构成的新事件 2)积事件:事件 A 和事件 B 同时发生而构成
22.比较总体和样本的平均数、标准差:
总体平均数µ=∑x/N,式中分母为总体观察个
数 N; 样本平均数 x=∑x/n,公式中 n 是样本
容量; 样本平均数是总体平均数的无偏估计
值。
总体和样本标准差都等于离均差的平方和
除以样本容量; 而总体标准差σ= ,分母
上是总体观测值个数 N; 而样本标准差是 s=
近于正态分布;当λ较大时,泊松分布也接近 正态分布。
10.正态分布的特征: 1
1)当 x=u 是,f(x)有最大值 2 2)当 x-u 的绝对值相等时,f(x)值也相等,
正态分布是以 u 为中心向左右两侧对称分 布 3) (X-u)/σ的绝对值越大,f(x)值也越小, 但 f(x)永不会等于 0,所以正态分布以 x 轴 为渐近线 4)正态分布的曲线完全由参数 u 和σ决定,u 确定正态分布曲线在 x 轴上的中心位置,减小, 曲线左移,增大曲线右移。σ确定正态分布曲 线的展开程度,越小,曲线展开程度越小,曲 线越陡高,反之亦然 5)正态分布曲线在 x=u+σ处各有一个拐点,曲 线通过拐点是改变弯曲的方向 6)正态分布的概率密度曲线与渐近线 X 轴所 围成的全部面积必然等于 1
第四章 1. 统计推断是根据理论分布由一个样本或一 系列样本所得的结果来推断总体特征的过程。 2.参数估计则是由丫根本结果对总体参数在 一定概率水平下所做出的估计。参数估计包括 点估计和区间估计。 3.统计推断包括假设检验和参数估计两个方 面 任务:分析误差产生的原因,确定差异的性质, 排除误差干扰,从而对总体的特征做出正确的 判断。 4.假设检验:根据总体的理论分布和小概率原 理,对未知或不完全知道的总体提出两种彼此 对立的假设,然后由样本的实际结果,经过一 定的计算,做出在一定概率意义上应该接受的 那种假设推断。 5.假设检验步骤: 1)提出假设:对样本所属总体提出无效假设 Ho 和备择假设 HA 2)确定显著水平α
11.无偏估计值:如果参数所有样本的某一统 计数的平均数等于总体的相应参数 (1)样本平均数是总体平均数的无偏估计值 (2)样本方差是总体方差的无偏估计值 (3)样本标准差不是总体的标准差的无偏估 计值 12.中心极限定理:如果被抽样总体不是正态 总体,但具有平均数 u 和σ2,当样本容量 n 不断增大,样本平均数的分布也越来越接近正 态分布,且具有平均数 u 和方差σ2/n 13.t 分布的特征: 1)t 分布曲线是左右对称,围绕平均数 u=0 向两侧递降 2)t 分布受自由度df=n-1的制约,每
3)计算概率:在 Ho 正确的前提下,计算统计 分布的统计数或相应的概率值。 4)推断是否接受假设:根据小概率原理,进 行差异是否显著地推断,并作出推论。 6.小概率原理:如果假设一些条件,并在假设 的条件下能够准确的算出事件A出现的芥蓝 菜为很小,则在假设条件下的n次独立重复试 验中,事件A将按预定的概率发生,而在一次 试验中则几乎不能发生。 小概率原理是指概率很小的事件再一次试验 中被认为是几乎不可能会发生的,一般统计学 中常把概率概率小于 0.05 或 0.01 的时间作为 小概率事件。他是假设检验的依据,如果在无 效假设 H0 成立的条件,某事件的概率大于 0.05 或 0.01,说明无效假设成立,则接受 H0, 否 定 HA; , 如 果 某时 间 的概率 小 于 0.05 或 0.01,说明无效假设不成立,则否定 H0,接受 HA。
个自由度都有一条t分布曲线 3)和正态分布相比,t分布的顶部偏低,尾 部偏高,自由度大于等于30 时,其曲线就比 较接近正态分布曲线,当自由度趋向于无穷大 时和正态分布曲线重合 14.重置抽样(放回式抽样):指从总体中抽取 一个个体,记下其特征数后再放回总体的抽样 方法。 15.非重置抽样(不放回式抽样):指从总体中 抽取一个个体,记下其特征数后不再放回的抽 样方法。 16.抽样分布:指从总体中按一定的样本容量 随机抽取全部所有可能的样本,由这些样本计 算的统计数组成的分布。 17.无偏估计:指在统计数上如果所有可能样 本的统计数的平均数等于总体相应的参数,则 称这个统计数为总体相应参数的无偏估计量。 18.频率与概率之间的转化: 事件 A 在 n 次重复试验中发生了 m 次,则比值 m/n 称为事件 A 发生的频率,记为 W(A);事 件 A 在 n 次重复试验中发生了 m 次,当试验次 数 n 不断增加时,事件 A 发生的频率 W(A)就越 来越接近某一确定值 p,则 p 即为事件 A 发生 的概率。二者的关系是:当试验次数 n 充分大 时,频率转化为概率 。 19.正态分布、标准正态分布、正态分布曲线 的特点 正态分布是一种连续型随机变量的概率分布, 它的分布特征是大多数变量围绕在平均数左 右,由平均数到分布的两侧,变量数减小,即 中间多,两头少,两侧对称。 U=0,σ²=1 的正态分布为标准正态分布。 正态分布具有以下特点:标准正态分布具有以 下特点:①、正态分布曲线是以平均数μ为峰
1 值的曲线,当 x=μ时,f(x)取最大值 2 ;
②、正态分布是以μ为中心向左右两侧对称的 xu
分布 ③、 的绝对值越大,f(x)值就越
小,但 f(x)永远不会等于 0,所以正态分布以 x 轴为渐近线,x 的取值区间为(-∞,+∞); ④、正态分布曲线完全由参数μ和来决定 ⑤、正态分布曲线在 x=μ±处各有一个拐点; ⑥、正态分布曲线与 x 轴所围成的面积必定等 于 1。 正态分布具有两个参数μ和,μ决定正态分 布曲线在 x 轴上的中心位置,μ减小曲线左移, 增大则曲线右移;决定正态分布曲线的展开 程度,越小曲线展开程度越小,曲线越陡, 越大曲线展开程度越大,曲线越矮宽。
的新事件 3)互斥事件:事件 A 和事件 B 不能同时发生 4)对立事件:事件 A 和事件 B 必有一个发生,
但二者不能同时发生 5)独立事件:事件 A 的发生或事件 B 的发生
毫无关系 6)完全事件:如果多个事件 A1、A2…两两互
斥,切每次试验结果必然发生其一 6.加法定理是互斥事件 A 和 B 的和事件的概率 等于事件 A 和事件 B 的概率之和 7.乘法定理是独立事件的概率的乘积 8.大数定理:样本容量越大,样本统计数与总 体参数之差越小 9.二项分布、泊松分布与正态分布的关系:如 果 n 相当大或 p 与 q 基本接近时,二项分布接
(x

2
x)
n 1
,分母上是样本自由度
n-1. 样本标准差 s 是总体标准差σ的无偏估
计值。
第三章: 1.事件:一种事物常存在几种可能出现的情 况,每种情况都为一次事件。 2.随机事件:在一定条件下,可能出现,也可 能不出现的事件。 3.随机现象:在原本条件不变的条件下,重 复进行观察,其结果未必相同的现象。 随机现象三个特征: 1)试验可以在相同条件下多次重复且相互独
6.试验资料搜集方法:调查和试验 7.资料调查方法:普查和抽样调查 抽样调查:根据一定的原则对研究对象抽取一 部分个体进行测量或度量,把得到的数据资料 作为样本进行统计处理,然后利用样本特征数 对总体进行推断。 8.随机抽样满足条件:1)总体中每个个体被 抽中的机会均相等;2)总体中任意一个个体 是否被抽中是相互独立的 9.统计表要求: 1)标题:简明扼要,准确地说明表的内容, 有时须注明时间、地点
集,或者说以某一数值为中心而分布的性 质。特征数是平均值 2)离散性:变量有着离中分散变异的性质。 特征数是变异数,常用的指标是极差、方 差、标准差和变异系数 15.平均数的种类:算术平均数、中位数、纵 数、几何平均数 17.标准差的作用; 1) 表示变量分布的离散度 2) 利用标准差的大小,可以概括的估计出变 量的次数分布及各类观测值在总体中所占 有的比例 3) 估计平均数的标准误 4) 进行平均数的区间估计和变异系数的计算 18.组距:根据极差分成若干组,每组的距离 相等,称为组距。组距=极差/组数 19.自由度:样本内独立且能自由变动的离均 差的个数。
至大,图形长宽约为 5.4 或 6.5 4)图 中 要 不 同 颜 色 或 线 条 代 表 不 同 的 事 物
时,应有图例说明 11.计数资料基本采用单项式分组法进行整理 12.计量资料的整理一般采用组距式分组法 13.次数分布图分类:条形图、饼图、直方图、 多边形图、散点图 14.变量的基本特征: 1)集中性:变量在趋势上有着向某一中心聚
相关文档
最新文档