生物统计学复习资料概论

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章统计数据的搜集与整理

1.1 总体与样本

1.1.1 统计数据的不齐性

•遗传因素

•环境因素

1.1.2总体与样本

•总体(Population) 指研究的全部对象,是由所研究具有某种共同性质的全部个体所组成的集合体。分为有限总体和无限总体。

•样本(Sample) 为总体的一部分,样本内包含的个体数目称为样本含量。

•统计学研究的核心问题是如何通过样本来推断总体。

1.1.3 抽样

从总体获得样本的过程称抽样,抽样的目的是希望通过对样本的研究推断其总体。生物统计学上要求抽样具有代表性,应是一个总体的缩影,因此要遵循随机性的原则。

1.1.4 随机抽样

要求总体中的任何个体都有同等的机会被抽到;要求抽样时不受任何主观因素的影响。如抽签,抓阄,用随机数字表等。随机表的用法(附表1,自习)

1.1.5 放回式抽样和非放回式抽样

•放回式抽样:从总体中抽出一个个体,记下它的特征后,放回总体中,再做第二次抽样。

•非放回式抽样:从总体中抽出个体后,不再放回。

有限总体中的抽样:放回式的抽样可能会重复抽中某一个体。尤其是总体量不大,或抽样范围小的时候。

•无限总体在同等抽样条件下,放回式抽样和非放回式抽样没有区别。

•一般情况样本的含量越大越有代表性。

1.2 数据类型及频率分布

1.2.1 连续型数据和离散型数据

统计学的最基本工作是收集数据,数据收集得越多越有可能揭示客观现象的特性和变化规律。

数据类型:

•连续型数据(度量数据):与某种标准做比较所得到的数据.例如:长度,时间,重量。对连续型数据进行分析的方法,通常称为变量的方法。

•离散型数据(记数数据):由记录不同类别个体的数目所得到的数据.例如:尾数,成活或死亡个数对离散型数据进行分析的方法,通常称为属性的方法。

1.2.2 频数(率)表和频数(率)图的编绘

离散型数据与连续型数据的频数(率)表和频数(率)图略有不同。

离散型数据频数(率)表和频数(率)图。

例:调查每天出生的10名新生儿中,体重超过3kg的人数,共调查120天。每天的10名新生儿中,体重超过3kg的人数,可能有11种情况:1名也没有,有1名,有2名,…,

10名都是,如表1-1的第一列所示,这一组称为组值。

表1-1每10名新生儿体重超过3kg的人数频数(率)表

图1-1每10名新生儿体重超过3kg的人数频数图

连续型数据频数(率)表和频数(率)图。

例:表1-2列出了某农场做高粱“三尺三”提纯时所调查的100个数据,试做其频数(率)表和频数(率)图。

表1-2 “三尺三”株高测量结果

编制连续型数据的频数(率)表的步骤:

1、从原始数据中找出最大值和最小值,并求出极差。R=mamx-minx (R=170-141=30)

2、决定划分的组数,这里划分为10组。

3、根据极差与决定划分的组数、确定组限。(30/10=3)

4、在频数表中列出全部组限、组界及中值。

5、将原始数据表中数据,填入频数表中,计算出每组的频数和频率。

表1-3 “三尺三”株高频数(率)表

直方图:又称组织图,横轴表示组界,纵轴表示频数(频数图)或频率(频率图),

两者图形完全一样。

频数(率)图的编绘

•多边形图(折线图):横轴表示各组中值,纵轴表示频数(率),连接各点得到多边形图。

•累积频数图:横轴表示各组中值,纵轴表示累积频数(率),连接各点得到累积频数(率)图(向上累积与向下累积)。

1.2.3 研究频数(率)分布的意义

根据频数(率)表或频数(率)图,可以看出数据的三个重要特征。

–集中情况:平均数,中位数,众数。

–变异情况:集中在平均数两侧的程度,越集中在平均数附近说明数据越整齐。–图形的形状:对称与不对称,也可能显示异常分布,出现一些不规则的情况,需要寻找原因。

1.2.4 频数分布的不恒定性

•同一总体中随机抽取的样本,其频数分布不完全相同,有时差距还很大。

•由于样本分布的不恒定性,当用样本去推断总体时,推断的结果也会有不同,因此,需要考察结果的可信度。为了回答这一问题,首先要对总体分布有所了解。

后面的第二、三章的内容就是围绕总体展开的。

1.3 样本的几个特征数

样本特征数:描述样本频率分布特征的数字.

1.3.1 平均数:数据集中点的度量,种类很多。

–算术平均数: 通常简称平均数。

–常用简单算术平均数方法,实际应用中也常用加权平均的方法来计算。

–几何平均数:处于稳定消长过程中生物群体的数量变化呈几何级数,如在细菌、藻类等培养,求平均消长率应采用几何平均数,若用算术平均数则偏高(几何平均

数小于算术平均数)。

•中位数:居于中间位置个体的数值。

•众数:具有最高频数的组值或中值。有单众数、双众数、三众数等。

•生物统计学中一般都是用平均数,中位数和众数很少使用。

自习:频数图、频数表、平均数的性质、平均数的简化计算公式。

1.3.2 标准差

•数据的变异程度

–范围(或极差)(R) R=maxx-minx

–平均离差(MD):离均差绝对值的和的平均数。

–样本方差(S2):

离均差平方的和(离差平方和)除以n-1。

–标准差(SD)或(S):

(样(本方差的开平方)

非频数资料标准差的简化计算公式:

频数资料标准差的简化计算公式:

离散型数据:

连续型数据:用中值代替,类似离散理数据计算方法(数据较大时可用编码):

相关文档
最新文档