生物统计学:第二章 试验资料整理与特征数计算
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表2.7 F2代山羊的有角无角分离情况
三 常用统计表与统计图
(一)统计表
1、结构 ➢ 序号 ➢ 标题 ➢ 横标目 ➢ 纵标目 ➢ 线条 ➢ 数字 ➢ 脚注
2、编制原则 结构简单,层次分明,内容安排合理,重点突出, 数据准确,便于理解和比较分析。
3、编制要求 ➢ 标题:简明扼要、准确说明表的内容,有时须注明
R=Max(x)-Min(x) 本例 R=65.0-37.0=28.0(kg)
2、确定组数 组数的多少视样本含量及资料的变动范围大小而 定,一般以达到既简化资料又不影响反映资料的规律 性为原则。组数要适当。分组越多所求得的统计量越 精确,但增大了运算量;分组过少,资料的规律性就 反映不出来,计算出的统计量的精确性也较差。一般 组数的确定,可参考表2.5。
表2.3 100只蛋鸡每年产蛋数的次数分布表
(二)计量资料的整理 计量资料在分组前需要确定全距、组数、组距、 组中值及组限,然后将全部观测值划线计数归组。 【例】将126名初中生的体重资料(见表2.4)整理成 次数分布表。
表2.4 126名初中生的体重资料 单位:kg
1、求全距 全距是资料中最大值与最小值之差,又称为极差, 用R表示,即
组距确定后,首先要选定第一组的组中值。在分 组时为了避免第一组中观察值过多,一般第一组的组 中值以接近或等于资料中的最小值为好。第一组组中 值确定后,该组组限即可确定,其余各组的组中值和 组限也可相继确定。注意,最末一组的上限应大于资 料中的最大值。
表2.4中,最小值为37.0,第一组的组中值取37.5, 因组距已确定为3.0,所以
为了使恰好等于前一组上限和后一组下限的数据能 确切归组,约定将其归入后一组。
通常将上限略去不写。 第一组记为36.0 , 第二组记为39.0 , ……
5、归组划线计数,作次数分布表 分组结束后,将资料中的每一观测值逐一归组,划 线计数,然后制成次数分布表。
表2.6 126名初中生体重的次数分布表
在归组划线时应注意,不要重复或遗漏,归组划 线后将各组的次数相加,结果应与样本含量相等。
在分组后所得实际组数,有时和最初确定的组数 不同。如第一组下限和资料中的最小值相差较大或实 际组距比计算的组距为小,则实际分组的组数将比原 定组数多;反之则少。
(三)质量性状资料、半定量(等级)资料的整理 可按性状或等级进行分组,分别统计各组的次数,然 后制成次数分布表。
第一组的下限为: 37.5-(1/2)×3.0=36.0;
第一组的上限也就是第二组的下限为: 36.0+3.0=39.0;
第二组的上限也就是第三组的下限为: 39.0+3.0=42.0,……,
以此类推,一直到某一组的上限大于资料中的最 大值为止。 于是可分组为:
36.0 39.0,39.0 42.0,……。
2. 常用统计图及其绘制方法
(1) 柱形图
它用等宽长条的长短或 高低表示按某一研究指标 划分属性种类或等级的次 数或频率分布。如果只涉 及一项指标,则采用单式 长条图;如果涉及两个以 上的指标,则采用复式长 条图。
Fig.? XXXXXXX
在绘制长条图时,应注意以下几点: ① 纵轴尺度通常从“0”开始,间隔相等,标明所 表示指标的尺度及单位。 ② 横轴是长条图的共同基线,应标明各长条的内 容。长条的宽度要相等,间隔相同。 ③ 在绘制复式长条图时,将同一属性种类、等级 的两个以上指标的长条绘制在一起,各长条所表示的
小鸡出壳天数在19─24天范围内变动,有6个不同 的观察值。用各个不同观察值进行分组,共分为6组, 可得表2.2形式的次数分布表。
表2.2 50枚受精种蛋出雏天数的次数分布表
有些计数资料,观察值多,变异范围大,若以每一 观察值为一组,则组数太多,而每组内包含的观察值 太少,资料的规律性显示不出来。对于这样的资料, 可扩大为以几个相邻观察值为一组,适当减少组数, 这样资料的规律性就较明显,进一步计算分析也较方 便。例如观测100只蛋鸡每年每只鸡产蛋数(原始资 料略),其变异范围为200299枚。这样的资料如以 每个观察值为一组,则组数太多,如间隔10枚为一组, 则可使组数适当减少。经初步整理后分为10组,资料 的规律性就比较明显,见表2.3。
时间、地点。 ➢ 标目:横标目用以表示被说明事物的主要标志;纵
标目用以说明横标目各统计指标内容,并注明计算 单位。 ➢ 数字:以小数点对齐,小数位数一致。 ➢ 线条:左右边线可省去;左上角一般不用斜线。
(二)统计图 1. 统计图绘制的基本要求 (1) 标题简明扼要,列于图的下方。 (2) 纵、横两轴应有刻度,注明单位。 (3) 轴上数值由小到大;图形长宽比例适宜。 (4) 用不同颜色或线条代表不同事物时,应有说明。
第二章 试验资料整理与特征数计算
第一节 试验资料的搜集与整理
一、资料的检查与核对 目的在于确保原始资料的完整性和正确性。 完整性是指原始资料无遗缺。 正确性是指原始资料的测量和记载无差错或未进行
不合理的归并。检查中要特别注意特大、特小和异常数 据(可结合专业知识作出判断)。对于有异常或遗漏的资 料,应予以删除或补齐;对有错误、相互矛盾的资料应 进行更正,必要时进行复查或重新试验。
二、资料的整理方法 当观测值不多(n≤30)时,不必分组,直接进行统
计分析。 当观测值较多(n>30)时,宜将观测值分成若干组,
以便统计分析。将观测值分组后,制成次数分布表, 即可看到资料的集中和变异情况。 (一)计数资料的整理 现以50枚受精种蛋孵化出雏 鸡的天数为例,说明计数资料的整理。
表2.1 50枚受精种蛋孵化出雏鸡的天数
表2.5 样本含量与组数 本例中,n=126,确定组数为10组。
3、确定组距
每组最大值与最小值之差称为组距(i)。分组时 要求各组的组距相等。
组距(i)=全距/组数
ቤተ መጻሕፍቲ ባይዱ本例
i=28.0/10≈3.0
4、确定组限及组中值 各组的最大值与最小值称为组限。每一组的中点 值称为组中值,它是该组的代表值。组中值与组限、 组距的关系如下: 组中值=(组下限+组上限)/2
三 常用统计表与统计图
(一)统计表
1、结构 ➢ 序号 ➢ 标题 ➢ 横标目 ➢ 纵标目 ➢ 线条 ➢ 数字 ➢ 脚注
2、编制原则 结构简单,层次分明,内容安排合理,重点突出, 数据准确,便于理解和比较分析。
3、编制要求 ➢ 标题:简明扼要、准确说明表的内容,有时须注明
R=Max(x)-Min(x) 本例 R=65.0-37.0=28.0(kg)
2、确定组数 组数的多少视样本含量及资料的变动范围大小而 定,一般以达到既简化资料又不影响反映资料的规律 性为原则。组数要适当。分组越多所求得的统计量越 精确,但增大了运算量;分组过少,资料的规律性就 反映不出来,计算出的统计量的精确性也较差。一般 组数的确定,可参考表2.5。
表2.3 100只蛋鸡每年产蛋数的次数分布表
(二)计量资料的整理 计量资料在分组前需要确定全距、组数、组距、 组中值及组限,然后将全部观测值划线计数归组。 【例】将126名初中生的体重资料(见表2.4)整理成 次数分布表。
表2.4 126名初中生的体重资料 单位:kg
1、求全距 全距是资料中最大值与最小值之差,又称为极差, 用R表示,即
组距确定后,首先要选定第一组的组中值。在分 组时为了避免第一组中观察值过多,一般第一组的组 中值以接近或等于资料中的最小值为好。第一组组中 值确定后,该组组限即可确定,其余各组的组中值和 组限也可相继确定。注意,最末一组的上限应大于资 料中的最大值。
表2.4中,最小值为37.0,第一组的组中值取37.5, 因组距已确定为3.0,所以
为了使恰好等于前一组上限和后一组下限的数据能 确切归组,约定将其归入后一组。
通常将上限略去不写。 第一组记为36.0 , 第二组记为39.0 , ……
5、归组划线计数,作次数分布表 分组结束后,将资料中的每一观测值逐一归组,划 线计数,然后制成次数分布表。
表2.6 126名初中生体重的次数分布表
在归组划线时应注意,不要重复或遗漏,归组划 线后将各组的次数相加,结果应与样本含量相等。
在分组后所得实际组数,有时和最初确定的组数 不同。如第一组下限和资料中的最小值相差较大或实 际组距比计算的组距为小,则实际分组的组数将比原 定组数多;反之则少。
(三)质量性状资料、半定量(等级)资料的整理 可按性状或等级进行分组,分别统计各组的次数,然 后制成次数分布表。
第一组的下限为: 37.5-(1/2)×3.0=36.0;
第一组的上限也就是第二组的下限为: 36.0+3.0=39.0;
第二组的上限也就是第三组的下限为: 39.0+3.0=42.0,……,
以此类推,一直到某一组的上限大于资料中的最 大值为止。 于是可分组为:
36.0 39.0,39.0 42.0,……。
2. 常用统计图及其绘制方法
(1) 柱形图
它用等宽长条的长短或 高低表示按某一研究指标 划分属性种类或等级的次 数或频率分布。如果只涉 及一项指标,则采用单式 长条图;如果涉及两个以 上的指标,则采用复式长 条图。
Fig.? XXXXXXX
在绘制长条图时,应注意以下几点: ① 纵轴尺度通常从“0”开始,间隔相等,标明所 表示指标的尺度及单位。 ② 横轴是长条图的共同基线,应标明各长条的内 容。长条的宽度要相等,间隔相同。 ③ 在绘制复式长条图时,将同一属性种类、等级 的两个以上指标的长条绘制在一起,各长条所表示的
小鸡出壳天数在19─24天范围内变动,有6个不同 的观察值。用各个不同观察值进行分组,共分为6组, 可得表2.2形式的次数分布表。
表2.2 50枚受精种蛋出雏天数的次数分布表
有些计数资料,观察值多,变异范围大,若以每一 观察值为一组,则组数太多,而每组内包含的观察值 太少,资料的规律性显示不出来。对于这样的资料, 可扩大为以几个相邻观察值为一组,适当减少组数, 这样资料的规律性就较明显,进一步计算分析也较方 便。例如观测100只蛋鸡每年每只鸡产蛋数(原始资 料略),其变异范围为200299枚。这样的资料如以 每个观察值为一组,则组数太多,如间隔10枚为一组, 则可使组数适当减少。经初步整理后分为10组,资料 的规律性就比较明显,见表2.3。
时间、地点。 ➢ 标目:横标目用以表示被说明事物的主要标志;纵
标目用以说明横标目各统计指标内容,并注明计算 单位。 ➢ 数字:以小数点对齐,小数位数一致。 ➢ 线条:左右边线可省去;左上角一般不用斜线。
(二)统计图 1. 统计图绘制的基本要求 (1) 标题简明扼要,列于图的下方。 (2) 纵、横两轴应有刻度,注明单位。 (3) 轴上数值由小到大;图形长宽比例适宜。 (4) 用不同颜色或线条代表不同事物时,应有说明。
第二章 试验资料整理与特征数计算
第一节 试验资料的搜集与整理
一、资料的检查与核对 目的在于确保原始资料的完整性和正确性。 完整性是指原始资料无遗缺。 正确性是指原始资料的测量和记载无差错或未进行
不合理的归并。检查中要特别注意特大、特小和异常数 据(可结合专业知识作出判断)。对于有异常或遗漏的资 料,应予以删除或补齐;对有错误、相互矛盾的资料应 进行更正,必要时进行复查或重新试验。
二、资料的整理方法 当观测值不多(n≤30)时,不必分组,直接进行统
计分析。 当观测值较多(n>30)时,宜将观测值分成若干组,
以便统计分析。将观测值分组后,制成次数分布表, 即可看到资料的集中和变异情况。 (一)计数资料的整理 现以50枚受精种蛋孵化出雏 鸡的天数为例,说明计数资料的整理。
表2.1 50枚受精种蛋孵化出雏鸡的天数
表2.5 样本含量与组数 本例中,n=126,确定组数为10组。
3、确定组距
每组最大值与最小值之差称为组距(i)。分组时 要求各组的组距相等。
组距(i)=全距/组数
ቤተ መጻሕፍቲ ባይዱ本例
i=28.0/10≈3.0
4、确定组限及组中值 各组的最大值与最小值称为组限。每一组的中点 值称为组中值,它是该组的代表值。组中值与组限、 组距的关系如下: 组中值=(组下限+组上限)/2