第二章 资料的整理与初步分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
结果作数量化处理,其方法有以下两种:
上一张 下一张 主 页
退 出
(一)统计频数(次数)法
在一定的总体或样本中,根据某一质量 性状的类别统计其次数,以次数作为质量性
状的数据。例如,在研究动物的毛色遗传时
,白色与黑色杂交,子二代中白色、黑色和 花色的个数分类统计如下表。
上一张 主 页 出 下一张 退
表2-1白色和黑色昆虫子二代的毛色分离情况
(一)统计表的结构和要求
统计表由表号、标题、横标目、纵标目、线条、
数字及合计构成,其基本格式如下表:
上一张 下一张 主 页
退 出
表号
标题
编制统计表的总原则:结构简单,层次分
明,内容安排合理,重点突出,数据准确,便
于理解和比较分析。具体要求如下:
上一张 下一张 主 页
退 出
1、表号 2、标题 标题要简明扼要、准确地说明表的内 容,有时须注明时间、地点。 3、标目 标目分横标目和纵标目两项。横标目 列在表的左侧 ,用以表示被说明事物的主要标志; 纵标目列在表的上端,说明横标目各统计指标内容, 并注明计算单位,如%、kg、cm等等。
退 出
二、资料的检查与核对
1、资料的完整性 失或重复。 完整性是指原始资料有无缺
2、资料的正确性 正确性是指原始资料的测量 和记载有无差错或进行不合理的合并。 3、抽样的正确性 要求所取的样本具有充分的 代表性、准确性与完整性。
三、数据的整理
当观测值不多(n≤30)时,不必分组,直接进行
统计分析。
这种由质量性状数量化得来的资料又叫次数资料。
上一张 下一张 主 页 退 出
(二)评分法
对某一质量性状,因其类别不同,分别
给予评分。
例如,在研究肥牛肌肉品质时,常用的方 法是将屠宰后2小时的眼肌横切面与标准图谱 对比,分别给予15 分的评分,以便统计分 析。
上一张 下一张 主 页
退 出
如粪便潜血试验的阳性反应是在涂有粪便 的棉签上加试剂后观察颜色出现的快慢及深浅 程度分为六个等级;又如用某种药物治疗畜禽 的某种疾病,疗效分为“无效”、“好转”、 “显效”和“控制”四个级别 ;然后统计各级 别的供试畜禽数。
上一张 下一张 主 页 退 出
表2-7
126只绵羊的体重的次数分布表
上一张 下一张 主 页
退 出
6、检验各组的频数之和,并分析结果
在归组划线时应注意,不要重复或遗漏,归组划线 后将各组的次数相加,结果应与样本含量相等,如不 等,证明归组划线有误,应予纠正。
上一张 下一张 主 页
退 出
注意:
在分组后所得实际组数,有时和最初确定的 组数不同,如第一组下限和资料中的最小值相差 较大或实际组距比计算的组距小,则实际分组的 组数将比原定组数多;反之则少。
退 出
表2-4 100只蛋鸡每年产蛋数的次数分布表
上一张 下一张 主 页
退 出
(二)连续性资料的整理 (组距式分组)
计量资料在分组前需要确定全距、组数、组距、
组中值及组限,然后将全部观测值划线计数归组。
【例2.1】 将126只绵羊的体重资料(见表25)整理成次数分布表。
上一张 下一张 主 页
退 出
上一张 下一张 主 页
退 出
两种不同类型的资料相互间有区别的,但 有时可根据研究的目的和统计方法的要求两者 可转化。
例如,临床化验动物的白细胞总数得到的 资料属于计数资料,根据化验的目的,可按白 细胞总数正常或不正常分为两组,清点各组的 次数,计数资料就转化为质量性状次数资料;
上一张 下一张 主 页
第二章 资料的整理 与初步分析
第一节 资料的整理
上一张 下一张 主 页
退 出
第一节 资料的整理
一、资料的来源和分类 (一)资料的来源 1、生产记录、病历等现场资料。 研究这类资料是为了了解生产规律,发 现问题并解决问题。按照研究对象的性质进行归类整理,保证资料的 完整性、真实性和准确性。 2、科学试验的记录。这些数据资料的获得必须通过科学试验这一途径。 首先要科学的选题,确定试验目的,根据试验要求,列出试验过程中 必须观察、记录的试验项目,然后按一定的要求进行试验设计,并进 行科学的试验,完整而准确地记录各种试验指标,得到系统、翔实的 资料。 3、调查研究获得的资料。通过项目或课题的普查或抽样调查所获得的资 料,是对已有事实进行调查获得的,因此应该明确调查的目的与意义 ,科学地选题。其次,列出详尽的调查提纲,确定科学的调查方法。 最后有目的、有计划、实事求是地开展调查研究,获得这些资料。
量性状资料,即用度、量、衡等计量工具直接 测定获得的数量性状资料。 这种资料的各个观测值不一定是整数,两 个相邻的整数间可以有带小数的任何数值出现 ,其小数位数的多少由度量工具的精度而定
,它们之间的变异是连续性的。因此,计量资
料也称为连续性变异资料。
上一张 下一张 主 页 退 出
(二)计数资料
指用计数方式获得的数
量性状资料。在这类资料中,它的各个观察值 只能以整数表示,在两个相邻整数间不得有任
何带小数的数值出现。这些观察值只能以整数
来表示,各观察值是不连续的,因此该类资料 也称为不连续性变异资料或间断性变异资料。
上一张 下一张 主 页 退 出
二、质量性状资料
质量性状(qualitative character)是指能观察到而不 能直接测量的性状,如颜色、 性别、生死等, 是属性性状。这类性状本身不能直接用数值表 示,要获得这类性状的数据资料,须对其观察
统计表可根据纵、横标目是否有分组分为简单表 和复合表两类。 1、简单表 由一组横标目和一组纵标目组成,
纵横标目都未分组 。 此类表适于简单资料的统计,
如表2-10。
上一张 下一张 主 页
退 出
表2-10 某品种鸡杂种二代冠形分离情 况
上一张 下一张 主 页
退 出
2、复合表 由两组或两组以上的横标目与一
抽样方式: 1、随机抽样 2、整群抽样 3、分层按比例 4、多级抽样 5、双重抽样6、顺序抽样
(二)资料的分类
正确地进行资料的分类是资料整理的前提。
试验中观察记载所得数据,因所研究的性状、 特性不同而有不同的性质,一般可以分为数量 性状资料和质量性状资料两大类。
一、数量性状资料 数量性状(quantitative character)是指能够以
表2-5 126只绵羊的体重资料
单位:kg
上一张 下一张 主 页
退 出
1、求全距
全距是资料中最大值与最小值之差,又称为极 差(range),用R表示,即
R=X(Max)- X (Min)
本例 R=65.0-37.0=28.0(kg)
上一张 下一张 主 页
退 出
2、确定组数
组数的多少视样本含量及资料的变动范围大小 而定,一般以达到既简化资料又不影响反映资料的规 律性为原则。组数要适当,不宜过多,亦不宜过少。 分组越多所求得的统计量越精确,但增大了运算量;
当观测值较多(n>30)时,宜将观测值分成若干
组,以便统计分析。将观测值分组后,制成次数分布
表,即可看到资料的集中和变异情况。 (一)间断性资料的整理 现以50枚受精种蛋孵 化出雏鸡的天数为例,说明计数料的整理。
上一张 下一张 主 页
退 出
表2-2 50枚受精种蛋孵化出雏鸡的天数
上一张 下一张 主 页
退 出
具体方法(单项式分组)
1、确定不同的观测值,以自然单位进行分组
小鸡出壳天数在19─24天范围内变动 ,有6个不同的 观 察值。用各个不同观察值进行分组,共分为6组
2、依据各组观测值统计频数
3、列表,分析其规律。
表2-3
50枚受精种蛋出雏天数的次数分布表
上一张 下一张 主 页
退 出
有些计数资料,观察值较多,变异范围较大,若 以每一观察值为一组,则组数太多,而每组内包含的 观察值太少,资料的规律性显示不出来。对于这样的 资料,可扩大为以几个相邻观察值为一组,适当减少 组数,这样资料的规律性就较明显,对资料进一步计 算分析也比较方便。
(三)质量性状资料资料的整理 对于质量性状资料 资料,可按性状或等级 进行分组,分别统计各组的次数,然后制成次
数分布表。
上一张 下一张 主 页
退 出
表2-8 F2代山羊的有角无角分离情况
上一张 下一张 主 页
退 出
表2-9 羔羊死亡情况
上一张 下一张 主 页
退 出
第三节
常用wenku.baidu.com计表与统计图
一、统计表
组纵标目结合而成 , 或由一组横标目与两组或两组
以上的纵标目结合而成,或由两组或两组以上的横、 纵标目结合而成。此类表适用于复杂资料的统计,如
表2-11。
上一张 下一张 主 页
退 出
表2-11 几种动物性食品的营养成分
上一张 下一张 主 页
退 出
二、统计图
常用的统计图有长条图(bar chart)、园图 (pie chart)、 线图(linear chart)、直方图 (histogram)和折线图 (broken-line chart) 等 。一般情况下,计量资料采用直方图和折线图, 计数资料、质量性状资料、半定量(等级)资料常用 长条图 、 线图或园图。
上一张 下一张 主 页 退 出
组距确定后, 首先要选定第一组的组中值。 在分组时为了避免第一组中观察值过多,一般第 一组的组中值以接近或等于资料中的最小值为好。第 一组组中值确定后,该组组限即可确定,其余各组的
组中值和组限也可相继确定。
注意:第一组的下限应小于资料中的最小值。
最末一组的上限应大于资料中的最大值。
上一张 下一张 主 页 退 出
为了使恰好等于前一组上限和后一组下限的数据
能确切归组,约定将其归入后一组。(上限排外法)
通常将上限略去不写。
第一组记为36.0 , 第二组记为39.0 , …… 5、归组划线计数,作次数分布表 分组结束后,将资料中的每一观测值逐一归组, 划线计数,然后制成次数分布表。
组距(i)=全距/组数 本例 i=28.0/10≈3.0
上一张 下一张 主 页
退 出
4、确定组限及组中值
各组的最大值与最小值称为组限。最小值称为 下限, 最大值称为上限。每一组的中点值称为组中 值,它是该组的代表值。组中值与组限、组距的关系 如下:
组中值=(组下限+组上限)/2=组下限+1/ 2 组距=组上限-1/2组距 由于相邻两组的组中值间的距离等于组距,所以 当第一组的组中值确定以后,加上组距就是第二组的 组中值,第二组的组中值加上组距就是第三组的组中 值,其余类推。
若分组过少,资料的规律性就反映不出来,计算出的
统计量的精确性也较差。一般组数的确定,可参考表
2-6。
上一张 下一张 主 页
退 出
表2-6
样本含量与组数
本例中,n=126,根据表2-6,初步确 定组数为10组。
上一张 下一张 主 页 退 出
3、确定组距
每组最大值与最小值之差称为组距,记为 i。分
组时要求各组的组距相等。组距的计算公式为:
上一张 下一张 主 页
退 出
表2-5中, 最小值为37.0, 第一组的组中值取 37.5,因组距已确定为3.0,所以 第一组的下限为: 37.5-(1/2)×3.0=36.0; 第一组的上限也就是第二组的下限为: 36.0+3.0=39.0; 第二组的上限也就是第三组的下限为: 39.0+3.0=42.0,……, 以此类推,一直到某一组的上限大于资料中的最 大值为止。 于是可分组为: 36.0 39.0,39.0 42.0,……。
测量或计数的方式表示其特征的性状。观察
测定数量性状而获得的数据就是数量性状资 料 (data of quantitative characteristics)。数量性状资 料的获得有测量和计数两种方式 ,因而数量 性状资料又分为计量资料和计数资料两种。
上一张 下一张 主 页 退 出
(一)计量资料
指用测量方式获得的数
上一张 下一张 主 页 退 出
4、数字 一律用阿拉伯数字,数字以小数点对 齐,小数位数一致, 无数字的用“─”表示,数字 是“0”的,则填写“0”。 5、线条 表的上下两条边线略粗,纵、横标目
间及合计用细线分开,表的左右边线可省去,表的左
上角一般不用斜线。
6、合计
上一张 下一张 主 页
退 出
(二) 统计表的种类
上一张 下一张 主 页
上一张 下一张 主 页
退 出
例如观测某品种100只蛋鸡每年每只鸡产
蛋数 ,其变异范围为200299枚。这样的 资料如以每个观察值为一组,则组数太多(该
资料最多可分为100组),如间隔10枚为一
组,则可使组数适当减少。经初步整理后分为 10组,资料的规律性就比较明显,见表2-4。
上一张 下一张 主 页