生物统计学:第二章 试验资料整理与特征数计算
生物统计学第四版--教学大纲
课程简介《生物统计学》是运用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,是生物学各专业的专业基础课。
本门课程在第七学期进行,是在学生已学习了《高等数学》课程和《植物学》、《动物学》、《生理学》、《遗传学》等生物学各学科的基础知识的基础上开设本门课程。
本课程系统地介绍了生物统计学的基本原理和方法,在简要叙述了生物统计学的概念、产生、发展和作用、生物学研究中试验资料的整理、特征数的计算、概率和概率分布、抽样分布基础上,着重介绍了平均数和频率的假设检验、X 2检验、方差分析、直线回归与相关分析、可直线化的非线性回归分析、协方差分析、试验设计的原理和常用试验设计及其统计分析、多元回归与相关分析和多项式回归分析,同时简要介绍聚类分析、判别分析、主成分分析、因子分析、典型相关、时间序列分析等多元分析。
本课程的主要目的是培养学生具有生物学试验设计的能力和对试验资料进行统计分析处理的能力.一、教学环节和教学方法1教学环节本门课程为生物学的专业基础课,在第七学期进行。
学生已学习了《高等数学》课程和《植物学》、《动物学》、《生理学》、《遗传学》等生物学各学科的基础知识,在此基础上开设本门课程。
主要教学形式为课堂讲授,主要教学环节包括课堂讲授、辅导答疑、课外作业、习题讲解等。
2教学方法以课堂讲授为主,研制电子教案和多媒体幻灯片以及C A I课件,在教学方法和手段上采用现代教育技术.二、本课程的性质和任务《生物统计学》是运用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,是生物学各专业的专业基础课.随着生物学的不断发展,对生物体的研究和观察已不再局限于定性的描述,而是需要从大量调查和测定数据中,应用统计学方法,分析和解释其数量上的变化,以正确制定试验计划,科学地对试验结果进行分析,从而作出符合科学实际的推断。
《生物统计学》不仅提供如何正确地设计科学试验和收集数据的方法,而且也提供如何正确地整理、分析数据,得出客观、科学的结论的方法。
生物统计学二
任何事件的概率都在0和1之间,即:0≤P(A) ≤1 必然事件的概率等于1,即:P(U)=1 不可能事件的概率等于0,即:P(V)=0
二:概率的计算
事件的相互关系
和事件(sum event)事件A和事件B至少有一个发生构成的新 事件称事件A和事件B的和事件。记为A+B或 A B 积事件(product event )积事件:事件A和事件B同时发生构 成的新事件,又叫变事件,记作AB 或 A B
数据
排序
求和 平均数 样本方差 var 总体方差 varp 样本标准差 stdev 总体标准差 stdevp
第三章 概率与概率分布
第一节 概率基础知识
概率的概念 概率的计算 概率分布 大数定律
一、概率的概念
事件:每种可能出现的情况称为事件。它是指事物发 生某种情况或试验中获得某种结果。 必然事件(U)和不可能事件(V) 随机事件:指在同一组条件下,可能发生也可能不发 生的事件。也就是说,在某一特定的条件下,可 能这样出现也可能那样出现,可能发生的只是其 中的几种情况,这种事件称为随机事件。
频率:事件A在n次试验中发生了m次,其比值m/n称为事件A 发生的频率(frequency),记为
m W ( A) n
0≤W(A) ≤1
概率:就是用来度量每一事件出现的可能性大小的数字特征。 某件事A在n次重复试验中,发生了m次,当试验次数n不断 增大是,事件A发生的频率W(A)就越来越接近某一确定值p, 于是定义p为事件A发生的概率,记为
独立事件(independent event)事件A发生与否不影响事件B发生 的可能性,反之亦然,那么就称事件A对于事件B是独立的。简称 独立事件。 完全事件系(complete event system) n个事件两两互斥,且每 次试验必有其一出现。则这n个事件构成完全事件系。
高级生物统计学第2章资料整理
计量资料 量、测 实数 或直接计数
正态分布 t 检验、 F检验
次数资料 先分组, 正整数 二项分布 X2检验
再计数
零
5
例一: 次数资料
采用二种不同生殖激素处理奶水牛发情结果如下:
处理 总母牛数 发情数
A激素 46
34
B激素 51
48
试分析两种激素效果有无显著差异。
6
例二:计量资料
采用二种不同生殖激素处理奶水牛发情结果如下:
39
应用Excel作频数分布表
一法:输入样本数据,后用Frequency统 计函数;
二法:数据分析工具------直方图(接收区输 入分组区间)----频数-----折线图
40
四、实例
北京肉鸭平均生长速度计算; 仔猪体内抗体效价计算; 发情期母畜生殖激素变化曲线。
41
测定北京肉鸭各周龄(x)与平均体重(g , y) 如下:
1、描述样本方法
二种受精方法体外受精效果比较 方法 卵子数 卵裂率(%) 囊胚率(%) A法 611 50.30±9.29 19.9±4.31a B法 753 57.79±7.56 21.00±2.49b
注: 未能注明是标准差还是标准误; 重复数是多少; 字母顺序有误。
32
计算器作统计运算
4
4
4.1
256
128
32
16
8
4.2
128
128
32
8
4
4.3
256
128
32
16
8
5
5.1
128
64
32
16
8
5.2
256
生物统计学习题集参考答案
生物统计学习题集参考答案第一章概论一、填空1 变量按其性质可以分为连续变量和非连续变量。
2 样本统计数是总体参数的估计量。
3 生物统计学是研究生命过程中以样本来推断总体的一门学科。
4 生物统计学的基本内容包括_试验设置、统计分析_两大部分。
5 统计学的发展过程经历了古典记录统计学、近代描述统计学现代推断统计学3个阶段。
6 生物学研究中,一般将样本容量n大于等于30称为大样本。
7 试验误差可以分为__随机误差、系统误差两类。
二、判断(-)1 对于有限总体不必用统计推断方法。
(-)2 资料的精确性高,其准确性也一定高。
(+) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
(+)4 统计学上的试验误差,通常指随机误差。
三、名词解释样本:从总体中抽出的若干个体所构成的集合称为样本。
总体:具有相同的个体所构成的集合称为总体。
连续变量:是指在变量范围内可抽出某一范围的所有值。
非连续变量:也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。
准确性:也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。
精确性:也称精确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章试验资料的整理与特征数的计算一、填空1 资料按生物的性状特征可分为___数量性状资料_变量和__变量性状资料_变量。
2 直方图适合于表示__计量、连续变量_资料的次数分布。
3 变量的分布具有两个明显基本特征,即_集中性_和__离散性_。
4 反映变量集中性的特征数是__平均数__,反映变量离散性的特征数是__变异数(标准差)_。
5 样本标准差的计算公式s= √∑(x-x横杆)平方/(n-1)。
二、判断( - ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
( - ) 2 条形图和多边形图均适合于表示计数资料的次数分布。
( +)3 离均差平方和为最小。
( + )4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。
生物统计学 第二章 统计数据与数据整理
பைடு நூலகம்
连续性数据可以用组中值代替单个具体观察 值。 对较大的一组数据,每个数减去一个常数C, 不影响S值的计算,据此可减化计算过程。
如样本: 101;103;105;109
4. 变异系数
方差,标准差皆有单位 若两样本单位不同,或者 若两样本平均数相差较大
例:
样本A:
样本B:
101;103;105;109
差数。当n≤10 时,可用来反映样本的变 异度,简单明了。n 较大时,易受资料中 不正常极端值的影响。
2 . 方差 需要根据样本全部观察值来度量资料的变异 度.
方差,用v 或s2 表示,当样本含量不很大时, 用n-1作分母,n-1称自由度。
注意:
3. 标准差
这样可免除 中间计算, 直接利用最 初基本数据。
权数两种表现形式:一是绝对数(频数), 另一个是用相对数(频率)表示。 频数(f) 频率(f/∑f), 为权数系数 .
加权平均数:
算术平均数的几个特性 :
2. 几何平均数G
例:番茄遗传中,曾有从亲本果重预测F1果重。
主要用的还是 x . 总体平均数用μ表示:
可以用
x 估计无限总体的μ值。
第二章 统计数据与数据整理
统计数据的特点
(1)一组数据;
(2)具有变异性, 故又称为变量。
(3)变量取值取决于随机取到的个体, 但全部个体所有取值又有规律可循。
第一节
频数分布
两种类型的数据
(1) 连续型数据:变量的取值是一个范围, 即变量可以在某个区间内连续取值。 (2) 离散性数据:试验只有若干确定的结果, 变量的取值可一一列出。
概论试验资料的整理与特征数的计算
误差与错误 误差指实验中不可控因素引起的观测值偏离
真值的差异。错误指在实验过程中人为作用 引起的差错。
随机误差(不可控因素造成) 误差
系统误差(实验处理以外其它条件明显 不一致造成)
准确性与精确性
准确性指在调查或实验中某一实验指标或性 状的观测值与其真值接近的程度。精确性指 调查或实验中同一实验指标或性状的重复观 测值彼此接近程度的大小。
5月,国家统计局发布4月份统计数据显示,全国CPI环 比上涨0.2%,同比上涨2.8%。但在大蒜价格暴涨,绿 豆价格连创新高的情况下,这样一个与公众感受“大 相径庭”的CPI数据,让人无法接受
中国统计局
第 章 概论
主要内容
生物统计学的概念 生物统计学的内容与作用 生物统计学发展概况 常用统计学术语
例题分析
(P23)例2.4-2.8
应用 exel来解决统计学中的问题
组中值
12.5 17.5 22.5 27.5 32.5 37.5
次数
10 7 6 8 9 10
频率
0.2 0.14 0.12 0.16 0.18 0.2
累积频率
0.2 0.34 0.46 0.62 0.8
1
次数(频数)分布图
条形图:适于表示计数资料和属性资料的次 数分布。
次数
40
30
20
10
0
1
1、计算方法简单。 2、受观测次数的影响,但不受极端观测值的影响。
1、较之算术平均数与中位数,众数的使用较少。 2、有些样本或总体中可能不存在众数,或是存在多 个众数。 3、众数的大小不受极端观测值影响。
变异数
变异数反映变量的离散程度,常用的变异数 有:极差、离均差、方差、标准差和变异系 数。
生物统计学 第二章 资料的整理
1.6 划线归组,作次数分布表
资料的整理
规律:螭(chi)霖体长变异范围在7-16;大部分数据集中在9-13; 分布的中心趋向11.5;两头小、中间大的分布趋势。
资料的整理
2.间断性资料(计数资料)的次数分布表 单向分组法进行整理。常用变量的自然数值进 行分组,每组用一个变量值表示。然后把各个观察 值归入相应的组内。
资料的整理
1.5 确定组限 组下限=组中值-1/2组距;组上限=组中值 +1/2组距。本题:第一组下限=7.5-1/2*1=7,上 限7.5+1/2*1=8,所以,本题的分组为7-8;8-9; 9-10;…。 约定:当各组上限为整数时减去0.1,一位小 数时减去0.01; 本资料的分组可改写为7-7.9;88.9;…;这个样可解决临界值‘8’的分组归属。 这样8就归为第二组。
资料的整理
圆形图 用于表示计数资料、质量性状资料或半 定量资料的构成比例。 图1.某渔场鱼苗放养情况 鲢鱼 鲤鱼 鳜鱼 草鱼
524
351
126
438
资料的整理
线图
用于表示事物或现象随时间而变化发展的情况
资料的整理
多边形图 用于表示连续性资料的次数分布。横 轴表示组中值,纵轴表示次数。
30 25
资料的整理
资料的整理
2、统计图 直观清楚的表示数据分布规律,常用于PPT等报告。 2.1 基本要求 标题简明扼要,列于图的下方。 纵、横两轴应有刻度,注明单位。 横轴由左至右、纵轴由下而上,数值由小到大。 图中需用不同颜色或线条代表不同事物时,应有
图例说明。
资料的整理
2.2 范例 长条图 展示某一指标划分属性种类或等级的次数 或频数分布。
样本含量(n) 10—100 100—200 200—500 500以上 组 数 7—10 9—12 12—17 17—30
第二章 试验资料的整理与特征数
5、准确性与精确性
• 准确性(accuracy)是指统计数接近参数真 值的程度,是说明测定值对真值符合程度 的大小。 • 精确度(precision)是指样品中的各个变量 间变异程度的大小。
• 整理资料的基本方法是根据资料的特性将其整理 成统计表、 绘制成统计图。 • 通过统计表、图可以大致看到所得资料集中、离 散的情况。 • 并利用所收集得来的数据计算出几个统计量,以 表示该资料的数量特征、估计相应的总体参数。
2、提供由样本推论总体的科学方法;
• 试验的目的在于认识总体的规律,但 总体庞大,一般无法实施。
例如 调查作物受某种病虫害危害情况,将作物性 状分为高抗、抗、中抗、中感、感病5个级别,分
别用1,2,3,4,5表示,统计样本内各种级别的
植株数。
不同类型的资料相互间是有区别的,但有时可 根据研究的目的和统计方法的要求将一种类型 资料转化成另一种类型的资料。
例如,临床化验动物的白细胞总数得到的资料 属于计数资料。 根据化验的目的,可按白细胞总数正常或不正 常分为两组,清点各组的次数,计数资料就转 化为质量性状次数资料; 如果按白细胞总数过高、正常、过低分为三组 , 清点各组次数 ,就转化成了半定量资料 。
3、效应与互作
• 引起试验差异的作用称为效应。 – 如栽培试验中的肥料、密度等。 – 组织培养中的温度、培养基种类、激素 浓度等。 – 效应可分正效应、负效应。
互作:指两个获两个以上处理因素间的 相互作用产生的效应。
4、随机误差与系统误差
• 在试验中由于无法控制的随机因素引起的差异叫 随机误差(random error)或抽样误差 (sampling error) 。 • 系统误差或片面误差(lopsided error)是指在试验 过程中,人为因素所引起的差错。
生物统计学习题集答案
生物统计学习题集参考答案第一章概论一、填空1 变量按其性质可以分为连续变量和非连续变量。
2 样本统计数是总体参数的估计量。
3 生物统计学是研究生命过程中以样本来推断总体的一门学科。
4 生物统计学的根本内容包括_试验设置、统计分析_两大局部。
5 统计学的开展过程经历了古典记录统计学、近代描述统计学现代推断统计学3个阶段。
6 生物学研究中,一般将样本容量n大于等于30称为大样本。
7 试验误差可以分为__随机误差、系统误差两类。
二、判断〔-〕1 对于有限总体不必用统计推断方法。
〔-〕2 资料的准确性高,其准确性也一定高。
(+) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
〔+〕4 统计学上的试验误差,通常指随机误差。
三、名词解释样本:从总体中抽出的假设干个体所构成的集合称为样本。
总体:具有一样的个体所构成的集合称为总体。
连续变量:是指在变量X围内可抽出某一X围的所有值。
非连续变量:也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。
准确性:也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。
准确性:也称准确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章试验资料的整理与特征数的计算一、填空1 资料按生物的性状特征可分为___数量性状资料_变量和__变量性状资料_变量。
2 直方图适合于表示__计量、连续变量_资料的次数分布。
3 变量的分布具有两个明显根本特征,即_集中性_和__离散性_。
4 反映变量集中性的特征数是__平均数__,反映变量离散性的特征数是__变异数〔标准差〕_。
5 样本标准差的计算公式s=√∑〔x-x横杆〕平方/(n-1)。
二、判断( - ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
( - ) 2 条形图和多边形图均适合于表示计数资料的次数分布。
〔+〕3 离均差平方和为最小。
〔+ 〕4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。
生物统计学第2章-2012
三、试验资料的整理
(4) 归组和制表
确定好组数和各组上下限后,可按原始资料中各观 测值的次序,将各个数值归于各组,计算各组的观 测数次数、频率、累积频率,制成一个次数分布表。
(2) 确定组数和组距(class boundary)
组数是根据样本观测数的多少及组距的大小来 确定的,同时考虑到对资料要求的精确度以及进一 步计算是否方便。
组数 组距
多 少
小 大
统计数精确,计算不方便 统计数不精确,计算方便
19
表2-5
样本容量与分组数的关系 分组数 5~8 7 ~ 10 9 ~ 12
11~17
分为7组
统计各组次数 计算频率和累积频率 制表
15 16 16 14 13 14 15 13 15 13
15 15 15 14 14 16 14 15 17 13 16 14 16 15 13 14 14 14 14 16 12 13 12 14 12 15 16 15 16 14 13 15 17 14 13 14 12 17 14 15
56 49 62 78 41 47 65 45 58 55 52 52 60 51 62
(1) 求全距,
78 66 45 58 58 56 46 58 70 72 76 77 56 66 58
63 57 65 85 59 58 54 62 48 63 58 52 54 55 66 52 48 56 75 5563 75 65 48 52 55 54 62 61 62
计数资料基本上采用单项式分组法进行整理。
生物统计学二解析
数所的的商
2、中位数
第1组数:1、2、3、6、7的中位数是3。 原理: 如果总数个数是奇数的话,按从小到大的顺序,取中 间的那个数
第2组数:1、2、3、5的中位数是2.5。 原理:如 果总数个数是偶数的话,按从小到大的顺序,取中间 那两个数的平均数.(2+3)/2=2.5
对立事件(contrary event)事件A和B不可能同时发生,但必 须发生其一,即A+B为必然事件,AB为不可能事件,这样A、 B互为对立事件 B是A的对立,记为 A
独立事件(independent event)事件A发生与否不影响事件B发生 的可能性,反之亦然,那么就称事件A对于事件B是独立的。简称 独立事件。
频率:事件A在n次试验中发生了m次,其比值m/n称为事件A 发生的频率(frequency),记为
W ( A) m 0≤W(A) ≤1 n
概率:就是用来度量每一事件出现的可能性大小的数字特征。 某件事A在n次重复试验中,发生了m次,当试验次数n不断 增大是,事件A发生的频率W(A)就越来越接近某一确定值p, 于是定义p为事件A发生的概率,记为
第三章 概率与概率分布
第一节 概率基础知识
概率的概念 概率的计算 概率分布 大数定律
一、概率的概念
事件:每种可能出现的情况称为事件。它是指事物发 生某种情况或试验中获得某种结果。
必然事件(U)和不可能事件(V) 随机事件:指在同一组条件下,可能发生也可能不发
生的事件。也就是说,在某一特定的条件下,可 能这样出现也可能那样出现,可能发生的只是其 中的几种情况,这种事件称为随机事件。
1、指出一组数据资料中心位置,标志着资料 所代表性状的数量水平和质量水平。
生物统计学02试验资料的整理和特征数的计算
∑
☆
样本中离均差的平方的总和, 样本中离均差的平方的总和,比各观察值与任何一个其它的 数值离差的平方和要小, 离均差的平方和最小。 数值离差的平方和要小,即离均差的平方和最小。
∑(x − x)
2
<
(x −α)2 ∑
二、变 异 数
例2.3
据如下: 据如下:
品种 甲 乙 每穗小穗数 13,14,15,17,18,18,19,21,22,23 , , , , , , , , , 16,16,17,18,18,18,18,19,20,20 , , , , , , , , , 总和 180 180 平均数 18 18
调查两个小麦品种的每穗小穗数,每品种10穗 调查两个小麦品种的每穗小穗数,每品种10穗,得数 10
二、变 异 数
1. 变异数的种类
☆
极差: 极差: R=Max-Min
☆
方差
σ 2=
( X − µ )2 ∑ N
均 方 ( mean square,MS ) ,
S2 = ∑ (x − x)2 /(n −1)
二、变 异 数
1. 变异数的种类
☆
变异系数( 变异系数(coefficient of variability,CV) , )
S CV = ×100% x
数量性状资料 质量性状
能观察到而不能测量的性状(颜色、 性别等) 能观察到而不能测量的性状(颜色、 性别等)
质量性状资料
第一节 试验资料的整理 二、试验资料的整理
间断性变量资料——单项式分组 单项式分组 间断性变量资料
次数分布表
连续性变量资料——组距式分组 组距式分组 连续性变量资料
次数分布图
折线图(多边形图) 折线图(多边形图) 矩形图(直方图) 矩形图(直方图)
生物统计学(王立超)
生物统计学习题集安徽工程大学生物技术教研室2012年6月第一章绪论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算2.1 某地100例30~40岁健康男子血清总胆固醇(mol·L1-)测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.12 4.56 4.37 5.396.30 5.217.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.584.09 3.35 4.08 4.795.30 4.97 3.18 3.97 5.16 5.105.85 4.79 5.34 4.24 4.32 4.776.36 6.38 4.88 5.553.044.55 3.35 4.87 4.175.85 5.16 5.09 4.52 4.384.31 4.585.726.55 4.76 4.61 4.17 4.03 4.47 3.403.91 2.704.60 4.095.96 5.48 4.40 4.55 5.38 3.89 4.604.47 3.64 4.345.186.14 3.24 4.90计算平均数、标准差和变异系数。
2.2 试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。
24号:19,21,20,20,18,19,22,21,21,19;金皇后:16,21,24,15,26,18,20,19,22,19。
2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下:单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,48,50,51,46,41,34,44,46;混养50绳的重量数据:51,48,58,42,55,48,48,54,39,58,50,54,53,44,45,50,51,57,43,67,48,44,58,57,46,57,50,48,41,62,51,58,48,53,47,57,51,53,48,64,52,59,55,57,48,69,52,504,53,50。
生物统计学课后习题解答
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。
24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ;金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在归组划线时应注意,不要重复或遗漏,归组划 线后将各组的次数相加,结果应与样本含量相等。
在分组后所得实际组数,有时和最初确定的组数 不同。如第一组下限和资料中的最小值相差较大或实 际组距比计算的组距为小,则实际分组的组数将比原 定组数多;反之则少。
(三)质量性状资料、半定量(等级)资料的整理 可按性状或等级进行分组,分别统计各组的次数,然 后制成次数分布表。
第一组的下限为: 37.5-(1/2)×3.0=36.0;
第一组的上限也就是第二组的下限为: 36.0+3.0=39.0;
第二组的上限也就是第三组的下限为: 39.0+3.0=42.0,……,
以此类推,一直到某一组的上限大于资料中的最 大值为止。 于是可分组为:
36.0 39.0,39.0 42.0,……。
组距确定后,首先要选定第一组的组中值。在分 组时为了避免第一组中观察值过多,一般第一组的组 中值以接近或等于资料中的最小值为好。第一组组中 值确定后,该组组限即可确定,其余各组的组中值和 组限也可相继确定。注意,最末一组的上限应大于资 料中的最大值。
表2.4中,最小值为37.0,第一组的组中值取37.5, 因组距已确定为3.0,所以
表2.5 样本含量与组数 本例中,n=126,确定组数为10组。
3、确定组距
每组最大值与最小值之差称为组距(i)。分组时 要求各组的组距相等。
组距(i)=全距/组数
本例
i=28.0/10≈3.0
4、确定组限及组中值 各组的最大值与最小值称为组限。每一组的中点 值称为组中值,它是该组的代表值。组中值与组限、 组距的关系如下: 组中值=(组下限+组上限)/2
表2.7 F2代山羊的有角无角分离情况
三 常用统计表与统计图
(一)统计表
1、结构 ➢ 序号 ➢ 标题 ➢ 横标目 ➢ 纵标目 ➢ 线条 ➢点突出, 数据准确,便于理解和比较分析。
3、编制要求 ➢ 标题:简明扼要、准确说明表的内容,有时须注明
时间、地点。 ➢ 标目:横标目用以表示被说明事物的主要标志;纵
标目用以说明横标目各统计指标内容,并注明计算 单位。 ➢ 数字:以小数点对齐,小数位数一致。 ➢ 线条:左右边线可省去;左上角一般不用斜线。
(二)统计图 1. 统计图绘制的基本要求 (1) 标题简明扼要,列于图的下方。 (2) 纵、横两轴应有刻度,注明单位。 (3) 轴上数值由小到大;图形长宽比例适宜。 (4) 用不同颜色或线条代表不同事物时,应有说明。
小鸡出壳天数在19─24天范围内变动,有6个不同 的观察值。用各个不同观察值进行分组,共分为6组, 可得表2.2形式的次数分布表。
表2.2 50枚受精种蛋出雏天数的次数分布表
有些计数资料,观察值多,变异范围大,若以每一 观察值为一组,则组数太多,而每组内包含的观察值 太少,资料的规律性显示不出来。对于这样的资料, 可扩大为以几个相邻观察值为一组,适当减少组数, 这样资料的规律性就较明显,进一步计算分析也较方 便。例如观测100只蛋鸡每年每只鸡产蛋数(原始资 料略),其变异范围为200299枚。这样的资料如以 每个观察值为一组,则组数太多,如间隔10枚为一组, 则可使组数适当减少。经初步整理后分为10组,资料 的规律性就比较明显,见表2.3。
表2.3 100只蛋鸡每年产蛋数的次数分布表
(二)计量资料的整理 计量资料在分组前需要确定全距、组数、组距、 组中值及组限,然后将全部观测值划线计数归组。 【例】将126名初中生的体重资料(见表2.4)整理成 次数分布表。
表2.4 126名初中生的体重资料 单位:kg
1、求全距 全距是资料中最大值与最小值之差,又称为极差, 用R表示,即
二、资料的整理方法 当观测值不多(n≤30)时,不必分组,直接进行统
计分析。 当观测值较多(n>30)时,宜将观测值分成若干组,
以便统计分析。将观测值分组后,制成次数分布表, 即可看到资料的集中和变异情况。 (一)计数资料的整理 现以50枚受精种蛋孵化出雏 鸡的天数为例,说明计数资料的整理。
表2.1 50枚受精种蛋孵化出雏鸡的天数
为了使恰好等于前一组上限和后一组下限的数据能 确切归组,约定将其归入后一组。
通常将上限略去不写。 第一组记为36.0 , 第二组记为39.0 , ……
5、归组划线计数,作次数分布表 分组结束后,将资料中的每一观测值逐一归组,划 线计数,然后制成次数分布表。
表2.6 126名初中生体重的次数分布表
第二章 试验资料整理与特征数计算
第一节 试验资料的搜集与整理
一、资料的检查与核对 目的在于确保原始资料的完整性和正确性。 完整性是指原始资料无遗缺。 正确性是指原始资料的测量和记载无差错或未进行
不合理的归并。检查中要特别注意特大、特小和异常数 据(可结合专业知识作出判断)。对于有异常或遗漏的资 料,应予以删除或补齐;对有错误、相互矛盾的资料应 进行更正,必要时进行复查或重新试验。
2. 常用统计图及其绘制方法
(1) 柱形图
它用等宽长条的长短或 高低表示按某一研究指标 划分属性种类或等级的次 数或频率分布。如果只涉 及一项指标,则采用单式 长条图;如果涉及两个以 上的指标,则采用复式长 条图。
Fig.? XXXXXXX
在绘制长条图时,应注意以下几点: ① 纵轴尺度通常从“0”开始,间隔相等,标明所 表示指标的尺度及单位。 ② 横轴是长条图的共同基线,应标明各长条的内 容。长条的宽度要相等,间隔相同。 ③ 在绘制复式长条图时,将同一属性种类、等级 的两个以上指标的长条绘制在一起,各长条所表示的
R=Max(x)-Min(x) 本例 R=65.0-37.0=28.0(kg)
2、确定组数 组数的多少视样本含量及资料的变动范围大小而 定,一般以达到既简化资料又不影响反映资料的规律 性为原则。组数要适当。分组越多所求得的统计量越 精确,但增大了运算量;分组过少,资料的规律性就 反映不出来,计算出的统计量的精确性也较差。一般 组数的确定,可参考表2.5。