第二章 资料的整理与描述2011
第2章 资料的整理与描述(田间试验与统计分析 四川农业大学)
╫╫ ║║
9
225
╫
3
240
║
2
255
│
1
140
累加次数 2 9 16 29 46 66 91 112 125 134 137 139 140
3、质量性状资料的整理
对于质量性状资 料可按性状或属性进行 分组,分别统计各组的 次数,然后制成次数分 布表。
水稻杂种F2植株米粒性状的分离情况
性状分组 次数(f) 频率(%)
组距(i)= 全距/组数
(3)确定组限和组中值
各组的最大值与最小值称为组限,最小值称为 下限,最大值称上限。每一组的中点值称为组中值, 是该组的代表值。组中值与组限、组距的关系为:
组中值 = (组下限+组上限)/2 = 组下限 + 组距/2 = 组上限 - 组距/2
由于相邻两组的组中值之差等于组距,所以当 第一组的组中值确定后,加上组距就是第二组的组 中值,第二组的组中值加上组距就是第三组的组中 值,其余类推。
如表2-4中,第一个观测值177,应归入表2-6中 第8组,其组限为172.5—;第二个观测值215,应归 入第10组,其组限为202.5—;
依次把140个观测值都进行归组、划线计数, 制成次数分布表。
组限 67.5— 82.5— 97.5— 112.5— 127.5— 142.5— 157.5— 172.5— 187.5— 202.5— 217.5— 232.5— 247.5— 合计
2、计量资料的整理
计量资料在分组前需要确定全距、组数、组距、 组中值及组限,然后将全部观测值划线计数归组制 成次数分布表。
表2-4 140行水稻产量 (单位:g)
177 215 197 97 123 159 245 119 119 131 149 152 167 104 161 214 125 175 219 118 192 176 175 95 136 199 116 165 214 95 158 83 137 80 138 151 187 126 196 134 206 137 98 97 129 143 179 174 159 165 136 108 101 141 148 168 163 176 102 194 145 173 75 130 149 150 161 155 111 158 131 189 91 142 140 154 152 163 123 205 149 155 131 209 183 97 119 181 149 187 131 215 111 186 118 150 155 197 116 254 239 160 172 179 151 198 124 179 135 184 168 169 173 181 188 211 197 175 122 151 171 166 175 143 190 213 192 231 163 159 158 159 177 147 194 227 141 169 124 159
生物统计第二章资料的整理与描述
大样本与小样本; 随机样本(random sample);
非随机样本(non-random sample)。
总体与样本的关系
由样本推断总体虽然有很大可靠 性,也有一定错误率。俗语说“不 可不信,不可全信”,这是我们对 待统计推断的正确态度。
2、参数与统计数 用总体的全体观察值计算的、描述总 体的特征数称为参数(parameter)。
玉米的穗行数等
上一张 下一张 主 页 退 出
(二)质量性状资料
质量性状是指只能观察而不能测量的性状。
如花药、种子、果实、叶片的颜色、籽粒的
饱满度、芒的有无等。 质量性状本身不能用数值表示,要获得这 类性状的资料,须对其观察结果作数量化
处理。数量化方法可分为以下两种:
统计次数法 评分法
上一张 下一张 主
页 退
出
1、统计次数法
在一定的总体或样本内,根据某一质量性状的
类别统计其次数,以次数作为质量性状的数据。
【例如】红花豌豆与白花豌豆的 【例如】 玉米果穗 杂交试验,统计F2不同花色植株, 上甜粒与 在1000个F2植株中,红花266株、 非甜粒的 分离比率。 紫花494株、白花240株。 这种利用统计次数法对质量性状 数量化得来的资料又叫次数资料。
这一条件的约束,能自由变动的
离均差的个数是 n-1 。当 n-1 个离均差确定 后,第n个离均差也就随之而定,不能再任 意变动。
【例】有5个观察值3、4、6、8、9,其平均数6。
5个察值的离均差为-3,-2,0,2,3,满足:
(x x) 0
一般,在计算离均差平方和时,若约束条 件为k个,则其自由度dƒ=n-k。
如:总体平均数 ---- μ
生物统计学 第二章 资料的整理
1.6 划线归组,作次数分布表
资料的整理
规律:螭(chi)霖体长变异范围在7-16;大部分数据集中在9-13; 分布的中心趋向11.5;两头小、中间大的分布趋势。
资料的整理
2.间断性资料(计数资料)的次数分布表 单向分组法进行整理。常用变量的自然数值进 行分组,每组用一个变量值表示。然后把各个观察 值归入相应的组内。
资料的整理
1.5 确定组限 组下限=组中值-1/2组距;组上限=组中值 +1/2组距。本题:第一组下限=7.5-1/2*1=7,上 限7.5+1/2*1=8,所以,本题的分组为7-8;8-9; 9-10;…。 约定:当各组上限为整数时减去0.1,一位小 数时减去0.01; 本资料的分组可改写为7-7.9;88.9;…;这个样可解决临界值‘8’的分组归属。 这样8就归为第二组。
资料的整理
圆形图 用于表示计数资料、质量性状资料或半 定量资料的构成比例。 图1.某渔场鱼苗放养情况 鲢鱼 鲤鱼 鳜鱼 草鱼
524
351
126
438
资料的整理
线图
用于表示事物或现象随时间而变化发展的情况
资料的整理
多边形图 用于表示连续性资料的次数分布。横 轴表示组中值,纵轴表示次数。
30 25
资料的整理
资料的整理
2、统计图 直观清楚的表示数据分布规律,常用于PPT等报告。 2.1 基本要求 标题简明扼要,列于图的下方。 纵、横两轴应有刻度,注明单位。 横轴由左至右、纵轴由下而上,数值由小到大。 图中需用不同颜色或线条代表不同事物时,应有
图例说明。
资料的整理
2.2 范例 长条图 展示某一指标划分属性种类或等级的次数 或频数分布。
样本含量(n) 10—100 100—200 200—500 500以上 组 数 7—10 9—12 12—17 17—30
田间试验与统计分析习题
四川农业大学植物生产类专业生物统计考试复习题第一章田间试验一、名词解释试验指标、试验因素、因素水平、试验处理、试验小区、总体、样本、样本容量、隋机样本总体准确性精确性二、简答题1、田间试验有哪些特点?保证田间试验质量的基本要求有哪些?2、什么是试验误差?随机误差与系统误差有何区别?田间试验误差有哪些主要来源及相应的控制途径?3、控制土壤差异的小区技术包括哪些内容?各措施有何作用?4、田间试验设计的基本原则及其作用为何?5、什么是试验方案?如何制订一个完善的试验方案?6、简述完全随机设计、随机区组设计、拉丁方设计和裂区设计各自的特点及其应用条件。
三、应用题1、有5个油菜品种A、B、C、D、E(其中E为对照)进行品种比较试验,重复3次,随机区组设计,试绘制田间排列图。
2、拟对4个水稻品种(副区因素)进行3种密度(主区因素)的栽培试验,重复3次,裂区设计,试绘制田间排列图。
第二章资料的整理与描述一、名词解释数量性状资料质量性状资料次数资料计量资料算术平均数几何平均数中位数众数调和平均数标准差变异系数二、简答题1、试验资料分为那几类?各有何特点?2、简述计量资料整理的步骤。
3、常用的统计表和统计图有哪些?4、算术平均数有哪些基本性质?三、应用题计算下面两个玉米品种的10个果穗长度(cm)的平均数、标准差和变异系数,解释所得结果。
BS24:19 21 20 20 18 19 22 21 21 19金皇后:16 21 24 15 26 18 20 19 22 19第三章常用概率分布一、名词解释随机事件概率的统计定义小概率事件实际不可能性原理正态分布标准正态分布两尾概率一尾概率二项分布标准误 t分布分布F分布二、简答题1、事件的概率具有那些基本性质?2、正态分布的密度曲线有何特点?3、标准误与标准差有何联系与区别?4、样本平均数抽样总体与原始总体的两个参数间有何联系?三、应用题1、已知随机变量~ (100, ,求的总体平均数和标准差。
第二章 资料来源与整理
山西农业大学
生物统计学
21
2. 如何作多边形图 (1)以组中值为横坐标,以次数为纵坐标,在 各个组中值的上方标注一个个点。
(2)连点成线。折线在最小组中值和最大组中
值之外各跨出一个组距的距离交于横轴。
山西农业大学
生物统计学
22
山西农业大学
生物统计学
23
3. 如何作条形图 (1)以组名或观测值为横坐标,以次 数或频率为纵坐标,绘制条形图。 (2)条形图之间有间隔。 (3)绘制复式条形图时,将同一组的 两个或两个以上亚组的条形图绘制在一 起,长条间不留间隔。
生物统计学
42
性质2
(x x)
x 4 .6
2
2
最小值
离均差的平方和为最小值。
例如: 有一样本,观测值分别为 5,5,5,4,4 则
2 2 2 2 2 2
(5 4 .6 ) (5 4 .6 ) (5 4 .6 ) ( 4 4 .6 ) ( 4 4 .6 )
山西农业大学 生物统计学 3
2. 计数资料 计数资料—指用计数方法获得的数据。计数 资料的观测值只能以整数表示,在两个相邻整数 间不允许有任何带小数的数值出现。 也成为间 断性变量。
山西农业大学
生物统计学
4
(二)质量性状资料 指能观察到而不能直接测量的性状。
需对其观察结果作数量化处理。
1. 统计次数法
2 2 2 2
(5 4 .5 ) (5 4 .5 ) (5 4 .5 ) ( 4 4 .5 ) ( 4 4 .5 )
2 2 2 2
也小于( 5 4 . 7 ) ( 5 4 . 7 ) ( 5 4 . 7 ) ( 4 4 . 7 ) ( 4 4 . 7 )
第二章统计数据资料的搜集与整理
分类:
按报送范围: 全面报表——要求调查对象中的每一个 单位均要填报 非全面报表——只要求一部分调查单位 填报 按报送日期: 月报、季报、年报 月报内容简单、时效性强 年报内容比较全面
(二)报告法
基层单位根据上级的要求,以各种原始 记录与核算资料为基础,搜集各种资料, 逐级上报给有关部门
统计报表制度
(三)观察与实验
调查者通过直接的观察或实验获得数据 的一种方法
1.直接观察法
是指就调查对象的行动和意识,调查人 员边观察边记录以收集信息的方法
由于调查人员不是强行介入,受访者无 需任何反应,因而常能够在被观测者不 觉察的情况下获得信息资料
第二章 统计数据资料的搜集与整理
第一节 统计数据资料的来源
一、统计数据资料的来源渠道 直接来源
是通过直接的调查获得的原始数据, 一般称之为第一手或直接的统计数据 主要通过统计调查获得 间接来源 是别人调查的数据,并将这些数据进 行加工和汇总后公布的数据,通常称之 为第二手或间接的统计数据
二、统计数据资料的间接来源
内容:
表式 由国家统计部门根据研究的任务 与目的而专门设计制定的统计报表表格, 用于搜集统计资料。是统计报表制度的 主体
填表说明 是对统计报表的统计范围、 指标等做出的规定,具体有填报范围、 指标解释、分类目录、其他有关事项的 规定
(四)重点调查
概念:是在调查对象中选择一部分重点 单位进行的一种非全面调查。
市场调查和社会调查常用方法
2.邮寄调查
是通过邮寄或宣传媒体等方式将调查表 或调查问卷送至被调查者手中,由被调 查者填写,然后将调查表寄回或投放到 指定收集点的一种调查方法
第二章资料的整理与基本分析
上一张 下一张 主 页
退 出
数据资料的来源
1、 实验观察所得的科学实验记录 2、 调查研究所得的资料 3、 生产记录、病理等现场资料 生产记录、
上一张 下一张 主 页
退 出
一 计量资料(数值变量) 计量资料(数值变量)
指用量测方式获得的数量性状资料,即用度、量、衡 等计量工具直接测定获得的数量性状资料。其数据是用长 度、容积、重量等来表示。这种资料的各个观测值不一定 是整数,两个相邻的整数间可以有带小数的任何数值出现 ,其小数位数的多少由度量工具的精度而定 , 它们之间 的变异是连续性的。因此,计量资料也称为连续性变异资 料。 体现:动物的各种生理、生化指标,药动力学指标等, 如血液中血红蛋白含量。
占
上一张 下一张 主 页
退 出
4周龄以上仔猪患某一疾病的记录 1.2 4周龄以上仔猪患某一疾病的记录
年龄 受检 白内障 患者周龄构 患病率 组(周) 个数 例数 成比(%) (%) ⑴ ⑵ ⑶ ⑷ ⑸=(3)/(2) 560 68 15.18 12.14 4~ 441 129 28.79 29.25 5~ 296 135 30.13 45.61 6~ 149 97 21.65 65.10 7~ ≥8 22 19 4.24 86.36 合计 1468 448 100.00 30.52
下限略小于最小值, (3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限必 ) 列出组段:第一组段的下限略小于最小值 最后一个组段上限必 须包含最大值,其它组段上限值忽略。 须包含最大值,其它组段上限值忽略。
第二章 资料的整理与基本分析
数据资料的分类 数据资料的整理 常用统计表与统计图 数据资料的特征值分析
上一张 下一张 主 页 退 出
高级生物统计学 第2章 资料整理
资料分类 资料的整理 统计量 Excel、SPSS制表、绘图和计算 功能简介
1
第一节: 资料的分类
试验观察、测量的数据按其性质不同,可分为计(数) 量资料、计(次)数资料二大类:
计(数)量资料 计(次)数资料
2
一、资料分类
计量(数量)资料:由量、测或直接计数所获 资料,取值为实数,常用连续型随机变量表示, 多服从正态分布,可用t检验、F检验作统计分 析。 计数(次数)资料:先按其性状或类别分组, 再清点各组次数所获资料,取值为正整数或零, 常用离散型随机变量表示,多服从二项分布, 可用X2检验作统计分析。
34
Excel应用(一)
求统计函数; 抽样; 作频数分布表-----频率数----直方图-----判断分布 正态性。
35
常用统计函数
频数分布函数———Frequency 平均数--------Average 几何平均数-------Geomean 样本标准差---------Stdev 样本方差----------Var 样本标准误(差)------Std. Error
进入统计状态: stat 数据输入:数据1-----DATA -----数据2---DATA-------数据N---DATA;
结果输出:直接按统计量符号即可。
33
Excel在统计中具体应用
查表(t、F、x2和r值表等) 求统计量 计算正态分布\二项分布概率 作图 抽样 统计分析 相关与回归分析
39
应用Excel作频数分布表
一法:输入样本数据,后用Frequency统 计函数; 二法:数据分析工具------直方图(接收区输 入分组区间)----频数-----折线图
Chapter 2 数据整理及数据的描述
2
• 抽样分布就是抽样均值 X 所遵循的分布。如
P
9 10 11 12 13 14 15
抽样一次,但 X 理论上应付从某种与总体 参数有关的分布
• 样本均值与样本方差
X =
S2 =
x
n 2 ( x x ) n-1
P237公式
4.2 抽样定理
X
~
N ( ,
2
n
)
• 总体为正态时成立,均值不变,密集度增加 • 一般总体,但n足够大时亦近似成立(可进一步 理解正态分布的成因)
85
60
26.5 7.3 0 10 32 66 88 100
●基尼系数
A/(A+B) 越小越均匀(公平)
●思考:与ABC分类法的关系? ●例
6,9,12,15,18 宽度定为1时,所绘图形上 可以面积表示频率大小
100 20
任何一个关于频率的直方图,可 以经适当度量变换,以分布形状 的面积大小来度量频率大小。 如某地区
3.2伯努利分布
• 抛硬币正面X=1,P(X=1)=1/2 反面X=0,P(X=0)=1/2 10个产品中2个次品,取一件,得正品为1, 次品为0。有P(X=1)=8/10,P(X=0)=1/5, 一般设P(X=1)=p P(X=0)=q=1-p(0<p<1) 可以计算E(X)=1*p+0*q=p Var(X) =(1-p)2p+(1-p)2q=q2p+p2q=pq
x1 x2 xn D( X ) D( ) n
1 2 ( D( X 1 ) D( X 2 ) ( DX n )) n
1 2 2 n n n
第2章_资料收集与整理-精选文档
表2-2 50只小鸡出壳天数的次数分布表
出壳天数 划线计数 19 ┰ 20 下 21 22 23 24 合计 正正 正正正正止 正止 ┰ 频数(f) 2 3 10 24 9 2 50 频率 0.04 0.06 0.20 0.48 0.18 0.04 1.00
表2-1 50只小鸡的出壳天数
21 20 20 21 23 22 22 22 21 22 20 23 22 23 22 1 9 22 23 2 4 22 19 22 21 21 21 22 22 24 22 21 21 22 22 23 22 22 21 22 22 23 22 23 22 22 23 23 22 21 22 22
计量资料分布表 第一组上限(第二组下限)为:44.25+1.5=45.75 第二组上限(第三组下限)为:45.75+1.5=47.25 依次类推,第三组47.2548.75; 第四组48.7550.25;…….. 依次分组下去,直到资料中的最大值归入最后一组为止。 通常将每组的上限略去不写。如第一组44.25,第二组 45.75,第三组47.25 ,…..。 5、归组划线计数,作频数分布表(“唱票式”)和频数
2、确定组数。组数要适当,一般以达到既简化资料 又不影响反映资料的规律性为原则。本例n=200, 初步确定组数为11组。
表2-3 某纯系蛋鸡200枚蛋重
单位:g
52.6 54.3 57.7 55.8 45.3 53.2 57.0 54.8 52.3 53.0 49.5 56.2 57.5 55.9 48.4 51.2 53.8 50.5 50.5 57.0 47.5 54.1 53.2 50.7 55.6 51.5 57.8 52.5 54.9 57.9 50.7 46.2 56.0 56.5 51.2 48.2 55.2 55.2 48.5 50.1 58.6 56.1 53.8 50.3 55.6 62.1 57.8 48.0 54.7 61.2 51.0 51.9 59.0 52.6 53.0 52.9 51.5 58.1 47.2 61.7 53.7 49.1 56.1 55.1 53.7 53.4 53.9 52.6 52.1 53.8 48.9 53.2 59.2 50.1 57.6 52.8 57.0 61.4 53.4 53.9 56.3 54.1 52.9 50.9 55.6 47.9 53.7 54.4 56.7 51.1 55.1 55.2 57.5 50.6 57.5 54.1 49.9 53.7 51.9 53.5 57.3 48.7 47.9 53.8 51.3 58.6 50.2 51.4
第二章资料整理和描述性统计
的工作· 只有经过检查与核对的数据才能进行统计分析,
真实地反映出调查和试验的客观情况·
第三节 资料的整理分析
•
数据的整理分析,就是要把大量复杂的数据进行整理归类 使其系统化,便于统计分析,从而得出正确的科学结论·
•
数据整理的方法,首先就是按照一定的标志,把记载数 据分门别类地分成若干部分,把同一现象、同一类型的数 据进行合并,使它们与其他现象、其他类型区别开来· 另 外,在数据整理时,要注意数据的完整性、真实性和准确 性· 对原始数据要细致地检查与核对,对那些个别极大和 极小的数值要反复核实,力求确实可靠· 数据整理的作用, 就是按不同的标志把数据的特征反映出来,以便于进一步 运用各种统计方法进行计算,来研究它们的规律性和相互 关系· 原始数据的整理,其结果需要用数字来表明,这时, 可将整理的数据制成表格,如样本较小可制成"依次表", 即将变数按数值的大小依次排列起来,形成一个由小到大 的数字表,称为"依次表"或"变异数列"·
所谓质量性状是指一些能观察到而不易直接测量的性状如颜色性别生死状态等质量性状资料简称质性资料对于质量性状的分析必须先将质量性状数量化常用方法有下列两种根据某一质量性状的类别统计其次数以次数作为质量性状的数据在分组统计时可按质量性状的类别进行分组再统计各组出现的次数例如在研究豌豆杂交试验中所观察到的花的颜色可以归类统计如下表豌豆杂交子二代花色分离情况性状分离红花白花总计次数f次数百分率70575892242411929100某校初二学生视力统计表性状分离优良视力中等视力较差视力弱视视力总计评分次数f59626对某些质量性状可以划分若干等级予以评分再统计次数例如对学生视力可作等级统计表如下表第二节原始数据的检查与核对搜集的原始数据在整理之前首先要对全部数据进行检查与核对分辨真伪力求完整真实和准确对数据检查与核对应注意以下三方面问记录不全丢失损坏遗漏记载错误笔误虚构以及测量工具不准测量技术不熟练等原因所造成的错误因此对一些特殊数值如极大或极小应反复核实以保证计算的正确与可靠取样不全或过少或非随机取样取样时加人人为因素把合乎意图的留下把不合乎意图的删掉都会影响统计的准确性当整理数据时对动物的雌与雄健康与疾病妊娠与空怀品种不同年龄不同胎次不同营养不同时间与年度不同生长状况试验因素不同等数据如进行了不合理的合并在数据检查与核对时就应加以纠正数据的检查与核对在统计处理工作中是一项非常重要的工作只有经过检查与核对的数据才能进行统计分析真实地反映出调查和试验的客观情况第三节资料的整理分析数据的整理分析就是要把大量复杂的数据进行整理归类使其系统化便于统计分析从而得出正确的科学结论数据整理的方法首先就是按照一定的标志把记载数据分门别类地分成若干部分把同一现象同一类型的数据进行合并使它们与其他现象其他类型区别开来另外在数据整理时要注意数据的完整性真实性和准确性对原始数据要细致地检查与核对对那些个别极大和极小的数值要反复核实力求确实可靠数据整理的作用就是按不同的标志把数据的特征反映出来以便于进一步运用各种统计方法进行计算来研究它们的规律性和相互关系原始数据的整理其结果需要用数字来表明这时可将整理的数据制成表格如样本较小可制成依次表即将变数按数值的大小依次排列起来形成一个由小到大的数字表称为依次表或变异数列在下表中某大学对100名女大学生测定了血清总蛋白含量scrumgl的记录在末加整理以前只是一堆数字看不出资料的任何意义100名大学生的血
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
140行水稻产量 (单位:g)
123 219 137 179 145 140 149 172 197 158 159 118 80 174 173 154 187 179 175 159 245 192 138 159 75 152 131 151 122 177 119 176 151 165 130 163 215 198 151 147 119 175 187 136 149 123 111 124 171 194 131 95 126 108 150 205 186 179 166 227 149 136 196 101 161 149 118 135 175 141 152 199 134 141 155 155 150 184 143 169 167 116 206 148 111 131 155 168 190 124 104 165 137 168 158 209 197 169 213 159
上一张 下一张 主 页 退 出
(2) 确定组数和组距
组数的多少视样本容量及资料全距的大 小而定,一般以达到既简化资料又不影响反 映资料的规律性为原则。 组数要适当,不宜过多,亦不宜过少。 分组过多或过少,资料的规律性都不能很好
的反映不出来,计算出的统计数的准确性也
较差。
上一张 下一张 主 页 退 出
由于相邻两组的组中值之差等于组距,所
以当第一组的组中值确定后,加上组距就是第
二组的组中值,第二组的组中值加上组距就是
第三组的组中值,其余类推。
上一张 下一张 主 页
退 出
在资料分组时:
通常第一组的组中值以接近或等于资 料中的最小观测值为好。
第一组的组中值确定后,则该组组限 也随之确定,其余各组的组中值和组限 也可相继确定。 注意,最后一组的上限应大于资料中 的最大值。
计量资料,分组前需要确定全距、 组数、组距、组中值及组限,然后 将全部观测值归组制成次数分布表。
(1)求全距
全距是资料中最大值与最小值之差,又称 为极差,用R表示,即 R=Max(x)-Min(x)
表2-4中,水稻产量最大观测值为254g,
最小观测值为75g,全距为: R = 254 – 75 = 179(g)
上一张 下一张 主 页
退 出
常用的统计图有柱形图、折线图或饼图等。
图形的选择取决于资料的性质。
计量资料采用柱形图、折线图; 计数资料、质量性状资料采用条形图、饼图。
以15g作为组距。
上一张 下一张 主 页
退 出
(3)确定组限和组中值
各组的最大值与最小值称为组限,最小
值称为下限,最大值称上限。每一组的中点 值称为组中值,是该组的代表值。组中值与 组限、组距的关系为:
组中值 = (组下限+组上限)/2
= 组下限 + 组距/2
= 组上限 - 组距/2
上一张 下一张 主 页 退 出
最后一组记为247.5— 。
上一张 下一张 主 页 退 出
(4)归组、制作次数分布表
将资料中的每一观测值逐一归组,然后 制成次数分布表。 如表2-4中,第一个观测值177,应归入 表2-6中第8组; 第二个观测值215,应归入第10组;
依次把140个观测值都进行归组,制成 次数分布表,见表2-6。
上一张 下一张 主 页
退 出
2、计数资料
指用计数方法获得的数量性状资料。计
数资料的观察值只能以整数表示,在两个相
邻整数间不允许有任何带小数的数值出现。 各个观察值是不连续的。因此,计数资 料也称为不连续性变异资料或间断性变异资 料。
上一张 下一张 主 页
退 出
(二)质量性状资料 质量性状又称属性性状。
表2-6
组 限
140行水稻产量数据的次数分布表
划线计数 次数(ƒ) 累加次数
组中值 (x)
67.5— 82.5— 97.5— 112.5— 127.5— 142.5— 157.5— 172.5— 187.5— 202.5— 217.5— 232.5— 247.5—
合计(n)
75 90 105 120 135 150 165 180 195 210 225 240 255
予以核查。
3、质量性状资料的整理 对于质量性状资料可按性状或属性进行
分组,分别统计各组的次数,然后制成次数
分布表。 例如,水稻杂种F2植株米粒性状的分离
情况,见表2-7。
上一张 下一张 主 页 退 出
表2-7 水稻杂种F2植株米粒性状分离情况
性状分组
红米非糯 红米糯稻 白米非糯 白米糯稻 合 计
第二章 资料的整理与描述
在试验研究中,通过观察、测量和记载, 可获得大量的原始数据资料。这些资料往往是 零乱的,无规律性可循。 通过对资料的整理,才能发现其内部联系 和规律性;
退
出
第一节
资料的整理
一、资料的分类
在田间试验中,由观察、测量所得的资 料,按其性质的不同,一般可分为两大类: (一)数量性状资料 (二)质量性状资料
这类性状本身不能直接用数值表示,要
获得这类性状的数据资料,须对其观察结果
作数量化处理,方法有以下两种:
1、统计次数法
பைடு நூலகம்
2、评分法
上一张 下一张 主
页 退
出
1、统计次数法
在一定的总体或样本内,根据某一质量性状的
类别统计其次数,以次数作为质量性状的数据。
【例如】,孟德尔的红花豌豆与白花豌豆的杂 交试验,统计F2不同花色的植株时,在1000株植株 中,有红花266株、紫花494株、白花240株。 这种利用统计次数法对质量性状数量化得来的
140
实际组数(13组)比原来确定组数(12组) 多一组原因:由于第一组的组中值等于最小 观测值,故第一组的下限小于最小观测值, 实际上增加了1/2组,这样也使最后一组的组 中值接近于最大值,又差不多增加了1/2组,
所以实际组数比原来确定组数多一组。
上一张 下一张 主 页
退 出
利用次数分布表不仅便于观察资料的 规律,还可根据它绘成次数分布图和计算 平均数、标准差等统计数。 在归组时应注意:不要重复或遗漏, 通过将各组的次数相加是否等于样本容量
2、计量资料的整理
【例如】表2-4中为水稻产量调查结果。
上一张 下一张 主 页
退 出
表2-4
177 161 214 98 163 131 183 116 173 192 215 214 95 97 176 189 97 254 181 231 197 125 158 129 102 91 119 239 188 163 97 175 83 143 194 142 181 160 211 159
次数(ƒ)
96 37 31 15 179
频率(%)
54 21 17 8 100
上一张 下一张 主 页
退 出
四、 常用统计表与统计图
统计表:用表格形式来表示数据间的数量关系; 统计图:用几何图形来表示数据间的数量关系。 使用统计表和统计图,可以把研究对象的特征、 内部构成、相互关系等简明、形象地表达出来, 便于比较分析。
资料中的最大值254为止。 分组为: 67.5—82.5, 82.5—97.5, …… , 247.5—262.5。
为了使恰好等于前一组上限和后一组
下限的数据能确切归组,约定将其归入后
一组,即约定“上限不在内”。
通常将上限略去不写:
如第一组记为67.5— ;
第二组记为82.5— ;
第三组记为97.5— ; „„ ;
表2-4中,最小观测值为75,选取75为第 一组的组中值;因组距为15,所以 第一组的下限为75-15/2=67.5; 第一组的上限也就是第二组的下限为
67.5+15=82.5;
第二组的上限也就是第三组的下限为 82.5+15=97.5;
上一张 下一张 主 页 退 出
依此类推,一直到某一组的上限大于
上一张 下一张 主 页
退 出
上述 100 个麦穗的每穗小穗数在 15—20范围内变动,变异范围不大。以 每一个观察值为一组,共分为6组。把所 有观察值按每穗小穗数予以归组,可得表 2-2形式的次数分布表。
表2-2
100个麦穗每穗小穗数的次数分布表
划线计数 次数(ƒ)
每穗小穗数(x)
15 16 17 18 19 20 ╫╫ ╫╫ ╫╫ ╫╫ ╫╫ ╫╫
小穗数,原始数据列于表2-1。
上一张 下一张 主 页
退 出
表2-1
18 17 17 18 17 17 17 18 18 15 15 18 16 15 19 19 19 19 17 16 17 17 17 16 15 19 16 18 18 18
100个麦穗的每穗小穗数
19 16 19 18 17 17 16 18 20 17 16 18 18 18 17 19 17 19 19 18 15 20 18 18 17 17 17 19 16 17 20 19 17 17 16 18 17 20 18 17 18 17 17 20 17 16 15 17 19 16 19 16 17 19 18 18 17 16 17 19 17 18 18 18 18 17 16 19 16 17
二、资料整理的方法
根据样本大小确定是否分组:
对小样本(n≤30)资料,可按观察值 进行分组。 当样本较大(n>30)时,宜将观测值 分成若干组,制成次数分布表,以了解资料 集中与分散的情况。
不同类型的资料,整理方法不同。
上一张 下一张 主 页 退 出
1、计数资料的整理
对于观察值不多、变异范围不大的计 数资料,以每一观察值为一组进行分组, 然后制成次数分布表。 【例如】随机调查100个麦穗,计数每穗
律性较明显,如表2-3所示。