第二章 试验资料的整理与特征数的计
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.0467
0.1600 0.3467 0.6133 0.7800 0.8973 0.9333 0.9800 0.9933 1.0000
表2-4 150尾鲢鱼体长(cm)
56 49 62 78 41 47 65 45 58 55 59 65 69 62 73
52 52 60 51 62 78 66 45 58 58 60 57 52 51 48
(一)原始资料的检查与核对 核对 调查 试验 原始 数据 检查
订正
检查和核对原始资料的目的:确保原始资料的完 整性和正确性。
(二)次数分布
三、试验资料的整理
由不同区组内观察值出现的次数组成的分布,叫
次数分布。
次数分布表:将数据资料分组,统计各组次数,并 计算其频率和累积频率,制成表格。 次数分布图:将分组作横坐标,次数作纵坐标,将 各组及其次数用柱形、线段、点等形状表示在坐标系
质量性状资料/属性性状资料
质量性状资料方法: 分级法:将所看到的质量化的特征分为等级,每一等级用 适当的数值表示。如 花卉分级,可根据花冠大小分为1级、 2级等。苹果、梨等可根据果实横径大小分为80、85、90。 评分法:类似体操比赛,请专家打分,用评分进行统计分 析。 统计次数法:统计某性状出现/不出现的次数。0、1现象, 如产品合格率,合格为1,不合格为0,分别统计0和1的次
数进行分析。属于次数资料。
秩次法:排序(按质量性状的好坏依次排序),排队的序 号为秩,用各处理的秩和进行统计分析。
化学分析法:用化学方法分析得出数据,如叶色可用叶绿
素含量表示等。
第一节:试验资料的搜集与整理
一、试验资料的类型 二、试验资料的搜集 三、试验资料的整理
调 查 资料搜集的方法 试 验
一、调查 调查是对已经存在的事情的资料按某种方案进行 收集的方法。资料的调查又可以分为两种:普查和抽 样调查。 1、普查 是对研究对象的全部个体逐一进行调查的方法。 普查一般要求在一定的时间或范围进行,要求准确和
5 4 3 2 1
14 36 97 53 7
三、试验资料的整理
2 次数分布图和频率分布图
作次数(频率)分布时,资料分组方法同次数 分布表,将分组作横坐标,次数(频率)作纵坐 标,将各组及其次数(频率)用柱形、线段、点 等形状表示在坐标系中,即绘成资料分布图。
特点:直观、形象 包括:条形图、直方图、多边形图、饼图和散点图
1 条形图(bar chart),
又称柱形图
40 35 30 25 20 15 10 5 0 11 12 13 14 15 16 17
计数资料
图2.1 月产蛋数次数分布柱形图
0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 11 12 13 14 15 16 17
特点:
柱形之间要间隔一定的距离
表2-2 每月产蛋数
100只来亨鸡每月产蛋数次数分布表 次数 Frequency 频率 Percent 0.02 0.07 0.19 0.35 0.21 累积频率 Cumulative Percent 0.02 0.09 0.28 0.63 0.84
11 12 13 14 15
2 7 19 35 21
11~17
分为7组
统计各组次数 计算频率和累积频率 制表
15 16 16 14 13 14 15 13 15 13
15 15 15 14 14 16 14 15 17 13 16 14 16 15 13 14 14 14 14 16 12 13 12 14 12 15 16 15 16 14 13 15 17 14 13 14 12 17 14 15
图2.2 月产蛋数频率分布柱形图
2 饼图(pie chart)
17 16 11 12
13
计数资料
15
质量性状资料
14
图1 来亨鸡月产蛋次数分布图
3 直方图 (histogram),又称矩形图
计量资料
特点:
各组之间没有距离
35 40 45 50 55 60 65 70 75 80 85 90
图2.3 鲢鱼体长次数分布图
63 75 65 48 52 55 54 62 71 48 62 58 46 57 38 54 53 65 42 83 66 48 53 58 46 46 26 36 76 55
R=Xmax- Xmin
=85-37 =48(cm)
60 54 58 49 52 56 82 63 65 54 75 65 86 46 77
组距=全距/组数=48/10=4.8
5cm
(3)确定组限(class limit)和组中值(class midvalue)
上限
组限 是指每个组变量值的起止界限。 下限 组中值 是两个组限的中间值。它可作为各组的代表 值,最好取整数或与观察值位数一致。
下限+上限 组中值= 2 = 下限+ 组距 2 = 上限- 组距 2
步计算是否方便。
组数 组距
多 少
小 大
统计数精确,计算不方便 统计数不精确,计算方便
表2-5
样本容量与分组数的关系 分组数 5~8 7 ~ 10 9 ~ 12
组数的确定
样本容量 30~60 60 ~ 100 100 ~ 200
200 ~ 500
>500 组距的确定
10 ~ 18
15 ~ 30
即每组内的上下限范围。一般取整数。
中。
目的:初步看出资料的集中和变异情况,对资料 有一个初步的直观印象。
三、试验资料的整理
1 次数分布表
计量资料的整理 计量资料一般采用组距式分组法。
全距
组数
组距
制表
归组
组限
表2-6
组限
150尾鲢鱼体长的次数分布表
组中值 次数 Frequency 频率 Percent 0.0200 累积频率 Cumulative Percent 0.0200
0.0467
0.1600 0.3467 0.6133 0.7800 0.8973 0.9333 0.9800 0.9933 1.0000
三、试验资料的整理
计数资料的整理 计数资料基本上采用单项式分组法进行整理。 特点:用样本变量自然值进行分组,每组用 一个或几个变量值来表示。
对于变异较小的计数资料,可按观察值直接分组。
第二章
试验资料的整理 与 特征数的计算
目的要求:
熟悉不同类型资料的整理和相关统计图表的制法。 掌握常用几种平均数和变异数的基本概念及计算 方法。
第一节:试验资料的搜集与整理
一、试验资料的类型
二、试验资料的搜集 三、试验资料的整理
对试验资料进行分类是统计归纳的基础。
计数资料/非连续变量资料 试 验 资 料 类 型 数量性状资料 计量资料/连续变量资料
70 69 40 56 58 61 54 53 52 43 52 64 58 58 54 78 52 56 61 59 54 59 64 68 51 59 68 63 52 63
(2) 确定组数和组距(class boundary)
组数是根据样本观测数的多少及组距的大小来
确定的,同时考虑到对资料要求的精确度以及进一
对于变异较大的计数资料,可用处理计量资料的方法 制作次数分布表。
表2-1
100只来亨鸡每月的产蛋数
来亨鸡每月产 蛋数变动范围:
15 17 12 14 13 14 12 11 14 13 16 14 14 13 17 15 14 14 16 14 14 15 15 14 14 14 11 13 12 14 13 14 13 15 14 13 15 14 13 14
(4) 分组
确定好组数和各组上下限后,可按原始资料中各观 测值的次序,将各个数值归于各组,计算各组的观 测数次数、频率、累积频率,制成一个次数分布表。
卡片法
计数的方法
画“正”字
唱票法
临界值就高不就低。
画“
”
表2-6
组限
150尾鲢鱼体长的次数分布表
组中值 次数 Frequency 频率 Percent 0.0200 累积频率 Cumulative Percent 0.0200
35~
37.5
3
40~
45~ 50~ 55~ 60~ 65~ 70~ 75~ 80~ 85~
42.5
47.5 52.5 57.5 62.5 67.5 72.5 77.5 82.5 87.5
4
17 28 40 25 17 6 7 2 1
0.0267
0.1133 0.1867 0.2666 0.1667 0.1133 0.0400 0.0467 0.0133 0.0067
试验是对已有的或没有的事物加以处理的方法。
常见的试验设计方法有:对比设计、随机区组设
计、平衡不完全区组设计、裂区设计、拉丁方设计、
正交设计、正交旋转设计等等。
试验设计须遵循的三大原则是:随机、重复和局
部控制。
第一节:试验资料的搜集与整理
一、试验资料的类型 二、试验资料的搜集 三、试验资料的整理
三、试验资料的整理
最小一组的下限必 须小于资料中的最小值, 最大一组的上限必须大 于资料中的最大值; 组限可取到10分位 或5分位上;
58 52 54 55 66 52 48 56 75 72 57 37 46 76 56
63 75 65 48 52 55 54 62 71 48 62 58 46 57 38 54 53 65 42 83 66 48 53 58 46 46 26 36 76 55
每穗粒数
18-22 23-27 28-32 33-37 38-42 43-47 48-52 53-57 58-62
3 18 38 51 68 53 41 22 6
对于质量性状的次数分布表,可按性
状代表级数的出现次数进行制作。
果实着色分级 代表值 果wenku.baidu.com数
全红 >2/3果面红色 1/3-2/3果面红色 <1/3果面红色 全绿
4 多边形图(polygon),又称折线图(broken-line chart)
45 40 35 30 25 20 15 10 5 0
16
17
11
5
0.11
0.05
0.95
1.00
1 自然值进行分组,最大值17,最小值11。
2 数据主要集中在14,向两侧分布逐渐减少。
表2-3
小麦品种300个麦穗穗粒数的次数分布表
次数 Frequency 频率 Percent 0.0100 0.0600 0.1267 0.1700 0.2267 0.1766 0.1367 0.0733 0.0200 累积频率 Cumulative Percent 0.0100 0.0700 0.1967 0.3667 0.5934 0.7700 0.9067 0.9800 1.0000
56 46 58 70 72 76 77 56 66 58 58 55 53 50 65 63 57 65 85 59 58 54 62 48 63 46 61 62 57 38
(1) 求全距,又称 极差 (range):
58 52 54 55 66 52 48 56 75 72 57 37 46 76 56
35~
37.5
3
40~
45~ 50~ 55~ 60~ 65~ 70~ 75~ 80~ 85~
42.5
47.5 52.5 57.5 62.5 67.5 72.5 77.5 82.5 87.5
4
17 28 40 25 17 6 7 2 1
0.0267
0.1133 0.1867 0.2666 0.1667 0.1133 0.0400 0.0467 0.0133 0.0067
全面。
2、抽样调查
是根据一定的原则从研究对象中抽取一部分具有代表性的 个体进行调查的方法。生物学研究中,进行普查的情况较少, 多数情况下还是进行抽样调查。 随机抽样必须满足2个条件: 一是总体中每个个体被抽中的机会是均等的;
二是总体中任意一个个体是相互独立的,是否被抽中不受
其他个体的影响。
二、试验
表2-4 150尾鲢鱼体长(cm)
56 49 62 78 41 47 65 45 58 55 59 65 69 62 73
52 52 60 51 62 78 66 45 58 58 60 57 52 51 48
56 46 58 70 72 76 77 56 66 58 58 55 53 50 65 63 57 65 85 59 58 54 62 48 63 46 61 62 57 38
60 54 58 49 52 56 82 63 65 54 75 65 86 46 77
70 69 40 56 58 61 54 53 52 43 52 64 58 58 54 78 52 56 61 59 54 59 64 68 51 59 68 63 52 63
35~,40~, 45~,…,85~。