第二章 生物统计 资料的整理
《生物统计附试验设计》第五版-课后习题(前六章)(完整资料).doc
此文档下载后即可编辑生物统计第一章绪论1.什么是生物统计?它在动物科学研究中有何作用?2.什么是总体、个体、样本、样本容量?统计分析的两个特点是什么?3.什么是参数、统计数?二者有何关系?4.什么是试验或调查的准确性与精确性?如何提高试验或调查的准确性与精确性?5.什么是随机误差与系统误差?如何控制、降低随机误差,避免系统误差?6.统计学发展的概貌可分为哪三种形态?拉普拉斯、高斯、高尔顿、皮尔森、哥塞特、费舍尔对统计学有何重要贡献?第二章资料的整理1.资料可以分为哪几种类型?它们有何区别与联系?2.为什么要对资料进行整理?对于计量资料,整理成次数分布表的基本步骤是什么?3.统计表与统计图有何用途?常用统计表、统计图有哪些?编制统计表、绘制统计图有何基本要求?4.某品种100头猪的血红蛋白含量资料单位:g/100ml列于下表,将其整理成次数分布表,并绘制次数分布直方图与折线图。
表格1 4某品种100头猪的血红蛋白含量(g/100ml)13. 4 13.814.414.714.814.413.913.13.12.812.512.312.111.811.10.111. 1 10.111.612.12.12.712.613.413.513.514.15.15.114.113.513.513. 2 12.712.816.312.111.711.210.510.511.311.812.212.412.812.813.313. 6 14.114.515.215.314.614.213.713.412.912.912.412.311.911.110.710. 8 11.411.512.212.112.89.512.312.512.713.13.113.914.214.912.413. 1 12.512.712.12.411.611.510.911.111.612.613.213.814.114.715.67 7 0 95.1~9周龄大型肉鸭杂交组合GW和GY的料肉比列于下表,绘制线图。
生物统计学:第二章 试验资料整理与特征数计算
在归组划线时应注意,不要重复或遗漏,归组划 线后将各组的次数相加,结果应与样本含量相等。
在分组后所得实际组数,有时和最初确定的组数 不同。如第一组下限和资料中的最小值相差较大或实 际组距比计算的组距为小,则实际分组的组数将比原 定组数多;反之则少。
(三)质量性状资料、半定量(等级)资料的整理 可按性状或等级进行分组,分别统计各组的次数,然 后制成次数分布表。
第一组的下限为: 37.5-(1/2)×3.0=36.0;
第一组的上限也就是第二组的下限为: 36.0+3.0=39.0;
第二组的上限也就是第三组的下限为: 39.0+3.0=42.0,……,
以此类推,一直到某一组的上限大于资料中的最 大值为止。 于是可分组为:
36.0 39.0,39.0 42.0,……。
组距确定后,首先要选定第一组的组中值。在分 组时为了避免第一组中观察值过多,一般第一组的组 中值以接近或等于资料中的最小值为好。第一组组中 值确定后,该组组限即可确定,其余各组的组中值和 组限也可相继确定。注意,最末一组的上限应大于资 料中的最大值。
表2.4中,最小值为37.0,第一组的组中值取37.5, 因组距已确定为3.0,所以
表2.5 样本含量与组数 本例中,n=126,确定组数为10组。
3、确定组距
每组最大值与最小值之差称为组距(i)。分组时 要求各组的组距相等。
组距(i)=全距/组数
本例
i=28.0/10≈3.0
4、确定组限及组中值 各组的最大值与最小值称为组限。每一组的中点 值称为组中值,它是该组的代表值。组中值与组限、 组距的关系如下: 组中值=(组下限+组上限)/2
表2.7 F2代山羊的有角无角分离情况
三 常用统计表与统计图
高级生物统计学第2章资料整理
计量资料 量、测 实数 或直接计数
正态分布 t 检验、 F检验
次数资料 先分组, 正整数 二项分布 X2检验
再计数
零
5
例一: 次数资料
采用二种不同生殖激素处理奶水牛发情结果如下:
处理 总母牛数 发情数
A激素 46
34
B激素 51
48
试分析两种激素效果有无显著差异。
6
例二:计量资料
采用二种不同生殖激素处理奶水牛发情结果如下:
39
应用Excel作频数分布表
一法:输入样本数据,后用Frequency统 计函数;
二法:数据分析工具------直方图(接收区输 入分组区间)----频数-----折线图
40
四、实例
北京肉鸭平均生长速度计算; 仔猪体内抗体效价计算; 发情期母畜生殖激素变化曲线。
41
测定北京肉鸭各周龄(x)与平均体重(g , y) 如下:
1、描述样本方法
二种受精方法体外受精效果比较 方法 卵子数 卵裂率(%) 囊胚率(%) A法 611 50.30±9.29 19.9±4.31a B法 753 57.79±7.56 21.00±2.49b
注: 未能注明是标准差还是标准误; 重复数是多少; 字母顺序有误。
32
计算器作统计运算
4
4
4.1
256
128
32
16
8
4.2
128
128
32
8
4
4.3
256
128
32
16
8
5
5.1
128
64
32
16
8
5.2
256
生物统计-第2章 资料的整理
又称为极差(range),用R表示,即
R=Max(x)-Min(x)
本例 R=65.0-37.0=28.0(kg)
上一张 下一张 主 页
退 出
2、确定组数
组数的多少视样本含量及资料的变动范 围大小而定,一般以达到既简化资料又不影 响反映资料的规律性为原则。组数要适当, 不宜过多,亦不宜过少。分组越多所求得的 统计量越精确,但增大了运算量;若分组过 少,资料的规律性就反映不出来,计算出的
第二节
资料的整理
一、资料的检查与核对 检查和核对原始资料的目的在于确保原始 资料的完整性和正确性。 所谓完整性是指原始资料无遗缺或重复。 所谓正确性是指原始资料的测量和记载无 差错或未进行不合理的归并。
上一张 下一张 主 页
退 出
检查中要特别注意特大、特小和异 常数据(可结合专业知识作出判断)。对 于有重复、异常或遗漏的资料 ,应予以
第二章 资料的整理
上一张 下一张 主 页
退 出
本章主要内容
第一节 第二节 资料的分类 资料的整理
第三节
常用统计表与统计图
由调查或试验收集来的原始资料,往 往是零乱的,无规律性可循。只有通过统 计整理,才能发现其内部的联系和规律性, 从而揭示事物的本质。资料整理是进一步 统计分析的基础,本章首先介绍资料的分 类,然后介绍不同类型资料的整理方法。
上一张 下一张 主 页 退 出
由于相邻两组的组中值间的距离等
于组距,所以当第一组的组中值确定以 后,加上组距就是第二组的组中值,第 二组的组中值加上组距就是第三组的组
中值,其余类推。
组距确定后, 首先要选定第一组
的组中值。在分组时为了避免第一组中
观察值过多,一般第一组的组中值以接
生物统计第二章资料的整理与描述
大样本与小样本; 随机样本(random sample);
非随机样本(non-random sample)。
总体与样本的关系
由样本推断总体虽然有很大可靠 性,也有一定错误率。俗语说“不 可不信,不可全信”,这是我们对 待统计推断的正确态度。
2、参数与统计数 用总体的全体观察值计算的、描述总 体的特征数称为参数(parameter)。
玉米的穗行数等
上一张 下一张 主 页 退 出
(二)质量性状资料
质量性状是指只能观察而不能测量的性状。
如花药、种子、果实、叶片的颜色、籽粒的
饱满度、芒的有无等。 质量性状本身不能用数值表示,要获得这 类性状的资料,须对其观察结果作数量化
处理。数量化方法可分为以下两种:
统计次数法 评分法
上一张 下一张 主
页 退
出
1、统计次数法
在一定的总体或样本内,根据某一质量性状的
类别统计其次数,以次数作为质量性状的数据。
【例如】红花豌豆与白花豌豆的 【例如】 玉米果穗 杂交试验,统计F2不同花色植株, 上甜粒与 在1000个F2植株中,红花266株、 非甜粒的 分离比率。 紫花494株、白花240株。 这种利用统计次数法对质量性状 数量化得来的资料又叫次数资料。
这一条件的约束,能自由变动的
离均差的个数是 n-1 。当 n-1 个离均差确定 后,第n个离均差也就随之而定,不能再任 意变动。
【例】有5个观察值3、4、6、8、9,其平均数6。
5个察值的离均差为-3,-2,0,2,3,满足:
(x x) 0
一般,在计算离均差平方和时,若约束条 件为k个,则其自由度dƒ=n-k。
如:总体平均数 ---- μ
生物统计学 第二章 资料的整理
1.6 划线归组,作次数分布表
资料的整理
规律:螭(chi)霖体长变异范围在7-16;大部分数据集中在9-13; 分布的中心趋向11.5;两头小、中间大的分布趋势。
资料的整理
2.间断性资料(计数资料)的次数分布表 单向分组法进行整理。常用变量的自然数值进 行分组,每组用一个变量值表示。然后把各个观察 值归入相应的组内。
资料的整理
1.5 确定组限 组下限=组中值-1/2组距;组上限=组中值 +1/2组距。本题:第一组下限=7.5-1/2*1=7,上 限7.5+1/2*1=8,所以,本题的分组为7-8;8-9; 9-10;…。 约定:当各组上限为整数时减去0.1,一位小 数时减去0.01; 本资料的分组可改写为7-7.9;88.9;…;这个样可解决临界值‘8’的分组归属。 这样8就归为第二组。
资料的整理
圆形图 用于表示计数资料、质量性状资料或半 定量资料的构成比例。 图1.某渔场鱼苗放养情况 鲢鱼 鲤鱼 鳜鱼 草鱼
524
351
126
438
资料的整理
线图
用于表示事物或现象随时间而变化发展的情况
资料的整理
多边形图 用于表示连续性资料的次数分布。横 轴表示组中值,纵轴表示次数。
30 25
资料的整理
资料的整理
2、统计图 直观清楚的表示数据分布规律,常用于PPT等报告。 2.1 基本要求 标题简明扼要,列于图的下方。 纵、横两轴应有刻度,注明单位。 横轴由左至右、纵轴由下而上,数值由小到大。 图中需用不同颜色或线条代表不同事物时,应有
图例说明。
资料的整理
2.2 范例 长条图 展示某一指标划分属性种类或等级的次数 或频数分布。
样本含量(n) 10—100 100—200 200—500 500以上 组 数 7—10 9—12 12—17 17—30
第二章生物统计课件
用计数方式
各观察值不一定是整数 各观察值只能是整数
两相邻的整数间可以有 两个相邻整数不得有任 带小数的任何数值出现 何带小数的数值出现
变异是连续性的
变异不连续性
体重、体尺、剪毛量、产 产仔数、产蛋数、鱼的尾
蛋量、日增重等
数、寄生虫虫卵数等
二、质量性状资料
质量性状是指只能观察而不能直接测量的性 状。 这类性状本身不能直接用数值表示,要获得这 类性状的数据资料,须对其观察结果作数量 化处理。 数量化方法——统计次数法(次数资料) 根据某一质量性状的类别统计其个体数(频 数)
组别
组中值 画线计数 次数(f)
44.15—
45.0
3
45.85—
46.7
6
47.55—
48.4
16
49.25—
50.1
22
50.95—
51.8
30
52.65—
53.5
44
54.35—
55.2
28
56.05—
56.9
30
57.75—
58.6
12
59.45—
60.3
5
61.15—
62.0
3
62.85 —
63.7
1
合计
200
直方图(图2-6,P19)
以每组的组限为宽、次数为高作矩形 (横轴标记组限,纵轴标记次数)
折线图(图2-7, P19 )
横坐标标记组中值,纵坐标标记次数, 以组中值为横坐标,次数为纵坐标描 点,用线段依次连接这些点
(三)质量性状资料、半定量(等 级)资料的整理
• 可按性状或等级进行分组,分别统计 各组的次数,然后制成次数分布表和 次数分布图。
[理学]生物统计 第二章 资料整理2
2.7 离散趋势的度量
一、平均数的代表程度与样本的变异程度有关
一个样本内有很多的变数,用平均数作为样本 的代表,其代表程度决定于样本内各个变数的变异 程度。 1.如果各个变数相同或者变异程度比较小,则平均 数能够代表整个样本。 2.如果各个变数的变异程度比较大,则平均数的代 表性就小。 因此,单靠平均数不能全面、正确地了解样 本。也不能了解平均数作为样本的变异程度
(70-78.6)+(72-78.6)+(80-78.6)+ (83-78.6)+(88-78.6) =(-8.6)+(- 6.6)+ 1.4+ 4.4+ 9.4 = 0
2.6.1 算术平均数
(二)离均差平方和最小:一个样本的各个观察值 与平均数之差的平方和比各个观察值与任意其他数 之差的平方和小。即:
2.6.2 几何平均数
【例】 某波尔山羊群1997—2000年各年度的存 栏数见表,试求其年平均增长率。
2.6.2 几何平均数
G=
1 lg [ (lg x1 lg x 2 lg x n )] n
1
=lg-1[(-0.368-0.398–0.602)] =lg-1(-0.456)=0.3501
2.6.6 各个集中趋势度量指标之间的关系和评价
例:一家小企业13个员工工资为:13500,11500, 11000,9000,8500,8000,6500,6000,3500, 3500,3500,3500,3000元。 如果低工资的员工抱怨工资低,老板可以用算术平均 数消除员工不满,我们平均有7000元收入。 如果慈善机构来募捐,他会搪塞说,我们多数人工资 才3500元(众数)。 在别的场合,他又可以用中位数6500元。 对于学过统计的人来说,不能盲目接受别人说的一个 统计指标,而应对数据进行分析并作出科学的评价。
生物统计学 第二章 统计数据与数据整理
统计数据的特点
(1)一组数据;
(2)具有变异性, 故又称为变量。
(3)变量取值取决于随机取到的个体, 但全部个体所有取值又有规律可循。
第一节
频数分布
两种类型的数据
(1) 连续型数据:变量的取值是一个范围, 即变量可以在某个区间内连续取值。 (2) 离散性数据:试验只有若干确定的结果, 变量的取值可一一列出。
1; 3; 5; 9
如何判断比较它们的变异程度较为合理?
引入变异系数CV 的概念
则可比较上述A、B样本的变异系数CV
3. 中数 样本中观察值从小到大依次排列,居 中间位置的观察值,如观察值个数为偶数, 以中间二个观察值的算术平均数为中数。 4、众数,M0 出现次数最多的一数或次数最多一组的 中点值。
第四节 变异数
表示样本内观察值的变异程度的统 计数,如极差、方差、标准差和变异系
数。
1. 极差
样本中最大观察值与最小观察值的
权数两种表现形式:一是绝对数(频数), 另一个是用相对数(频率)表示。 频数(f) 频率(f/∑f), 为权数系数 .
加权平均数:
算术平均数的几个特性 :
2. 几何平均数G
例:番茄遗传中,曾有从亲本果重预测F1果重。
主要用的还是 x . 总体平均数用μ表示:
可以用
x 估计无限总体的μ值。
二、频数表和频数图(数据整理或资料整理)
频数:实际次数,频率:以百分率表示。
连续性数据分组的一般性设计
离散性数据
直方图
离散型数据亦可分组。
说明及讨论
(1)原始数据中,极差=最大值-最小值; (2)每组的最大值与最小值,称为组限,即组的界 限,大的称为上限,小的称为下限。 (3)组的中点值=(上限+下限)/2,如第一 组为155.5 。组距=上限-下限。
生物统计学重要知识点
生物统计学重要知识点生物统计学重要知识点(说明:下列知识点为考试内容,没涉及的不需要复习。
注意加粗的部分为重中之重,一定要弄懂。
大家要进行有条理性的复习,望大家考出好成绩!)第一章概论(容易出填空题和名词解释)1、生物统计学的目的、内容、作用及三个发展阶段2、生物统计学的基本特点3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作4、会区分误差(随机误差和系统误差)与错误以及产生的原因5、会区分准确度和精确度第二章试验资料的整理与特征数的计算(容易出填空和名词解释)1、随机抽样必须满足的两个条件2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性4、会求极差、方差、标准差和变异系数,理解标准差的性质第三章概率与概率分布(选择、填空和计算)1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用2、概率密度函数曲线的特点和大数定律3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾5、样本平均数差数的分布第四章统计推断(计算)1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据小概率原理做出是否接受无效假设的判断2、总体方差已知和未知情况下如何进行U检验3、一个样本平均数的t检验(例)成组数据平均数比较的t检验(例和)4、一个样本频率的假设检验(例),知道连续性矫正5、参数的区间估计(置信区间)和点估计第五章X2检验(计算)1、X2检验的原理和条件,以及进行连续性矫正的条件和方法2、适合性检验(例和)3、独立性检验:掌握2*2列联表的X2值的两种求法(例)第六章方差分析(计算)1、平方和与自由度的分解、计算方差、F检验2、掌握多重比较的LSD法,会用标记字母法和梯形法3、组内观测次数相等和不等的方差分析(例和)4、方差分析缺失数据的估计中弥补缺失数据的原则第七章直线回归与相关分析(填空、选择)1、回归和相关的概念,回归截距和回归系数的统计学意义,回归方程的三个基本性质2、直线回归的变异来源,每一部分的平方和的计算3、相关分析的相关系数和决定系数的意义第十章试验设计及其统计分析(填空、选择)1、试验设计的基本原则2、正交表及其特点(两个性质和两个特性)3、知道如何选用合适的正交表和设计表头4、正交设计试验结果的统计分析:利用极值R确定关键因子并选出最优组合(例)。
生物统计:资料的整理
资料的整理由调查或试验收集来的原始资料,往往是零乱的,无规律性可循。
只有通过统计整理,才能发现其内部的联系和规律性,从而揭示事物的本质。
资料整理是进一步统计分析的基础,本章首先介绍资料的分类,然后介绍不同类型资料的整理方法。
第一节资料的分类正确地进行资料的分类是资料整理的前提。
在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可以分为数量性状资料、质量性状资料和半定量(等级)资料三大类。
一、数量性状资料数量性状(quantitative character)是指能够以量测或计数的方式表示其特征的性状。
观察测定数量性状而获得的数据就是数量性状资料(data of quantitative characteristics)。
数量性状资料的记载有量测和计数两种方式,因而数量性状资料又分为计量资料和计数资料两种。
(一)计量资料指用量测手段得到的数量性状资料,即用度、量、衡等计量工具直接测定的数量性状资料。
其数据是用长度、容积、重量等来表示,如体高、产奶量、体重、绵羊剪毛量等。
这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精度而定,它们之间的变异是连续性的。
因此,计量资料也称为连续性变异资料。
(二)计数资料指用计数方式得到的数量性状资料。
在这类资料中,它的各个观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现。
如猪的产仔数、鸡的产蛋数、鱼的尾数、母猪的乳头数等,这些观察值只能以整数来表示,各观察值是不连续的,因此该类资料也称为不连续性变异资料或间断性变异资料。
二、质量性状资料质量性状(qualitative character)是指能观察到而不能直接测量的性状,如颜色、性别、生死等。
这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:(一)统计次数法在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。
生物统计2
表5 白猪和黑猪子二代的毛色分离情况
毛色 白色 黑色 花色 合计 次数(f) 332 96 22 450 频率/% 73.78 21.33 4.89 100.00
由质量性状数量化得来的资料又叫次数资料。
• 等级资料(ranked data)亦称有序分 类资料(ordinal categorical data), 是将观察单位按属性的等级分组,清点 各组的观察单位数,所得的资料为等级 资料。 • 如治疗结果分为治愈、显效、好转、无 效四个等级。
(2)标目
横标目(主语) 纵标目(谓语) 总纵标目
横标目(即第一分组标志)位于表的左侧, 说明每一横行的内容;总纵标目写在表的 上部,用来说明下面的现象或情况;纵标 目(即第二分组标志)写在总纵标目之下, 说明每一列的内容。
(3)线条
尽量少; 不必要的横线都可取消; 不能有左上角的斜线; 不能有竖线; 为了使行数很多的表在取消横线后不看错行, 可将横行每隔几行分为一个组,组间空一行隔开。 若表中有“合计”行,“合计”行上沿应有一 条横线,但同时,该横线不应划到“合计”二字 头上。
数据的频率分布 数 据 的 频 率 分 布 离散性资料的频率分布
分类资料
计数资料
连续性资料的频率分布
离散性资料的频率分布
分类资料:
其频率分布就是属于不同类别的观测值出 现的次数(频数)和所占的比例(频率)。 计数资料: 以每个自然值代表一类,计算各类中观察 值出现的频数和频率。
表2-1 70头经产母猪窝产仔数资料
表1
总 的 横标目 纵标目:
统计表的模式
总的纵标目(指标)
各行书 写具体 的横标 目内容
表体内书写与“总的纵标目”对应的绝对数或相对数
《生物统计学》习题集总参考答案
《生物统计学》习题集总参考答案第一章绪论一、名词解释1、总体:根据研究目的确定的研究对象的全体称为总体。
2、个体:总体中的一个研究单位称为个体。
3、样本:总体的一部分称为样本。
4、样本含量:样本中所包含的个体数目称为样本含量(容量)或大小。
5、随机样本:从总体中随机抽取的样本称为随机样本,而随机抽取是指总体中的每一个个体都有同等的机会被抽取组成样本。
6、参数:由总体计算的特征数叫参数。
7、统计量:由样本计算的特征数叫统计量。
8、随机误差:也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成,带有偶然性质,影响试验的精确性。
9、系统误差:也叫片面误差,是由于一些能控制但未加控制的因素造成的,其影响试验的准确性。
10、准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。
11、精确性:也叫精确度,指调查或试验研究中同一试验指标或性状的重复观测值彼此接近的程度。
二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?答:(1)生物统计是数理统计的原理和方法在生物科学研究中的应用,是一门应用数学。
(2)生物统计在畜牧、水产科学研究中的作用主要体现在两个方面:一是提供试验或调查设计的方法,二是提供整理、分析资料的方法。
2、统计分析的两个特点是什么?答:统计分析的两个特点是:①通过样本来推断总体。
②有很大的可靠性但也有一定的错误率。
3、如何提高试验的准确性与精确性?答:在调查或试验中应严格按照调查或试验计划进行,准确地进行观察记载,力求避免认为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试畜禽的初始条件如品种、性别、年龄、健康状况、饲养条件、管理措施等尽量控制一致,并通过合理的调查或试验设计,努力提高试验的准确性和精确性。
4、如何控制、降低随机误差,避免系统误差?答:随机误差是由于一些无法控制的偶然因素造成的,难以消除,只能尽量控制和降低;主要是试验动物的初始条件、饲养条件、管理措施等在试验中要力求一致,尽量降低差异。
生物统计学第2章-2012
三、试验资料的整理
(4) 归组和制表
确定好组数和各组上下限后,可按原始资料中各观 测值的次序,将各个数值归于各组,计算各组的观 测数次数、频率、累积频率,制成一个次数分布表。
(2) 确定组数和组距(class boundary)
组数是根据样本观测数的多少及组距的大小来 确定的,同时考虑到对资料要求的精确度以及进一 步计算是否方便。
组数 组距
多 少
小 大
统计数精确,计算不方便 统计数不精确,计算方便
19
表2-5
样本容量与分组数的关系 分组数 5~8 7 ~ 10 9 ~ 12
11~17
分为7组
统计各组次数 计算频率和累积频率 制表
15 16 16 14 13 14 15 13 15 13
15 15 15 14 14 16 14 15 17 13 16 14 16 15 13 14 14 14 14 16 12 13 12 14 12 15 16 15 16 14 13 15 17 14 13 14 12 17 14 15
56 49 62 78 41 47 65 45 58 55 52 52 60 51 62
(1) 求全距,
78 66 45 58 58 56 46 58 70 72 76 77 56 66 58
63 57 65 85 59 58 54 62 48 63 58 52 54 55 66 52 48 56 75 5563 75 65 48 52 55 54 62 61 62
计数资料基本上采用单项式分组法进行整理。
生物统计附试验设计习题集.
《生物统计附试验设计》习题集第一章绪论一、名词解释总体个体样本样本含量随机样本参数统计量随机误差系统误差准确性精确性二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?2、统计分析的两个特点是什么?3、如何提高试验的准确性与精确性?4、如何控制、降低随机误差,避免系统误差?第二章资料的整理一、名词解释数量性状资料质量性状资料半定量(等级)资料计数资料计量资料全距(极差)组中值次数分布表次数分布图二、简答题1、资料可以分为哪几类?它们有何区别与联系?2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样?3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?4、统计表与统计图有何用途?常用统计图有哪些?常用统计表有哪些?列统计表、绘统计图时,应注意什么?第三章平均数、标准差与变异系数一、名词解释算术平均数无偏估计几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数二、简答题1、生物统计中常用的平均数有几种?各在什么情况下应用?2、算术平均数有哪些基本性质?3、标准差有哪些特性?4、为什么变异系数要与平均数、标准差配合使用?三、计算题1、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。
试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。
2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。
试利用加权法计算其平均数、标准差与变异系数。
组别组中值(x)次数(f)80—84 288—92 1096—100 29104—108 28112—116 20120—124 15128—132 13136—140 33、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、4、4、4、5、9、12(天)。
试求潜伏期的中位数。
4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。
高级生物统计学 第2章 资料整理
资料分类 资料的整理 统计量 Excel、SPSS制表、绘图和计算 功能简介
1
第一节: 资料的分类
试验观察、测量的数据按其性质不同,可分为计(数) 量资料、计(次)数资料二大类:
计(数)量资料 计(次)数资料
2
一、资料分类
计量(数量)资料:由量、测或直接计数所获 资料,取值为实数,常用连续型随机变量表示, 多服从正态分布,可用t检验、F检验作统计分 析。 计数(次数)资料:先按其性状或类别分组, 再清点各组次数所获资料,取值为正整数或零, 常用离散型随机变量表示,多服从二项分布, 可用X2检验作统计分析。
34
Excel应用(一)
求统计函数; 抽样; 作频数分布表-----频率数----直方图-----判断分布 正态性。
35
常用统计函数
频数分布函数———Frequency 平均数--------Average 几何平均数-------Geomean 样本标准差---------Stdev 样本方差----------Var 样本标准误(差)------Std. Error
进入统计状态: stat 数据输入:数据1-----DATA -----数据2---DATA-------数据N---DATA;
结果输出:直接按统计量符号即可。
33
Excel在统计中具体应用
查表(t、F、x2和r值表等) 求统计量 计算正态分布\二项分布概率 作图 抽样 统计分析 相关与回归分析
39
应用Excel作频数分布表
一法:输入样本数据,后用Frequency统 计函数; 二法:数据分析工具------直方图(接收区输 入分组区间)----频数-----折线图
生物统计附试验设计-习题
生物统计附试验设计——习题第二章资料的整理1、资料可以分为哪几类?它们有何区别与联系?2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样?3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?4、统计表与统计图有何用途?常用统计图有哪些?常用统计表有哪些?列统计表、绘统计图时,应注意什么?5、下表为100头某品种猪的血红蛋白含量(单位:g/100ml)资料,试将其整理成次数分布表,并绘制直方图和折线图。
(提示:第一组下限取为9.1,组距i=0.7)6、测得某肉品的化学成分的百分比如下(单位:%),请绘制成圆图。
7、2001年调查四川省5个县奶牛的增长情况(与2000年相比)得如下资料(单位:%),请绘成长条图。
8、1-9周龄大型肉鸭杂交组合GW和GY的料肉比如下表所示,请绘制成线图。
第三章平均数、标准差与变异系数1、统计学中常用的平均数有几种?各在什么情况下应用?2、何谓算术平均数?算术平均数有哪些基本性质?3、何谓标准差?标准差有哪些特性?4、何谓变异系数?为什么变异系数要与平均数、标准差配合使用?5、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。
试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。
(=9.8头,S=2.098头,C·V=21.40%)。
6、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。
试利用加权法计算其平均数、标准差与变异系数。
组别组中值(x)次数(f)80—84 288—92 1096—100 29104—108 28112—116 20120—124 15128—132 13136—140 3(=111.07cm,S=12.95cm, C·V=11.66%)。
7、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、4、4、4、5、9、12(天)。
张勤主编的(畜牧兽医)生物统计学方面的习题作业及答案
第一章绪论一、名词解释总体个体样本样本含量随机样本参数统计量准确性精确性二、简答题1、什么是生物统计它在畜牧、水产科学研究中有何作用?2、统计分析的两个特点是什么?3、如何提高试验的准确性与精确性?4、如何控制、降低随机误差,避免系统误差?第二章资料的整理一、名词解释数量性状资料质量性状资料半定量(等级)资料计数资料计量资料二、简答题1、资料可以分为哪几类它们有何区别与联系?2、为什么要对资料进行整理对于计量资料,整理的基本步骤怎样?3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?4、统计表与统计图有何用途常用统计图、统计表有哪些?第三章平均数、标准差与变异系数一、名词解释算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数二、简答题1、生物统计中常用的平均数有几种各在什么情况下应用2、算术平均数有哪些基本性质?3、标准差有哪些特性?4、为什么变异系数要与平均数、标准差配合使用?三、计算题1、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。
试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。
2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。
试利用加权法计算其平均数、标准差与变异系数。
组别组中值(x)次数(f)80—84 288—92 1096—100 29104—108 28112—116 20120—124 15128—132 13136—140 33、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、4、4、4、5、9、12(天)。
试求潜伏期的中位数。
4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。
5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。
生物统计学考试复习笔记整理
学中最常用的一个统计量 算术平均数 x 研究数据的代表值
中位数:Md 位置平均数数据先从小到大排序 研究数据的代表值
众数 Mo 位置平均数 几何平均数 G 可削弱数据中个别极大值的影响 调和平均数/倒数平均数 H
误差:在畜牧,水产科学试验中,试验指标除受试验因素影响外,还受到许多其他非非试验 因素的干扰,从而产生误差。
随机误差:(抽样误差/统计上的试验误差),无法控制,难以消除。影响精确性。
系统误差:(片面误差),容易克服。影响准确性。
准确性:试验结果值与真实值之间的符合程度。|真值-观测值|
精确性:观察值之间的符合程度。|任意两个观测值间的差值| 准确性高则精确性一定高
在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际的 可能性原理。 (3)标准误的基本概念: σx 是样本平均数抽样总体的标准差,简称标准误,σx=σ/ n 表示平均数抽样误差的大小。 σ 往往是未知的,用样本标准差 S 来估计 σ,于是有样本标准误 Sx=S/ n
标准差 S 与标准误 Sx 的区别与联系 区别: ①S 反映样本观测值变异程度大小,反映样本的精确度,它的大小说明了 x 对该样本代表性的 强弱。
对试验样本所在总体作出假设 无效假设:H0:μ1 = μ2 备择假设:HA:μ1 ≠ μ2
选定显著水平 α = 0.05 或 0.01(通常用 0.05 )
在无效假设 H0 成立的前提下计算 t 值即无效假设正确的概率
根据小概率事件实际不可能性原理作出统计推断,否定或接受无效假设 根据 df=(n1-1)+(n2-1),由附表 3 查临界 t 值 t0.05 和 t0.01 若|t|< t0.05,则 P>0.05,接受 H0,两样本平均数所在的总体平均数差异不显著 若 t0.01<|t|≤t0.05 ,则 0.01<P≤0.05,否定 H0 接受 HA,差异显著,有 95%把握认为两样本不
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
贵州大学
第二节 资料的整理
一、资料的检查与核对
检查和核对原始资料的目的在于确保原始资料的完 整性和正确性。 所谓完整性是指原始资料无遗缺或重复。
所谓正确性是指原始资料的测量和记载无差错或未进 行不合理的归并。检查中要特别注意特大、特小和异常 数据(可结合专业知识作出判断)。对于有重复、异常 或遗漏的资料,应予以删除或补齐 ;对有错误、相互 矛盾的资料应进行更正,必要时进行复查或重新试验。
贵州大学
在绘制长条图时,应注意以下几点: (1)纵轴尺度从“0”开始,间隔相等,标 明所表示指标的尺度及单位。 (2)横轴是长条图的共同基线,应标明各长 条的内容。长条的宽度要相等,间隔相同。间隔的 宽度可与长条宽度相同或者是其一半。 (3)在绘制复式长条图时,将同一属性种类 、等级的两个或两个以上指标的长条绘制在一起, 各长条所表示的指标用图例说明,同一属性种类、 等级的各长条间不留间隔。
容,有时须注明时间、地点。
2、标目 标目分横标目和纵标目两项。横标目
列在表的左侧,用以表示被说明事物的主要标志; 纵标目列在表的上端,说明横标目各统计指标内容 ,并注明计算单位,如%、kg、cm等等。
贵州大学
3、数字
一律用阿拉伯数字,数字以小数点对齐,
小数位数一致, 无数字的用“─”表示,数字是 “0”的,则填写“0”。 4、线条 表的上下两条边线略粗,纵、横标目间及Fra bibliotek贵州大学
2、圆图
用于表示计数资料、质量性状资料或半定量(
等级)资料的构成比。
所谓构成比,就是各类别、等级的观测值个数 (次数)与观测值总个数(样本含量)的百分比。 把园图的全面积看成100%,按各类别、等级的 构成比将园面积分成若干分, 以扇形面积的大小表 分别表示各类别、等级的比例。
贵州大学
绘制圆图时,应注意以下三点:
合计用细线分开, 表的左右边线可省去,表的左上
角一般不用斜线。
贵州大学
(二) 统计表的种类
统计表可根据纵、横标目是否有分组分
为简单表和复合表两类。 1、简单表 由一组横标目和一组纵标目组
成,纵横标目都未分组。此类表适于简单资
料的统计,如表2-10。
贵州大学
表2-10 某品种鸡杂种二代冠形分离情况
P15 【例2.1】
将126头基础母羊的体重资
料(见表2-5)整理成次数分布表。
贵州大学
表2-5
126头基础母羊的体重资料 (kg)
贵州大学
1、求全距 全距是资料中最大值与最小值之差,又称 为极差(range),用R 表示,即
R=Max(x)-Min(x)
本例 R=65.0-37.0=28.0(kg)
贵州大学
例如观测某品种100只蛋鸡每年每只 鸡产蛋数 (原始资料略),见P14-15,其变异范 围为200299枚。这样的资料如以每个观察值为 一组, 则组数太多 (该资料最多可分为100组) ,如间隔10枚为一组,则可使组数适当减少。经 初步整理后分为10组,资料的规律性就比较明显 ,见表2-4。
贵州大学
图1
肉色遗传图谱
贵州大学
三、半定量(等级)资料
半 定 量 或 等 级 资 料 (semi-
quantitative or ranked data) 是指将观察单位按所
考察的性状或指标的等级顺序分组,然后清点各组观
察单位的次数而得的资料。这类资料既有次数资料的
特点,又有程度或量的不同。
贵州大学
贵州大学
二、质量性状资料
质量性状(qualitative character)是指能观察到而不能 直接测量的性状,如颜色、 性别、生死等。这类性状本身不 能直接用数值表示,要获得这类性状的数据资料,须对其观察 结果作数量化处理,其方法有以下两种:
贵州大学
(一)统计次数法
在一定的总体或样本中,根据某一质量性状的类别统计
到大; 图形长宽比例约5:4或6:5。
4、图中需用不同颜色或线条代表不同事物时
,应有图例说明。
贵州大学
(二)常用统计图及其绘制方法 1、长条图 它用等宽长条的长短或高低表示按某一 研究指标划分属性种类或等级的次数或频率 分布 。如果只涉及一项指标,则采用单式长 条图,见图2-1;如果涉及两个或两个以上的 指标,则采用复式长条图,见图2-2.ppt
(histogram)和 折线图 (broken-line chart)等 。
一般情况下 ,计量资料采用直方图和折线图,计数资
料 、质量性状资料、半定量 (等级)资料常用长条
图 、 线图或圆图。
贵州大学
(一)统计图绘制的基本要求 1、标题简明扼要,列于图的下方。 2、纵、横两轴应有刻度,注明单位。 3、横轴由左至右、纵轴由下而上,数值由小
贵州大学
二、资料的整理方法
(一)计数资料的整理
现以50枚受精种蛋孵化出雏鸡的天数为例,说明计
数料的整理。(表2-2、表2-3)表2-2 孵化出雏鸡的天数 50枚受精种蛋
贵州大学
表2-3
50枚受精种蛋出雏天数的次数分布表
贵州大学
有些计数资料,观察值较多,变异范围较大,若以 每一观察值为一组,则组数太多,而每组内包含的观 察值太少,资料的规律性显示不出来。对于这样的资 料,可扩大为以几个相邻观察值为一组,适当减少组 数,这样资料的规律性就较明显,对资料进一步计算 分析也比较方便。
贵州大学
2、确定组数 组数的多少视样本含量及资料的变动范围大 小而定,一般以达到既简化资料又不影响反映资 料的规律性为原则。组数要适当,不宜过多,亦 不宜过少。分组越多所求得的统计量越精确,但
增大了运算量;若分组过少,资料的规律性就反
映不出来,计算出的统计量的精确性也较差。一
般组数的确定,可参考表2-6。
贵州大学
生物统计附试验设计
第二章 资料的整理
目录
贵州大学
第一节 资料的分类
资料整理的前提是正确地进行资料的分类。在调查或试验
中,由观察、测量所得的数据按其性质的不同,一般可以分
为数量性状资料 大类。 、 质量性状资料和半定量(等级)资料三
贵州大学
一、数量性状资料
数量性状(quantitative character)是 指能够以量测
贵州大学
表2-6 样本含量与组数
本例中,n=126,根据表2-6,初步确定组数 为10组。
贵州大学
3、确定组距 每组最大值与最小值之差称为组距,记为 i。分组 时要求各组的组距相等。组距的计算公式为:
组距(i)=全距/组数
本例
i=28.0/10=2.8≈3.0
贵州大学
4、确定组限及组中值 (1)组限: 各组的最大值与最小值称为。最小值称 为下限, 最大值称为上限。 第一组下限的确定:取资料中的最小值或接近 最小值的数据。
或计数的方式表示其特征的性状 。观察测定数量性状而获
得的数据就是数量性状资料
( data
of
quantitative
characteristics)。数量性状资料的获得有量测和计数两
种方式 ,因而数量性状资料 又分为 计量资料和计数资料
两种。
贵州大学
(一)计量资料 指用量测方式获得的数量性状资料,即用度、量、衡等计量 工具直接测定获得的数量性状资料。其数据是用长度、容积、 重量等来表示。这种资料的各个观测值不一定是整数,两个相 邻的整数间可以有带小数的任何数值出现,其小数位数的多少 由度量工具的精度而定 (二)计数资料 指用计数方式获得的数量性状资料。在这类资料中,它的 各个观察值只能以整数表示,在两个相邻整数间不得有任何带 小数的数值出现。
贵州大学
为了使恰好等于前一组上限和后一组下限的 数据能确切归组,约定将其归入后一组。 通常将上限略去不写。 第一组记为36.0 , 第二组记为39.0 , ……
贵州大学
(2)组中值:每一组的中点值称为,它是该组的代 表值。组中值与组限、组距的关系如下:
组中值=(组下限+组上限)/2=组下限+1/ 2组 距=组上限-1/2组距
第一组上限的确定:第一组上限=第一组下限+ 组距; 第二组的下限等于第一组的上限;第二组的上 限=第二组下限(第一组上限)+组限
第三组的下限等于第二组的上限;
……
贵州大学
表2-5中, 最小值为37.0, 第一组的下 限为37.0(36.0) 第一组的上限也就是第二组的下限为: 36.0+3.0=39.0; 第二组的上限也就是第三组的下限为: 39.0+3.0=42.0,……, 以此类推,一直到最后一组的上限大于 资料中的最大值为(65.0)止。 于是可分组为: 36.0 - 39.0,39.0-42.0,…
表2-7 126头基础母羊的体重的次数分布
贵州大学
在归组划线时应注意,不要重复或遗漏,归 组划线后将各组的次数相加,结果应与样本含量 相等,如不等,证明归组划线有误,应予纠正。 在分组后所得实际组数,有时和最初确定的 组数不同,如第一组下限和资料中的最小值相差 较大或实际组距比计算的组距为小,则实际分组
贵州大学
表2-4 100只蛋鸡每年产蛋数的次数分布表
贵州大学
(二)计量资料的整理
当观测值不多(n≤30)时,不必分组
,直接进行统计分析。
当观测值较多(n>30)时,宜将观测值
分成若干组,以便统计分析。将观测值分 组后,制成次数分布表,即可看到资料的 集中和变异情况。
贵州大学
计量资料在分组前需要确定全距、组数 、组距、组中值及组限,然后将全部观测值 划线计数归组。
的组数将比原定组数多;反之则少。
贵州大学
(三)质量性状资料、半定量(等 级)资料的整理
对于质量性状资料 、 半定量(等级)资 料,可按性状或等级进行分组,分别统计各组