生物统计学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
系统误差(systematic error) 指由于某些特定的非试验条件所造成的使试验结果朝某一
个方向发生有规律的偏移。 造成系统误差的原因有以下几种:
1. 度量工具的不正确或未经校正 2. 试验仪器及其读数器发生偏差或未经校正 3. 外界试验条件发生了很大的变化 4. 观测时间及顺序的影响 5. 试验人员操作及观测时的偏爱和习惯 6. 试验动物分组时发生的偏差等
第二章 资料整理
1 资料的分类 2 数据的频率分布 3 数据的表示方法 4 集中趋势的度量 5 离散趋势的度量
2.1 资料的分类
统计资料:指反映事物、现象或过程的数据资料。 包括原始资料和次级资料。
特点:
(1)数字性:数字形式或者可以转换为数字形式。 (2)大量性:大量相像或对同类相像观察所取得的
总体(population):具有相同性质的所有观测 值所组成的集合(set)
在实际工作中只能对总体中具有代表性的一小部分 进行研究。被研究的这一小部分观测值(子集 subset)必须来自于这一总体,并具有很好的 代表性。这样的一批观测值的子集就称为样本 (sample)
从总体中得到样本的过程称为抽样(sampling)
数据资料。 (3)具体性:已经实现的事实的记载。
• 主要内容: 1)数据的审核与修订 2)数据的汇总与分组 3)基本统计特征计算 4)用图表展示结果
1.资料的分类
什么是资料(data)? 资料有哪些种类?
连续性资料(comtinuous data)? 离散性(间断性)资料(discrete data)? 离散性资料又分成哪两类?
到总体(与演绎相对)
试验设计(experiment design)
正确地确定抽样方案,正确地对将要进行的试验进行 科学设计是统计工作的基础
在试验工作进行之前,应用统计学原理,制订出合理 的试验方案,如最适样本大小,最佳样本配置,正 确的试验动物种类,试验整个过程的安排等
使我们可以用最少的人力、物力、财力和时间,获得 尽可能多的、可靠的信息和资料进行统计分析,得 到可信的科学结论
总体具有时、空性(具有时间和空间的概念) 总体有有限总体与无限总体之分 总体可分为实总体与虚总体 有限总体总是实总体;但实总体不一定是有限总体,
虚总体也不能肯定就是无限的。 总体有常量性 总体的特征值一般是常量 总体有不可知性 总体的特征值往往是未知的 另:统计学中的总体和样本一般是指数据或资料 而试验设计中的总体和样本一般是指动物个体。
A.样本容量小于30 B.样本容量小于等于30 C.样本容量大于30 D.样本容量大于60
6、统计上所讲的样本是指( )
A.由非随机抽样的方法获得的样本
B.有目的地在总体中选择若干个体的集合
C. 保证总体中的每个个体具有相等的概率 被抽取作为样本
D.随机样本,即无限总体采用复置抽样的 方式抽样,有限小总体采用非复置抽样的 方式抽样。
(variate)。
变量在某一个体具体表现出来的数值又称为变数或 称观测值(observed value)、数据(data)、 资料(data)
变量是和常量(constant)相对应的一个概念
参数和统计量 用来描述总体特征的数值称为参数(parameter) 由样本观测值计算得到的描述样本特征的数值称为
全距——极差(range) 组距(class interval)
组限(class limit)组中值 组下限 组上限
次数分布表
次数分布图
离散性资料的频数分布 70头母羊窝产仔数
7 8 11 14 10 12 11 10 10 7 10 12 11 10 10 11 9 12 8 10 10 9 11 12 10 12 9 9 11 10 11 11 13 11 14 13 10 11 13 11 13 10 10 9 11 11 8 9 9 11 10 7 10 13 12 12 13 10 11 9 12 10 10 11 8 10 8 10 11 13
资料的正确性
异常数据的校核与认定
错误数据的复查和更正
数据的审定与修证
✓ 异常数据 观察数据中存在的极端值。
✓ 异常数据的判断和处理 判断: 数据是否有错误 是否有与众不同的数据
✓ 处理: 四分位数检验 格拉布斯检验
2.资料的整理
频数分布:不同类型的观测值出现次数。
连续性资料的整理:组距式分组法
组距式分组法中的几个名词:
这些因素都会使得试验结果有规律地偏离真值 由于系统误差影响了试验的准确性,因此应当在试
验前就加以预防和克服。 一般来说,系统误差是能被消除的。
随机误差(random error)
指由种种偶然因素引起的、无法加以 预测和控制的无规律的偏差。 随机误差又称为偶然误差 随机误差的大小、方向都无法确定 。 消除系统误差以后,试验过程中主要的误差来源就是随
生物统计学
王建国
电话:18796419138 QQ: 290037120
第一章 绪论
统计学的基本功能:
对资料进行整理和描述 用局部数据来推断和估计全体研究对象的特征 通过显著性检验来鉴定试验效应 寻找因素间的关系
提供试验设计的一般原则和方法
统计学的特点
概率性——所有结论和结果都有一定的概率保证 二元性——理论和实践的紧密结合,尤以实践为重 归纳性——由特殊到一般、由局部到全体、由样本
如何学习畜牧统计学?
首先,确立统计学的思维方式,学会用统计学的思想 来武装自己的头脑,用统计学的思考方式来观察世 界,观察周围的事物。
其次,在畜牧科研、技术推广等方面要用好用活统计 学,除了学好统计学,掌握统计学的基本原理、计 算公式、数学概念和含义、具有一定的电脑知识和 操作技能外,还必须有坚固、扎实的畜牧学专业方 面的知识,丰富的畜牧实践。
以消灭 。
准确度和精确度
准确度和精确度和两类误差密切相关。 准确度(accuracy):指观测值与真值接近的
程度。 当发生系统误差时,观测值都会有规律地向某一
个方向偏离真值,因而降低了试验的准确度
精确度(precise)
指在同一处理条件下,同一批观测值间相互接近 的程度。
当随机误差较大时,数据较离散,精确度较低 。 准确度是比精确度更重要的一个概念 在任何时候,都应当将系统误差降至零或最小程
B.众数,算术平均数,几何平均数,方差和标 准差
C. 极差,算术平均数,几何平均数,方差和标 准差
D.算术平均数,几何平均数,方差和标准差
第二章 资料整理
原始数据:
大量的、“杂乱无章” 不能直接用于统计分析,必须经过统 整理和加工。
第二章 资料整理
资料整理的主要内容
(1)审核与订正:人为错误、小数点等 (2)分组与汇总:内部结构、类型和特征 (3)计 算各种综合数字特征:如,n、平均数、标准差 (4)统计表或统计图:显示资料的基本特征和内在规律
使得试验结果更正确。 3 对试验处理间的差异所作出的评定更准确、更可靠 。
错误(mistake)
由于工作人员的粗心大意或不负责任(如仪器使用 不当,错读数据,记录不准,任意涂改,凭空杜 撰等)所产生的测定值与真值的偏差,称为错误
错误不是统计学的研究内容 在试验和调查中,错误应当、必须,同时也可以加
最后,用畜牧统计学处理和分析每一批资料、每一 批数据,都必须有充分的生物学意义和畜牧学意 义,而所作的试验也必须有生物学科的理论意义 和实践意义。
因此,畜牧统计学的学习,统计学方法的应用不能 孤立地、单独地进行,它必须紧密结合畜牧学科 的实践,以取得具有专业意义和指导意义的结果。
常用统计术语
总体和样本
计数资料(counting data) 分类资料(categorical data)
1 资料的分类
特点:数字性、大量性、具体性 类型:
连续性资料:一定范围内可取任何实数值的 数据资料。如:身高 离散性资料:一定范围内只取有限值的数据。
计数资料:用计数的方式得到的数据资料, 如:人数,鸡蛋数
分类资料:以类别作为分类对象,如:性别
从畜牧科研实践中所得到的数据资料 具有变异性、随机性和复杂性 。 学习畜牧统计学的目的就是要使用统计学的原理和方法
来定量地处理和分析生物数据的这些变异性、不确定 性和复杂性,从而得出最令人信服的结论,以阐明事 物发展的规律 。 畜牧统计学是畜牧学科中的一个重要工具。 它能帮助畜牧工作者发现隐藏在纷繁复杂的表面现象下 面的客观规律 。
误差
在生物学科中,人们几乎无法把非试验条件绝对地 控制在同一水平上,同时试验对象也是错综复杂 的生物体,因此,很难使所得到的试验结果完全 符合真值。
试验结果和真值之间的这种差异和偏离,就是误差 (error)
误差按其来源和性质可分为系统误差 (systematic error)和随机误差(random error)
• B.统计上所指的样本均是指随机样本
• C.保证总体中的每个个体均有相等的概率被 抽取作为样本的抽样叫随机抽样,抽得的样本 叫随机样本。
• D.通过抽样调查获得的样本是随机样本,用 试验方法获得的数据不是随机样本
• 3、研究某肉用仔鸡56天体重,因为该 肉用仔鸡是一个极大的群体,其数量是 一个天文数字,该总体属于( )。
• 分类资料
公称尺度:不同类别之间没有等级之分。 如:性别公、母,正常、不正常。
等级尺度:不同类别之间有内在的等级之分。 如:成绩的优、良、中。
分类资料的相对数表示(%):
受精率 孵化率 出苗率 有效率 合格率
出栏率 上市率 情期受胎率 死亡率
资料的采集与核对
资料的采集: 调查 试验
记录
资料的检查与核对: 资料的完整性
10、调查江苏省2004年全省生猪生产情况时,如果以 断奶休重为指标,则该总体是( )
A.无限总体 B.有限总体 C.既不是有限总体又不是无限总体 D.既是有限总体又是无限总休
14、描述样本的特征数为统计量,统计量 一般有两个,即平均数和变异数,除了地 位特征数外,下述( )是常用的统计量。
A.中位数,算术平均数,几何平均数,方差和 标准差
一个样本内观测值即变量的个数,称为样本含量,用 n
表பைடு நூலகம்。
n>30为大样本,n≤30为小样本
有限总体的大小用 N 表示。
由于抽样往往是随机(random)的,因此抽样是随机 抽样(random sampling 简称为抽样),随机抽 样所得到的样本称为随机样本(random sample 简称为样本)
机误差。 在不发生歧义的情况下,随机误差简称为误差 如果观测次数足够多的话,随机误差有统计学上的意义
每一次观测所产生的随机误差都是独 立发生的,且服从一定的规律 通过各种手段可以把随机误差有效地缩小到最低的程度 随机误差是进行统计假设检验的基础 降低随机误差,可以: 1 提高试验的精确性 2 可以更好地区别误差效应(表面效应)和处理效应,
7、描述总体的特征数叫参数,对于特定的总体, 其总体参数是不变的常数,用( )字母表示
A.希腊 B.拉丁 C.英文 D.拼音 8、获得数据资料的总的原则是( )。 A.随机抽样 B.通过试验来获得 C.通过调查 D.通过普查
9、描述样本的特征数叫统计量,样本统计量是变量, 用( )字母标示。 A.希腊 B.拉丁 c.英文 D.拼音
度,或将系统误差化为随机误差,以保证有足够
的准确度 。
练习题
• I、参数是描述总体的特征数,某一特定总体的 参数,其特点是
• A.完全可以通过一定方法测定的 • B.容易随观察者的角度不同而不同 • C.固定的变量 • D.不随人的意志改变
• 2、下列四种表述中不正确的一种是( )
• A.样本是总体中若干个体的随机集合
总体与样本的关系:样本必须来自于总体 样本必须能代表总体
如: 一叶知秋
管窥蠡测 尝鼎一脔
总体与样本关系不好的例子:
一叶障目 瞎子摸象
变异和变量
在实践中,无论是总体还是样本,无论是调查还是 试验,所得到的数值都是有差别的,这种差别在 统计学中称为统计数据的变异(variation)
具有变异性质的数值在生物统计学中就称为变量
统计量(statistic)
参数用希腊字母表示 ,如μ、σ2、β、ρ 统计量用英文字母表示 ,如x、s2、b、r
参数一般为一常量,需通过样本的统计量来进行估 计(estimation)
从同一总体中抽取不同的样本所计算得到的同一性 质的统计量是不会相同的,因此统计量是变量
这些统计量都可以用来无偏(unbias)地估计相 应的参数
• A.有限总体 • B.大总体 • C.小总体 • D. 无限总体
• 4、在总体中( )一部分个体织成的群 体称为样本。
• A.人为挑选出 • B.随机抽出 • C.划分出 • D.取出
5.大样本和小样本在统计分析方法有一定的区 别,大样本和小样本的主要区别在于样本容量, 小样本一般是指( )的随机样本。