生物统计学答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物统计学答案
第一章绪论
一、名词释义
1、总体:根据研究目的确定的研究对象的全体称为总体。
2、个体:总体中的一个研
究单位称为个体。
3.样本:人口的一部分称为样本。
4、样本含量:样本中所包含的个体数目称为样本含量(容量)或大小。
5.随机抽样:从人群中随机抽取的样本称为随机抽样,随机抽样是指人群中的每个个
体都有相同的机会被选择形成一个样本。
6.参数:由总体计算的特征数称为参数。
7.统计学:样本计算出的特征数称为统计学。
8、随机误差:也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成,带有偶然性质,影响试验的精确性。
9.系统误差:也称为单侧误差,由一些可控但不可控的因素引起,影响测试的准确性。
10、准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与真值接
近的程度。
11.准确度:亦称准确度,指在调查或实验研究中,同一测试指标或特征的重复观测
值彼此接近的程度。
二、简答题
1.什么是生物识别?它在畜牧业和水产科学研究中扮演什么角色?答:(1)生物统
计学是数理统计原理和方法在生物科学研究中的应用。
这是一门应用数学。
(2)生物统
计学在畜牧业和水产科学研究中的作用主要体现在两个方面:一是提供实验或调查设计的
方法,二是提供整理和分析数据的方法。
2、统计分析的两个特点是什么?
① 人口分析的特点有两个。
② 它具有很高的可靠性,但也有一定的错误率。
3、如何提高试验的准确性与精确性?
答:在调查或测试中,我们应该严格遵守调查或测试计划,准确观察和记录,努力避
免错误。
特别是要注意试验条件的一致性,即除了研究的各种处理外,还应通过合理的调
查或试验设计,尽可能地控制试验畜禽的初始条件,如品种、性别、年龄、健康状况、饲
养条件和管理措施等,努力提高测试的准确性和准确性。
4、如何控制、降低随机误差,避免系统误差?
答:随机误差是由一些不可控的偶然因素引起的,这些因素很难消除,只能尽可能地
加以控制和减少;主要是实验动物的初始条件、饲养条件和管理措施应在实验中保持一致,以尽量减少差异。
系统误差是由一些可控但不可控的因素引起的。
一般来说,只要仔细进
行测试工作,就可以消除这种情况。
避免系统性误差的主要措施是:尽量保证实验动物的
初始条件(年龄、初始体重、性别、健康状况等)的一致性,尽量控制饲料类型、质量、
数量、饲养条件等,测量仪器应准确,标准试剂应进行校正,避免观察、记录中的误差,
转录和计算。
第二章资料的整理
一、名词释义
1、数量性状资料:数量性状是指能够以量测或记数的方式表示其特征的象状,观察
测定数量性状而获得的数据称为数量性状资料。
2.质量特征数据:质量特征是指可以观察到但不能直接测量的特征。
通过观察质量特
征获得的数据称为质量特征数据。
3、半定量(等级)资料:是指将观察单位按所考察的性状或指标的等级顺序分组,
然后清点各组观察单位的次数而得到的资料。
4.计数数据:指通过计数获得的数量性状数据。
5、计量资料:指用量测手段得到的数量性状资料,即用度、量、衡等计量工具直接
测定的数量性状资料。
6、全距(极差):是资料中最大值与最小值之差。
7.分组中值:分组后各组的中值称为组中值,是该组的代表值。
二、简答题
1.什么样的信息可以分为?它们之间有什么区别和联系?
答:资料一般可以分为数量性状资料、质量性状资料、半定量资料三大类,其中数量
性状资料又包括计量资料和计数资料。
区别:数量性状资料是能够以量测或计数的方式获
得的资料,质量性状资料是只能观察而不能直接测量的资料,半定量资料既有计数资料的
特点又有程度或量的不同。
联系:三种不同类型的资料有时可根据研究目的和统计方法的
要求将一种类型资料转化成另一种类型的资料。
2.为什么要组织数据?整理测量数据的基本步骤是什么?
答:(1)由调查或试验收集来的原始资料往往是零乱的,无规律可循。
只有通过统
计整理,才能发现其内部的联系和规律性,从而揭示事物的本质。
资料整理是进行统计分
析的基础。
(2)计量资料整理的基本步骤包括:①求全距,全距即为资料中最大值与最
小值之差。
②确定组数,一般根据样本含量及资料的变动范围大小确定组数。
③确定组距,通常根据等距离分组的原则,组距等于全距除以组数。
④确定组限和组中值,各组的最大
值为组上限,最小值为组下限;每一组的中点值称为组中值。
⑤归组划线计数,作次数分
布表。
3.在整理测量数据时,为什么第一组的组中值应接近或等于数据中的最小值?答:在
整理测量数据时,第一组的组中值接近或等于数据中的最小值,这样可以避免第一组中观
察值过多,确保数据中的最小值不会被忽略。
4、统计表与统计图有何用途?常用统计图有哪些?常用统计表有哪些?列统计表、
绘统计图时,应注意什么?答:(1)统计表用表格形式来表示数量关系;统计图用几何
图形来表示数量关系。
用统计表和统计图可以把研究对象的特征、内部构成、相互关系等
简明、形象地表达出来,便于比较分析。
(2)常用的统计图表包括条形图、圆图、折线图、直方图和折线图。
(3)常用的
统计表包括简单表和复合表。
(4)列统计表的注意事项:①标题要简明扼要、准确地说明表的内容,有时须注明
时
房间和位置。
② 航向分为水平航向和垂直航向。
水平标题列在表格的左侧,代表被
解释事物的主要标记;垂直标题列在表格顶部,表示水平标题各统计指标的内容和计算单位。
③ 所有数字应为阿拉伯数字。
数字的小数点应对齐,小数点位置应相同。
没有数字的,以“-”号填列。
如果数字为“0”,则应写上“0”。
④ 桌子的上下边线稍粗,垂直、水平项目和总数用细线隔开。
表格的左右边线可以省略,表格的左上角通常不需要斜杠。
(5)绘统计图的注意事项:①标题简明扼要并列于图的下方。
②纵、横两轴应有刻度,注明单位。
③横轴由左至右,纵轴由上而下,数值由小到大;图形长宽比例约为5:4或6:5。
④图中需用不同颜色或线条表示不同事物时应有图例说明。
第三章均值、标准差和变异系数
一、名词解释
1.算术平均值:指数据中所有观测值之和除以观测值个数所得的商,简称平均值或平
均值。
2.当估计的参数无偏时,称为无偏。
3、几何均数:n个观测值相乘之积开n次方所得的方根称为几何均数,记为g。
4.中位数:从小到大排列数据中的所有观察值。
中间观察称为中位数,记录为MD。
5、众数:资料中出现次数最多的那个观测值或次数最多一组的组中值称为众数,记
为mo。
6、调和平均数:资料中各观测值倒数的算术平均数的倒数称为调和平均数,记为h。
7、标准差:统计学上把样本方差s2的平方根叫做样本标准差,记做s。
8、方差:统
计量σ(x-)2/(n-1)称为均方,又称样本方差,记为s2。
9、离均差平方和(平方和):各个观测值与平均数的离差(x-)称为离均差,各个离均差平方再求和即为离均差平方和,简称平方和,记为ss。
10.变异系数:标准偏差与平均值之比称为变异系数。
这是另一个统计数据,用于测
量数据中每个观察值的变化程度,记录为C.V。
二、简答题
1.生物特征识别中常用的平均值是多少?在什么情况下应该适用每种方法?
答:生物统计中常用的平均数有算术平均数、几何平均数、调和平均数、中位数和众数。
算术平均数较常用,简称平均数,当资料呈正态分布时可用算术平均数描述其中心位置。
几何均数主要应用于畜牧、水产业的动态分析,畜禽疾病及药物效价的统计分析,如
畜禽、水产养殖的增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等。
调和均数主
要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。
当所获得的数据资料
呈偏态分布时中位数的代表性优于算术平均数。
众数也适用于资料呈偏态分布的情况。
2.算术平均数的基本性质是什么?
答:算术平均数的两个基本性质是:①离均差之和等于零。
②离均差平方和最小。
3.标准偏差的特点是什么?
答:标准差的特性主要表现在四个方面:
① 标准偏差的大小受数据中每个观察值的影响。
如果观测值之间的差异较大,则获
得的标准偏差也较大,反之亦然
之则小。
② 在计算标准偏差时,从每个观测值中加或减一个常数,其值保持不变。
③ 当每个
观测值乘以或除以常数a时,得到的标准偏差是原始标准偏差的a倍或1/a倍。
④ 在数
据服从正态分布的情况下,数据中约68.26%的观测值在平均值标准差(±s)的1倍范围内;约95.43%的观测值在平均值标准偏差(±2S)的两倍范围内;约99.73%的观测值在
平均值标准偏差(±3S)的3倍范围内。
4、为什么变异系数要与平均数、标准差配合使用?
答:变异系数是标准偏差与平均值的比率,是衡量数据中每个观察值变异程度的另一
个统计数据。
在比较两个或两个以上数据的变化程度时,如果测量单位与平均值相同,则
可以直接使用标准偏差进行比较;如果单位和(或)平均值不同,则不能使用标准偏差来
比较变异程度,但应使用变异系数。
变异系数可以消除不同单位和/或平均值对两个或多
个数据变异程度比较的影响。
第四章常用概率分布
一、名词释义
1、必然现象:某类现象是可预言其结果的,即在保持条件不变的情况下,重复进行
试验,其结果总是确定的,这类现象称为必然现象。
2.随机现象:如果某一种现象的结果无法提前预测,也就是说,如果在相同条件下重
复测试,结果可能不一样。
这种现象叫做随机现象。
3、随机试验:一个试验若满足下述三个特性则称为随机试验,简称试验:①试验可
以在相同条件下多次重复进行。
②每次试验的可能结果不止一个,并且事先知道会有哪些
可能的结果。
③每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能
肯定这次试验会出现哪个结果。
4.随机事件:随机测试的每一个可能结果在一定条件下可能发生,也可能不发生,这
被称为随机事件,简称事件。
5、概率的统计定义:在相同条件下进行n次重复试验,若随机事件a发生的次数为m,那么m/n称为随机事件a的频率;当试验重复数n逐渐增大时,随机事件a的频率越来越
稳定地接近某一数值p,那么就把p称为随机事件a的概率。
这样定义的概率称为统计概率,也叫后验概率。
6.小概率原理:如果随机事件的概率非常小,如小于0.05、0.01和0.001,则称为小概率事件;在统计学中,小概率事件的实际不可能性原理称为小概率事件的实际不可能性
原理,简称小概率原理。
7、随机变量:作一次试验,其结果有多种可能,每一种可能结果都可以用一个数来
表示,把这些数作为变量x的取值范围,则试验结果可用随机变量x来表示。
8.离散随机变量:如果代表测试结果的变量x最多可以取可数值,并以各种确定的概
率取这些不同的值,则称为离散随机变量。
9、连续型随机变量:如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量。
9、标准正态分布:μ=0,δ2=1的正态分布称为标准正态分布。
10.标准正态变量(标准正态偏差):任何一个服从正态分布n(μ,δ2)的随机变
量x可以通过标准化进行转换:u=(XCμ)/δ,它被转换成服从标准正态分布的随机变
量u,称为标准正态变量。
11、双侧概率(两尾概率):随机变量x落在平均数μ加减不同倍数标准差δ区间
之外的概率称为双侧概率。
12.单边概率(单尾概率):随机变量x小于μ-kδ或大于μ+kδ的概率称为单边
概率。
13.伯努利试验:对于n个独立试验,如果每个试验结果都发生,且只有一个相反
的事件a和a发生,则每个试验中发生a的概率为常数P(0
14、返置抽样:由总体随即抽样时,每次抽出一个个体后,这个个体还返置回原总体,则称为返置抽样。
15.非回归抽样:从总体中随机抽样时,每次抽取的个体不会返回到原始总体,这称
为非回归抽样。
16标准误差:即平均抽样总体的标准偏差,其大小反映了抽样平均误差的大小,即准确度水平。
17、样本平均数的抽样总体:样本平均数也是一个随机变量,其概率分布叫做样本平
均数的抽样分布,由样本平均数构成的总体称为样本平均数的抽样总体。
18.中心极限定理:如果随机变量x服从正态分布n(μ,δ2),x1,x2Xn是从总体
中获得的随机样本,那么统计量=σX/N的概率分布也是正态分布,并且具有μ=μ,
δ=δ/N。
也就是说,它服从正态分布N(μ,δ2/N);如果随机变量服从均值μ,则方
差为δ分布2(非正态分布),x1,X2,??,Xn是从总体中获得的随机样本,则统计
量=σ当N相当大时,X/N的概率分布接近正态分布N(μ,δ2/N)
二、简答题
1.事件概率的基本性质是什么?
答:事件的概率一般具有以下三个基本性质:①对于任何事件a,有0≤p(a)≤1②必
然事件的概率为1,即p(ω)=1③不可能事件的概率为0,即p(ф)=0
2.离散随机变量的概率分布和连续随机变量的概率分布有什么区别?
答:离散型随机变量概率分布常用分布列来表示,其具有pi≥0和σpi=1两个基本
性质。
连续型随机变量的概率分布不能用分布列来表示,其可能取的值是不可数的,一般
用随机变量x在某个区间内取值的概率p(a≤x)
3.标准差和标准差之间的关系和区别是什么?
答:样本标准差与样本标准误是既有联系又有区别的两个统计量,二者的联系是:样
本标准误等于样本标准差除以根号下样本含量。
二者的区别在于:样本标准差是反映样本
中各观测值x1,x2,??,xn变异程度大小的一个指标,它的大小说明了对该样本代表性
的强弱。
样本标准误是样本平均数1,2,??k的标准差,它是抽样误差的估计值,其大小
说明了样本间变异程度的大小及精确性的高低。
4.抽样总体和原始总体的两个参数之间的关系是什么?答复:① 样本的平均数量样本
总体的平均数量等于原始总体的平均数量。
②样本平均数抽样总体的标准差等于与原始总体的标准差除以根号下样本含量。
5.t分布和标准正态分布之间的区别和关系是什么?
答:t分布与标准正态分布曲线均以纵轴为对称轴,左右对称。
与标准正态分布曲线相比t分布曲线顶部略低,两尾部稍高而平;df越小这种趋势越明显。
df越大,t分布越趋近于标。