生物统计学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章概论
一、什么就是生物统计学?生物统计学主要内容与作用?
1、生物统计学就是数理统计在生物学研究中的应用,它就是应用数理统计的原理,运用统计方法来认识、分析、推断与解释生命过程中的各种现象与试验调查资料的科学。

属于生物数学的范畴
2、主要内容
基本原则对比设计
试验设计方案制定随机区组设计
常用试验设计方法裂区设计
资料的搜集与整理拉丁方设计、正交设计
统计分析数据特征数的计算
统计推断、方差分析
协方差分析、回归与相关分析
3、生物统计学的基本作用:
(1)提供整理与描述数据资料的科学方法,确定某些性状与特征的数量特征
(2)运用显著检验,判断试验结果的可靠性或可行性
(3)提供由样本推断总体的方法
(4)提供试验设计的一些重要原则
二、解释概念:总体、个体、样本、变量、参数、统计数、效应、试验误差
总体:具有相同性质或属性的个体所组成的集合称为总体,它就是指研究对象的全体;
个体:组成总体的基本单元称为个体
样本:从总体中抽出若干个体所构成的集合称为样本
变量:变量,或变数,指相同性质的事物间表现差异性或差异特征的数据
参数:描述总体特征的数量称为参数,也称参量
统计数:描述样本特征的数量称为统计数,也称统计量
效应:通过施加试验处理,引起试验差异的作用称为效应
试验误差:误差也称为实验误差,就是指观测值偏离真值的差异,可分为随机误差与系统误差
三、准确性与精确性有何区别?
准确性,也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。

精确性,也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。

准确性反应测量值与真值符合程度的大小,而精确性则就是反映多次测定值的变异程度。

(具体在课本第7页)
第二章样本统计量与次数分布
一、算数平均数与加权平均数形式上有何不同?为什么说它们的实质就是一致的?
1、算术平均数定义:总体或样本资料中所有观测数的总与除以观测数
的个数所得的商,简称平均数、均数或均值
直接计算法或减去(加上)常数法
加权平均数
2、实质就是一样的,就是因为它们都反映的一组数据的平均水平
二、为了评价两种药物对于小鼠体重的影响,随机从两组各抽出20只测定其体重(g),结果如下:
药物A处理组: 15, 15, 23, 24, 26, 25, 22, 19, 15, 17, 15, 20, 23, 21, 19, 22, 26, 21, 18, 23
药物B处理组: 31, 28, 26, 31, 28, 34, 32, 29, 32, 35, 28, 29, 33, 30, 34, 32, 36, 38, 40, 38
试从平均数、极差、标准差、变异系数几个指标评价两种药物对于小鼠体重的影响,并给出结论。

详细结果略,本题考查平均数(P22)、极差(P24)、标准差(P25)、变异系数(P27)等特征数
第三章概率与分布
一、试解释必然事件、不可能事件、随机事件、频率、概率、正态分布、抽样误差、标准误?
必然事件:在一定条件下必然出现的现象称为必然事件
不可能事件:在一定条件下必然不出现的事件称为不可能事件
随机事件:在某些确定的条件下,可能出现也可能不出现的现象,称为随机事件,简称“事件”
频率:若在相同的条件下,进行了n次试验,在这n次试验中,事件A出现的次数m称为事件A出现的频数,比值m/n称为事件A出现的频率,记为W(A)=m/n
0≤W(A) ≤1
概率:概率的统计定义:设在相同的条件下,进行大量重复试验,若事件A的频率稳定地在某一确定值p的附近摆动,则称p为事件A出现的概率。

P(A) = p
正态分布:正态分布也称为高斯分布,就是一种连续型随机变量的概率分布。

它的分布状态就是多数变量值都围绕在平均值左右,由平均值到分布的两侧,变量数减少
抽样误差:由这些样本算得的平均数有大有小,不尽相同, 与原总体均数μ相比往往表现出不同程度的差异。

这种差异就是由随机抽样造成的, 称为抽样误差
标准误: 标准误,平均数抽样总体的标准差),标准误的大小反映样本平均数的抽样误差的大小,即精确性的高低
2、已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值:
(1) P(0、3<u≤1、8) P=0、34617
(2) P (-1<u ≤1) P=0、6826
(3) P (-1、96<u ≤1、96) P=0、95
(4) P (-2、58<u ≤2、58) P=0、9901
(注:此类题计算方法见课本P43例3、9)
第四章统计推断
一、什么就是统计推断?统计推断有哪几种,含义就是什么?
统计推断:由一个样本或一糸列样本所得的结果来推断总体的特征,主要包括假设检验与参数估计两个方面
假设检验:假设检验又称显著性检验,就就是根据总体的理论分布与小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断
参数估计:参数估计就是统计推断的另一个方面,它就是指由样本结果对总体参数在一定概率水平下所作出的估计,参数估计包括区间估计与点估计。

参数的区间估计与点估计就是建立在一定理论分布基础上的一种方法
二、什么就是小概率原理?它在假设检验中有何作用?
小概率原理:如果假设一些条件,并在假设的条件下能够准确地算出事件A出现的概率α为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生
作用:在假设检验中,根据小概率原理计算出的可能性若小于α则否定原假设 ,若大于α则接受原假设
三、用中草药青木香治疗高血压,记录了13个病例,所测定的舒张压(mmHg)数据如下:
试检验该药就是否具有降血压作用?
分析:该题考查的就是成对资料平均数的假设检验,用t检验法;检验该药就是否具有降血压作用,故用单尾检验
答案:t=5、701,否定H0,接受HA,即该药具有降血压的作用
(注:此类题详细解题步骤见课本P68例4、11)
4、调查了甲、乙两医院乳腺癌手术后5年的生存情况,甲医院共有
755例,生存数为485人,乙医院共有383例,生存数为257人,问
两医院乳腺癌手术后5年生存率有无显著差异?
分析:两个样本频率的假设性检验;np与nq>30,无需连续性矫正,用u检验;事先不知道两个生存率孰高孰低,用双尾检验
答案:u=-0、958 ,接收H0,否定H A,即两医院乳腺癌手术后5年生存率无显著差异
(注:此类题型详解见课本P72例4、14、例4、15;例4、14就是不需要连续性矫正的情况,例4、15就是需要连续性矫正的情况)
第五章χ2 检验
一、χ2主要有几种用途?各自用于什么情况下的假设检验?
χ2检验的用途:适合性检验(也称吻合度检验)、独立性检验、同质性检验
(1)适合性检验比较观测数与理论数就是否符合的假设检验用途:遗传学中用以检验实际结果就是否符合遗传规律、样本的分布与理论分布就是否相等、自由组合定律
(2)独立性检验就是指研究两个或两个以上的计数资料或属性资料之间就是相互独立的或者就是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设就是否成立
(3)同质性检验在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行χ2 检验 (课本P78—P80就是样本方差的同质性检验,个人觉得考的几率不大)
二、有一大麦杂交组合,F2的芒性状表型有钩芒、长芒与短芒三种,观察其对应株数为348,115,157。

试检验其比率就是否符合9:3:4的理论比率
分析:此题为χ2适合性检验
答案:χ2=0、041,χ20、05=3、84;χ2<χ20、05,p>0、05,接收H0,否定HA,即大麦F2的比率符合9:3:4的理论比率
(注:df=1时,需进行连续性矫正;课本P85例5、1、P87例5、3)
对于资料数多于两组的值,可以用下列简式:
(课本P87例5、3)
三、某仓库调查不同品种苹果的耐储藏情况,随机抽取“国光”苹果200个,腐烂14个;“红富士”苹果178个,腐烂16个,试问这两种苹果的耐贮性差异就是否显著?
分析:次题为χ2独立性检验 (2×2 列联表的独立性检验)
答案:χ2=0、274,χ2<χ20、05,p>0、05, 接收H0,否定H A,即这两种苹果的耐贮性差异与苹果种类无关
(注:此类题型见课本P88例5、4)
2×2 列联表需要进行连续性矫正,简式为
(课本P882×2 列联一般形式、例5、4)
2×c列联表不需要进行连续性矫正,简式为
r×c列联表不需要进行连续性矫正
第六章方差分析
一、什么就是方差分析?方差分析的基本思想与一般步骤?
方差分析又叫变量分析,它就是用以检验两个或多个均数间差异的假设检验方法。

它就是一类特定情况下的统计假设检验,或者说就是平均数差异显著性检验的一种引伸
基本思想:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小总变异来源于处理效应与实验误差
一般步骤:(1)平方与计算 (2)自由度计算 (3)计算方差
(注:详见课本P99例6、1)
二、什么就是多重比较?多重比较有哪些方法?
多重比较:要明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其她的处理进行比较,这种差异显著性的检验就叫多重比较; 统计上把多个平均数两两间的相互比较称为多重比较。

方法: 最小显著差数法 (LSD法 )与最小显著极差法(LSR法)
LSD法的实质就是两个平均数相比较的t检验法、 LSR法克服了LSD法的局限性,采用不同平均数间用不同的显著差数标准进行比较,它可用于平均数间的所有相互比较
三、为了研究氟对种子发芽的影响,分别用四种不同浓度的氟化钠溶液处理种子,随后进行发芽试验(每盆50粒,每处理重复三次),观察它们的发芽情况,测得芽长如下表。

试作方差分析,并用LSD法、SSR 法与q法分别进行多重比较
处理 1 2 3
0ug·g-1(对照) 8、9 8、4 8、6
10ug·g-1 8、2 7、9 7、5
50ug·g-1 7、0 5、5 6、1
100ug·g-1 5、0 6、3 4、1
四、用同一公猪对三头母猪进行配种试验,所产各头仔猪断奶时的体重(kg)资料如下:No、1: 24、0,22、5,24、0,20、0,22、0,23、0,22、0,22、5;
No、2:19、0,19、5,20、0,23、5,19、0,21、0,16、5;
No、3:16、0,16、0,15、5,20、5,14、0,17、5,14、5,15、5,19、0
试分析母猪对仔猪体重效应的差异显著性
答案:F=21、515**,s1-2=0、944
第七章回归与相关分析
一、什么叫回归分析?回归截距与回归系数的统计学意义?
回归分析:(因果关系)如果对x的每一个可能的值,都有随机变量y的一个分布相对应,则称随机变量y对变量x存在回归关系,就是一个变量的变化受另一个变量或几个变量的制约
回归截距:常量a,a就是总体回归截距,就是回归直线在纵坐标的截距,它就是y的本底水平,即x对y没有任何作用时y的数量表现,它属于不能用x来估计的部分
回归系数:β为总体回归系数,βx表示依变量y的值改变中,由y与自变量x的线性回归关系所引起变化的部分,即可以由x直接估计的部分
Y=a+bx:a为当x=0时的Y值,即直线在y轴上的截距,称为回归截距;b
为回归直线的斜率,称为回归系数,其含义就是自变量x改变一个单位,依变量y平均增加或减少的单位数
二、什么叫相关分析?相关系数与决定系数各具什么意义?
相关分析:(平行关系) 就是两个以上变量之间共同受到另外因素的影响
相关系数:如果两个变量间呈线性关系,但不需要由一个变量来估计另一个变量,只需了解两个变量的相关程度以及相关性质,可以通过计算表示两个变量相关程度与性质的统计数——相关系数来进行研究
决定系数:统计中还有另外一个表示相关程度的统计数——决定系数,决定系数定义为相关系数r的平方。

决定系数的含义就是变量x引起y变异的回归平方与占y变异总平方与的比率,只能表示相关程度,不能表示相关性质。

相关文档
最新文档