生物统计学-4-统计推断
重庆大学生物统计学_第四章 统计推断
假设检验的步骤
1、分析 • 2、提出假设 • 3、确定显著性水平 a • 4、计算概率 • 5、推断是否接受假设 •
确定适当的检验统计量
什么检验统计量? •
用于假设检验问题的统计量 • 选择统计量的方法与参数估计相同,需考虑 • (1)是大样本还是小样本 • (2)总体方差已知还是未知 •
提出假设
无效假设又称零假设,即待检验的假设,表示为H0
无效:指处理效应与总体参数之间没有真实的差异, 试验结果中的差异是误差导致 •
备择假设:与无效假设对立的假设,表示为HA
备择假设认为试验结果中的差异是由于总体参数不 同引起 •
无效假设遵循原则: •
1、无效假设有意义 • 2、可算出因抽样误差而获得样本结果的概率 •
P(X<7.65) P(X>7.65)
7.65 7.25
0.158
true
0.994
0.006
(4)推断 •
P<0.05, 显著水平上拒绝H0,接 受HA。即认为新育苗方法和常 规方法有显著差异 •
0.994
α
α
2
2
P 1 =0.025
P 2 =0.975
分析:1)总体方差已知,故采用u检验 • 2)治疗后能否提高总体平均数,故进行单尾检验 •
小概率 原理 •
可能正确 •
接受H0 否定HA
P <α 可能错误
接受HA 否定H0
判断P-值显著性的指导
如果 0.01<=P<0.05: 则结果是显著的 (*) 如果 P<0.01: 则结果是极显著的(**) 如果 P>0.05: 则结果被认为没有统计显著性 (NS)
生物统计学答案
第一章绪论一、名词解释1、总体:根据研究目的确定的研究对象的全体称为总体。
2、个体:总体中的一个研究单位称为个体。
3、样本:总体的一部分称为样本。
4、样本含量:样本中所包含的个体数目称为样本含量(容量)或大小。
5、随机样本:从总体中随机抽取的样本称为随机样本,而随机抽取是指总体中的每一个个体都有同等的机会被抽取组成样本。
6、参数:由总体计算的特征数叫参数。
7、统计量:由样本计算的特征数叫统计量。
8、随机误差:也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成,带有偶然性质,影响试验的精确性。
9、系统误差:也叫片面误差,是由于一些能控制但未加控制的因素造成的,其影响试验的准确性。
10、准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。
11、精确性:也叫精确度,指调查或试验研究中同一试验指标或性状的重复观测值彼此接近的程度。
二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?答:(1)生物统计是数理统计的原理和方法在生物科学研究中的应用,是一门应用数学。
(2)生物统计在畜牧、水产科学研究中的作用主要体现在两个方面:一是提供试验或调查设计的方法,二是提供整理、分析资料的方法。
2、统计分析的两个特点是什么?答:统计分析的两个特点是:①通过样本来推断总体。
②有很大的可靠性但也有一定的错误率。
3、如何提高试验的准确性与精确性?答:在调查或试验中应严格按照调查或试验计划进行,准确地进行观察记载,力求避免认为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试畜禽的初始条件如品种、性别、年龄、健康状况、饲养条件、管理措施等尽量控制一致,并通过合理的调查或试验设计,努力提高试验的准确性和精确性。
4、如何控制、降低随机误差,避免系统误差?答:随机误差是由于一些无法控制的偶然因素造成的,难以消除,只能尽量控制和降低;主要是试验动物的初始条件、饲养条件、管理措施等在试验中要力求一致,尽量降低差异。
第四章 生物统计学统计推断121031
名患某种疾病病人的平均脉搏x=67.4次/min,
并测得样本方差s2=35.16,问这些病人的脉搏 是否正常?
2
统计推断两种方式
统计假设检验:首先对总体参数提出一个假设, 通过样本数据推断这个假设是否可以接受,如 果可以接受,样本很可能抽自这个总体,否则 拒绝该假设,样本抽自另外总体。
参数估计:通过样本统计量估计总体参数。
9
u
x 0
n
10.23 10.00 1.82 0.40 10
P(U >1.82)=0.03438,P < 0.05,拒绝H0,接受 HA。
10
在实际应用中,并不直接求出概率值,而是建
立在α水平上H0的拒绝域。从正态分布上侧分
位数表中查出P(U > uα)= α时的uα值,U > uα的
下尾单侧检验:对应于HA:μ<μ0时的检验称为 下尾单侧检验。其拒绝域为U <-uα。 双侧检验:对应于HA:μ≠μ0时的检验称为双侧 检验。双侧检验的拒绝域为|U| >uα/2 。
12
5、单侧检验和双侧检验的效率
在样本含量和显著水平相同的情况下,单侧检验的 效率高于双侧检验。这是因为在做单侧检验利用了 已知有一侧是不可能这一条件,从而提高了它的辨 别力。所以,在可能的条件下尽量做单侧检验。
三、在σ已知的情况下,单个平均数的显 著性检验—— u 检验
检验程序如下:
1、假设从σ已知的正态或近似正态总体中抽出 含量为n 的样本。 2、零假设
备择假设
H0: μ=μ0
HA: ① μ > μ0
② μ < μ0
③ μ ≠ μ0
生物统计第4章 统计推断
4.1.5 变异性的显著性检验:2检验
一个混杂的小麦品种,株高标准差0 =14cm,经 提纯后随机抽取10株,它们的株高为:90, 105, 101, 95, 100, 100, 101, 105, 93, 97, 考察 提纯后的群体是否比原群体整齐?
1、小麦株高是服从正态分布的随机变量 2、提出假设 关于备择假设的说明:小麦经提纯后只 能变得更整齐,绝不会更离散,即只能 小于0,因此HA:< 0 。
2014-8-4
4.1.5 变异性的显著性检验:2检验(续) 3、显著性水平规定=0.05 4、统计量的值:
5、建立的拒绝域:因HA: < 0 ,故为下尾 单侧检验,当2<21-时拒绝H0 ,从附表6中可 以查ቤተ መጻሕፍቲ ባይዱ29,0.99 = 2.09 6、结论,因2<29,0.99,拒绝H0 ,接受HA , 提纯后株高比原株高整齐。
2014-8-4
小概率原理
在一次试验中,几乎是不会发生的,若根 据一定的假设条件计算出来的该事件发生 的概率很小,而在一次试验中它竟然发生 了,则可认为原假设条件不正确,给予否 定。 在生物统计的显著性检验中,通常取5%或 1%小概率为显著性水平,记为“”
2014-8-4
小概率原理用于显著性检验
2014-8-4
两种类型的错误
–Ⅰ型错误:假设是正确的,却错误地拒绝了它。 犯Ⅰ型错误的概率不会大于 。(以真为假) –Ⅱ型错误:当 0但错误地接受了 = 假设时所犯的错误。(以假为真)
0的
2014-8-4
关于两种类型错误的三点解释
• 当1越接近于0时,犯Ⅱ型错误的概率愈 大;当1越远离0时,犯Ⅱ型错误的概率 愈小。 • 在样本含量和样本平均数都固定时,为了 降低犯Ⅰ型错误的概率 (就应将图5-2 中的竖线右移),必然增加犯Ⅱ型错误的 概率。 • 为了同时降低和就需增加样本含量。
生物统计学课后习题作业答案完善版
答:事件A在n次重复试验中发生了m次,则比值m/n称为事件A发生的频率,记为W(A);事件A在n次重复试验中发生了m次,当试验次数n不断增加时,事件A发生的频率W(A)就越来越接近某一确定值p,则p即为事件A发生的概率。二者的关系是:当试验次数n充分大时,频率转化为概率。
习题3.4
答:正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。
U=0,σ²=1的正态分布为标准正态分布。
正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值 ;②、正态分布是以μ为中心向左右两侧对称的分布③、 的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x轴为渐近线,x的取值区间为(-∞,+∞);④、正态分布曲线完全由参数μ和来决定⑤、正态分布曲线在x=μ±处各有一个拐点;⑥、正态分布曲线与x轴所围成的面积必定等于1。
习题3.2
答:事件A和事件B不能同时发生,即A·B=V,那么称事件A和事件B为互斥事件,如人的ABO血型中,某个人血型可能是A型、B型、O型、AB型4中血型之一,但不可能既是A型又是B型。事件A和事件B必有一个发生,但二者不能同时发生即A+B=U,A×B=V,则称事件A与事件B为对立事件,如抛硬币时向上的一面不是正面就是反面。事件A与事件B的发生毫无关系。反之事件B的发生与事件A的发生毫无关系,则称事件A与事件B为独立事件,如第二胎生男生女与第一台生男生女毫无关系。
习题6.1
答:(1)方差分析是对两个或多个样本平均数差异显著性检验的方法。
(2)方差分析的基本思想是将测量数据的总变异按照变异来源分为处理效应和误差效应,并作出数量估计,在一定显著水平下进行比较,从而检验处理效应是否显著。
生物统计第4章 统计推断.
小概率原理用于显著性检验(续)
• 解: 1 样本平 均数满足何种 分布?
• 2 从正态分布表查出 P = 0.03438 < 0.05,这是一个小概率事件,该样本 几乎不可能抽自 = 10.00 g 的总体。
2018/12/8
单侧检测(one-sided test)
• 上尾检验(upper tailed test):拒绝H0后, 接受 > 0,如下左图。 • 下尾检验(lower tailed test):拒绝H0后, 接受 < 0 ,如下右图。
2018/12/8
4.1.2单个样本显著性检验的程序(续)
3. 两种类型的错误 不宜定得太严,太严会增加 。尽量增 加样本含量n 4. 确定检验方法:u检验、t检验、卡方检 验、F检验等。 5. 建立在水平上的H0的拒绝域(注意单 侧或双侧):单侧检验时,拒绝域只在 零假设的一侧有一个区间。做双侧检验 时,拒绝域在零假设的两侧各有一个区 间。
2018/12/8
小概率原理
在一次试验中,几乎是不会发生的,若根 据一定的假设条件计算出来的该事件发生 的概率很小,而在一次试验中它竟然发生 了,则可认为原假设条件不正确,给予否 定。 在生物统计的显著性检验中,通常取5%或 1%小概率为显著性水平,记为“”
2018/12/8
小概率原理用于显著性检验
• 例:用实验动物作实验材料,现从一批动 物中抽取含量n = 10的样本并已经计算出 平均值为 10.23 g 。要求动物满足平均体 重 =10.00 g, = 0.4 的正态分布总体, 若 < 10.00 g 须再饲养,若 >10.00 g 则应淘汰,问此批动物材料是否合适?
2018/12/8
2018/12/8
最新生物统计学课后习题解答-李春喜
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地100 例30 ~40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种10 个果穗长度(cm) 的标准差和变异系数,并解释所得结果。
24 号:19 ,21 ,20 ,20 ,18 ,19 ,22 ,21 ,21 ,19 ;金皇后:16 ,21 ,24 ,15 ,26 ,18 ,20 ,19 ,22 ,19 。
【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。
生物统计学中的统计推断
x
非患者 506 180.6
45.8 34.2
u x1 x2
s s 2
2
1 2
n1 n2
ν=n1+n2-2
t检验:要求样本来自正态分布,且两均数比 较时还要求两总体方差相等。
u检验:n较大。
t检验的条件是样本观察值来自于正态分布,且 要求两组比较时两组总体方差相等,由于抽 样误差的存在,即使总体方差相等,求出的 样本方差也未必相等,但是否一定是由抽样 误差引起的呢?
检验统计量
t
d
sd
n
例 某单位研究饮食中缺乏维生素E与肝中维生素A含
量的关系,将同种属的大白鼠按性别相同,年龄、 体重相近者配成对子,共8对,并将每对中的两头 动物随机分到正常饲料组和维生素E缺乏组,过一 定时期将大白鼠杀死,测得其肝中维生素A的含量, 问不同饲料的大白鼠肝中维生素含量有无差别?
当样本例数n一定时,α减小则β会增大。
检验效能(power of a test):亦称把握度,1-β, 它的意义是当两总体确有差别,按规定检验水准α 所能发现该差异的能力。
(1)统计意义:从总体中作大数次随机抽样, 有95%求得的可信区间包含总体均数。并不是 做一次抽样求得可信区间包括μ的概率是0.95,
n
t s
x
n ,
< μ<
t x s
n ,
1
n1
1
n2
ν=n1+n2-2
例 某克山病区测得11例克山病患者与13名健康人的血 磷值(mmol/L),问该地急性克山病患者与健康人 的血磷值是否不同?
患者X1:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
生物统计学4 统计推断
2) 选取显著水平: 0 .0 5
3)
计算: x 3 5 5 ( k g / 亩 )
s
(x x)2 9.4868
n 1
sx
s 3.3541 n
t x 0 1.491
sx
4) 推断: 查表t-table, 与显著性水平对应的|t 0.05, 7|=2.365,因
第一节 假设检验的原理与方法
统计假设:在科学研究中,往往首先要提 出一个有关某一总体参数的假设,这种假 设称为统计假设。
原品种 µ0 =300kg ,σ=75kg
新品系 n=25,-x=330kg
µ
? µ≠µ0
首先,先假设真实差异不存在,表面差 异全为随机误差;
其次,计算这一假设出现的概率,根据 小概率事件实际不可能性原理,判断假设是 否正确。
即:两品种产量相同。
2) 选取显著水平: 0 .0 1
3) 计算:s x1 x2
s12
s
2 2
4.951
n1 n2
u x1 x2 3.595 s x1 x2
4) 推断:查表z-two-tails,与显著性水平对应的 |U0.01|=2.58,因为3.595>2.58,所以假设错误,
如第一节的例子,如n从25增至225,则 σx -=75/√225=5㎏ 由此计算的接受区间变小,为
290.2㎏~309.8㎏。若新品种μ=315㎏,则不能发现H0:µ=µ0 为错误的概率β=0.1492=14.92%(图4.5) 。
综合起来可以归纳如下:
样本容量n固定的情况下,提高显著水平,如从 5%提高到1%,则将增大第二类错误的概率值。
生物统计学-名词解释
第一章绪论与第二章概率论基础1总体:指研究对象的全体,它是由研究对象中的所有单元组成的。
总体中包含单元的数目称作总体容量(或大小)用N表示。
2个体:3样本:是指按照抽样规则所抽中的那部分单元所组成的集合。
4样本含量:样本所包含的单位数用 n表示,称为样本含量。
5随机样本:总体是唯一的、确定的,而样本是不确定的、可变的、随机的。
6参数:反映总体数量特征的综合指标称为总体参数。
常见的总体参数主要有:总体总和;总体均值;总体比率;总体比例等。
7统计量:反映样本数量特征的综合指标称之为统计量。
统计量是n元样本的一个实值函数,是一个随机变量,统计量的一个具体取值即为统计值。
主要样本统计量有:样本总和、样本均值、样本比率、样本比例等。
8准确性9精确性10必然现象11随机现象:带有随机性、偶然性的现象.12随机试验:如果每次试验的可能结果不止一个,且事先不能肯定会出现哪一个结果,这样的试验称为随机试验.13随机事件:在一次试验中可能发生也可能不发生的事件称为随机事件,简称事件.14概率的统计定义:验后概率,在相同条件下随机试验n次,某事件A出现m次(m<n),则比值称为事件A发生频率。
15小概率原理16随机变量:在随机试验中所得到的取值具有随机性的量,称为随机变量。
17 离散型随机变量:所有取值可以逐个一一列举18连续型随机变量:全部可能取值不仅无穷多,而且还不能一一列举,而是充满一个区间. 19标准正态分布: μ=0,σ=0的正态分布20标准正态变量21双侧概率(两尾概率):把随机变量X落在平均数μ加减不同倍数标准差σ区间之外的概率称为两尾概率,记做α。
22单侧概率(一尾概率):随机变量X小于μ-kσ或者大于μ+kσ的概率,称为一尾概率,记做α/2.23贝努利试验:二项试验,满足下列条件:一次试验只有两个可能结果,即“成功”和“失败”,“成功”是指我们感兴趣的某种特征;试验是相互独立的,并可以重复进行n次,在n 次试验中,“成功”的次数对应一个离散型随机变量X。
生物统计学课后习题
01习题1、什么是生物试验?它有哪些要求?2、什么事食盐试验的精确度和准确度?它们各有何特点?3、什么是实验误差?它与试验错误有何不同?生物试验误差的来源有哪些?如何控制它们以减少误差?4、实验设计的三大基本原则是什么?常见的试验设计有哪些?它们分别适合什么情况?5、解释名词:总体;样本;观察值;变数;随机抽样;分层抽样;整群抽样;典型抽样;机械抽样。
6、什么是间断性变数资料和连续性变数资料?7、从某小麦品种群体中随机抽取10株,统计其单株有效分蘖数,分别是3,4,4,5,5,5,6,6,7,8。
请计算其中数、众数、平均数、几何平均数、极差、离均差平方和、方差、标准差、变异系数。
8、某玉米品种的100个穗子的长度(cm)资料如题表1.1所示。
试整理之形成频数分布表和频数分布图。
题表1.115 17 19 16 15 20 18 19 17 17 17 18 17 16 18 20 19 17 16 18 16 17 19 18 18 17 17 17 18 1818 15 16 18 18 18 17 20 19 1819 15 17 17 17 16 17 18 18 17 17 19 19 17 19 17 18 16 18 1719 16 16 17 17 17 16 17 16 18 18 19 18 18 19 19 20 15 16 19 17 18 20 19 17 18 17 17 16 15 15 16 18 17 18 16 17 19 19 179、试以第8题中的数据,计算其中数、众数、平均数、几何平均数、极差、离均差平方和、方差、标准差、变异系数等统计参数。
02习题1、设A,B,C表示三个随机事件,试将下列事件用A,B,C表示出来:(1)仅A发生;(2)A,B,C都发生;(3)A,B,C都不发生;(4)A,B,C不都发生;(5)A不发生,而且B,C中至少有一个事件发生;(6)A,B,C中至少有一个事件发生;(7)A,B,C 中只有一个事件发生;(8)A,B,C中至少有两个事件发生;(9)A,B,C中最多有一个事件发生。
生物统计学 第四章 统计推断
选定检验方法,计算检验统计量(test statistic)
u
t
两个样本平均数的比较
F
多个样本平均数的比较
2
事物间的构成比的差异进行比较
例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),
2 =240 (mg/L)2的正态分布。现用克矽平对6位矽肺病患者进 行治疗,治疗后化验测得其平均血红蛋白含量x =136(mg/L)。
P(F 3.48) 0.05
P(F 5.99) 0.01
在df1=4,df2=10的正态总体中连续 抽样,所得F值大于3.48的仅有5%, 而大于5.99的仅有1%。
第一节
第四章 假设检验的原理与方法
第二节 样本平均数的假设检验
第三节 样本频率的假设检验
第四节 参数的区间估计与点估计
第五节 方差的同质性检验
0
加。
x
n
0
标准误小,正态分布中接受区就变得十分狭窄,μ 和 μ0 之间的差别比较容 易发现。
当P< 时否定H0,称“差异是显著的”
严格的讲应是“由样本推断出的总体平均数 与0之间的差异有统计学意义”
即它们属于两个不同总体(冒 风险)。
“差异显著”并不是指的数值上有显著性差异。 单纯数值上的 x 与0 的差异并不能说明任何问 题。
u x 136 126 1.581
x
40
u x 136 126 1.581
x
40
P( u >1.581)=2×0.0571=0.1142
在N(126,240)的总体中,以n=6进行随机抽样,所得平均数 x=136与126相差为10以上的概率为0.1142。
检验所计算的概率并不是实得差异本身的概率,而是超过实 得差异的概率。
统计推断原理和步骤
用样本的平均值来检验总体平均值 用两个样本平均值的差异来检验相应两个总体平均 值的差异 用样本平均值作为检验对象的理由是: 用样本平均值作为检验对象的理由是: 1、我们已经证明了 ∑ ( xi x )2 为最小,这说明样本平 我们已经证明了 最小, 的差异最小, 均值 x 与各变量 xi 的差异最小,因此 x 是样本资料 最好的代表 最好的代表 2、在抽样分布中,我们已经证明了样本平均值 x 是 在抽样分布中, 在抽样分布中 总体平均值 的无偏估计量,即 x 的数学期望是 无偏估计量,
x1 x 2 = 0.12
s1 = 0.063
s 2 = 0.071
发现两组小鼠的血浆含N量有差异: 发现两组小鼠的血浆含 量有差异: 量有差异
那么我们能否仅凭这一差异就认为日龄的不同, 那么我们能否仅凭这一差异就认为日龄的不同,其 血浆含N量就有差异呢? 血浆含 量就有差异呢? 量就有差异呢 35d的小鼠中也有含 量高的(如0.99 0.98 0.94) 的小鼠中也有含N量高的 的小鼠中也有含 量高的( ) 90d的小鼠中也有含 量低的(如0.93 0.94) 的小鼠中也有含N量低的 的小鼠中也有含 量低的( ) 即:同一组内的小鼠其血浆含N量之间也是有差异 同一组内的小鼠其血浆含 量之间也是有差异 的
35d( x2 )0.98 0.83 0.81 90d( )1.00 1.08 0.97 0.93 1.03 0.94 1.11 1.10
对这两组数据进行计算,得: 对这两组数据进行计算, 35d组小鼠的 x1 = 0.90 组小鼠的 90d组小鼠的 x = 1.02 组小鼠的 2
标准误不仅反映了抽样误差的大小, 标准误不仅反映了抽样误差的大小,而且反映了样 大小 本统计量与总体相应参数间的差异程度 本统计量与总体相应参数间的差异程度 也反映了用某个样本统计量来估计总体参数的准确 也反映了用某个样本统计量来估计总体参数的准确 程度
生物统计学知识点总结
一、田间试验的特点1、田间试验具有严格的地区性和季节性,试验周期长。
2、田间试验普遍存在试验误差3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研究其生长发育规律、各项栽培技术或栽培条件的效果。
二、田间试验的基本要求结果重演性、结果可靠性、条件先进代表性、目的明确性三、单因素试验的处理数就是该因素的水平数。
四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组合数是?3因素3水平的处理组合数是?多因素试验的处理数是各因素不同水平数的所有组合。
五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为喷施等量清水。
六、简单效应的计算N 的简单效应为40-30=10在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。
七、平均效应的计算P的主效(8+14)/2=11;N的主效(10+16)/2=13;八、互作的计算N与P的互作为(16-10)/2=3或(14-8)/2=3九、田间试验误差可分为系统误差和随机误差两种。
(1、系统误差影响试验的准确性,随机误差影响试验的精确性。
2、准确度受系统误差影响,也受随机误差影响;精确度受随机误差影响。
3、若消除系统误差,则精确度=准确度。
)十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。
适当的时候可以考虑增加重复次数来降低误差。
小区面积一般在6-60m2,而示范小区面积不小于330m2 。
十一、通常情况下,狭长小区误差比方形小区误差小。
小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。
一般小区长宽比为3-10:1,甚至达20:1十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。
十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复;小区面积较大的试验可设2-4次重复。
十四、将对照或早熟品种种在试验田四周,一般4行以上。
生物统计学课后习题解答李春喜
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性;第二章试验资料的整理与特征数的计算习题某地100例30~40岁健康男子血清总胆固醇mol·L-1测定结果如下:计算平均数、标准差和变异系数;答案=,s=,CV=%试计算下列两个玉米品种10个果穗长度cm的标准差和变异系数,并解释所得结果;24号:19,21,20,20,18,19,22,21,21,19;金皇后:16,21,24,15,26,18,20,19,22,19;答案1=20,s1=,CV1=%;2=20,s2=,CV2=%;某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重kg,结果分别如下:单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38 ,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,48,50,51,46,41,3 4,44,46;混养50绳重量数据:51,48,58,42,55,48,48,54,39,58,50,54,53,44,45,50,51,57,43,67,48,44,58,57 ,46,57,50,48,41,62,51,58,48,53,47,57,51,53,48,64,52,59,55,57,48,69,52,5 4,53,50;试从平均数、极差、标准差、变异系数几个指标来评估单养与混养的效果,并给出分析结论;答案1=,R=30,s1=,CV1=%;2=,R=30,s2=,CV2=%;第三章概率与概率分布解释下列概念:互斥事件、对立事件、独立事件、频率、概率频率如何转化为概率什么是正态分布什么是标准正态分布正态分布曲线有什么特点μ和σ对正态分布曲线有何影响已知u服从标准正态分布N0,1,试查表计算下列各小题的概率值:1P<u≤;2P-1<u≤1;3P-2<u≤2;4P<u≤;5P<u≤;答案1;2;3;4;5;设x服从正态分布N4,16,试通过标准化变换后查表计算下列各题的概率值:1P-3<x≤4;2Px<;3Px>;4Px≥-1;答案1;2;3;4;水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯纯合体为WW,两个纯合亲本杂交后,其F1为非糯杂合体Ww;1现以F1回交于糯稻亲本,在后代200株中试问预期有多少株为糯稻,多少株为非糯稻试列出糯稻和非糯稻的概率;2当F1代自交,F2代性状分离,其中3/4为非糯,1/4为糯稻;假定F2代播种了2000株,试问糯稻株有多少非糯株有多少答案1糯稻100株,非糯100株,概率均为;2糯稻500株,非糯1500株;大麦的矮生抗锈基因和抗叶锈基因连锁,以矮生基因与正常感锈基因杂交,在F2代出现纯合正常抗锈植株的概率仅;试计算:1在F2代种植200株时,正常抗锈植株的概率;2若希望有的概率保证获得1株以上纯合正常抗锈植株,则F2代至少应种植多少株答案1P0=,P1=;P2=,P3=,P4=,P5=,P6=;21279;设以同性别、同月龄的小白鼠接种某种病菌,假定接种后经过一段时间生存的概率为,若5只一组进行随机抽样,试问其中“四生一死”的概率有多大答案;有一正态分布的平均数为16,方差为4,试计算:1落于10到20之间的数据的百分数;2小于12或大于20的数据的百分数;答案1%;2%;查表计算:1df=5时,Pt≤= Pt>=2df=2时,P2≤= P2>= P<2<==3df1=3,df2=10时,PF>= PF>=答案1Pt≤=,Pt>=;2P2≤=,P2>=,P<2<==;3PF>=,PF>=;第四章统计推断什么是统计推断统计推断有哪两种什么是小概率原理它在假设检验中有何作用假设检验中的两类错误是什么如何才能少犯两类错误什么叫区间估计什么叫点估计置信度与区间估计有什么关系某养殖场以往都用鲜活饵料喂养对虾,经多年的观测资料得知,成虾平均体重为21g,标准差为1.2g;现改用鲜活与人工配合饵料各半喂养对虾,随机抽取成虾100尾,测得平均体重为20g,试问改变饵料后,对虾体重有无显着变化,并估计对虾体重的95%置信区间;答案u=-,否定H0:=0=21g,接受HA:≠0;95%置信区间:,;核桃树枝条的常规含氮量为%,现对一桃树新品种枝条的含氮量进行了10次测定,其结果为:%、%、%、%、%、%、%、%、%、%,试问该测定结果与常规枝条含氮量有无差别;答案t=-,接受H0:=0=%;检查三化螟各世代每卵块的卵数,检查第一代128个卵块,其平均数为粒,标准差为粒;检查第二代69个卵块,其平均数为粒,标准差为粒;试检验两代每卵块的卵数有无显着差异;答案u=,否定H0:1=2,接受HA:1≠2;假说:“北方动物比南方动物具有较短的附肢;”为验证这一假说,调查了如下鸟翅长mm资料:北方的:120,113,125,118,116,114,119;南方的:116,117,121,114,116,118,123,120;试检验这一假说;答案t=-,接受H0:1=2;用中草药青木香治疗高血压,记录了13个病例,所测定的舒张压mmHg数据如下:序号 1 2 3 4 5 6 7 8 9 10 11 12 13治疗前110 115 133 133 126 108 110 110 140 104 160 120 120治疗后90 116 101 103 110 88 92 104 126 86 114 88 112试检验该药是否具有降低血压的作用;答案t=,否定H0:1=2,接受HA:1≠2;为测定A、B两种病毒对烟草的致病力,取8株烟草,每一株皆半叶接种A病毒,另半叶接种B病毒,以叶面出现枯斑病的多少作为致病力强弱的指标,得结果如下:序号 1 2 3 4 5 6 7 8病毒A 9 17 31 18 7 8 20 10病毒B 10 11 18 14 6 7 17 5试检验两种病毒的致病能力是否有显着差异;答案t=,否定H0:1=2,接受HA:1≠2;有一批棉花种子,规定发芽率p≥80%为合格,现随机抽取100粒进行发芽试验,有77粒发芽,试估计:1该批棉花种子是否合格2该批棉花种子发芽率所属总体的95%置信区间;答案1u=,接受H0:p≤p0;295%置信区间:,;习题调查了甲、乙两医院乳腺癌手术后5年的生存情况,甲医院共有755例,生存数为485人,乙医院共有383例,生存数为257人,问两医院乳腺癌手术后5年的生存率有无显着差别;答案u=-,接受H0:p1=p2;用三种不同的饵料喂养同一品种鱼,一段时间后,测得每小池鱼的体重增加量g如下:A饵料:,,;B饵料:,,,;C饵料:,,,;试检验各饵料间方差的同质性;答案2=,接受H0:==;工艺上要求棉纤维的断裂强度为5.5g,现对一新品系的断裂强度测定8次,得结果为:,,,,,,,g;问此新品系的断裂强度是否符合工艺要求试用符号检验法进行检验;答案Pn+≠4=,接受H0:Md=5.5g;测定两个马铃薯品种的淀粉含量%各5次,得A品种为:,,,,;B品种为:,,,,;试用秩和检验法检验两品种淀粉含量的差异显着性;答案T=17,T<T1=19,否定H0,接受HA:两品种淀粉含量有显着差异;第五章检验2检验的主要步骤有哪些什么情况下需要进行连续性矫正某林场狩猎得到143只野兔,其中雄性57只,雌性86只,试检验该种野兔的性别比例是否符合1∶1答案2=,否定H0,接受HA:野兔性别比例不符合1∶1;有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348,115,157;试检验其比率是否符合9∶3∶4的理论比率;答案2=,接受H0:符合9∶3∶4的理论比率;某乡10岁以下的747名儿童中有421名男孩,用95%的置信水平,估计这群儿童的性别比例是否合理答案2=,否定H0,接受HA:性别比例不合理;某仓库调查不同品种苹果的耐贮情况,随机抽取“国光”苹果200个,腐烂14个,“红星”苹果178个,腐烂16个,试测试这两种苹果耐贮差异是否显着答案2=,接受H0:两种苹果耐性没有差异;调查5个小麦品种感染赤霉病的情况如下表;试分析不同品种是否与赤霉病的发生有关;品种 A B C D E 总和健株数442 460 478 376 494 2250病株数78 39 35 298 50 500总计520 499 513 674 544 2750答案2=,否定H0,接受HA:品种与赤霉病的发生有极显着的关系;用A、B、C三种浓度药物治疗219尾病鱼,试验结果如下表:浓度治愈显效好转无效总和A 67 9 10 5 91B 32 23 20 4 79C 10 11 23 5 49总计109 43 53 14 219试检验三种浓度下药物治疗效果;答案2=,否定H0,接受HA:不同浓度的治疗效果有极其显着差异;第六章方差分析什么是方差分析方差分析的基本思想是什么进行方差分析一般有哪些步骤方差分析有哪些基本假定为什么有些数据需经过转换后才能进行方差分析测定4种密度〔万株·hm2-1〕下“金皇后”玉米的千粒重g各4次,得下表结果.试作方差分析,并以SSR法作多重比较;3万株·hm2-1 6万株·hm2-1 9万株·hm2-1 12万株·hm2-1247 238 214 210258 244 227 204256 246 221 200251 236 218 210答案F=,s=;为研究氟对种子发芽的影响,分别用0 g·g-1对照、10 g·g-1、50g·g-1、100 g·g-14种浓度的氟化钠溶液处理种子浸种,每浓度处理的种子用培养皿进行发芽试验每盆50粒,每处理重复三次,测得芽长资料如下表;试作方差分析,并用LSD法、SSR法和q法分别进行多重比较;处理 1 2 30 g·g-1对照10 g·g-150 g·g-1100 g·g-1答案F=,s1-2=,s=;用同一公猪对三头母猪进行配种试验,所产各头仔猪断奶时的体重kg资料如下::,,,,,,,;:,,,,,,;:,,,,,,,,;试分析母猪对仔猪体重效应的差异显着性;答案F=,s1-2=;测定了小麦4个新品系A1、A2、A3和A4的籽粒蛋白质含量%,结果如下:A1:,108,,,,;A2:,,,,;A3:,,,,,,,;A4:,,,,;试检验其蛋白质含量的差异显着性;答案F=,s1-2=;分析A、B、C、D、E等5个杂优水稻品种稻米中的含氮量mg,有甲、乙、丙、丁四个学生,每学生对每一样品各分析一次,得下表结果;试作方差分析,并以SSR进行多重比较;品种学生甲乙丙丁ABCDE答案品种间F=,学生间F=,s=;对A、B、C、D、E等5个杂优水稻品种的干物质积累过程进行了系统的测定,每次每品种随机取两个样点,结果如下表;试作方差分析;品种样点干物质重量g·株-1A ⅠⅡB ⅠⅡC ⅠⅡD ⅠⅡE ⅠⅡ答案样点间AF=,品种间BF=,A×B的F=,s1-2=08314;个品种的家兔,每一种用兔7只,测定其不同室温下血糖值,以每100mg血中含萄糖的mg数表示,问各种家兔正常血糖值间有无差异室温对家兔的血糖值有无影响试验资料见下表;品种室温35 ℃30 ℃25 ℃20 ℃15 ℃10 ℃ 5 ℃ⅠⅡⅢⅣ140 120 110 82 82 110 130 160 140 100 83 110 130 120 160 120 120 110 100 140 150 130 110 100 82 74 100 120答案品种间F=,室温间F=;为了从三种不同原料和三种不同发酵温度中选出最适宜的条件,设计了一个二因素试验,并得到结果如下表所示,请对该资料进行方差分析;原料A 温度BB130 ℃B235 ℃B340 ℃A1 41 49 23 25 11 13 25 24 6 22 26 18A2 47 59 50 40 43 38 33 36 8 22 18 14A3 43 35 53 50 55 38 47 44 30 33 26 19答案原料间AF=,温度间BF=,A×B的F=;药物处理大豆种子试验中,使用了大、中、小粒三种类型种子,分别用五种浓度、两种处理时间进行试验处理,播种后45d对每种处理各取两个样本,每个样本取10株测定其干物重g,求其平均数,结果如下表;试进行方差分析;处理时间种子类型C浓度BB10g·g-1B210g·g-1B320g·g-1B430g·g-1B540g·g-1A112hC1小粒C2中粒C3大粒A224h C1小粒C2中粒C3大粒答案时间间AF=,浓度间BF=,籽粒类型间CF=,A×B的F=,A×C的F=,B×C的F=,A×B×C的F=;第七章抽样原理与方法抽样调查有哪些基本方法试比较其优缺点及适用对象;某地区进行仔猪断奶体重的调查,所得=8.78kg,s=3.3kg,试问对这样一个性状制订抽样调查方案,它的样本容量以多少头为宜95%的允许误差L不超0.5kg答案n=174头;研究某地区鸡的球虫感染率,预测感病率为15%,希望调查的感染率与该地区普查的感染率相差不超过3%,且置信概率为95%,问应调查多少只鸡才能达到目的答案n=567只;某单位进行增加人工光照提高母鸡产蛋量试验;根据以往试验知道,差数标准差sd 为枚;希望本次试验结果的平均差数在3枚以内,能有95%的可靠度测出差异显着性,问需要多少对试验鸡答案n=8对;比较两种饲料配方对鲤鱼增重的影响;根据以往试验增重的s2为4kg2,要求有95%的把握使两组增重差值在1.5kg内能测出差异显着性,问每组试验需要多少尾鱼答案n=15尾;从一批平菇中随机抽出10株,其单株鲜重=464.8g,s=46.59g,试在95%的置信概率下估计出这批平菇平均单株鲜重的置信区间;答案95%置信区间:,;第八章试验设计及其统计分析一何为试验设计生物学试验的基本要求是什么简述试验误差的来源及其控制途径;试验设计的基本原理和作用是什么下表为某一大豆品种比较试验的产量结果kg,小区面积为100m2,采用对比法设计,试作统计分析;品种CK A B CK C D CK E F CKⅠⅡⅢ答案A、B、C、D、E、F各品种对邻近CK的比值分别为:%,%,%,%,%,%;表为某养殖场使用四种不同饲料喂猪的增重结果kg;试作统计分析,比较饲料间的增重效果;窝组 A B C D TrⅠ14 14 16 15 59Ⅱ16 15 14 12 57Ⅲ16 12 15 12 55Ⅳ15 13 14 13 55Ⅴ15 14 15 13 57Tt 76 68 74 65 283T答案窝组间F=,饲料间F=,s1-2=kg;为了研究湿度和温度对黏虫卵发育历期的影响,用3种湿度4种温度处理黏虫卵,采用随机区组设计,重复4次,结果如下表,试进行方差分析;答案窝组间F=,相对湿度间AF=,温度间BF=,A×B的F=;第九章试验设计及其统计分析二用5×5拉丁方设计安排5个不同激素处理的黄瓜盆栽试验,得到以下干重g结果;试比较5种激素处理所得干重差异是否显着;答案品种s2=,F=;行间s2=,列间s2=,误差s2e=;以提取方法为A因素、提取浓度为B因素进行细胞转化试验,所得结果如下表;试作统计分析;答案区组s2=;提取方法s2=,F=;主区误差s2ea=;提取浓度s2=,F=;提取方法×浓度s2=,F=;误差s2eb=;某校在研究利用木霉酶解稻草粉的优良工艺条件时,发现曲种比例、水量多少、pH 值大小等因素取不同水平时对稻草粉糖化的质量有很大影响,因此作了三因素三水平的正交设计试验,获得如下表资料;试用直观分析及方差分析的方法,对试验结果进行分析;因素试验号A曲比B水量CpH值指标酶解得糖率%1 13∶717 142 13∶729 23 13∶735 354 25∶517 25 25∶529 356 25∶535 147 37∶317 358 37∶329 149 37∶335 2答案曲比F=,水量F=,pH值F=,各项变异均不显着;第十章直线回归与相关分析何谓回归分析回归截距和回归系数的统计意义是什么何谓相关分析相关系数和决定系数各具有什么意义下表是某地区4月下旬平均气温与5月上旬50株棉苗蚜虫头数的资料;年份1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 x,4月下旬平均气温℃y,5月上旬50株棉蚜虫数86 197 8 29 28 29 23 12 14 64 50 112建立直线回归方程;对回归系数作假设检验;3该地区4月下旬均温18 ℃时,5月上旬50株棉苗蚜虫预期为多少头若该地某年4月下旬均温为18 ℃时呢答案1=-+;2sy/x=,F=;3y/x的95%置信区间:,,单个y的95%置信区间:-,;研究某种有机氯的用量x,kg·hm-2和施用于小麦后在籽粒中的残留量y,mg·kg-1的关系,每一用量测定三个样本,其结果列于下表;xkg·hm-2 15 30ymg·kg-11由15对x,y求解直线回归方程和相关系数;2由5对x,y求解直线回归方程和相关系数;答案1=+,r=;2=.41+,r=;在研究代乳粉营养价值时,用大白鼠作实验,得大白鼠进食量x,g和体重增加量y,g 数据如下表;鼠号 1 2 3 4 5 6 7 8进食量g 800 780 720 867 690 787 934 750增重量g 185 158 130 180 134 167 186 1331试用直线回归方程描述其关系;2根据以上计算结果,求其回归系数的95%置信区间,绘制直线回归图形并图示回归系数的95%置信区间;3试估计进食量为900g时,大白鼠的体重平均增加多少,计算其95%置信区间,并说明含义;4求进食时为900g时,单个y的95%预测区间,并解释其意义;答案1=+;2b的95%置信区间:,;3y/x的95%置信区间:,;4单个y的95%置信区间:,;用白菜16棵,将每棵纵剖两半,一半受冻,一半未受冻,测定其维生素C含量单位:mg·g-1结果如下表;试计算相关系数和决定系数,检验相关显着性,并计算相关系数95%置信区间;未受冻受冻未受冻受冻答案r=,r2=,r的95%置信区间:,;第十一章可直线化的非线性回归分析非线性回归曲线进行直线化时,常用的转换方法有哪两种可直线化的非线性回归分析的基本步骤是什么测定不同浓度鱼滕酮x,mg·L-1对菊蚜死亡率y,%影响的资料如下表;试进行回归分析,并进行显着性检验;xy 12 25 33 43 53 68 84 90答案=-+,F=;根据下表原始数据,求某市4周岁至未满11岁女孩的年龄与平均身高的回归方程;x,年龄岁y,身高cm答案=;下表列出了甘薯薯块在生长过程中的鲜重x,g和呼吸强度〔y,CO2mg·100g-1FW·h-1〕的数据资料;试作回归分析;x 10 38 80 125 200 310 445 480y 92 32 21 12 10 7 7 6答案=-,F=;江苏省东台县测定了1972年越冬棉铃虫的化蛹进度,其结果列于下表;试以Logistic生长曲线方程描述之;日期月/日6/5 6/10 6/15 6/20 6/25 6/30 7/5 7/10 7/15 7/20 x以5 月 31日为0 5 10 15 20 25 30 35 40 45 50 y%,化蛹进度答案=,ry'x=-;。
生物统计学课后习题解答李春喜
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地100 例30 ~40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种10 个果穗长度(cm) 的标准差和变异系数,并解释所得结果。
24 号:19 ,21 ,20 ,20 ,18 ,19 ,22 ,21 ,21 ,19 ;金皇后:16 ,21 ,24 ,15 ,26 ,18 ,20 ,19 ,22 ,19 。
【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。
生物统计学课后习题解答
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。
24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ;金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ⅰ
µ0 µ
Ⅱ
Ⅰ和Ⅱ重合
0.025 0.95
α错误
µ = µ0
0.025
犯第一类错误的概率等于显著水平 α 值
Ⅰ和Ⅱ不重合
C1
β
C2
Ⅰ
Ⅱ
α 2
α 2
-uα
µ0
uα
µ
犯第二类错误的概率记为 β 值
为了降低犯两类错误的概率,一般从选取适当的显 为了降低犯两类错误的概率,一般从选取适当的显 来考虑; 著水平α 和增加试验重复次数 n 来考虑; 结论: 结论: 1. 两类错误既有联系又有区别:α 错误只在否定 H 时 两类错误既有联系又有区别: 0 发生,β 错误只在接受 H 0时发生;α 错误增加时 β 发生; 发生, 错误减小, 错误减小; 错误减小,β 错误增加时 α 错误减小; 2. β 还依赖于 µ − µ0 的距离; 的距离; 3. 可使两类错误的概率都减小; n ↑, σ ↓ 可使两类错误的概率都减小;
1.3 对二个样本平均数相比较的假设:假设二个样本平均 对二个样本平均数相比较的假设: 数 的总体, x1和 x 2 来自于具有平均数 µ1和µ 2 的总体,即: H 0 : µ1 = µ 2
H A : µ1 ≠ µ 2
2. 确定显著性水平: 确定显著性水平: 在确定无效假设和备择假设后, 在确定无效假设和备择假设后,要确定一个否定 H 0 的 概率标准,即显著性水平( 概率标准,即显著性水平(significance level)或概率 ) 水平( ),记作 水平(probability level),记作 α ,生物统计中常取 ), 两个显著水平; α = 0.05和α = 0.01 两个显著水平; 3. 计算概率; 计算概率; 4. 推断是否接受假设 小概率原理:如果根据假设条件能够确定事件 出现 小概率原理:如果根据假设条件能够确定事件A出现 为很小, 的概率 α 为很小,则在此假设条件下的 n 次独立重复 试验中,事件 将按预定的概率发生 将按预定的概率发生, 试验中,事件A将按预定的概率发生,而在一次试验 中则几乎不可能发生; 中则几乎不可能发生;
3. 双尾检验与单尾检验 3.1 双尾检验(two-tailed test):具有两个否定区,分别 双尾检验( ):具有两个否定区 ):具有两个否定区, 位于分布的两尾, 位于分布的两尾,即:
3.2 单尾检验(one-tailed test):只有一个否定区的检验, 单尾检验( ):只有一个否定区的检验 ):只有一个否定区的检验, 即:
样本 ( n1 < 30, n2 < 30) ;
2 2 2.1 两样本的总体方差 σ 12和σ 2 未知,但可假设 σ 12 =σ 2 = σ 2 未知,
时的检验: 时的检验: 首先计算平均数差数的方差 s :
2 e
s (n1 − 1) + s (n2 − 1) s = (n1 − 1) + (n2 − 1)
第一节 假设检验的原理与方法
一、假设检验(Hypothesis test)的概念:根据总体的理 假设检验( )的概念: 论分布和小概率原理, 论分布和小概率原理,对未知或不完全知道的总体提出 2种彼此对立的假设,然后由样本的实际结果,经过一 种彼此对立的假设,然后由样本的实际结果, 种彼此对立的假设 定的计算, 定的计算,做出在一定概率意义上应该接受的那种假设 的推断,亦称为显著性检验( );小概 的推断,亦称为显著性检验(significance test);小概 ); 率(little probability)水平为 0.05 或 0.01; ) ;
因此, 检验获得“差异显著” 因此,如果经 u 检验获得“差异显著”或“差 异极显著” 我们有 异极显著”,我们有95%或99%的把握认为 与 或 的把握认为 u u
0
不相同, 判断错误的可能性不超过5%或1% ;若经 不相同, 判断错误的可能性不超过 或 u 差异不显著” 检验获得 “差异不显著”, 我们只能认为在本次试 验条件下, 与 验条件下,u0 u H0: 没有差异的假设u = u 与0 u
即:
H0正确 否定H 否定 0 接受H 接受 0
H0 错误 推断正确(1推断正确 β)
α 错误 α) 错误(
推断正确(1推断正确 α)
β 错误 (β)
4.1 两类错误的关系: 两类错误的关系: I型错误与 型错误不会同时出现; 型错误与II型错误不会同时出现 型错误与 型错误不会同时出现; 在样本容量相同情况下, 型错误的概率减少 型错误的概率减少, 在样本容量相同情况下,犯I型错误的概率减少, 型错误的概率增加, 则II型错误的概率增加,反之亦然; 型错误的概率增加 反之亦然; 因为在显著性检验中,否定或接受无效假设的依据是 因为在显著性检验中, “小概率事件实际不可能性原理”,所以我们下的结论不 小概率事件实际不可能性原理” 可能有百分之百的把握。 可能有百分之百的把握。
时的检验: 检验法, n1 = n2 = n 时的检验:仍用 t 检验法,计算与假设两
2 时一样, 总体方差 σ 12 = σ 2 时一样,但其自由度为 df = n − 1 ,
而不是 2(n − 1);
2 2 2.3 两样本的总体方差 σ 12和σ 2 未知,且σ 12 ≠ σ 2 , n1 ≠ n2 时 未知,
2 e 2 1 2 2
再计算两样本平均数差数的标准误 s x
1 − x2
:
sx1 − x2 =
最后计算 t 值:
s s + n1 n2
Hale Waihona Puke 2 e2 e( x1 − x 2 ) − ( µ1 − µ2 ) df = n1 + n2 − 2 t= sx1 − x2
2 2 2.2 两样本的总体方差 σ 12和σ 2 未知,且 σ 12 ≠ σ 2 ,但 未知,
sx1 − x2 =
s s + n1 n2
2 1
2 2
( x1 − x 2 ) − ( µ1 − µ2 ) u= sx1 − x2
检验: 二、小样本平均数的假设检验— t 检验:当总体方差 σ 2 小样本平均数的假设检验 检验( 未知且样本容量 n < 30 时则采用 t 检验(t-test); ); 1. 一个样本平均数的 t 检验:小样本的 s 2和σ 2 相差较大, 检验: 相差较大,
x−µ 分布, 遵循自由度 df = n – 1 的 t 分布,即: sx s x−µ sx = , t= ; sx n 2. 成组数据(pooled data)平均数比较的 t 检验:即检 成组数据( 检验: )
故
验两个样本平均数 x1和 x 2 所属总体平均数 µ1和µ2 是否
2 相等,适用于总体方差 σ 12和σ 2 未知且两样本均为小 相等,
1.1 无效假设所遵循的原则:有意义,且根据它可算出因 无效假设所遵循的原则:有意义, 抽样误差而获得样本结果的概率; 抽样误差而获得样本结果的概率; 1.2 对一个样本平均数的假设:假设一个样本平均数 x 来 对一个样本平均数的假设: 自于一具有平均数 的总体, µ 的总体,即: H 0 : µ = µ0 H A : µ ≠ µ0
x1 − x 2 的检验: 分布, 的检验:统计数 不再服从相应的 t 分布,故 sx1 − x2
检验; 进行近似 t 检验;由于 σ ≠ σ ,所以需要用两个样
2
第二节 样本平均数的假设检验
检验: 一、大样本平均数的假设检验— u 检验:当总体方差 σ 2 大样本平均数的假设检验 已知或总体方差未知但样本为大样本( 已知或总体方差未知但样本为大样本(n≥30)时,样 ) 本平均数的分布服从于正态分布, 本平均数的分布服从于正态分布,标准化后则服从于 标准正态分布, 分布, 检验( ); 标准正态分布,即 u 分布,故采用 u 检验(u-test); 1. 一个样本平均数的检验: 一个样本平均数的检验: 总体方差
σ2
已知时: 已知时:
σ
,
x−µ
;
σx = u= n , σx ; 未知时: 总体方差 未知时: s x−µ 2 sx = σ u= sx n
2. 两个样本平均数比较的 u 检验:即检验两个样本平均 检验: 数 x1和 x 2 所属的总体平均数 µ1和µ2 是否来自于同一个
2 2 已知, 总体,适用于两个样本方差 总体,适用于两个样本方差 σ 12和σ 2 已知,或 σ 12和σ 2
例如,经 u 检验获得“差异显著”的结论,我们有 例如, 检验获得“差异显著”的结论, 95%的把握否定无效假设 0,同时要冒 的把握否定无效假设H 同时要冒5%下错结论的风 下错结论的风 的把握否定无效假设 检验获得“差异极显著”的结论,我们有99% 险; 经 检验获得“差异极显著”的结论,我们有 u 的把握否定无效假设H0,同时要冒 同时要冒1%下错结论的风险; 下错结论的风险; 的把握否定无效假设 下错结论的风险 u 检验获得“差异不显著”的结论, 而经 检验获得“差异不显著”的结论,在统计学上是指 “没有理由”否定无效假设H0,同样也要冒下错结论的 没有理由”否定无效假设 风险。 风险。
0
未被 确实没有
否定,这有两种可能存在: 否定,这有两种可能存在:或者是 u 差异, 差异, 或者是 u 盖了。 盖了。
与0 有差异而因为试验误差大被掩 u
因而, 因而,不能仅凭统计推断就简单地作出绝对肯 定或绝对否定的结论。 有很大的可靠性, 定或绝对否定的结论。“有很大的可靠性,但有一 定的错误率” 这是统计推断的基本特点。 定的错误率” 这是统计推断的基本特点。 “有三种谎言 — 谎话、该死的谎言和统计术” 谎话、该死的谎言和统计术” 引自Benjamin Disraeli(19世纪英国首相) 世纪英国首相) 引自 ( 世纪英国首相
未知,但两个样本都是大样本( 未知,但两个样本都是大样本(即 n1 ≥ 30和n2 ≥ 30);