第四章统计假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一常数
t分布的平均数和标准差为:
t (0 假定 1)
Hale Waihona Puke Baidu
t
(
2
假
定
2)
2、u分布与t分布的比较
a. t分布的平均数与u分 布相同,都是0,并 在t=0处曲线最高, 以0为中心左右对称
b. 与u分布曲线相比,t 分布曲线的峰高较低, 两侧接近x轴的速度 更缓慢
c. t分布的曲线性状随自由度ν而改变,自由度ν越小, 其分布越离散,随ν值增大,逐渐趋近于u分布,当 自由度增大到30时基本接近u分布
表4.1 适于用正态离差检验的二项样本的 npˆ 和n值表
pˆ
(样本百分数) 0.50 0.40 0.30 0.20 0.10 0.05
npˆ
(较小组次数) 15 20 24 40 60 70
n
(样本容量) 30 50 80 200 600
1400
一、一个样本频率的假设检验
检验某一样本频率 pˆ 所属总体频率与某一理论值或期望
假设大豆花色遗传符合一对等位基因的分离规律,紫花 植株的百分数是75%,即H0: p=0.75;对HA: p≠0.75。
显著水平 a 0.05,作两尾检验, u0.05=1.96。
检验计算: pˆ 208 0.7197 289
σ pˆ
u 0.7197 0.75 1.19 0.0255
0.75 0.25 0.0255 289
0 下,正态离差u值为 u
( y1 y 2 )
y1 y2
,
故可对两样本平均数的差异作出假设检验。
例: 据以往资料,已知某小麦品种每平方米产量的
2 0.4(kg)2。今在该品种的一块地上用A、B两法取样,A法 取12个样点,得每平方米产量y1 =1.2(kg);B法取8个样点,得 y 2 =1.4(kg)。试比较A、B两法的每平方米产量是否有显著差异?
(n=30),计算得 x =4.37头。问这个样本对该已知总体有无代
表性?
解:a. 提出无效假设 (一尾or两尾?)
H0: 0 4.73头 HA: 0
注意:此处 是对总体参 数做假设
b. 确定一个否定H0的概率
a =0.05
c. 检验概率计算(首先判断要用什么分布)
Q 总体标准差已知,且抽样为大样本(n=30)
3、t分布的概率估计
t
F (t ) f (t )dt
P(t t1 ) F (t1 )
t1
f (t )dt
P(t t1 ) 1 F (t1 ) t1 f (t )dt
P(| t | t1) 2 F (t1) 2
t1
f
(t)dt
4、t 检验
• T检验通过比较t值与tα的大小关系来判断否定还 是接受H0
检验计算:
按ν=7+8=15,查t 表得一尾 t0.05=1.753(一尾检验t0.05等于两尾检验的 t0.10),现实得t=-3.05<- t0.05=-1.753,
故P<0.05。
推断:否定H0: μ1≥μ2,接受HA: μ1 <μ2,即认为玉米喷施矮壮素后,其株
高显著地矮于对照。
(2)成对数据的比较
1908年W. S. Gosset首先提出,又叫学生氏t分布 (Student’s t-distribution)
t
x
sx
其中,sx
s ,而s是指样本标准差
n
t分布的密度函数为:
f (t)
[( 1) / 2]! [( 2) / 2]!
(1
t2
)
(
1 2
)
,
(
t
)
其中,为自由度(n 1),对于特定总体为
假设H0: A、B两法的每平方米产量相同,即 H0 : 1 2 0
y1 y2 0.2系随机误差;对H A : 1 2
显著水平 a 0.05
u0.05 1.96
σ2
σ12
σ
2 2
0.4
n1 12, n2 8
0.4 0.4
σ y1 y2
0.2887 (kg) 12 8
u 1.2 1.4 0.69 0.2887
\ 可以用u检验
x
n
2.63 30
0.48头,
u
x x
4.374.73 0.48
0.75
| u | 0.75 1.96 u0.05(2)
d. 做出推断结论并加以解释
►根据以上计算可知样本在假定总体中出现的概率 P > 0.05,即差异不显著,所以,应该接受H0否 定HA。
►由此,我们应该认为,所抽得的样本平均数对总 体平均数有代表性,抽样平均数和总体平均数之 间的差异是抽样误差造成的。
试单位彼此独立,不论两个处理的样本 容量是否相同,所得数据皆称为成组数 据,以组平均数作为相互比较的标准。
1、在两个样本的总体方差已知时,用u 检
验。
例: 据以往资料,已知某小麦品种每平方
米产量的σ2=0.4(kg)2。今在该品种的一块地上
用A、B两法取样,A法取了12个样点,得每平方 米 =1.2(kg);B法取得8个样点,得 =1.4(kg)。试比较A、B两法的每平方米产量是 否有显著差异?
• 检验步骤为:
• H0:新引入品种千粒重与当地良种千粒重指定 值相同,即μ =μ0 =34g;对HA: μ ≠34g
显著水平α=0.05
检验计算:
=(35.6+37.6+…+34.6)/8=35.2(g)
t
x
sx
35.2 34 43.4
0.02764
• 查附表3,ν=7时,t 0.05=2.365。现实得|t| <tα=2.365,故P>0.05。
• 设两个样本的观察值分别为y1和y2,共配成 n对,各个对的差数为d=y1-y2,差数的平均
数为
则差数平均数的标准误为:
• 它具有ν=n-1。若假设H0:μd=0,则上式改成: 即可检验 H0:μd=0。
例:选生长期、发育进 度、植株大小和其它方面 皆比较一致的两株番茄构 成一组,共得7组,每组中 一株接种A处理病毒,另一 株接种B处理病毒,以研究 不同处理方法的纯化的病 毒效果,表中结果为
值p0的差异显著性。
由于样本频率的标准误 pˆ 为:
pˆ
p0(1 p0 ) n
故由
u pˆ p0
pˆ
即可检验H0 : p=p0, HA : p ≠ p0 。
[例] 以紫花和白花的大豆品种杂交,在F2代共得289株, 其中紫花208株,白花81株。如果花色受一对等位基因控制, 则根据遗传学原理,F2代紫花株与白花株的分离比率应为3∶1, 即紫花理论百分数p=0.75,白花理论百分数q=1-p =0.25。 问该试验结果是否符合一对等位基因的遗传规律?
第二节 样本平均数的假设检验
魏玉清
一、大样本平均数的假设检验--u检验
1、u检验的基本原理
a. 根据正态分布的理论分布,计算抽样平均数总
体的标准差
x
n
b. 对x进行u转换 u x0
x
c. 将计算所得u值与设定显著性水平下的否定无 效假设的临界值uα比较
2、u检验的适用条件-抽样分布为正态分布
(1)基础总体为正态分布,无论样本容量大小,其抽样分布 肯定为正态分布
因为实得|u|<u0.05=1.96,故P>0.05
推断:接受 H0 : 1 2 , 即A、B两种取样方法所得的每平方
米产量没有显著差异。
二、小样本平均数的假设检验-t 检验
当总体的分布情况以及总体的方差未知, 且样本容量很小(n<30)时,只有用样本算出 的均方s2来估计总体的方差,此时,
1、t 分布的提出
在理论上,这类百分数的假设检验应按二项分布进行,即从 二项式(p+q)n的展开式中求出某项属性个体百分数 pˆ 的概率。
但是,如样本容量n 较大,p较小,而np和nq又均不小于5时, (p+q)n的分布趋近于正态。因而可以将百分数资料作正态分布处 理,从而作出近似的检验。
适于用u检验所需的二项样本容量n见下表。
首先,从样本变异算出平均数差数的均方 ,作为对σ2 的估计。由于可假定 = = σ2,故 应为两样本均方
•的加权平均值,即:
• 当n1=n2=n 时,则上式变为:
由于假设H0: μ1=μ2,故上式为:
例:研究矮壮素使玉米矮化的效果,在 抽穗期测定喷矮壮素小区8株、对照区玉米 9株,其观察值如下表:
组别 y1(A法) y2(B法) d
1
10
25
-15
2
13
12
1
3
8
14
-6
4
3
15
-12
5
20
27
-7
6
20
20
-7
7
6
18
-12
病毒在番茄上产生的病痕数目,试检验两种处理方 法的差异显著性。 假设:两种处理对纯化病毒无不同效果,即:
H0:μd=0 ;对HA:μd≠0。显著水平α=0.01。
检验计算:
• tα可以通过查附表3获得(注意是两尾的临界值)
• 一尾检验的t临界值tα(1)通过查附表中的相应自由 度下对应2α的t2α(2)获得
• t表中,ν相同时,P越大,t值越小,反之亦然
• 因此,当计算所得|t|大于或等于表中所查tα时, 说明,其属于随机误差的概率小于或等于规定 的显著性水平,即t位于否定区内,则否定H0, 否则接受H0
y1(喷施矮壮素) 160 160 200 160 200 170 150 210
y2(对照)
170 270 180 250 270 290 270 230 170
从理论上判断,喷施矮壮素只可能矮化无
效而不可能促进植物长高,因此假设H0:喷施 矮壮素的株高与未喷的相同或更高,,即H0: μ1≥μ2对HA: μ1<μ2,即喷施矮壮素的株 高较未喷的为矮。显著水平α=0.05。
u0.05
因为实得|u|<u0.05,故P>0.05。 推断:接受H0: p=0.75,即大豆花色遗传是符合一对等位 基因的遗传规律的,紫花植株百分数 pˆ =0.72和p=0.75的相差 系随机误差。
以上资料亦可直接用次数进行假设检验。当二项资料以次
数表示时, np , np npq
4 、两个样本平均数的检验
(1)
在两个样本的总体方差
2 1
和
2 2
为已知时,用u检验
由抽样分布的公式知,两样本平均数 y1和 y2的差数标准
误
y1
y2
,在
和 2
1
2 2
是已知时为:
并有:
y1 y2
2 1
2 2
n1
n2
u ( y1 y2 ) (1 2 ) y1 y2
在假设
H0
: 1 2
假设H0:A、B两法的产量相同,即H0:
系随机误差;
• 对HA:μ1≠μ2,α=0.05
检验计算:
因为实得|u|<u0.05=1.96,故P>0.05。
推断:接受H0: μ1=μ2,即A、B两种取样方法
所得每平方米产量没有显著差异。
2、在两个样本的总体方差 和 为未知,但可假定
= =σ2,而两个样本又为小样本时,用t 检验。
(2)未知基础总体,样本容量很大时,根据中心极限定理, 其抽样分布也可以看作正态分布
➢ 直接用大样本的均方代替总体方差,这时
2 s2 xn
因为用的是大样本的均方,所以此样本的均方对 总体方差的估计是有效的。
3、一个样本平均数的检验
例:在江苏沛县调查333 m2小地老虎虫害情况的结果, =4.73头, =2.63头。用某种抽样方法随机抽得一个样本
查附表4, ν=7-1=6时,t0.01=3.707。实得 |t|> t0.01,故P<0.01。
推断:否定H0:μd=0,接受HA:μd≠0,即
A、B两法对纯化病毒的效应有极显著差异。
第三节 样本频率的假设检验
许多生物试验的结果是用百分数或成数表示的,称为样本频 率,如结实率、发芽率等,这些百分数系由计数某一属性的个体 数目求得,属间断性的计数资料。
若试验设计是将性质相同的两个供试单位配 成对,并设有多个配对,然后对每一配对的 两个供试单位分别随机地给予不同处理,则 所得观察值为成对数据。
• 成对数据,由于同一配对内两个供试单位的 试验条件很是接近,而不同配对间的条件差 异又可通过同一配对的差数予以消除,因而 可以控制试验误差,具有较高的精确度。
• 推断:接受H0: μ=34g,即新引入品种千粒
重与当地良种千粒重指定值无显著差异。
6、 两个样本平均数的假设检验
这是由两个样本平均数的相差,以检 验这两个样本所属的总体平均数有无显著 差异。检验的方法因试验设计的不同而分 为成组数据的平均数比较和成对数据的比 较两种。
(1)成组数据的平均数比较 如果两个处理为完全随机设计,各供
5、单个样本平均数的假设检验
这是检验某一样本所属的总体平均数是否和 某一指定的总体平均数相同。
例:某春小麦良种的千粒重μ0 =34g,现自外
地引入一高产品种,在8个小区种植,得其千粒 重(g)为: 35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,问 新引入品种的千粒重与当地良种有无显著差异?