第五章 t检验1
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t0.05(18) 2.101 t0.01(18) 2.878
P(| t|>2.101)= P(t>2.101)+ P(t <-2.101)=0.05 P(| t|>2.878)= P(t>2.878)+ P(t<-2.878)=0.01
魏泽辉讲义
17
构造检验统计量
若取 =5%,则否定域:
1 P(t0.05 t t0.05 ) 0.05
否定域 2.5%
接受域 95%
否定域 2.5%
-2.101
2.101
否定域:t> 2.101 或 t < -2.101,即|t| > 2.101
魏泽辉讲义
18
3、否定或接受无效假设(假设推断)
- 差异不显著:在 =5%水平下,检验统 计量的观察值落在接受域中
- 差异显著:在 =5%水平下,检验统计 量的观察值落在否定域中
魏泽辉讲义
28
t检验主要内容:
显著性 检验
u检验:总体方差已知 单个总体 t检验:总体方差未知
两个总体
非配对试验 配对试验
u检验:总体方差已知
t检验:总体方差未知 方差齐性检验
总体方差未知相等
百分数的比较 总体方差未知不等
标准误
!! 自由度
魏泽辉讲义
t值和临界值
32
5.2 样本平均数与 总体平均数差异显著性检验
表面效应可以计算,实验误 差可以估计,根据这些推断 处理效应是否显著。
魏泽辉讲义
10
x1 1 1, x2 2 2 x1 x2 (1 1) (2 2 ) (1 2 ) (1 2 )
1 2 : 处理效应 1 2 : 试验误差
x1 x2 : 表面效应
目的就是分析表面效应主要 是由处理效应引起,还是由 实验误差引起。从而分析处 理效应是否存在。
- 差异极显著:在 =1%水平下,检验统 计量的观察值落在否定域中
魏泽辉讲义
19
假设推断
若随机事件的概率很小,例如小于0.05,0.01,0.001,称 之为小概率事件;
在统计学上,把小概率事件在一次试验中看成是实际上不 可能发生的事件,称为小概率事件实际不可能原理。
t0.05(18) 2.101 本例t 2.426
根据题意,本例应进行双侧t检验。
1.提出无效假设与备择假设 H0:µ=114,HA:µ≠114 2.计算t值
经计算得: x 114.5 ,S=1.581
t x u0 114 .5 114 0.5 1
df=n-1=10-1=9
Sx
1.581 10 0.5
3、查临界值,作出统计推断
由df=9查值表(附表3)得 t0.05(9) 2.262 ,因为|t|<t0.05, P>0.05,故不能否定: µ=114,表明样本平均数与总体平
魏泽辉讲义
13
5.1.2显著性检验的基本步骤
例(续):随机抽测10头长白猪和10头大白猪经产母猪的 产仔数,资料如下
长白:11,11,9,12,10,13,13,8,10,13 大白:8,11,12,10,9,8,8,9,10,7
x2 =11头, S1=1.76头 x1 =9.2头,S2=1.549头
魏泽辉讲义
14
5.1.2显著性检验的基本步骤
2) 构造合适的检验统计量
• 检验统计量:用于检验原假设能否成立的统
计量,满足以下条件
x x – 必须利用原、 假设提供的信息
t – 抽样分布已知
S S x1x2
(x1 x1)2 (x2 x2 )2 ( 1 1 )
(n1 1) (n2 1)
- 差异不显著:|t|< t0.05,P>0.05 ; t值的右上方标记“ns”或不标记符号
- 差异显著:t0.05≤|t|<t0.01, 0.01 <P≤0.05 ; t值的右上方标记“*”
- 差异极显著:|t|≥t0.01, P ≤0.01 ; t值的右上方标记“* *”
魏泽辉讲义
21
5.1.3显著水平与两种类型的错误
即E( )=xμ。
3、根据统计学中心极限定理,样本平均数 服从或逼近正态分布。
魏泽辉讲义
7
两个总体平均数的比较
பைடு நூலகம்x1 x2 1 2
为了比较两个总体均数的差异,不可能对两个总 体的所有个体进行测定,只能通过样本来推断总 体。
魏泽辉讲义
8
两个总体平均数的比较
设有一个样本,含有n次重复观察值,其数据 为x1、x2……xn,假定总体均数(实验处理的理论值) 为μ ,第i个观察值的实验误差为εi,
1
界
值
拒绝H0
23
5.1.3显著水平与两种类型的错误
影响 II 型错误概率大小的因素 - 显著性水平 - 样本含量 n - 假设分布与真实分布总体平均数之差 - 两个分布的总体方差
检验功效 一个错误的原假设能够被否定的概率 检验功效 = 1 - II 型错误概率 =1-β
魏泽辉讲义
24
5.1.3显著水平与两种类型的错误
魏泽辉讲义
26
五、显著性检验中应注意的问题
(一)为了保证试验结果的可靠及正确,要有严密 合理的试验或抽样设计,保证各样本是从相应同 质总体中随机抽取的
(二)选用的显著性检验方法应符合其应用条件 (三)要正确理解差异显著或极显著的统计意义 (四)合理建立统计假设,正确计算检验统计量 (五) 结论不能绝对化
按题意,此例应采用单侧检验。
1、提出无效假设与备择假设 H 0 : =246, H A : >250
魏泽辉讲义
36
1
2、计算 t 值
2
经计算得: x =252,S=9.115
3
所以 t x u = 252 246 = 6 =2.281
魏泽辉讲义
12
3、否定或接受无效假设
根据小概率事件原理,比较检验统计量和临界值的关系,确 定其落在否定域还是接收域。
显著水平:0.01;0.05
(1)差异不显著:接受原假设 (2)差异显著:在 0.05 水平下,否定原假设,接受备择假设 (3)差异极显著:在 0.01 水平下,否定原假设,接受备择假设
魏泽辉讲义
16
构造检验统计量
确定否定域
• 在检验统计量抽样分布的尾部(1侧或2侧)中划定 一小概率区域,一旦计算的检验统计量的实际值落 入此区域,就否定原假设,接受备择假设。
• 这个小概率也称为显著性水平,用 表示 • 通常取 =5%或 =1%
自由度df =(n1-1)=(n2-1)=(10-1)+(10-1)=18
第五章 t 检 验
魏泽辉讲义
统计推断的内容之一
1
统计推断 (statistical inference)
统计推断是根据带随机性的观测数据(样本) 以及问题的条件和假设模型,而对未知事物作 出的,以概率形式表达的推断。
参数估计 (parameter estimation)用样本
统计量对总体参数进行估计
则 xi= μ+ εi(i=1、2……n)
则,x
xi
n
i
n
总体均数 试验误差
魏泽辉讲义
9
x1 1 1, x2 2 2 x1 x2 (1 1) (2 2 ) (1 2 ) (1 2 )
1 2 : 处理效应 1 2 : 试验误差
x1 x2 : 表面效应
目的就是分析表面效应主要 是由处理效应引起,还是由 实验误差引起。从而分析处 理效应是否存在。
n1 n2
12 x1 x2
S x1x2 叫做均数差异标准误;
n1、n2为两样本的含量。
统计量t 服从自由度df =(n1-1)=(n2-1)的t分布
魏泽辉讲义
15
构造检验统计量
t x1 x2 S x1x2
S x1x2
(x1 x1)2 (x2 x2 )2 ( 1 1 )
(n1 1) (n2 1)
x1 x2 1.8头
1)提出假设(对试验样本所在的总体作假设)
• 原假设(无效假设,null hypothesis):
•
H0: 1 2 1
备择假设(alternative
2 0 hypothesis):
HA: 1 2 1 2 0
其意义是指试验的表面效应,除包含试验误差外,
还含有处理效应在内。
本例:试验的表面效应是试验误差的概率在0.01─0.05之间,
小于0.05,故有理由否定H0: 1 2 ,从而接受HA:1 2
结论:可以认为长白猪与大白猪两品种经产母猪产仔数
总体平均数µ1和µ2不相同
魏泽辉讲义
20
5.1.3显著水平与两种类型的错误
• 用来确定否定或接受无效假设的概率标准叫显 著水平(significance level),记作α。 在生物学研究中常取α=0.05或α=0.01
均数差异不显著,可以认为该样本取自母猪怀孕期为114
天魏的泽总辉讲体义 。
35
【例 5.2】 按饲料配方规定,每 1000kg 某种饲料中维 生素 C 不得少于 246g,现从工厂的产品中随机抽测 12 个样 品,测得维生素 C 含量如下:255、260、262、248、244、245、 250、238、246、248、258、270g/1000kg,若样品的维生素 C 含量服从正态分布,问此产品是否符合规定要求?
魏泽辉讲义
4
5.1.1 显著性检验的意义
例:随机抽测10头长白猪和10头大白猪经产母猪的产仔 数,资料如下
长白:11,11,9,12,10,13,13,8,10,13 大白:8,11,12,10,9,8,8,9,10,7
x1 =11头, S1=1.76头 x2=9.2头,S2=1.549头
x1 - x2 =1.8头
真实情况 (未知)
H0为真 H0不真
魏泽辉讲义
所作决策
接受H0
正确
拒绝H0
犯第I类错误
犯第II类错误
正确
25
5.1.4双侧检验和单侧检验
•双侧检验:否定域在检验统计量分布的两尾 •单侧检验:否定域在检验统计量分布的一侧
– 左侧检验:否定域在检验统计量分布的左侧 – 右侧检验:否定域在检验统计量分布的右侧
检验一个样本平均数与已知的总体平均数是否有显著差异 (检验该样本是否来自某一总体)
已知的总体平均数一般为一些公认的理论数值、经验数值 或期望数值。
(正常生理指标、怀孕期、家禽出雏日龄)
魏泽辉讲义
33
X 0 X 0
t X 0
n
n
标准 正态 分布
显著性检验步骤
S n
S2
2
(n1)S 2 2
n 1
两类错误 任何假设检验的结果都有犯错误的可能
• 一类错误:以真为假 - 原假设正确但被否定。 P(一类错误) =
• 二类错误:以假为真 - 原假设错误但被接受。 P(二类错误) =
一般无法计算!
魏泽辉讲义
22
5.1.3显著水平与两种类型的错误 I 型错误和 II 型错误图示
魏泽辉讲义
1-
0
不拒绝H0
魏泽辉讲义
5
造成差异可能原因:
• 可能是品种造成的差异 • 可能是试验误差(或抽样误差)
如何区分两类性质的差异
怎样通过样本来推断总体
魏泽辉讲义
6
样本平均数作为检验对象的原因
1、离均差的平方和∑( x - x )2最小。
说明样本平均数与样本各个观测值最接 近,平均数是资料的代表数。
2、样本平均数是总体平均数的无偏估计值,
n1 n2
28 21.6 ( 1 1 )
(10 1) (10 1) 10 10
0.742
t x1 x2 11 9.2 2.426
S x1 x2
0.742
P(| t|>2.101)= P(t>2.101)+ P(t <-2.101)=0.05 P(| t|>2.878)= P(t>2.878)+ P(t<-2.878)=0.01
Χ2分 布
1、提出假设
(1) H0:μ=μ0;HA:μ≠μ0 双侧检验
2、计算t值 t x 0
Sx
df n 1
3、查临界t值,作出统计推断
Sx
S n
魏泽辉讲义
34
【例5.1】 母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别 为116、115、113、112、114、117、115、116、114、113(天), 试检验所得样本的平均数与总体平均数114天有无显著差异?
表面效应可以计算,实验误 差可以估计,根据这些推断 处理效应是否显著。
魏泽辉讲义
11
5.1.2显著性检验的基本步骤:
1、提出假设
H0:原假设或零假设,被直接检验的假设
HA:备择假设,一旦否定原假设就接受备择假设
2、构造合适的统计量
在无效假设成立的前提下,构造合适的统计量,并研究试 验所得统计量的抽样分布,计算无效假设正确的概率
假设检验 (hypothesis test)利用样本统计量
对总体的分布特征进行检验
魏泽辉讲义
2
假设检验
• 假设(hypothsis)
– 对总体的某些未知的或不完全知道的性质 所提出的待考察的命题
• 假设检验(显著性检验)
–对假设成立与否做出的推断
(t检验、F检验、2检验 )
魏泽辉讲义
3
5.1 显著性检验的基本原理
P(| t|>2.101)= P(t>2.101)+ P(t <-2.101)=0.05 P(| t|>2.878)= P(t>2.878)+ P(t<-2.878)=0.01
魏泽辉讲义
17
构造检验统计量
若取 =5%,则否定域:
1 P(t0.05 t t0.05 ) 0.05
否定域 2.5%
接受域 95%
否定域 2.5%
-2.101
2.101
否定域:t> 2.101 或 t < -2.101,即|t| > 2.101
魏泽辉讲义
18
3、否定或接受无效假设(假设推断)
- 差异不显著:在 =5%水平下,检验统 计量的观察值落在接受域中
- 差异显著:在 =5%水平下,检验统计 量的观察值落在否定域中
魏泽辉讲义
28
t检验主要内容:
显著性 检验
u检验:总体方差已知 单个总体 t检验:总体方差未知
两个总体
非配对试验 配对试验
u检验:总体方差已知
t检验:总体方差未知 方差齐性检验
总体方差未知相等
百分数的比较 总体方差未知不等
标准误
!! 自由度
魏泽辉讲义
t值和临界值
32
5.2 样本平均数与 总体平均数差异显著性检验
表面效应可以计算,实验误 差可以估计,根据这些推断 处理效应是否显著。
魏泽辉讲义
10
x1 1 1, x2 2 2 x1 x2 (1 1) (2 2 ) (1 2 ) (1 2 )
1 2 : 处理效应 1 2 : 试验误差
x1 x2 : 表面效应
目的就是分析表面效应主要 是由处理效应引起,还是由 实验误差引起。从而分析处 理效应是否存在。
- 差异极显著:在 =1%水平下,检验统 计量的观察值落在否定域中
魏泽辉讲义
19
假设推断
若随机事件的概率很小,例如小于0.05,0.01,0.001,称 之为小概率事件;
在统计学上,把小概率事件在一次试验中看成是实际上不 可能发生的事件,称为小概率事件实际不可能原理。
t0.05(18) 2.101 本例t 2.426
根据题意,本例应进行双侧t检验。
1.提出无效假设与备择假设 H0:µ=114,HA:µ≠114 2.计算t值
经计算得: x 114.5 ,S=1.581
t x u0 114 .5 114 0.5 1
df=n-1=10-1=9
Sx
1.581 10 0.5
3、查临界值,作出统计推断
由df=9查值表(附表3)得 t0.05(9) 2.262 ,因为|t|<t0.05, P>0.05,故不能否定: µ=114,表明样本平均数与总体平
魏泽辉讲义
13
5.1.2显著性检验的基本步骤
例(续):随机抽测10头长白猪和10头大白猪经产母猪的 产仔数,资料如下
长白:11,11,9,12,10,13,13,8,10,13 大白:8,11,12,10,9,8,8,9,10,7
x2 =11头, S1=1.76头 x1 =9.2头,S2=1.549头
魏泽辉讲义
14
5.1.2显著性检验的基本步骤
2) 构造合适的检验统计量
• 检验统计量:用于检验原假设能否成立的统
计量,满足以下条件
x x – 必须利用原、 假设提供的信息
t – 抽样分布已知
S S x1x2
(x1 x1)2 (x2 x2 )2 ( 1 1 )
(n1 1) (n2 1)
- 差异不显著:|t|< t0.05,P>0.05 ; t值的右上方标记“ns”或不标记符号
- 差异显著:t0.05≤|t|<t0.01, 0.01 <P≤0.05 ; t值的右上方标记“*”
- 差异极显著:|t|≥t0.01, P ≤0.01 ; t值的右上方标记“* *”
魏泽辉讲义
21
5.1.3显著水平与两种类型的错误
即E( )=xμ。
3、根据统计学中心极限定理,样本平均数 服从或逼近正态分布。
魏泽辉讲义
7
两个总体平均数的比较
பைடு நூலகம்x1 x2 1 2
为了比较两个总体均数的差异,不可能对两个总 体的所有个体进行测定,只能通过样本来推断总 体。
魏泽辉讲义
8
两个总体平均数的比较
设有一个样本,含有n次重复观察值,其数据 为x1、x2……xn,假定总体均数(实验处理的理论值) 为μ ,第i个观察值的实验误差为εi,
1
界
值
拒绝H0
23
5.1.3显著水平与两种类型的错误
影响 II 型错误概率大小的因素 - 显著性水平 - 样本含量 n - 假设分布与真实分布总体平均数之差 - 两个分布的总体方差
检验功效 一个错误的原假设能够被否定的概率 检验功效 = 1 - II 型错误概率 =1-β
魏泽辉讲义
24
5.1.3显著水平与两种类型的错误
魏泽辉讲义
26
五、显著性检验中应注意的问题
(一)为了保证试验结果的可靠及正确,要有严密 合理的试验或抽样设计,保证各样本是从相应同 质总体中随机抽取的
(二)选用的显著性检验方法应符合其应用条件 (三)要正确理解差异显著或极显著的统计意义 (四)合理建立统计假设,正确计算检验统计量 (五) 结论不能绝对化
按题意,此例应采用单侧检验。
1、提出无效假设与备择假设 H 0 : =246, H A : >250
魏泽辉讲义
36
1
2、计算 t 值
2
经计算得: x =252,S=9.115
3
所以 t x u = 252 246 = 6 =2.281
魏泽辉讲义
12
3、否定或接受无效假设
根据小概率事件原理,比较检验统计量和临界值的关系,确 定其落在否定域还是接收域。
显著水平:0.01;0.05
(1)差异不显著:接受原假设 (2)差异显著:在 0.05 水平下,否定原假设,接受备择假设 (3)差异极显著:在 0.01 水平下,否定原假设,接受备择假设
魏泽辉讲义
16
构造检验统计量
确定否定域
• 在检验统计量抽样分布的尾部(1侧或2侧)中划定 一小概率区域,一旦计算的检验统计量的实际值落 入此区域,就否定原假设,接受备择假设。
• 这个小概率也称为显著性水平,用 表示 • 通常取 =5%或 =1%
自由度df =(n1-1)=(n2-1)=(10-1)+(10-1)=18
第五章 t 检 验
魏泽辉讲义
统计推断的内容之一
1
统计推断 (statistical inference)
统计推断是根据带随机性的观测数据(样本) 以及问题的条件和假设模型,而对未知事物作 出的,以概率形式表达的推断。
参数估计 (parameter estimation)用样本
统计量对总体参数进行估计
则 xi= μ+ εi(i=1、2……n)
则,x
xi
n
i
n
总体均数 试验误差
魏泽辉讲义
9
x1 1 1, x2 2 2 x1 x2 (1 1) (2 2 ) (1 2 ) (1 2 )
1 2 : 处理效应 1 2 : 试验误差
x1 x2 : 表面效应
目的就是分析表面效应主要 是由处理效应引起,还是由 实验误差引起。从而分析处 理效应是否存在。
n1 n2
12 x1 x2
S x1x2 叫做均数差异标准误;
n1、n2为两样本的含量。
统计量t 服从自由度df =(n1-1)=(n2-1)的t分布
魏泽辉讲义
15
构造检验统计量
t x1 x2 S x1x2
S x1x2
(x1 x1)2 (x2 x2 )2 ( 1 1 )
(n1 1) (n2 1)
x1 x2 1.8头
1)提出假设(对试验样本所在的总体作假设)
• 原假设(无效假设,null hypothesis):
•
H0: 1 2 1
备择假设(alternative
2 0 hypothesis):
HA: 1 2 1 2 0
其意义是指试验的表面效应,除包含试验误差外,
还含有处理效应在内。
本例:试验的表面效应是试验误差的概率在0.01─0.05之间,
小于0.05,故有理由否定H0: 1 2 ,从而接受HA:1 2
结论:可以认为长白猪与大白猪两品种经产母猪产仔数
总体平均数µ1和µ2不相同
魏泽辉讲义
20
5.1.3显著水平与两种类型的错误
• 用来确定否定或接受无效假设的概率标准叫显 著水平(significance level),记作α。 在生物学研究中常取α=0.05或α=0.01
均数差异不显著,可以认为该样本取自母猪怀孕期为114
天魏的泽总辉讲体义 。
35
【例 5.2】 按饲料配方规定,每 1000kg 某种饲料中维 生素 C 不得少于 246g,现从工厂的产品中随机抽测 12 个样 品,测得维生素 C 含量如下:255、260、262、248、244、245、 250、238、246、248、258、270g/1000kg,若样品的维生素 C 含量服从正态分布,问此产品是否符合规定要求?
魏泽辉讲义
4
5.1.1 显著性检验的意义
例:随机抽测10头长白猪和10头大白猪经产母猪的产仔 数,资料如下
长白:11,11,9,12,10,13,13,8,10,13 大白:8,11,12,10,9,8,8,9,10,7
x1 =11头, S1=1.76头 x2=9.2头,S2=1.549头
x1 - x2 =1.8头
真实情况 (未知)
H0为真 H0不真
魏泽辉讲义
所作决策
接受H0
正确
拒绝H0
犯第I类错误
犯第II类错误
正确
25
5.1.4双侧检验和单侧检验
•双侧检验:否定域在检验统计量分布的两尾 •单侧检验:否定域在检验统计量分布的一侧
– 左侧检验:否定域在检验统计量分布的左侧 – 右侧检验:否定域在检验统计量分布的右侧
检验一个样本平均数与已知的总体平均数是否有显著差异 (检验该样本是否来自某一总体)
已知的总体平均数一般为一些公认的理论数值、经验数值 或期望数值。
(正常生理指标、怀孕期、家禽出雏日龄)
魏泽辉讲义
33
X 0 X 0
t X 0
n
n
标准 正态 分布
显著性检验步骤
S n
S2
2
(n1)S 2 2
n 1
两类错误 任何假设检验的结果都有犯错误的可能
• 一类错误:以真为假 - 原假设正确但被否定。 P(一类错误) =
• 二类错误:以假为真 - 原假设错误但被接受。 P(二类错误) =
一般无法计算!
魏泽辉讲义
22
5.1.3显著水平与两种类型的错误 I 型错误和 II 型错误图示
魏泽辉讲义
1-
0
不拒绝H0
魏泽辉讲义
5
造成差异可能原因:
• 可能是品种造成的差异 • 可能是试验误差(或抽样误差)
如何区分两类性质的差异
怎样通过样本来推断总体
魏泽辉讲义
6
样本平均数作为检验对象的原因
1、离均差的平方和∑( x - x )2最小。
说明样本平均数与样本各个观测值最接 近,平均数是资料的代表数。
2、样本平均数是总体平均数的无偏估计值,
n1 n2
28 21.6 ( 1 1 )
(10 1) (10 1) 10 10
0.742
t x1 x2 11 9.2 2.426
S x1 x2
0.742
P(| t|>2.101)= P(t>2.101)+ P(t <-2.101)=0.05 P(| t|>2.878)= P(t>2.878)+ P(t<-2.878)=0.01
Χ2分 布
1、提出假设
(1) H0:μ=μ0;HA:μ≠μ0 双侧检验
2、计算t值 t x 0
Sx
df n 1
3、查临界t值,作出统计推断
Sx
S n
魏泽辉讲义
34
【例5.1】 母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别 为116、115、113、112、114、117、115、116、114、113(天), 试检验所得样本的平均数与总体平均数114天有无显著差异?
表面效应可以计算,实验误 差可以估计,根据这些推断 处理效应是否显著。
魏泽辉讲义
11
5.1.2显著性检验的基本步骤:
1、提出假设
H0:原假设或零假设,被直接检验的假设
HA:备择假设,一旦否定原假设就接受备择假设
2、构造合适的统计量
在无效假设成立的前提下,构造合适的统计量,并研究试 验所得统计量的抽样分布,计算无效假设正确的概率
假设检验 (hypothesis test)利用样本统计量
对总体的分布特征进行检验
魏泽辉讲义
2
假设检验
• 假设(hypothsis)
– 对总体的某些未知的或不完全知道的性质 所提出的待考察的命题
• 假设检验(显著性检验)
–对假设成立与否做出的推断
(t检验、F检验、2检验 )
魏泽辉讲义
3
5.1 显著性检验的基本原理