第4.2节 正态总体均值与方差的假设检验
正态总体方差的假设检验
方差的计算方法
简单方差
适用于数据量较小,且数据间相互独立的情况。
加权方差
适用于数据量较大,且数据间存在相关关系的 情况,需要考虑到每个数据点的重要程度。
配对样本方差检验
总结词
配对样本方差检验用于比较两个相关样本的方差是否相同。
详细描述
在配对样本方差检验中,我们首先需要设定一个零假设,即两个相关样本的方差无显著差异。然后, 通过计算检验统计量(如Wilcoxon秩和统计量或Stevens' Z统计量),我们可以评估零假设是否被拒 绝。如果零假设被拒绝,则可以得出两个相关样本方差不相同的结论。
方差齐性检验的目的是为了后续 的方差分析提供前提条件,确保 各组数据具有可比性。
方差分析
方差分析(ANOVA)是
1
用来比较多个正态总体均
值的差异是否显著的统计
方法。
4
方差分析的结果通常以p值 表示,若p值小于显著性水 平(如0.05),则认为各组 均值存在显著差异。
2
方差分析的前提条件是各
组数据具有方差齐性和正
正态总体方差假设检验的未来发展
改进假设检验方法
结合其他统计方法
结合其他统计方法,如贝叶斯推断、机器学习等, 可以更全面地分析数据和推断总体特征。
针对正态总体方差假设检验的局限性,未来 研究可以探索更灵活、适应性更强的检验方 法。
拓展应用领域
正态总体方差假设检验的应用领域可以进一 步拓展,特别是在大数据和复杂数据分析方 面。
数学表达式
正态总体均值与方差的假设检验
(1) σ1 = σ 2 = σ (未知),这一情形问题的一般提法是:
设 ( X1, X 2 , , X n1 ) 为来自 N (µ1,σ 2 ) 的样本, (Y1,Y2 , ,Yn2 ) 为来自 N (µ2 ,σ 2 ) 的样
+ (n2
−
1)S
∗2 2n2
n1n2 (n1 + n2 − 2) n1 + n2
在H0成立的条件下, T =
(X −Y)
(n1
− 1)S1∗n21
+
(n2
−
1)S
∗2 2n2
n1n2 (n1 + n2 n1 + n2
−
2)
~ t(n1
+ n2
−
2)
3°
给定显著性水平
α
(0
<
α
≤
0.05)
,
⎧ P⎨
平均成绩为 66.5 分,修正的标准差为 15 分. 问:在显著水平 0.05 下,是否可以认为这次考
试全体考生的平均成绩为 70 分? 解 设该次考试的学生成绩为 X,则 X ~ N (µ,σ 2 ) ,
1° 提出假设: H0: µ = 70 ; H1: µ ≠ 70 由于σ 2 未知,所以用 t 检验法.
拒绝域:W = {(x1, x2 , , xn1 ; y1, y2 , , yn2 ) : u ≥ 1.96}. 4° 由样本值: n1 = n2 = 5, x = 24.4, y = 27 计算U的观察值 u0 .
u0 =
(x − y) = 24.4 − 27 = −1.612
第二节-正态总体均值和方差的假设检验PPT课件
根据第六章定理三知,
当 H 0 为,真 X S/ n 时 0~t(n1 ),
P { 当 H 0为 ,拒 真 H 0 } 绝 P0 X S/n0 k ,
10
得 kt/2(n 1 ),
拒绝 t域 x s/n 0为 t/2(n1).
上述利用 t 统计量得出的检验法称为t 检验法.
故接H受 0,认为金属棒的 无平 显均 著. 长 变
12
例3 某种电子元件的寿命X(以小时计)服从正态
分布, , 2 均为未知. 现测得16只元件的寿命如
下: 152981002112223471972964 223261262851042964081570 问是否有理由认为元件的平均寿命大于225(小时)?
P 2 0 2 (n 1 2 )S 2 (n 0 1 2 )k . (因2 为 0 2 )
要 P { H 0 为 使 ,拒 H 真 0 } 绝 ,
只需 P 2 0 2 令 (n 1 2 )S 2(n 0 1 2 )k .
因(为 n 12)S2~2(n1),所(以 n01 2)k 2(n1),
拒绝域 x的 0k,(形 k待 式 ).定
由标准正态分布的分布函数(•) 的单调性可知,
P {拒H 绝 0|H 0为} 真 P 0(x 0 k )
4
P 0 x /n 00 /k n
1(0/k)n0(/ 0n k)0
0
(/0nk)/ kn,
因此 P { 拒 要 H 0|绝 H 0 控 为 } 制 真 ,
件都尽可能做到相同.先采用标准方法炼一炉, 然
后用建议的新方法炼一炉, 以后交替进行, 各炼了
10炉, 其得率分别为(1)标准方法: 78.1, 72.4, 76.2,
正态分布假设检验
正态分布假设检验一、概述正态分布假设检验是统计学中常用的一种方法,用于判断一个数据集是否符合正态分布。
正态分布是指在统计学中,当数据集的频率分布呈钟形曲线时,称其为正态分布。
正态分布在实际应用中非常广泛,因为许多自然现象都遵循这种分布规律。
对于一个数据集而言,如果它符合正态分布,则可以使用一系列的统计方法进行进一步的研究和分析。
二、检验方法1. 假设检验假设检验是指通过样本数据来推断总体参数的方法。
在正态分布假设检验中,我们需要对总体均值和标准差进行假设检验。
具体而言,我们需要提出原假设和备择假设两个假设:原假设:样本数据符合正态分布;备择假设:样本数据不符合正态分布。
在进行实际计算时,我们需要根据样本数据来计算出样本均值和标准差,并使用这些数据来推断总体均值和标准差是否符合正态分布。
2. 正态概率图正态概率图是判断一个数据集是否符合正态分布的常用方法之一。
它通过将数据集的分位数与正态分布的分位数进行比较,来判断数据集是否符合正态分布。
具体而言,正态概率图将数据集的每个值按照从小到大的顺序排列,并计算出每个值对应的标准化值(即该值与样本均值之间的差除以样本标准差)。
然后,将这些标准化值按照从小到大的顺序排列,并绘制在图表上。
如果数据集符合正态分布,则这些标准化值应当近似于一个直线。
3. 偏度和峰度检验偏度和峰度是用来描述一个数据集形态特征的指标。
在正态分布中,偏度为0,峰度为3。
因此,在进行正态分布假设检验时,我们可以通过计算样本偏度和峰度来判断样本是否符合正态分布。
具体而言,如果样本偏度和峰度与正态分布相差不大,则可以认为样本符合正态分布。
三、实例演示以下是一个实例演示,在Python中使用scipy库进行正态分布假设检验:```pythonimport numpy as npfrom scipy import stats# 生成100个随机数data = np.random.normal(0, 1, 100)# 进行正态性检验k2, p = stats.normaltest(data)alpha = 0.05# 输出检验结果print("p = {}".format(p))if p < alpha:print("数据不符合正态分布")else:print("数据符合正态分布")```在上述代码中,我们首先生成了一个包含100个随机数的数据集。
中级统计师统计方法部分-假设检验
补引例1:设某厂生产的显像管的使用寿命X服从正态分布 N(μ ,90000),从过去较长一段时间的生产情况来看,显 像管的平均寿命为5000小时。现在采用新工艺生产这种显 像管,抽样36个的平均值为5100,试问,采用新工艺后显 像管寿命是否有变化? 原假设 H 0 1.没变化:采用新工艺后均值 μ = 5000 2.有变化:采用新工艺后均值μ ≠5000 备择假设 H 1 假设:对问题发表看法. 假设检验(统计检验)依据样本对“假设”是否成立作出论 证.
0 0
0 0
| Z | z
2
| T | t (n 1)
2
Z z
T t (n 1)
0 0
Z z
T t (n 1)
补例1某企业购买建筑板材.供应商声称板材的厚度服从 正态分布,其总体均值为15毫米,总体标准差为0.1毫 米.该企业随机抽取了50张板材作为样本,测得样本均值 为14.982毫米.以0.05为显著性水平,能否证明供应商提 供的总体均值是正确的? 解 (1)假设 H 0 : 0 15 H1 : 15 X 0 Z (2)当H0成立时,统计量 ~ N (0,1) / n (3)对给定α,拒绝条件为 |Z|> Zα/2 查表得 Z0.025 1.96 X 0 14.982 15 (4)计算 1.0605 1.96 / n 0.1/ 50 (5)接受原假设,可认为供应商提供的总体均值是正确的。
解: (1)提出原假设H0: μ=μ0=0.5; 对立假设H1: μ≠ μ0= 0.5; X 0 Z ~ N (0,1) (2)若H0成立,则 / n (3)α=0.05,则 P{|Z|>zα/2}=α, 查表得: P{|Z|>1.96}=0.05, (4)将样本观测值代入Z得
正态总体均值的假设检验
假设检验
正态总体均值的假设检验
1.1 单个正态总体均值的假设检验
3.大样本单个正态总体均值的检验
设总体为 X ,它的分布是任意的,方差 2 未知, X1 ,X2 , ,Xn 为 来自总体 X 的样本,H0 : 0( 0 已知).当样本容量 n 很大( n 30 )
时,无论总体是否服从正态分布,统计量 t X 0 都近似服从正态分 S/ n
解 依题意,建立假设 由于 2 未知,故选取统计量
H0 : 0 72,H1 : 72 . t X 0 , S/ n
已知 0.05 ,故此检验问题的拒绝域为
W t | | t |
x 0
s/ n
t
/
2
(n
1)
.
又知 n 26,x 74.2,s 6.2,查表得 t /2 (25) t0.025 (25) 2.06 ,则有 | t | x 0 74.2 72 1.81 2.06 , s/ n 6.2/ 26
解 依题意,建立假设 由于 2 未知,取检验统计量
H0 : 0.8,H1 : 0.8 .
t X 0 ~ t(n 1) , S/ n
已知 0.05 ,故此检验问题的拒绝域为
W t | t x 0 s/ n
t (n 1) .
又知 n 16 ,x 0.92,s 0.32 ,查表得 t0.05 (16 1) t0.05 (15) 1.75,则有 t x 0 0.92 0.8 1.50 1.75 , s/ n 0.32/ 16
假设检验 H0 : 0 ,H1 : 0 的拒绝域为 W {t | t t (n 1)}.
(7-8) (7-9)
假设检验
正态总体均值的假设检验
1.1 单个正态总体均值的假设检验
第42节正态总体均值与方差的假设检验
8 7 2 查表可知 t0.025 (13) 2.160,
0.547,
补充:方差已知但不相等时,两个正态总体 均值是否相等的检验
设 X1 , X 2 , 的样本, Y1 , Y2 ,
, X n1 为来自正态总体 N ( 1 , )
2 1 2 , Yn 2 为来自正态总体 N ( 2 , 2 )的
样本, 且设两样本独立. 注意两总体的方差相等.
2 *2 又设 X , Y 分别是总体的样本均值, S1*n , S 2 n2 是样本 1
方差, 1 , 2 , 均为未知,
2
假设检验的问题 H 0 : 1 2 , H1: 1 2
取显著性水平为 .
引入 t 统计量作为检验统计量 : *2 *2 ( n 1 ) S ( n 1 ) S (X Y ) 1 1n 2 2n 2 T , 其中 Sw . n1 n2 2 1 1 Sw n1 n2
解 依题意, 两总体 X 和 Y 分别服从正态分布
2 , , 均为未知, N ( 1 , ) 和N ( 2 , ), 1 2
2 2
需要检验假设 H 0 : 1 2 , H1 : 1 2 .
n1 8, n2 7,
*2 s x 19.925, 1n1 0.216,
2 Sn
( Z i Z ) 2 / 7 102200
i 1
8
2 t ( Z 0) / s 8 / 102200 2.83 n / 8 320
对给定 0.05 ,查自由度为8 1 7 的 t 分布 表得临界值 t0.025 (7) 2.365,由于t 2.83 2.365
对试验数据不做配对分析,轮胎之间和飞机之间对数 据的影响交织在一起,这时样本 X1 , , X n1
一个正态总体期望与方差的假设检验
W { 2 2.7 or 2 19.023}
而这里
2 / 2 (n
1)
2
2 1
/
2
(n
1)
即样本观测值落在拒绝域之外, 故接受原假设,认为该批金
属丝折断力的方差与64无显著差异.
以上对方差的检验属于双侧检验,另外还有单侧检验:
H0
:
2
2 0
;
H1
:
2
第八章
第二节 一个正态总体 期望与方差的假设检验
一、期望值的假设检验
二、方差的假设检验- 2检验
一、期望值的假设检验
1、方差
2
2为已知时对期望值
0
的检验—
u
检验
设样本 X1, X 2, , X n 来自正态总体 N (, 2 ), 方
差 2已知,对 的检验问题由上节中的五个步骤来进行.
u
0 t (n 1)
(c) H1 : 0
W {t t1 (n 1)}
W {t t1 (n 1)}
W {t t (n 1)}
2 (备择假设、拒绝域和显著性水平)
例3 电视台广告部称某类企业在该台黄金时段内播放 电视广告后的平均受益量(平均利润增加量)至少为15万元,
2未知, 由抽样分布定理知,若用样本标准差 s 代替 , U
统计量变为 t 统计量,
即
t
x 0
~ t(n 1)
s/ n
(8.2.2)
相应于上述三对假设,拒绝域见下图.
/2
/2
t
t (n 1) 0 t1 (n 1)
正态分布总体的区间估计与假设检验汇总表
(单侧检验)
2
(n
1)S 2
2 0
~2n1
2
2 /2
n
1
或
2
2 1- / 2
n 1
2 2 n 1
2
≥
2 0
2
<
2 0
(单侧检验)
2
2 1-
n
1
2. 两个正态总体均值及方差的假设检验表(显著性水平 α)
条件 原假设 H0 备择假设 H1
检验统计量
拒绝域
12
,
2 2
已知
1 =2 1 2 1 2
1 2
1 2
(单侧检验)
SW
(n1 1)S12 (n2 1)S22 n1 n2 2
T < - t (n1 n2 2)
1,2
未知
2 1
=
2 2
2 1
≤
2 2
2 1
≠
2 2
(双侧检验)
2 1
>
2 2
(单侧检验)
F
S12 S22
~
F ( n1 - 1, n2 - 1)
F ≥ F /2 n1 1, n2 1
已知
0 / n
X
0 n
u
/2,
X
0 n
u
/2
2 未知 T X 0 ~ t(n 1) S/ n
X
S n 1
t / 2
n
1 ,
X
S n
1
t
/
2
n
1
方差 2
未知
2
(n 1)S 2
2 0
~2n1
(n 2 /
1)S 2
第八章—正态总体均值和方差的假设检验-PPT课件
4.364 4.55 3.9 1. 96 0.108 n 5
0
,可认为现在的生产是不正常的。
例2 已知某正态总体的方差为 49,抽测 24个样本值 的均值为 x 55 . 8
.0 5) 问:总体均值 55是否成立 ( 0
解: 假设 H : 5 5 , H : 5 5 0 1 显然它与检验 H 0 : 55 时的讨论是一样的。 取统计量
概率统计
2.
2
未知,关于 的检验 ( t 检验 )
2 在 未知条件下用服
(1) 检验假设:
从 N (0,1) 的统计量 H : , H : 0 0 1 0 检验正态总体 的方 因为 2未知,所以可以考虑用 法为 t 检验法 2 2 的无偏估计 s 来代替,故有:
都取检验统计量: 拒绝域: 双边假设检验
X 0 n
右边假设检验 左边假设检验
x 0 z 2 n
概率统计
x 0 z n
x 0 z n
例1. 已知某钢铁厂的铁水含碳量在正常情况下服从 2 正态分布 N 现又测了5 炉铁水, ( 4 . 5 5 ,0 . 1 0 8),
未知,所以用 t 检验。
(2) 两个单边检验假设: 右边
t
2
t
2
左边
H : ( 或 ) ,H :
H : ( 或 ) ,H : 0 0 0 1 0
0 0 0 1 0
概率统计
则在显著性水平 下, H 0 的拒绝域: 分别为
x 0 t (n 1) s n
x 0 z n
概率统计
正态总体均值和方差的假设检验
求检验统计量为 2 (n -1)S 2 8 s2 0.08s2
σ02
100
当H0为真时,χ2服从自由度为8的χ2分布
对于α=0.05,
查表得
2 0.975
(8)
2.180,
2 0.025
(8)
17.535
则拒绝域为
W {0.08s2 2.180 U0.08s2 17.535}
即
W {s 5.220 Us 14.805}
每当测得s的值小于5.220或大于14.805时, 就认为机床的精度发生了变化。应引起注意, 并分析原因。
当方差σ12σ22已知时,用U检验法,构造 统计量
U (X Y)
2 1
2 2
n1 n2
取显著性水平α
P{| U | u /2}
得拒绝域为 | U | u /2
二、正态总体方差的检验
1、单个总体的情况—χ2检验
设总体N(, 2), , 2 未知,x1,L ,xn 是
来自总体X的样本,现要检验假设(显著性
(n
1)S
2 0
2
2/2 (n 1)
2
,
则p{ 2 χ12 (n 1) 2 χ2 (n 1)} α
2
2
得显著性水平为的拒绝域为
2
2 1
/
2
(n
1)或
2
2 / 2 (n 1)。
例3 由以往管理生产过程的大量资料表明某自 动机床产品的某个尺寸X服从正态分布,其标 准差为σ0=10.00毫米,并且把σ0=10.00毫米 定为机床精度的标准。为控制机床工作的稳定 性,定期对其产品的标准差进行检验:每次随 机地抽验9件产品,测量结果为x1,x2,…x9。试 制定一种规则,以便能根据样本标准差s的值 判断机床的精度(即标准差)有无变化(显著 性水平为α=0.05)? 解 依题意,所考虑的产品指标X服从正态
正态总体的均值和方差的假设检验课件PPT
(4)统 计 量 观 察 值 : u(xy)/ 1 22 21301252.5
n 1 n 2 6080 30 40
( 5 ) |u | 2 .5 1 .9 6 , 拒 绝 原 假 设 H 0 .
0.42, 0.08, 0.12, 0.30 , 0.27
处理后: 0.15, 0.13, 0.00, 0.07, 0.24,
0.19, 0.04, 0.08, 0.20, 0.12 假定处理前后含脂率都服从正态分布,且相互独立, 方差相等.问处理前后含脂率的均值有无显著差异
( = 0.05)?
解 以X表示物品在处理前的含脂率,Y表示物品在 处理后的含脂率,且 X ~ N ( μ 1 ,σ 1 2 )Y , ~ N ( μ 2 ,σ 2 2 )
1 假 H 0 : μ μ 0 设 , H 1 : μ μ 0 ; 2° 取检验统计量
T X0 ~t(n1);
Sn / n
(当H0为真)时
3° 给定显著水平 ( 0< < 1)
P |T | t /2 ( n 1 ) ,查表 t /2 ( n 1 可 ).
拒绝域: W1 = { (x1,x2,∙∙∙,xn)| |t | t /2 (n-1)};
(4) 由样本值计算U的观测值为
ux800977080032.25;
40
40
(5)判断:由 |u|2.251.9,6故拒绝原假设H0,即
不能认为这批钢索的断裂强度为 800 Mpa .
2. σ2为未知 μ的 ,检 关 t检 验 于 验 (法)
设 X 1 ,X 2 ,,X n 是来自 N (μ ,正 σ 2)的 态 一 总 其μ 中 ,σ2未知,检 α, 验检 水 μ的 验 平 步为 骤
正态总体方差的假设检验
(4). 拒绝域与临界点
当检验统计量取某个区域C中的值时, 我们拒绝原假
设H0, 则称区域C为拒绝域, 拒绝域的边界点称为临界点.
(5). 两类错误及记号
真实情况
所作
(未知)
接受 H0
H0 为真
正确
H0 不真
犯第II类错误
决策 拒绝 H0
犯第I类错误 正确
F0.975 (9,
9) 0.248, 取统计量F
sx2 sy2
2.67 2.12, 1.21
0.248 F 2.12 4.03,
故接受
H0,
认为
2 x
y2.
再验证 x y , 假设 H0 : x y , H1 : x y .
取统计量
犯第一类错误的概率为 当样本容量 n 一定时, 若减少犯第一类错误的概率,
则犯第二类错误的概率往往增大.
若要使犯两类错误的概率都减小, 除非增加样本容量.
(6). 显著性检验
只对犯第一类错误的概率加以控制, 而不考 虑犯第二类错误的概率的检验, 称为显著性检验.
(7). 双边备择假设与双边假设检验
在 H0 : 0 和 H1 : 0 中, 备 择 假 设H1 表 示 可 能 大 于0 , 也 可 能 小 于0 , 称 为 双 边 备 择 假 设, 形 如 H0 : 0 , H1 : 0 的 假 设 检 验 称 为 双 边 假设 检 验.
(8). 右边检验与左边检验
形如 H0 : 0 , H1 : 0 的假设检验 称为右边检验.
分布, 且总体方差相等. ( 0.05)
解 依题意, 两总体 X 和Y 分别服从正态分布
N (1, 2 )和N (2 , 2 ), 1, 2, 2均为未知,
34两个正态总体均值和方差的假设检验
(n1 n2 2)
(
x sw
y 1 n1
1 n2
k)
2
概率统计
在显著性水平 下, H0 的拒绝域:
x y
sw
11 n1 n2
t (n1 n2 2)
2
注:
当
2 1
2 2
2
未知时
检验假设 H0 : 1 2 , H1 : 1 2
H1
:
2 1
2 2
单边检验
H1
:
2 1
2 2
同上面双边检验的讨论类似,可得 H0的拒绝域为:
s12 s22
F (n1
1, n2
1)
习惯上亦称两个总体 方差相等的检验为: 两总体方差齐性的检验
或
s12 s22
F1 (n1
1, n2
1)
概率统计
例2. 现要检测两批葡萄酒的醇含量,分别对它们
设有 n 对相互独立的观察结果:
( X1 ,Y1 ) , ( X 2 ,Y2 ) , , ( X n ,Yn )
令:D1 X1 Y1 , D2 X 2 Y2 , , Dn ( X n ,Yn ) 则 D1 , D2 , , Dn相互独立。又由于 D1 , D2 , , Dn 是由同一因素所引起的,所以可认为它们服从同 一分布。
例4 现要比较甲、乙两种橡胶制成的轮胎的耐磨性。
今从甲、乙两种轮胎中各随机的取 8 个,又从 两组中各取一个组成一对,共 8 对; 再随机的取 8 架飞机,将 8 对轮胎随机地搭配 给这 8 架飞机作耐磨性试验,当飞机飞行了一 定时间后测得轮胎的磨损量的数据(单位:毫克) 如下:
正态总体均值的假设检验
于是
x
0
/n
0.516
z0.05
1.645,
故接受 H0 , 认为该机工作正常.
2. 2为未知, 关于 的检验( t 检验)
设总体 X ~ N (, 2 ), 其中, 2 未知, 显著性水平为 .
求检验问题 H0 : 0 , H1 : 0 的拒绝域.
设 X1 , X2 ,, Xn 为来自总体 X 的样本,
正态总体均值的假设检验
一、单个总体均值 的检验
二、两个总体均值差的检验(t 检验) 三、基于成对数据的检验(t 检验)
一、单个总体N(, 2)均值 的检验
1. 2 为已知, 关于 的检验( Z 检验)
在正态总体 N(, 2) 讨论中
当
2为已知时,
关于
的检验问题
0
:
(1) 假设检验 H0 : 0 , H1 : 0 ; (2) 假设检验 H0 : 0 , H1 : 0 ; (3) 假设检验 H0 : 0 , H1 : 0 .
设两样本独立. 注意两总体的方差相等. 又设 X ,Y 分别是总体的样本均值, S12 , S22 是样本方
差, 1, 2 , 2 均为未知,
求检验问题 H0 : 1 2 , H1 : 1 2 ( 为已知常数)的拒绝域.
取显著性水平为 .
引入 t 统计量作为检验统计量:
t
(X Sw
11 n1 n2
k
得 k t / 2 (n1 n2 2).
故拒绝域为
t
(x sw
y)
11 n1 n2
t / 2 (n1
n2
2).
关于均值差的其它两个检验问题的拒绝域见表
8.1, 常用 0 的情况.
正态总体均值的假设检验
拒绝域为 u u u0.05 1.645 .
现在 u x 0 41.25 40 3.125 1.645 , / n 2 / 25
即 u 的取值落在拒绝域中,所以在显著性水
平 = 0.05下拒绝 H0,接受 H1,即认为这
2
2 0
2 0
H0:
,H1:
.
其中
为已知常数.检验统计量
T
1
2 0
n
(Xi )2
i 1
~ 2 (n) .
对于给定的显著性水平 ,拒绝域为
t 12 / 2 (n) 或
t
2
/
2
(n)
.
上述检验的统计量服从 2 分布,称此种检
验为 2 检验,类似地可以进行单边检验(见表
右边检验的拒绝域为 t k ,左边检验的拒绝域为 t k .
例2 某工厂生产的固体燃料推进器的燃烧率
服从正态分布 N (, 2 ), 40cm / s , 2cm/ s ,
现在用新方法生产了一批推进器,从中抽取 n=25 只,测得样本均值为 x 41.25cm / s .设在新方
二、两类错误
由于检验法则是依据样本作出的,因此假设 检验的结果可能犯两类错误:
第一类错误:当原假设H0为真时,作出的决 定却是拒绝H0,犯这类错误的概率记为 ,即
P{拒绝H0|H0为真}= . 第二类错误:当原假设H0不正确时,作出的决定却是接受H0,犯这类错 误的概率记为 ,即
P{接受H0|H0不正确} = .
在H0成立时,检验统计量
第二节 正态总体均值和方差的假设检验
查表可知 t0.05 (18) = 1.7341,
查表8.1知其拒绝域为 查表 知其拒绝域为 t ≤ − tα ( n1 + n2 − 2). x− y = −4.295, 因为 t = 1 1 sw + 10 10
≤ − t 0.05 (18) = −1.7341,
所以拒绝 H 0 ,
2. , ( () σ2为未知 关于 的检验 t 检验) µ
设总体 X ~ N ( µ ,σ 2 ), 其中µ ,σ 2 未知, 显著性水平为 α .
求检验问题 H 0 : µ = µ 0 , H 1 : µ ≠ µ 0 的拒绝域 .
设 X 1 , X 2 ,⋯, X n 为来自总体 X 的样本 , X − µ0 2 , 来确定拒绝域 . 因为σ 未知 不能利用 σ/ n
X − µ0 ≥ k = α , P {当 H 0 为真 , 拒绝 H 0 } = Pµ 0 S/ n
得 k = tα / 2 ( n − 1),
x − µ0 拒绝域为 t = ≥ tα / 2(n −1) . s/ n
统计量得出的检验法称为t 检验法. 上述利用 t 统计量得出的检验法称为 检验法
10.9 10.6 10.8 10.5 10.7 10.2 10.7 假定切割的长度服从正态分布, 假定切割的长度服从正态分布 且标准差没有变 试问该机工作是否正常? 化, 试问该机工作是否正常 (α = 0.05)
解
因为 X ~ N ( µ ,σ 2 ), σ = 0.15,
要检验假设 H 0 : µ = 10.5, H 1 : µ ≠ 10.5,
要检验假设 H 0 : µ = 10.5, H 1 : µ ≠ 10.5,
两个正态总体均值差和方差的假设检验
方差齐性检验是检验 两个正态总体方差是 否相等的统计方法。
常用的方差齐性检验 方法有:Levene检验、 Bartlett检验和Welch 检验。
Levene检验基于方差 分析,通过比较不同 组间的方差来判断方 差是否齐性。
Bartlett检验基于 Kruskal-Wallis秩和 检验,通过比较不同 组间的中位数和四分 位距来判断方差是否 齐性。
独立样本的均值检验
1
独立样本的均值检验是用来比较两个独立正态总 体的均值是否存在显著差异的统计方法。
2
常用的独立样本均值检验方法包括t检验和z检验, 其中t检验适用于小样本和大样本,而z检验适用 于大样本。
3
在进行独立样本均值检验时,需要满足独立性、 正态性和方差齐性的假设,以确保检验结果的准 确性和可靠性。
根据研究目的和数据类型,选择合适的统计量 来描述样本数据。
确定临界值
根据统计量的分布和显著性水平,确定临界值。
计算样本统计量
根据样本数据计算所选统计量的值。
做出决策
将样本统计量的值与临界值进行比较,做出接受 或拒绝原假设的决策。
解读结果
根据决策结果解读研究问题,给出结论和建议。
Part
02
两个正态总体均值的假设检验
Part
05
结论与展望
假设检验的优缺点
理论基础坚实
假设检验基于概率论和统计学原理,具有坚实的理论基础。
操作简便
假设检验提供了清晰的步骤和标准,方便研究者进行操作。
假设检验的优缺点
• 实用性强:假设检验广泛应用于各个领域,为科学研究和实践提供了有效的工具。
假设检验的优缺点
01
对数据要求较高
假设检验对数据的分布、样本量 等有一定的要求,不符合条件的 样本可能导致检验结果不准确。
假设检验(完整)
抽样分布
置信水平
1 -
拒绝H0
0 观察到的样本统计量
样本统计量 临界值
显著性水平和拒绝域
(右侧检验 )
抽样分布
置信水平
1 -
拒绝H0
0
样本统计量
临界值
第一节 假设检验概述
1、假设检验的基本思想 2、假设检验的步骤 3、两类错误和假设检验的规则
三、两类错误和假设检验的规则
• 1. 第Ⅰ类错误(弃真错误)
x
~ N (0,1) s/ n
x ~ t(n 1)
s/ n
非正态分布 大样本 x ~ N (0,1) / n
x ~ N (0,1)
s/ n
非正态小样本情形不讨论。
3、拒绝域和接受域的确定
(双侧检验 )
抽样分布
拒绝H0
/2
1 -
置信水平 拒绝H0
/2
拒绝域
临界值
临界值
0 接受域
样本统计量 拒绝域
关统计) 6、《红楼梦》后40回作者的鉴定(文学统计)。 7、民间借贷的利率为多少?(金融统计) 8、兴奋剂检测(体育统计)
1、假设检验的基本思想
为研究某山区的成年男子的脉搏均数是否高于一般 成年男子脉搏均数,某医生在一山区随机抽查了25名 健康成年男子,得其脉搏均数x为74.2次/分,标准差 为6.0次/分。根据大量调查已知一般健康成年男子脉 搏均数为72次/分,能否据此认为该山区成年的脉搏 均数μ高于一般成年男子的脉搏均数μ0?
– 原假设为真时拒绝原假设
– 第Ⅰ类错误的概率记为
• 被称为显著性水平
• 2. 第Ⅱ类错误(取伪错误)
– 原假设为假时未拒绝原假设
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本, 且设两样本独立. 注意两总体的方差相等.
2 *2 又设 X , Y 分别是总体的样本均值, S1*n , S 2 n2 是样本 1
方差, 1 , 2 , 均为未知,
2
假设检验的问题 H 0 : 1 2 , H1: 1 2
取显著性水平为 .
引入 t 统计量作为检验统计量 : *2 *2 ( n 1 ) S ( n 1 ) S (X Y ) 1 1n 2 2n 2 T , 其中 Sw . n1 n2 2 1 1 Sw n1 n2
* n
t / 2 ( n 1)} .
上述利用 t 统计量得出的检验法称为t 检验法. 此检验的势函数为: (略)
( ) P T t / 2 ( n 1)
1 k x
0 n 2
( x ){[
xt / 2 ( n 1) n 1
] [
t 0.516 2.145 t0.025 14,因而接受
由于
H 0 ,即认为这两种轮胎的耐磨性无显著差异。
以上是在同一检验水平 0.05 下采用不同方法 的分析结果,方法不同所得结果也比一致,到底哪个 结果正确呢?下面作一简要分析。因为我们将8对轮 胎随机地搭配给8架飞机作轮胎耐磨性试验,两种轮 胎不仅对试验数据产生影响,而且不同的飞机也对试 验数据产生干扰,因此试验数据配对分析,消除了飞 机本身对数据的干扰,突出了比较两种轮胎之间耐磨 性的差异。
解 依题意, 两总体 X 和 Y 分别服从正态分布
2 , , 均为未知, N ( 1 , ) 和N ( 2 , ), 1 2
2 2
需要检验假设 H 0 : 1 2 , H1 : 1 2 .
n1 8, n2 7,
*2 s x 19.925, 1n1 0.216,
于是,对 1 与
2 是否相等的检验
就变为对 d 0 的检验,这时我们可采用关于 一个正态总体均值的T 检验法。将甲,乙两 种轮胎的数据对应相减得Z的样本值为:
-30,320,360,320,230, 780,720,-140 1 8 计算得样本均值 Z Z i 320 8 i 1
因为 X ~ N ( , 2 ), 0.15,
要检验假设 H 0 : 10.5, H1 : 10.5,
n 15,
x 10.48, 0.05,
x 0 10.48 10.5 0.516, 则 / n 0.15 / 15
u0.025 1.96, x 0 于是 | | 0.516 u0.025 1.96, / n
当H 0为真时,
X 0 S / n
* n
~ t (n 1),
X 0 P{拒绝 H0|H0 为真} P * k , 0 Sn / n
令 k t / 2 (n 1),
拒绝域为 W { x : t x 0 s / n
第4.2节 正态总体均值与方差的 假设检验
一、 t 检验
2 二、 检验
三、F 检验 四、单边检验
一、t 检验
1. 已知时, 关于的检验( U 检验)
2
在上节中讨论过正态总 体 N ( , 2 )
当 2已知时, 关于 0的检验问题:
假设检验 H 0 : 0பைடு நூலகம், H1: 0
根据第一章§1.3, 当H 0为真时,
取 2
*2 ( n 1) Sn 2
*2 (n 1) Sn
02
~ 2 ( n 1),
*2 * 因为 Sn 是 2 的无偏估计, 故用 Sn 来取代 ,
即采用 T
X 0 S / n
* n
来作为检验统计量.
x 0 当观察值 t 过分大时就拒绝 H 0 , s/ n x 0 拒绝域的形式为 t k. s/ n
根据第一章§1.3定理1.13知,
定理1.13
8 7 2 查表可知 t0.025 (13) 2.160,
0.547,
补充:方差已知但不相等时,两个正态总体 均值是否相等的检验
设 X1 , X 2 , 的样本, Y1 , Y2 ,
, X n1 为来自正态总体 N ( 1 , )
2 1 2 , Yn 2 为来自正态总体 N ( 2 , 2 )的
X1 , X 2 ,, X n 为来自总体 X 的样本,
(1) 要求检验假设: H 0 : 0 , H1 : 0 ,
2 2 2 2
其中 0 为已知常数.
设显著水平为 ,
*2 由于 Sn 是 2 的无偏估计, 当 H 0 为真时,
*2 sn 比值 2 在1附近摆动, 不应过分大于1或过分小于1, 0
xt / 2 ( n 1) n 1
]}
其中k 2 / 2
1 ( n 3) 2
n ( 0 ) n 1 ( ), 2
例2(p121例4.5)如果在例1中只假定切割的长度 服从正态分布, 问该机切割的金属棒的平均长度 有无显著变化? ( 0.05) 解 依题意 X ~ N ( , 2 ), , 2均为未知,
*2 s y 20.000, 2 n2 0.397,
且 sw
2
(8 1) s (7 1) s
*2 1n1
*2 2 n2
|x y| |t | | 0.265| 2.160, 所以接受 H 0 , 1 1 sw 8 7 即甲、乙两台机床加工的产品直径无显著差异.
n1n2 ( n1 n2 2) n1 n2
由样本数据及 n1 n2 8可得
x 6145 ,
*2 S y 5825 1n1 1633900 8 / 7
*2 S2 n2 1053875 8 / 7
t 320 / 619 .7 0.516
对给定的 0.05 ,查自由度为16-2=14的t分布 表,得临界值 t / 2 16 2 t0.025 14 2.145
查表得
故接受 H0 , 认为该机工作正常 .
2. 2未知时, 关于 的检验( t 检验)
设总体 X ~ N ( , 2 ), 其中 , 2 未知, 显著性水平为 .
求检验问题 H 0 : 0 , H1 : 0 的拒绝域. 设 X1 , X 2 ,, X n 为来自总体 X 的样本, X 0 2 来确定拒绝域. 因为 未知, 不能利用 / n
2 1 2 2
2 12 2 2 欲检验假设
H0:1 2,H1:1 2
下面分两种情况讨论:
(1)实验数据配对分析:记 Z X Y ,则
E(Z) 1 2 def d,D(Z) 2 2 ,由正
态分布的可加性知,Z服从正态分布N (d , 2 2 ) 。
10.48 10.5
0.327,
t分布表
故接受 H0 , 认为金属棒的平均长度 无显著变化.
3. 方差未知时, 两个正态总体均值的检验( t 检验)
利用t检验法检验具有相同方差的两正态总体 均值差的假设.
设 X1 , X 2 , 的样本, Y1 , Y2 ,
, X n1 为来自正态总体 N ( 1 , 2 ) , Yn 2 为来自正态总体 N ( 2 , 2 )的
对试验数据不做配对分析,轮胎之间和飞机之间对数 据的影响交织在一起,这时样本 X1 , , X n1
与样本 Y1 ,
,Yn2 不独立。
因此,用两个独立正态总体的t检验法是不合适的。 由本例看出,对同一批试验数据,采用配对分析还是 不配对分析方法,要根据抽样方法而定。
二、 检验
2
设总体 X ~ N ( , 2 ), , 2均为未知,
2 Sn
( Z i Z ) 2 / 7 102200
i 1
8
2 t ( Z 0) / s 8 / 102200 2.83 n / 8 320
对给定 0.05 ,查自由度为8 1 7 的 t 分布 表得临界值 t0.025 (7) 2.365,由于t 2.83 2.365
1 2
当H 0为真时,根据第1章§1.3定理1.14知,
T ~ t ( n1 n2 2).
定理1.14
其拒绝域的形式为
W {x : sw |x y| 1 1 n1 n2 t ( n1 n2 2)},
2
第一类错误的概率为:
| X Y | P t ( n n 2 ) | H 0为真} 1 2 2 S 1 1 w n1 n2
讨论中选用的统计量为U X 0
/ n
H 0 为真时,U服从 N (0,1) 分布.这种 检验法称为 U 检验法.
例1 某切割机在正常工作时, 切割每段金属棒的 平均长度为10.5cm, 标准差是0.15cm, 今从一批产 品中随机的抽取15段进行测量, 其结果如下: 10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7 假定切割的长度服从正态分布, 且标准差没有变 化, 试问该机工作是否正常? ( 0.05) 解
量(单位:mg)数据如下:
轮胎甲:4900,5220,5500,6020
6340,7660,8650,4870
轮胎乙;4930,4900,5140,5700
6110,6880,7930,5010 试问 这两种轮胎的耐磨性有无显著差异?
解:用X及Y分别表示甲乙两种轮胎的磨损量
假定 X ~ N(1, ),Y ~ N(2, ) ,其中