两个正态总体的假设检验
两个正态总体的假设检验
由样本观察值算出的 F 满足
F0.95 (9 , 9) 1 3.18 F 1.95 3.18 F0.05 (9 , 9) .
可见它不落入拒绝域,因此不能拒绝原假设 H0 :σ12 = σ22 ,
从而认为两个总体的方差无显著差异。
注意:在 μ1 与 μ2 已知时,要检验假设 H0 :σ12 = σ22 ,其
检验方法类同均值未知的情况,此时所采用的检验统计量是:
1 n1
2
(
X
)
i 1
n1 i 1
F
1 n2
2
(
Y
)
i 2
n2 i 1
其拒绝域参看表8-5。
( 2 )单边检验可作类似的讨论。
F0.05 (n1 , n2 ) .
8-5
概率学与数理统计
体的样本,且 μ1 与 μ2 未知。现在要检验假设 H0 : σ2 = σ02 ;
H1: σ2 ≠ σ02 。在原假设 H0 成立的条件下,两个样本方差的
比应该在1附近随机地摆动,所以这个比不能太大又不能太小。
于是我们选取统计量
S12
F 2.
S2
( 8.21 )
显然,只有当 F 接近1时,才认为有 σ12 = σ22 。
10 10 2
18
由( 8.20 )式计算得
2.063 2.059
t0
3.3 .
0.0000072 (2 10)
对于 α =0.01,查自由度为18的 t 分布表得 t 0.005( 18 )=2.878。
由于| t0|=3. 3 > t 0.005( 18 )=2.878 ,于是拒绝原假设 H0 :μ1 = μ2 。
两个正态总体方差的假设检验
两个正态总体方差的假设检验1. 引言嘿,大家好!今天我们来聊聊一个在统计学中非常重要,但听起来可能有点儿复杂的话题——两个正态总体方差的假设检验。
别担心,我们会用通俗易懂的方式,把这个问题掰开了揉碎了讲清楚。
你可能会问,“这跟我有什么关系呢?”其实,这些统计方法不仅仅是数学家的专属,很多实际问题都可以通过这些方法得到解决。
好比你买衣服时,会比较不同品牌的裤子,看哪个更适合你,其实也是在做“检验”。
所以,搞懂这个概念,绝对会让你在数据分析的世界里如鱼得水。
我们从最基本的概念开始聊起,循序渐进,一步一步深入。
2. 正态总体和方差2.1 正态总体是什么?首先,让我们搞清楚什么是“正态总体”。
简单来说,正态总体就是数据分布呈现钟形曲线的情况。
在生活中,很多自然现象都符合这种分布,比如人的身高、体重、考试分数等等。
正态分布的特点就是数据集中在中间,向两边渐渐减少,就像一个标准的山峰。
想象一下你在玩飞盘,飞盘从空中下落时的轨迹,就是一个典型的钟形曲线。
2.2 方差的作用接下来,我们来谈谈方差。
方差是用来衡量数据的离散程度的,换句话说,就是数据离中间值的远近程度。
方差大的话,数据就会分布得比较散,方差小的话,数据就比较集中。
好比你家里那只爱乱跑的猫,方差大,它就到处跑;而如果它安安静静地待在一个角落,那就是方差小了。
3. 假设检验的基本概念3.1 什么是假设检验?好,接下来进入正题:假设检验。
假设检验就像是在做一个“真心话大冒险”,我们要通过数据来验证某个“假设”是否成立。
比如你和朋友讨论哪家餐馆的菜最好,你们就会提出一个假设,然后用实际的体验来检验这个假设。
统计学中的假设检验也是类似的,只不过我们用的是数字和公式来做这个验证。
3.2 两个正态总体方差的假设检验现在,我们要做的是两个正态总体方差的假设检验。
这就像是比较两个篮球队的实力,看看哪个队更强。
假设我们有两个正态分布的数据集,我们的任务就是判断这两个数据集的方差是否相同。
第58讲 两个正态总体参数假设检验(比较两个正态总体均值的检验)
第58讲:两个正态总体参数的假设检验(比较两个正态总体均值的检验)例1:通常认为男女的脉搏率是没有显著差异的. 现在随机地抽取年龄都是25岁的16位男子和13位女子, 测得他们的脉搏率如下:男: 61, 73, 58, 64, 70, 64, 72, 60, 65, 80, 55,72, 56, 56, 74, 65,女: 83, 58, 70, 56, 76, 64, 80, 68, 78, 108,76, 70, 97.问题:假设男女脉搏率都是服从正态分布, 这些数据能否认为男女脉搏率的均值相同?()()12221212122221,,,,,,,,,,,n n X X X N Y Y Y N X Y S S μσμσ∙∙∙ 12假设:是来自的样本是来自的样本,两样本相互独立.并记,分别为两样本的均值和方差.()012112.:,:,H H μμμαμ=≠检验假设显著水平22121.σσ当和已知时2212012,.~(0X Y X Y C H X Y N n n σσ∙--≥∙-+ 检验统计量拒绝域形式 当成立时,,).221212σσ-=+X YZ n n 记: 2α≥--Z z z 则检验拒绝域为:检验{}00002212122(1(),.σσ-=≥=-Φ-=+H P P Z z z x yz n n 其中:222122.σσσ当==但未知时2σ首先利用合样本给出参数的无偏估计量()()22112221211 .2wn S n SS n n -+-=+-1211-=+w X Y T S n n 可取检验统计量为:()21212211wX Y T t n n S n n α-=≥+-+检验拒绝域为:{}{}00120012||||2(2)||11--=≥=+-≥-=+H w P P T t P t n n t x yt P s n n 其中为::值——两样本精确t检验22123.σσ≠当且未知时221212.-=+X Y T S S n n 取检验统计量为:22221212.S S σσ以样本方差分,别代替,{}{}000||||2||,--=≥=≥H P P T t P Z P t 值为:(1)当两个样本量都很大时,利用中心极限定理{}/2||α≥T z 检验的拒绝域为:0221212~(01).-=+x y Z N t s sn n 其中: ,,12min(1,1),=--k n n (2)当两个样本为小样本时都很大时,统计量近似服从t 分布,自由度为22211222222112212(//)(/)(/)11+=+--S n S n k S n S n n n 或更精确的近似自由度{}/2||()α≥T t k 检验的拒绝域为: {}{}000||||2()||.--=≥=≥H P P T t P t k t P 值为: t ——两样本近似检验22112212221201,~(,),~(,),16,13,65.31,75.69,56.36,211.40,.X Y X N Y N n n x y s s H H μσμσμμμμ=======≠1212检验假设在例1中设分别表示男女的脉搏率,由已知数据计得:,::算221256.36,211.40,s s t ==注意到相差很大,采用不等方差的检验法,结论:拒绝原假设,认为男女脉搏率的均值不相同。
双正态总体的假设检验
2 1 2 2
(1) 双侧检验 H 0 : 1 2 0 , H1 : 1 0 , 其中 0 为已知常数. 当 H 0 为真时,
x y 0 U ~ N (0,1), 2 2 1 专业课件讲义教材 / n1 2 / n文档 PPT 2
P{| U | k } 查标准正态分布表 k u / 2 u0.025 1.96, 从而拒绝域 为 | u | 1.96. 由于 x 1295, y 1230, 1 84, 2 96, 所以
u
x y
n1
2 1
n2
2 1
3.95 1.96,
x1 , x2 ,, xn1
和
专业课件讲义教材PPT文档
y1 , y2 ,, yn2 ,
3
计算出 U 的观察值 u,若 u u / 2 , 则拒绝原假设 H 0 , 若 u u / 2 , 则接受原假设 H 0 .
类似地,对单侧检验有: (2) 右侧检验 H 0 : 1 2 0 , H1 : 1 2 0 , 可得拒绝域为 其中 0 为已知常数,
H 0 : 1 2 2 , H1 : 1 2 2 ,
专业课件讲义教材PPT文档
8
解 检验假设 H 0 : 1 2 2 , 2 4 22 X 2Y ~ N 1 2 2 , . n1 n2
在 H 0 成立下
1
记其观察值为 u, 相应的检 选取 U 作为检验统计量, 验法称为 u 检验法. 由于 X 与 Y 是 1 与 2 的无偏估计量, 当 H 0 成立时,
u 不应太大, 当 H1 成立时, u 有偏大的趋势, 故拒绝
概率论与数理统计02-82.2 两个正态总体均值的检验_70
第八章假设检验第二节正态总体均值的假设检验2. 两个正态总体在寿命问题中提出了两个正态总体均值是否相等的假设012:H μμ=112:H μμ≠这种情形经常发生在当研究对象的外界条件发生了改变时,判断研究对象是否受到了这种影响.检验统计量如何构造呢?例3对用两种不同热处理方法加工的金属材料做抗拉强度试验,得到的试验数据如下:方法Ⅰ:31,34,29,26,32,35,38,34,30,29,32,31方法Ⅱ:26,24,28,29,30,29,32,26,31,29,32,28设两种热处理加工的金属材料的抗拉强度都服从正态分布,且方差相等.比较两种方法所得金属材料的平均抗拉强度有无显著差异().05.0=α).,(),,(2221σμσμN N 解:记两总体的正态分布为.:,:211210μμμμ≠=H H 本题是要检验假设关键问题在于找到拒绝域12k μμ->X Y k->121212()()~(2),11w X Y t n n S n n μμ---+-+222112212(1)(1)2w n S n S S n n -+-=+-其中12221212()()~(0,1)X Y N n n μμσσ---+).,(),,(2221σμσμN N 解:记两总体的正态分布为.:,:211210μμμμ≠=H H 本题是要检验假设1212~(2)11w X Y T t n n S n n -=+-+检验统计量为21212||(2)11w x y t t n n S n n α-=≥+-+拒绝域为,1221==n n ,75.31=x .67.28=y ,25.112)1(211=-s n ,64.66)1(222=-s n .85.2=w s .647.26185.2|67.2875.31|11||||21=-=+-=n n s y x t w 计算统计值074.2)22()2(025.0212==-+t n n t α查t 分布表,得/212||(2)t t n n α>+-统计判决:由于故拒绝H 0.即认为两种热处理方法加工的金属材料的平均抗拉强度有显著差异.解:休息一下吧。
8.3两个正态总体参数的假设检验
方差
12
2 2
2
未知
1.H0 : 1 2 0 H1 : 1 2 0
由于
Sw2
1 n1 n2
n1
[ 2 i1
(Xi
X )2
n2 i1
(Yi
Y )2]
是
2 的无偏估计
检验统计量:T
Sw
X Y 1 n1
1 n2
~ t(n1 n2 2)
检验问题的拒绝域为:| T | t (n1 n2 2)
X Y H0
2 1
2 2
~ N (0,1)
n1 n2
检验问题的拒绝域为:|U | Z
2
方差
12 ,
2 2
已知
2.
检验统计量:U
X Y
2 1
2 2
n1 n2
检验问题的拒绝域为:U Z1
3. H0 : 1 2 0
方差
12 ,
2 2
已知
H1 : 1 2 0
检验统计量:U
X Y
2 1
2 2
n1 n2
检验问题的拒绝域为:U Z
例:设可乐厂车间使用灌装机生产的可乐容量服从正态分布, 方差为1。某天计量检验人员随机抽取10瓶可乐,容量数据如下 (单位:毫升):
499.5 496.3 500.5 499.1 499.3 499.2 499.0 500.2 500.1 499.8 另一可乐厂生产的可乐容量服从正态分布,方差为1.5。计 量检验人员随机抽取了的9瓶可乐,容量数据如下(单位:毫 升):
2. H0 : 1 2 0 H1 : 1 2 0
3. H0 : 1 2 0 H1 : 1 2 0
问题1称为双侧检验问题,问题2、3称为单侧检验问题。
两个正态总体参数的假设检验 推导
两个正态总体参数的假设检验推导一、引言假设检验是统计学中常用的方法,用于检验两个正态总体参数是否具有显著差异。
本文将介绍两个正态总体参数的假设检验的推导过程,主要包括以下步骤:假设提出、样本收集、样本检验、推断结论、结果解释和误差分析。
二、假设提出假设检验的基本思想是通过样本数据对总体参数进行推断。
在这个过程中,首先需要提出假设,即对两个正态总体参数的关系做出假设。
通常,假设检验中包含两个假设:零假设(H0)和备择假设(H1)。
零假设通常表示两个总体参数无显著差异,备择假设则是与零假设相对的假设。
例如,我们可以在零假设中设定两个总体均数相等,备择假设则是均数不等。
三、样本收集在提出假设后,需要收集样本数据以进行检验。
样本收集应遵循随机抽样的原则,以确保样本的代表性。
在收集样本时,还需要注意样本量的大小,以保证推断结论的准确性。
四、样本检验样本检验是假设检验的核心步骤,包括计算样本统计量、确定临界值和做出推断结论等步骤。
样本统计量是根据样本数据计算出的量,用于推断总体参数。
临界值是用于判断样本统计量是否达到显著差异的标准。
在做出推断结论时,需要根据样本统计量和临界值进行比较,以确定零假设是否被拒绝。
五、推断结论根据样本检验的结果,可以做出推断结论。
如果样本统计量超过了临界值,则可以拒绝零假设,接受备择假设;否则,不能拒绝零假设。
推断结论是假设检验的关键步骤之一,要求谨慎和客观地做出判断。
六、结果解释推断结论做出后,需要对结果进行解释。
解释结果时需要关注以下几点:一是理解推断结论的含义,二是明确结果对于实践的意义,三是注意结果的局限性,即样本量和误差范围等因素对结果的影响。
结果解释要求清晰明了地传达结果的含义和应用范围。
七、误差分析误差分析是假设检验中不可或缺的一环。
误差分为两类:一类是随机误差,由随机抽样造成;另一类是系统误差,由样本设计和处理等环节造成。
误差分析的目的是评估结果的可靠性和精确性,从而确定结果在实际应用中的可信度。
方差不等两正态总体期望假设检验的回归方法
乘
首先 推 导 回归模 型 y = XB+8 的广 义最 小二 乘估 计 1 3和 V a r ( 1 3) 的公式。
_ _ _ 1 _I
.
0
仃 l
假 设检 验
虚拟 变 量
回归
广 义 最 小二
模型 y = x1 3+8两边左乘 n =
0
盯
I
“
= =
: ~
别 记 为y 。 和y : , 其中y 产 ∑y ; y 2 = ∑y 2 1 o 根 据 抽 样 分 布
II 1 i= 1 1 1 2 i = I
知识 , 然后将两个样本均值
( \ 一 Y I y _ 一 / l Y - 2 ) , 其 中 n I i ; 一 i y z = n 2 i ; 一 i
, 1 3 - =一 Y 一一 Y・ ( 2 )
2
V 1 3 闩) ( I Q X ) 一
仃 l
n,
假 设 E ( £ ) : 0 , E ( 8 t 8 ) : f \ o 1 垒 Q ' l n 是 n I 维 的 单 0 2 I l l 2/
=
nl
n2
∑y : i
B = ( : ) , x = ( ) , - 为 其 元 素 全 部 为 ・ 的 × n 的 列 向 即1 3
量, l 类似 , 零 向量 0是 n 维列 向量 。 y = ( y Y …, Y l n 1 , Y , Y , …, y ) ’ , Y 表示 两个 独立 样本 中 第g 个样本 中的第 i 个观测值 , g = 0 , 1 。
之差 Y 一Y. 标准化则服从标准正态分布 , 即
两个正态总体均值的检验.
S
2 w
(n1
1)S1*2 (n2 1)S2*2 n1 n2 2
.
当H0为真时, 根据第六章§3定理2知,
T ~ t(n1 n2 2).
第八章 假设检验
§8.3 两个正态总体参数的假设检验
对给定的 , 由t分布的分位表可查得 t/ 2(n1 n2 2).
X Y
使得P{ Sw
1 1 t / 2 (n1 n2 2)}
,
2均为
2
未
知.
需要检验假设:
H0
:
2 1
22,
H1 :12 22 ,
第八章 假设检验
§8.3 两个正态总体参数的假设检验
当 H0 为真时,
E
(
S1*
2
)
2 1
2 2
E(S2*2 ),
当 H1 为真时,
E(
S1*2
)
2 1
22
E(S2*2 ),
当 H1 为真时,
观
察
值S1*
S
* 2
2 2
有 偏
大
或
偏
小
的
趋
势
故拒绝域的形式为 s1*2 s2* 2
k1或
s1* 2 s2* 2
k2,
此处 k1和k2 的值由下式确定:
第八章 假设检验
P
S1* S2*
2 2
k1
S1*2 S2*2
k2
§8.3
两个正态总体参数的假设检验
为了计算方便, 习惯上取
P
S1* S2*
2 2
k1
,
2
P
P{| ( X Y ) /
故拒绝域为
双正态总体参数的假设检验
§7.3 双正态总体参数的假设检验设样本1,,1n X X 取自正态总体211(,)N μσ,样本2,,1n Y Y 取自总体222(,)N μσ,两样本相互独立,它们的样本均值分别为∑==1111n i iX n X ,∑==2121n j jYn Y ,样本方差分别为∑=--=112121)(11n i i X X n S ,∑=--=212222)(11n j j Y Y n S 。
一、 关于两个正态总体方差比的假设检验以双侧检验:2221122210::σσσσ≠↔=H H 为例 选用检验统计量2221S S F =,它在原假设0H 成立的条件下服从F 分布)1,1(21--n n F ;记2221s s f O =表示检验统计量F 的样本观测值,则检验的P 值为⎪⎩⎪⎨⎧<=≥≥=≥=1),/1/1(21),(222212221O O O O f f F P f f F P P 如果如果σσσσ这种检验方法通常称为“F 检验”。
例7.3.1 甲乙两台车床分别加工某种轴,轴的直径分别服从正态分布),(211σμN ,),(2σμN ,从各自加工的轴中分别抽取若干根,测得其直径如下表所示:试问在显著性水平05.0=α下,两台车床加工的精度是否有显著差异?解:(1)依题意,考虑假设检验问题2221122210::σσσσ≠↔=H H (2)用F 检验,检验统计量为)6,7(~02221F S S F H =或)7,6(~/102122F S S F H =;(3)由样本观测值可得2164.021=s ,2729.022=s ,检验统计量的值为793.0/2221==s s f O 。
故检验的P 值为76.038.02)793.0/1/1(22221=⨯==≥=σσF P P 。
(4) 因为05.0>P ,所以不拒绝原假设0H ,即没有充分理由认为两种机床所加工轴的精度有显著差异。
两个正态总体均值的检验.
2 , , 均为未知, N ( 1 , ) 和N ( 2 , ), 1 2
2 2
第八章
假设检验
*2 1
*2 2
需要检验假设 H 0 : 1 2 , H1 : 1 2 .
n1 8, n2 7,
2
§8.3 两个正态总体参数的假设检验
使得P{ Sw X Y 1 1 n1 n2 t / 2 ( n1 n2 2)}
故拒绝域为
W1 { sw ( x y) 1 1 n1 n2 t / 2 ( n1 n2 2)}
第八章
假设检验
§8.3 两个正态总体参数的假设检验
例2 有甲、乙两台机床加工相同的产品, 从这两台 机床加工的产品中随机地抽取若干件, 测得产品直 径(单位:mm)为 机床甲: 20.5, 19.8, 19.7, 20.4, 20.1, 20.0, 19.0, 19.9 机床乙: 19.7, 20.8, 20.5, 19.8, 19.4, 20.6, 19.2, 试比较甲、乙两台机床加工的产品直径有无显著 差异? 假定两台机床加工的产品直径都服从正态 分布, 且总体方差相等. ( 0.05)
x 24.4,
12
2 2
y 27
24.4 27 u ( x y) / 1.612 n1 n2 5 8 5 5 对 0.05, 查正态分布表得 u / 2 1.96,由于
| u | 1.612 1.96, 故接受原假设 H0 .
第八章
假设检验
§8.3 两个正态总体参数的假设检验
2.未知方差时两正态总体均值的检验 利用t检验法检验具有相同方差的两正态总体均 值差的假设. 设 X 1 , X 2 , , X n1 为 来 自 正 态 总 体 N ( 1 , 2 )的
第3节正态总体方差的检验
解 H0 : σ 2 = 5000, H1 : σ 2 ≠ 5000, α = 0.02
当H
为真时
0
,
(n − 1)S2
σ
2 0
~
χ 2(n − 1),
Pσ
2 0
⎪⎧⎛ ⎨⎪⎩⎜⎜⎝
(n − 1)S2
σ
2 0
≤
χ12−α 2
⎞ (n − 1)⎟⎟⎠
U
⎛ ⎜⎜⎝
(n − 1)S2
σ
2 0
≥
χα2
2
(n
−
1)
⎞⎪⎫ ⎟⎟⎠⎬⎪⎭
=α
拒绝域
或 (n −1)s2
σ 02
≤
χ2 1−α
(
n
−
1)
2
(n −1)s2
σ 02
≥
χ
2 α
(
n
−
1)
2
现在 n = 26,
χα2
(n
− 1)
=
χ
2 0.01
(
25)
=
44.314
2
χ2 1−α
(n
−
1)
=
χ
2 0.99
(
25)
=
11.524
s2 = 9200
2
因此
Fα
2
(n1
−1,n2
−1)⎞⎟⎟⎠⎫⎪⎬⎪⎭
=
α
此处n1 = n2 = 10, α = 0.01
拒绝域为
s2 1
s22
≥
F0.005(10 − 1,10
− 1)
=
6.54
或
s2 1
s22
34两个正态总体均值和方差的假设检验
(n1 n2 2)
(
x sw
y 1 n1
1 n2
k)
2
概率统计
在显著性水平 下, H0 的拒绝域:
x y
sw
11 n1 n2
t (n1 n2 2)
2
注:
当
2 1
2 2
2
未知时
检验假设 H0 : 1 2 , H1 : 1 2
H1
:
2 1
2 2
单边检验
H1
:
2 1
2 2
同上面双边检验的讨论类似,可得 H0的拒绝域为:
s12 s22
F (n1
1, n2
1)
习惯上亦称两个总体 方差相等的检验为: 两总体方差齐性的检验
或
s12 s22
F1 (n1
1, n2
1)
概率统计
例2. 现要检测两批葡萄酒的醇含量,分别对它们
设有 n 对相互独立的观察结果:
( X1 ,Y1 ) , ( X 2 ,Y2 ) , , ( X n ,Yn )
令:D1 X1 Y1 , D2 X 2 Y2 , , Dn ( X n ,Yn ) 则 D1 , D2 , , Dn相互独立。又由于 D1 , D2 , , Dn 是由同一因素所引起的,所以可认为它们服从同 一分布。
例4 现要比较甲、乙两种橡胶制成的轮胎的耐磨性。
今从甲、乙两种轮胎中各随机的取 8 个,又从 两组中各取一个组成一对,共 8 对; 再随机的取 8 架飞机,将 8 对轮胎随机地搭配 给这 8 架飞机作耐磨性试验,当飞机飞行了一 定时间后测得轮胎的磨损量的数据(单位:毫克) 如下:
两个正态总体期望假设检验的回归方法
【 e od ]xet yo eit t i aVr b ; g so K yw rsEpc H pt s s Vr la al r r s n ; h se ; t i e e e i u
0 引言
则有 E yd 1= o 。E(l O = ,。E y = )E y = (l )3 , y = ) 卢 = (l 1一 ( l = d d d 0 表示两个总体 和 卵的期望的差。 )
=
和 - , , , 分 别是来 自总体 和 q : …
。
的样本
1 , 它们的样本均值和方差分别记为 ,2 m, S = s 和 町 。
( )其 2,
( 称 为估计量 的标 准误
毒 = 2 丁 (毒) 毒 ,
毒 , = ( ) 2 r 。
me h d t s e h p t e i. h a u l e r s in mo e y u ig a d mmy v r b e t o o t tt y o h s T e w y i t b i a r g e so d lb sn u e h s so d ai l. a
:
. 一
:
() 4
n 维列向量 d ( ,, 0 1 1… ,)O -0 0 …, ,, , 1I建立 回归模 型 y o  ̄ - +
∑(-.= Y ̄ d = 。 。 q ) ∑(-。 ) ∑( ) i
+
卢.+ , d 8 假设 该模型满 足经典 的假 定条件嘲 其 中 E( l = , , ed 0 E )
2 两种 方法 的等 价性
针对方差未 知但相 同的两个正态总体期望 的假设 检验 ,
由 上述 构 造 的 回 归模 型 的 解 释 变 量 d的 t 验 的统 计 量 t 检 与
两个正态总体期望假设检验的回归方法
2012年9月第25期科技视界SCIENCE &TECHNOLOGY VISION 科技视界※基金项目:浙江省教育厅科研计划一般项目(Y201119868)。
0引言设ξ,η是两个相互独立的随机变量,ξ~N (μ1,σ12),η~N(μ2,σ22),ξ1,ξ2,…,ξn 和η1,η2,…,ηn 分别是来自总体ξ和η的样本,它们的样本均值和方差分别记为ξ軃,S 12和η軍,S 22。
ξ軃=1n 1n i =1Σξi ,S 12=1n 1-1n i =1Σ(ξi -ξ軃)2,η軍=1n 2n i =1Σξi ,S 22=1n 2-1n i =1Σ(ηi-η軍)2。
考虑总体方差σ12与σ22未知但相等的情况,当原假设H 0:μ1=μ2成立时,采用的统计量[1]是T =ξ軃-η軍S w1n 1+1n 2姨(1),其中S w 2=(n 1-1)S 12+(n 2-1)S 22n 1+n 2-2,该统计量服从自由度为n -2的t 分布,其中n =n 1+n 2。
本文通过引进虚拟变量(dummy variable)[2],建立回归模型,给出两个正态总体的期望的假设检验的另种方法。
该回归的方法不仅能检验两个总体的期望是否相同,而且能估计期望之差及期望之差的置信区间。
1回归模型的建立定义虚拟变量d i =0,样本点来自总体η1,样本点来自总体,ξ,i =1,2,…,n 1+n 2。
n 1+n 2维列向量y =(ξ1,ξ2,…,ξn ,η1,η2,…,ηn )′,对应的n 1+n 2维列向量d =(0,0,…,0,1,1,…,1)′。
建立回归模型y =β0+β1d +ε,假设该模型满足经典的假定条件[2],其中E (ε|d )=0,E(ε′ε|d )=σ2I n 。
则有E (y |d =1)=β0+β1,E (y |d =0)=β0,β1=E (y |d =1)-E (y |d =0)表示两个总体ξ和η的期望的差。
两个正态总体均值差和方差的假设检验
方差齐性检验是检验 两个正态总体方差是 否相等的统计方法。
常用的方差齐性检验 方法有:Levene检验、 Bartlett检验和Welch 检验。
Levene检验基于方差 分析,通过比较不同 组间的方差来判断方 差是否齐性。
Bartlett检验基于 Kruskal-Wallis秩和 检验,通过比较不同 组间的中位数和四分 位距来判断方差是否 齐性。
独立样本的均值检验
1
独立样本的均值检验是用来比较两个独立正态总 体的均值是否存在显著差异的统计方法。
2
常用的独立样本均值检验方法包括t检验和z检验, 其中t检验适用于小样本和大样本,而z检验适用 于大样本。
3
在进行独立样本均值检验时,需要满足独立性、 正态性和方差齐性的假设,以确保检验结果的准 确性和可靠性。
根据研究目的和数据类型,选择合适的统计量 来描述样本数据。
确定临界值
根据统计量的分布和显著性水平,确定临界值。
计算样本统计量
根据样本数据计算所选统计量的值。
做出决策
将样本统计量的值与临界值进行比较,做出接受 或拒绝原假设的决策。
解读结果
根据决策结果解读研究问题,给出结论和建议。
Part
02
两个正态总体均值的假设检验
Part
05
结论与展望
假设检验的优缺点
理论基础坚实
假设检验基于概率论和统计学原理,具有坚实的理论基础。
操作简便
假设检验提供了清晰的步骤和标准,方便研究者进行操作。
假设检验的优缺点
• 实用性强:假设检验广泛应用于各个领域,为科学研究和实践提供了有效的工具。
假设检验的优缺点
01
对数据要求较高
假设检验对数据的分布、样本量 等有一定的要求,不符合条件的 样本可能导致检验结果不准确。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有时,我们需要比较两总体的参数 有时,我们需要比较两总体的参数 是否存在显著差异。比如, 是否存在显著差异。比如,两个农作物 品种的产量,两种电子元件的使用寿命, 品种的产量,两种电子元件的使用寿命, 两种加工工艺对产品质量的影响, 两种加工工艺对产品质量的影响,两地 区的气候差异等等。 区的气候差异等等。
Fα2 (n1 − 1, n2 − 1) 和 F12 α (n1 − 1, n2 − 1) ,使 −
2
( P (F
P F < Fα (n1 − 1, n2 − 1) =
2 2
2
2
> F12 α −
2
)、(3) 由(2)、( )式可得检验的拒绝域为 )、(
F < F1−(α 2) ( n1 − 1, n2 − 1) 及 F > Fα 2 ( n1 − 1, n2 − 1)
拒绝H 两种灯泡的平均寿命 所以拒绝 假设, 所以拒绝 0假设,即认为 A、B两种灯泡的平均寿命 、 两种灯泡的 有统计意义。 有统计意义。
两个正态总体的方差检验 问题: 问题: X ~ N µ , σ 2 , Y ~ N µ ,σ 2 1 1
(
)
未知
µ1 , µ2 ,检验假设 0:σ 12 = σ 22 检验假设H
所以拒绝原假设 H20,即认为两种玉米的产量差异 有统计意义。 有统计意义。
(
2
2
)
F检验 检验
S12 σ 12 F = 2 2 ~ F ( n1 − 1, n2 − 1) 由抽样分布知 S2 σ 2 2 S 若假设H 成立, 若假设 0成立,则 F = 12 ~ F ( n1 − 1, n2 − 1) S2
f (x )
α
2
α
2
o
Fα
2
F1 − α
x
F 双侧检验
2
图7—6
对于给定的检验水平 α ,由F 分布表查得
2
U检验法 检验法
(
)
2 Y ~ N ( µ2 , σ 2 )
2 检验H σ 2 ,检验 0: µ1 = µ 2
从而, 成立时, 从而,当H0成立时, U =
X −Y
2 σ 12 n1 + σ 2 n2
~ N ( 0,1)
的拒绝域: 对给定的检验水平 α , 得H0的拒绝域:
X −Y
2 σ 12 n1 + σ 2 n2
两个正态总体的均值检验 1、方差已知,检验均值相等 、方差已知, 问题: 问题: X ~ N µ1 , σ 已知 σ
2 1
(
2 1
)
, σ
2 检验H 2 ,检验 0:
µ1 = µ2
Y ~ N ( µ2 , σ
2 2
)
设 X 1 , X 2 ,...... X n1 是X的一个样本, Y1 , Y2 ,......Yn2 的一个样本, 的一个样本 的一个样本, 是Y的一个样本, 的一个样本
> tα 2 ( n1 + n2 − 2 )
T 双侧检验
有两种灯泡, 型灯丝, 型灯丝。 例2 有两种灯泡,一种用 A 型灯丝,另一种用 B 型灯丝。随机 抽取两种灯泡各10 只做试验,测得它们的寿命(小时) 抽取两种灯泡各 只做试验,测得它们的寿命(小时)为: A 型:1293 1380 1614 1497 1340 1643 1466 1677 1387 1711 B 型:1061 1065 1092 1017 1021 1138 1143 1094 1028 1119 设两种灯泡的寿命均服从正态分布且方差相等, 设两种灯泡的寿命均服从正态分布且方差相等,试检验两种 灯泡的平均寿命之间是否存在显著差异? 灯泡的平均寿命之间是否存在显著差异?(α = 0.05 ) 解 假设: 假设:
试比较A、 两法的平均产量 点,得平均产量 y = 1.6 ,试比较 、B两法的平均产量 是否有统计意义。 是否有统计意义。(α = 0.05 ) 解 假设: 假设: 因为: 因为:
法设8个样本 x = 1.5 ;B 法设 个样本
H 0 : µ1 = µ2 , H1 : µ1 ≠ µ2
= 1.5 − 1.6 ≈ 0.49 < 1.96 = u0.025 0.2 12 + 0.2 8
T= X −Y S
2 1
( n1 − 1) + S ( n2 − 1)
2 2
n1 + n2 − 2
1 1 + n1 n2
~ t ( n1 + n2 − 2 )
的拒绝域: 对给定的检验水平 α , 得H0的拒绝域:
T = X −Y
2 S12 ( n1 − 1) + S 2 ( n2 − 1) 1 1 + n1 + n2 − 2 n1 n2
H11 : σ 1 ≠ σ 2
2 x = 998.0, s12 = 51.52 ; y = 820.0, s2 = 108.62 F0.975 ( 4, 4 ) = 0.104 F0.025 ( 4, 4 ) = 9.604
s12 51.52 F= 2 = ≈ 0.689 2 s2 108.6
因为 0.104 < 0.689 < 9.604 所以可认为甲、 所以可认为甲、乙两种玉米的方差没有显著差异 即可认为
H 21 : µ1 ≠ µ2
x = 998.0, s12 = 51.52 ;
由 T =
2 y = 820.0, s2 = 108.62
因为已假设方差相等, 检验。 因为已假设方差相等,故用 T 检验。
998 − 820 51.52 × 4 + 108.62 × 4 1 1 + 8 5 5
≈ 3.31 > 2.306 = t0.025 ( 8 )
T= S
2 1
( n1 − 1) + S ( n2 − 1)
2 2
X − Y − ( µ1 − µ 2 ) 1 1 + n1 n2
~
t ( n1 + n2 − 2 )
n1 + n2 − 2
两个正态总体的均值检验
T检验法 检验法
2、方差未知,但两个总体的方差相等,检验均值相等 、方差未知,但两个总体的方差相等, 成立, 若 H0 成立,则
H 0 : µ1 = µ2 , H1 : µ1 ≠ µ 2
x = 1500.8,
y = 1077.8
2 s12 = 151.32 , s2 = 47.02
1500.8 − 1077.8
因
151.3 × 9 + 47.0 × 9 1 1 + 18 10 10
2 2
≈ 8.45 > 2.101 = t0.025 (18 )
2 问题:设总体X ~ N ( µ1 , σ 12 ),Y ~ N ( µ 2 , σ 2 ),X 1 , X 2 ,⋯ , X n1 ; Y1 , Y2 ,⋯ , Yn2 是总体X , Y的iid样本,欲对µ1 , µ 2的关系。
该问题可以通过检验下列类型的统计假设实现。 1型 H 0 : µ1 = µ 2 ; H : µ1 ≠ µ2 2型 H 0 : µ1 ≥ µ2 ; H : µ1 < µ2 3型 H 0 : µ1 ≤ µ 2 ; H : µ1 > µ2
x− y
σ n1 + σ n2
2 2
接受H 两法的平均产量无统计意义 所以接受 假设, 、 两法的平均产量无统计意义。 所以接受 0假设,即认为 A、B两法的平均产量无统计意义。
两个正态总体的均值检验 2、方差未知,但两个总体的方差相等,检验均值相等 、方差未知,但两个总体的方差相等, 问题: 问题: X ~ N µ1 , σ 未知 σ , σ
对甲、乙两种玉米进行评比试验,得如下产量资料: 例4 对甲、乙两种玉米进行评比试验,得如下产量资料: 甲:951 966 1008 1082 983 乙:730 864 742 774 990 问这两种玉米的产量差异有没有统计意义? 问这两种玉米的产量差异有没有统计意义? α = 0.05
(
)
解
先对方差作检验: 先对方差作检验:H10 : σ 1 = σ 2 ,
σ1 = σ 2
对甲、乙两种玉米进行评比试验, 例4 对甲、乙两种玉米进行评比试验,得如下产量资料 甲:951 966 1008 1082 983 乙:730 864 742 774 990 问这两种玉米的产量差异有没有统计意义? 问这两种玉米的产量差异有没有统计意义? α = 0.05
(
)
解:再对均值作检验:H 20 : µ1 = µ 2 , 再对均值作检验:
则
σ 12 X ~ N µ1 , , n1
Y~
2 σ2 N µ2 , n2
所以, 所以,
2 σ 12 σ 2 + X − Y ~ N µ1 − µ2 , n1 n2
两个正态总体的均值检验 1、方差已知,检验均值相等 、方差已知, 问题: 问题: X ~ N µ1 , σ 12 已知 σ 1 ,
> uα 2
U 双侧检验
据以往资料,已知某品种小麦每4平方米产量 千克) 平方米产量( 例1 据以往资料,已知某品种小麦每 平方米产量(千克)的 方差为 σ 2 = 0.2 。今在一块地上用A,B 两法试验,A 今在一块地上用 , 两法试验, 法设12个样本点, 法设 个样本点,得平均产量 个样本点
2 1 2 ,但知 2
(
2 1
2 σ 12 = σ 2 ,检验 0: µ1 = µ 2 检验H
)
Y ~ N ( µ2 , σ
2 2
)
设 X 1 , X 2 ,...... X n1 是X的一个样本, Y1 , Y2 ,......Yn2 的一个样本, 的一个样本 的一个样本, 是Y的一个样本, 的一个样本 由抽样分布定理和t分布定义知 由抽样分布定理和 分布定义知