均值假设检验
假设检验公式汇总判断统计显著性的关键计算方法

假设检验公式汇总判断统计显著性的关键计算方法在统计学中,假设检验是一种常用的方法,用于判断某个假设是否与观察数据相一致。
假设检验涉及多种公式和计算方法,用来确定统计显著性,即观察到的差异是否仅仅是由于随机因素引起的。
本文汇总了一些常用的假设检验公式和计算方法,帮助读者更好地理解和运用假设检验。
一、单样本均值假设检验单样本均值假设检验用于比较一个样本的平均值与一个已知的总体平均值是否存在显著差异。
假设样本服从正态分布,而总体的均值已知。
下面是关键的计算方法:1. 计算样本均值(x):将样本中所有观测值求和,然后除以样本容量(n)。
2. 计算标准误差(SE):SE是样本均值的标准差,用来衡量样本均值与总体均值之间的差异。
计算公式为:SE = σ / √n,其中σ表示总体标准差。
3. 计算t值:t值用于测量样本均值与总体均值之间的标准差差异。
计算公式为:t = (x - μ) / SE,其中μ表示总体均值。
4. 判断统计显著性:根据t值与自由度(df = n - 1)在t分布表中查找对应的临界值。
比较t值与临界值,如果t值大于临界值,则拒绝原假设,认为样本均值与总体均值存在显著差异。
二、双样本均值假设检验双样本均值假设检验用于比较两个样本的平均值是否存在显著差异。
假设两个样本都服从正态分布,且两个总体的方差相等。
以下是关键的计算方法:1. 计算样本均值(x1和x2):分别计算两个样本的均值。
2. 计算标准误差(SE):SE用于衡量两个样本均值之间的差异,计算公式为:SE = √[(s1^2 / n1) + (s2^2 / n2)],其中s1和s2分别表示两个样本的标准差,n1和n2分别表示两个样本的容量。
3. 计算t值:t值用于测量两个样本均值之间的差异相对于标准误差的大小。
计算公式为:t = (x1 - x2) / SE。
4. 判断统计显著性:根据t值与自由度(df = n1 + n2 - 2)在t分布表中查找对应的临界值。
正态总体均值的假设检验

2 用 分布
检验
下,若能求得检验统计量的 极限分布,依据它去决定临界值C.
例 1 (用例中数据,但未知)
n=10, =0.05, 0=10 t10-1(/2)=t9(0.025)=2.2622
X 10.05,S2 0.05, S 0.224 X 10 0.05 , 即未落入拒绝域为 S 10 2.262 0.160 S 10 2.262
抽取 样本
检验 假设
拒绝还是不能 拒绝H0
P(T W)=
类错误的概率, W为拒绝域
对差异进行定量的分析, 确定其性质(是随机误差 显著性 水平
还是系统误差. 为给出两 者界限,找一检验统计量T, 在H0成立下其分布已知.)
-----犯第一
一般说来,按照检验所用的统计量的分布, 分为 U 检验 用正态分布
以上检验法叫U检验法.
X ~tn 1 S/ n
0
于是当原假设 H0:μ =μ X 0 ~tn 1 S/ n
成立时,有:
X 0 P tn 1 2 S / n S 即P X 0 tn 1 n 2 S 拒绝域为 X 0 tn 1 n 2 以上检验法叫t检验法.
第八章 第二节
正态总体均值的假设检验
一、单个正态总体N(,2)均值的检验
(I) H0:μ = μ
0
H1:μ ≠ μ
0
设X1,X2, ,Xn为来自总体N(,2)的样本. 求:对以上假设的显著性水平=的假设检验. 方差2已知的情况
根据第一节例1,当原假设 H0:μ =μ , 有:
总体均数的假设检验

$number {01}
目 录
• 引言 • 假设检验的基本原理 • 总体均数的假设检验方法 • 实例分析 • 总结与展望
01 引言
目的和背景
确定样本数据是否与假设的总体均数 存在显著差异,从而对总体均数进行 假设检验。
在科学实验、统计学、医学研究等领 域广泛应用,用于评估样本数据是否 支持或拒绝关于总体均数的假设。
配对样本均数假设检验实例
总结词
配对样本均数假设检验用于比较同一组研究对象在不同条件下的均数是否存在统计学显 著性差异。
详细描述
例如,为了比较同一组患者在接受两种不同治疗措施前后的改善程度,研究者收集了患 者的基线数据和接受不同治疗措施后的数据,并计算出各自治疗组的平均改善程度。然 后,研究者使用配对样本均数假设检验来比较同一组患者在不同治疗措施下的平均改善
概念简介
假设检验是一种统计推断方法,通过 检验样本数据是否符合某个假设,从 而对总体参数进行推断。
它基于概率论原理,通过计算样本数 据与假设的总体参数之间的差异,评 估这种差异是否具有统计学上的显著 性。
02
假设检验的基本原理
假设检验的步骤
建立假设
根据研究目的,提出一个关于总 体参数的假设,通常包括零假设 和备择假设。
收集样本数据
从总体中随机抽取一定数量的样 本,并记录样本数据。
确定检验水准
选择合适的检验水准,如α和β, 以平衡第一类和第二类错误的概 率。
计算统计量
根据样本数据计算适当的统计量, 如t值、Z值或χ^2值。
假设检验的类型
1 2
3
单样本均数检验
比较一个样本均数与已知总体均数或正常值范围。
两样本均数比较
双样本均值比较分析假设检验

双样本均值比较分析假设检验在进行双样本均值比较分析假设检验之前,需要建立以下的假设:-零假设(H0):两个样本的均值相等,即差异为零。
-备择假设(H1):两个样本的均值不相等,即差异不为零。
接下来的步骤是计算样本的均值、标准差和样本容量,并且通过标准误差来计算检验统计量。
常用的检验统计量有t统计量和z统计量,选择哪种统计量取决于样本容量是否足够大。
如果样本容量足够大,通常使用z统计量进行假设检验。
计算z统计量的公式如下:z = (x1 - x2) / sqrt(s1^2 / n1 + s2^2 / n2)其中,x1和x2分别是两个样本的均值,s1和s2分别是两个样本的标准差,n1和n2分别是两个样本的容量。
如果样本容量较小,那么应该使用t统计量进行假设检验。
计算t统计量的公式如下:t = (x1 - x2) / sqrt(s1^2 / n1 + s2^2 / n2)在计算了检验统计量之后,需要根据显著性水平(通常为0.05)来确定拒绝域的边界。
拒绝域是指当检验统计量的取值落在这个区域之内时,拒绝零假设,即认为两个样本的均值存在显著差异。
最后,根据计算的检验统计量与拒绝域的比较结果,得出是否拒绝零假设的结论。
如果检验统计量的取值落在拒绝域之内,那么可以拒绝零假设,认为两个样本的均值存在显著差异。
需要注意的是,这种假设检验只能提供统计显著性的结论,而不是实际意义的差异。
所以在进行假设检验之前,需要对样本差异的实际意义进行考量。
总之,双样本均值比较分析假设检验是一种常用的统计方法,可以用于比较两个独立样本的均值是否存在显著差异。
通过计算检验统计量和拒绝域的比较,可以得出是否拒绝零假设的结论。
总体均值的假设检验

总体均值的假设检验一、正态总体均值的检验设n X X X ,,, 21为总体),(2σμN 的一个容量为n 的样本. 1.方差2σ已知,μ的检验——u 检验法. 当202σσ=已知时,假设检验问题:0100μμμμ≠=:;:H H . 选择检验统计量nX U /00σμ-=,当0H 成立时,)1,0(~N U .给定显著性水平α,由标准正态分布分位点的定义, 有αα=>}|{|2/u U P ,故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= ,这种利用服从正态分布的检验统计量的检验方法称为u 检验法.有时我们只关心总体的均值是否增大(或减小).比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值μ是小于等于原来的均值0μ,还是大于0μ,即检验假设 0100μμμμ>≤:;:H H . 可以证明,在显著性水平α下,上述假设检验问题和检验假设0100μμμμ>=:;:H H 有相同的拒绝域,因此,遇到形如00μμ≤:H 的检验问题,可归结为后一个假设检验问题讨论. 类似地,形如0100μμμμ<≥:;:H H 的检验问题, 可归结为检验假设 0100μμμμ<=:;:H H .这都是单边检验问题.给定显著性水平α,求得的临界值点是上α分位点或上α-1分位点.例1 某厂生产的某种钢索的断裂强度X 服从),(2σμN ,其中40=σ(kg/cm 2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值x 较以往正常生产的μ大20(kg/cm 2),设总体方差不变,问在1.00=α下,能否认为这批钢索质量有显著提高?解 依题意,检验假设0100μμμμ>≤:;:H H , 由于40=σ已知,选择检验统计量nX U /0σμ-=因为0H 中的μ全部都比1H 中的μ要小,从直观上看,当0H 成立时,X 的取值x 不应比μ大很多,若偏差0μ-x 过大,则拒绝0H 而接受1H .因为 0100μμμμ>=:;:H H 的拒绝域为}{αu U W >=, 故在显著性水平1.00=α下原假设的拒绝域为}{}{0nu X u U W σμαα+>=>=.本题中,9=n ,40=σ,200=-μx ,33.201.0=u , 计算U 的值33.25.1/0<=-=nx u σμ因此在显著性水平1.00=α下不能拒绝0H ,即认为这批钢索质量没有显著提高.2.方差2σ未知,μ的检验——t 检验法. 检验假设0100μμμμ≠=:;:H H .因为2σ未知,而样本方差2S 是总体方差2σ的无偏估计量,用S 代替σ. 选择检验统计量 nS X T /0μ-=,当0H 成立时,)1(~-n t T .给定显著性水平α,由t 分布分位点的定义, 有αα=->)}1(|{|2/n t T P ,故拒绝域)}1({)}1({)}1(|{|2/2/2/->--<=->=n t T n t T n t T W ααα , 这种利用服从t 分布的检验统计量的检验方法称为t 检验法.例2 某切割机工作正常时,切割每段金属棒的平均长度为10.5cm .今在某段时间随机地抽取15段进行测量,其结果如下(cm):10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7问此段时间该机工作是否正常(5.00=α)?假设金属棒长度服从正态分布.解 依题意,检验假设0100.510μμμμ≠==:;:H H , 由于2σ未知,故选择检验统计量nS X T /0μ-=.在0H 下,)1(~-n t T ,15=n .给定显著性水平5.00=α,查t 分布表, 得临界值1448.2)14()1(025.02/==-t n t α,故拒绝域)}1(|{|2/->=n t T W α.由已知条件可得48.102.15715111=⨯==∑=n i i x n x056.0784.0141)(11122=⨯=--=∑=n i ix x n s 故2366.0=s .计算统计量的值3274.015/2366.05.1048.10/0-=-=-=ns x t μ因为)1(||2/-<n t t α,所以接受0H ,认为切割机工作正常.例3 设木材的小头直径),(~2σμN X ,12≥μcm 为合格,今抽出12根测得小头直径的样本均值为2.11=x cm ,样本方差为44.12=s cm 2,问该批木材是否合格(5.00=α)?解 依题意,检验假设010012μμμμ<=≥:;:H H ,选择检验统计量nS X T /0μ-=.在假设0100μμμμ<=:;:H H 下,)1(~-n t T ,12=n .给定显著性水平5.00=α,查t 分布表,得临界值7959.1)11()1(05.0==-t n t α,故拒绝域)}1({--<=n t T W α,也是假设010012μμμμ<=≥:;:H H 的拒绝域. 由于2.11=x ,44.12=s ,计算统计量的值3094.212/44.1122.11/0-=-=-=ns x t μ因为)1(--<n t t α,故拒绝0H ,认为该批木材是不合格的. 二、正态总体方差的检验——2χ检验法设n X X X ,,, 21为来自总体),(2σμN 的一个样本,检验假设 20212020σσσσ≠=:;:H H .1.均值μ已知. 因为)1,0(~N X i σμ-,n i ,,2,1 =,则选取检验统计量∑∑==-=⎪⎪⎭⎫ ⎝⎛-=ni ini i XX 12201202)(1μσσμχ.当0H 成立时,)(~22n χχ,给定显著性水平α,由2χ分布表分位点的定义,有αχχχχαα=><-))}(())({(22/222/12n n P ,故得拒绝域)}({)}({22/222/12n n W ααχχχχ><=- .2.均值μ未知.因为X 是总体均值μ的无偏估计量,用X 代替μ.选择检验统计量202122)1(σσχS n XX ni i -=⎪⎪⎭⎫ ⎝⎛-=∑=. 当0H 成立时,)1(~22-n χχ,给定显著性水平α,由2χ分布表分位点的定义,有αχχχχαα=->-<-))}1(())1({(22/222/12n n P故得拒绝域)}1({)}1({22/222/12->-<=-n n W ααχχχχ .类似地,在μ已知和μ未知时,可以求出检验假设20212020σσσσ>≤:;:H H 和20212020σσσσ<≥:;:H H的拒绝域.例如,在μ未知时,检验假设2020σσ≤:H 的拒绝域为)}1({22->=n W αχχ.上述检验所用的检验统计量均服从2χ分布,称这种检验方法为2χ检验法例4 某无线电厂生产的一种高频管,其中一指标服从正态分布),(2σμN ,今从一批产品中抽取8只管子,测得指标数据:68 43 70 65 55 56 60 72(1) 总体均值60=μ时,检验228=σ(取5.00=α); (2) 总体均值μ未知时,检验228=σ(取5.00=α). 解 本题是在显著性水平5.00=α下,检验假设2021220208σσσσ≠==:;:H H ,这里8=n .(1) 60=μ已知时临界值35.517)8()(2025.022/==χχαn ,80.12)8()(2975.022/1==-χχαn ,而检验统计量的值359.10663641)(811222=⨯=-=∑=ni i x μχ, 由于)()(22/222/1n n ααχχχ<<-,故接受0H .(2) μ未知时临界值13.016)7()1(2025.022/==-χχαn ,90.61)7()1(2975.022/1==--χχαn ,而125.614898111=⨯==∑=n i i x n x ,875.652)()1(122=-=-∑=ni i x x s n ,检验统计量的值2012.1075.86526412=⨯=χ, 由于)1()1(22/222/1-<<--n n ααχχχ,故接受0H .§8.3 两个正态总体参数的假设检验设121n X X X ,,, 为总体),(~112σμN X 的一个样本,221n Y Y Y ,,, 为总体),(~222σμN Y 的一个样本.∑==1111n i i X n X 和∑==2121n i iYn Y 分别是两个样本的样本均值,∑=--=112121)(11n i i X X n S 和∑=--=212222)(11n i i Y Y n S 是相应的两个样本方差.设这两个样本相互独立..一、两个正态总体均值的检验考虑检验假设 211210μμμμ≠=:;:H H . 1.方差21σ与22σ已知——u 检验法. 选取 22212121)()(n n Y X U σσμμ+---=.当0H 成立时,检验统计量)1,0(~222121N n n YX U σσ+-=.给定显著性水平α,由标准正态分布表分位点的定义,有αα=>}|{|2/u U P ,故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= .例1 设从甲乙两场所生产的钢丝总体X ,Y 中各取50束作拉力强度试验,得1208=x ,1282=y ,已知801=σ,942=σ,请问两厂钢丝的抗拉强度是否有显著差别(5.00=α)?解 本题是在显著性水平5.00=α下, 检验假设211210μμμμ≠=:;:H H , 这里5021==n n .选取检验统计量222121n n YX U σσ+-=.给定显著性水平05.0=α,查标准正态分布表,得临界值96.1025.02/==u u α,故拒绝域}|{|2/αu U W >=.由于1208=x ,1282=y ,801=σ,942=σ, 计算检验统计量的值2392.450/)(2221-=+-=σσy x u .由于2/||αu u >,故拒绝0H ,认为两厂钢丝的抗拉强度有显著差别. 2.方差21σ与22σ未知,但2221σσ=——t 检验法.选取 212111)()(n n S Y X T w+---=μμ.这里2)1()1(21222211-+-+-=n n S n S n S w .当0H 成立时,检验统计量)2(~112121-++-=n n t n n S Y X T w.给定显著性水平α,由t 分布表分位点的定义, 有αα=-+>)}2(|{|212/n n t T P ,故拒绝域)}2({)}2({212/212/-+>-+-<=n n t T n n t T W αα .例2 某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22 乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平5.00=α下,判断两种香烟的尼古丁含量有无显著差异?解 检验假设211210μμμμ≠=:;:H H ,这里621==n n ..525=x ,67.625=y ,7386.21=s ,3267.32=s ,0469.3=w s . 选取检验统计量2111n n S Y X T w+-=.给定显著性水平5.00=α,查t 分布表,得临界值2281.2)10()2(025.0212/==-+t n n t α,故拒绝域)}2(|{|212/-+>=n n t T W α.计算统计量的值0949.00469.33)667.255.25(1121-=⨯-=+-=n n s y x t w.由于)2(||212/-+<n n t t α,故接受0H ,认为两种香烟的尼古丁含量无显著差异. 二、两个正态总体方差的检验——F 检验法 考虑检验假设 2221122210σσσσ≠=:;:H H . 1.均值1μ与2μ已知.因为)(~)(11212121211n Xn i iχμσχ∑=-=,)(~)(12212222222n Yn i iχμσχ∑=-=,选取221222211211222121/)(1/)(1//21σμσμχχ∑∑==--==n i i n i i Y n X n n n F . 当0H 成立时,检验统计量),(~)(1)(1211222121121n n F Y n X n F n i i n i i ∑∑==--=μμ.给定显著性水平α,由F 分布分位点的定义,有ααα=><-))},(()),({(212/212/1n n F F n n F F P , 故得拒绝域)},({)},({212/212/1n n F F n n F F W αα><=- . 2.均值1μ与2μ未知.因为)1(~)1()(112212111221211--=-=∑=n S n X X n i i χσσχ,)1(~)1()(122222221222222--=-=∑=n S n Y Yn i iχσσχ,选取22222121222121//)1/()1/(σσχχS S n n F =--=.当0H 成立时,检验统计量)1,1(~212221--=n n F S S F .给定显著性水平α,由F 分布分位点的定义,有ααα=-->--<-))}1,1(())1,1({(212/212/1n n F F n n F F P , 故得拒绝域)}1,1({)}1,1({212/212/1-->--<=-n n F F n n F F W αα .例3某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22 乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平5.00=α下,判断两种香烟的尼古丁含量的方差是否相等? 解 考虑检验假设2221122210σσσσ≠=:;:H H . 由于两个正态总体的均值都未知,选取检验统计量)1,1(~212221--=n n F S S F .给定显著性水平α,查F 分布表,得两个临界值:15.7)5,5()1,1(025.0212/==--F n n F α1399.015.71)5,5(1)5,5()1,1(025.0975.0212/1====---F F n n F α,故得拒绝域}15.7{}1399.0{><=F F W . 计算统计量的值6777.03267.37386.2222221===s s F .由于15.71399.0<<F , 故接受0H ,认为两种香烟的尼古丁含量的方差也无显著差异.§8.4 非正态总体参数的大样本检验本节讨论一般总体参数的检验.设总体X 的均值为μ,方差为2σ, n X X X ,,, 21为总体X 的一个样本.由中心极限定理可知,当样本容量n 足够大时,nX U /σμ-=近似地服从标准正态分布.因此,我们可以用正态分布去近似.如果对均值μ进行检验,方差2σ未知时,可以用样本方差2S 代替2σ;如果对方差2σ进行检验,均值μ未知时,可以用样本均值X 代替μ.下面举两个例子.例1 设某段高速公路上汽车限速为104.6km/h ,现检验85辆汽车的样本,测出的平均车速为106.7km/h ,已知总体标准差为.413=σ km/h ,但不知总体是否服从正态分布.在显著性水平50.0=α下,试检验高速公路上的汽车是否比限制速度104.6km/h 显著地快?解 依题意,检验假设0100.6104μμμμ>=≤:;:H H , 由于.413=σ已知,n =85足够大, 选择检验统计量nX U /0σμ-=近似地服从)10(,N .其拒绝域}{αu U W >=,其中65.105.0==u u α. 计算U 的值449.4185/4.136.1047.106=-=u ,由于αu u <,因此接受0H ,没有理由认为高速公路上的汽车比限制速度104.6km/h 显著地快.例2 为比较甲乙两种小麦植株的高度(单位:cm),分别抽得甲、乙小麦各100穗,在相同条件下进行高度测定,算得甲乙小麦样本均值和样本方差分别为28=x ,8.3521=s ,26=y ,3.3222=s ,问这两种小麦的株高有无显著差异(50.0=α)?解 依题意,检验假设 211210μμμμ≠=:;:H H , 选取 22212121)()(n n Y X U σσμμ+---=,这里两个方差用样本方差代替.当0H 成立时, 检验统计量 222121n Sn S Y X U +-=近似地服从)1,0(N .给定显著性水平05.0=α,查附表3,得临界值96.1025.02/==u u α, 得拒绝域}|{|2/αu U W >=.计算U 的值4236.21003.328.352628=+-=u ,由于αu u >,因此拒绝0H ,认为这两种小麦的株高有显著差异.当总体服从(0-1)分布),1(p b 时,由于只有一个参数p ,总体均值p 和方差)1(p p -均只与p 有关,这时对参数p 进行假设检验时,检验统计量可以直接用样本和参数p 表示出来.例3 某厂有一批产品须经检验后方可出厂.按规定二级品率不得超过10%,从中随机抽取100件产品进行检查,发现有二级品14件,问这批产品是否可以出厂(50.0=α)?解 这里n =100,14.0=x .检验假设01001.0p p H p p H >=≤:;:, 选取检验统计量 np p p X U )1(000--=,U 近似地服从)1,0(N .由显著性水平50.0=α,可以得到拒绝域}{αu U W >=,其中65.105.0==u u α,计算U 的值333.31100.90.10.104.10=⨯-=u ,由于αu u <,因此接受0H ,认为这批产品二级品率没有超过10%,可以出厂.§8.5 分布的拟合检验前几节的检验都是参数的检验.实际问题中,有时需要对分布作出假设,进行检验.本节只介绍一种分布的检验方法——皮尔逊2χ检验法,它只适合于大样本的情形,一般要求样本容量50≥n .设总体X 的分布函数为)(x F ,)(0x F 为一个已知的分布函数,n X X X ,,, 21为总体X 的一个样本,我们来检验关于总体分布的假设)()()()(0100x F x F H x F x F H ≠=:;:.一、基本原理2χ检验法的基本思想是:将随机试验的所有可能结果的全体分成k 个两两互不相容的事件k A A A ,,, 21,在n 次试验中,将i A 发生的次数i f 叫做i A 发生的频数,如果0H 为真,则由大数定律,在n 次试验中(n 足够大),i A (k i ,,, 21=)出现的实际频率nf i与理论频率)(i i A P p =(可由分布函数)(0x F 算出)不应相差很大.基于这种想法,皮尔逊构造了统计量∑=-=ki i i i np np f 122)(χ或∑=-=ki i i i p n p n f 122ˆ)ˆ(χ, 其中i p ˆ是由)(ˆ0x F 计算出来的理论频率,)(ˆ0x F 是)(0x F 中未知参数估计出后的分布函数,并证明了如下定理:定理1 若n 足够大,当0H 成立时,统计量2χ总是近似地服从自由度为1--r k 的2χ分布,其中r 是已知的分布函数)(0x F 中未知参数的个数.直观上看,2χ值表示实际观测结果与理论期望结果的相对差异的总和,当它的取值大于临界值时,应拒绝0H . 二、检验步骤如果)(0x F 为不带有未知参数的已知分布,皮尔逊2χ检验法的具体步骤如下:(1) 将总体X 的值域划分成k 个不交的区间i A (k i ,,, 21=),使得每个区间包含的理论频数满足5≥i np ,否则将区间适当调整; (2) 在0H 成立时,计算各理论频率即概率i p 的值:)()()(100--==i i i i y F y F A P p ,k i ,,, 21=.这里1-i y 与i y 为区间i A 的端点,即](1i i i y y A ,-=;(3) 数出i A 中含有样本值的个数,即i A 的频数i f ,并计算统计量∑=-=ki i iinp np f 122)(χ 的值2χ;(4) 由2χ分布,对于给定的显著性水平α,找出临界值)1(2-k αχ; (5) 判断:若)1(22->k αχχ,则拒绝0H ,否则可接受0H . 如果总体X 是离散型的,则假设0H 相当于假设总体X 的概率分布00}{i i p x X P H ==:, ,,21=i .如果总体X 是连续型的,则假设0H 相当于)()(00x f x f H =:,这里)(x f 为总体的概率密度.例1 至1984年底,市开办有奖储蓄以来,13期兑奖中诸数码的频数汇总如表8.1:表8.1试检验器械或操作方法是否有问题(50.0=α).解 设抽取的数码为X ,它可能的取值为0~9,如果检验器械或操作方法没有问题,则0~9出现是等可能的,即检验假设 1010=i p H :,9210,,,, =i ,这里}{i X P p i ==. 依题意知k =10,令}{i A i =,9210,,,, =i ,n =350,则理论频数35=i np .57.61935688)(9022==-=∑=i ii i np np f χ给定显著性水平5.00=α,查2χ分布表,得临界值9.16)9()1(205.02==-χχαk .由于19.675>16.9,故拒绝0H ,即认为器械或操作方法有问题.如果)(0x F 为带有未知参数的已知分布,未知参数为r θθθ,,, 21,这时用这r 个未知参数的极大似然估计量r θθθˆˆˆ21,,, 来代替)(0x F 中的参数r θθθ,,, 21,得到分布函数)(ˆ0x F ,然后建立统计量∑=-=ki ii i p n p n f 122ˆ)ˆ(χ,这里i p ˆ是由)(ˆ0x F 计算出来的理论频率,再用以上检验步骤进行检验,但此时检验统计量2χ近似服从)1(2--r k χ分布(这里k >r +1).例2 某高校对100名新生的身高(厘米)做了检查,把测得的100个数据按由大到小的顺序排列,相同的数合并得表8.2:表8.2试问,在显著性水平5.00=α下是否可以认为学生身高X 服从正态分布? 解 这里n =100,我们来检验假设222)(021)(σμσπ--=x ex f H :,+∞<<∞-x ,这里)(x f 为正态分布),(2σμN 的概率密度,设其分布函数为)(x F ,μ与0>σ为未知参数.先求μ与2σ的极大似然估计值μˆ,2ˆσ: 33.1661ˆ1==∑=n i i x n μ, 06.28)ˆ(1ˆ212=-=∑=μσn i i x n . 设服从正态分布)ˆ,ˆ(2σμN 的随机变量为Y ,分布函数为)(ˆy F .按照分组要求,每个小区间的理论频数i pn ˆ不应小于5,因此我们将数据分成了7个组,使得每组的实际频数不小于5,各计算结果如下表8.3所示.表8.3中第3列i pˆ的计算如下: )(ˆ)(ˆ}{ˆ11---=≤<=i i i i i y F y F y Y y P p ,7210,,,, =i , 例如,}06.2833.1665.164ˆˆ06.2833.1665.161{}5.1645.161{ˆ3-≤-<-=≤<=σμY P Y P p1837.0)911.0()345.0(=-Φ--Φ=.给定显著性水平5.00=α,查2χ分布表,得临界值488.9)4()127()1(205.0205.02==--=--χχχαr k .由于1.8843<9.488,故接受0H ,即认为学生身高服从正态分布.。
正态分布均值的假设检验

VS
详细描述
在单样本均值假设检验中,我们首先需要 确定一个期望的均值,然后计算样本的均 值。通过比较这两个值,我们可以判断样 本均值是否显著地偏离了期望的均值。常 用的统计量包括z分数和t分数,用于评估 样本均值与已知期望值之间的差异是否具 有统计学上的显著性。
双样本均值的假设检验
总结词
双样本均值的假设检验是检验两个独立样本的均值是否存在显著差异。
详细描述
在双样本均值假设检验中,我们需要比较两个独立样本的均值。通过计算两组样本的均值,并比较这两个值,我 们可以判断两个样本的均值是否存在显著差异。常用的统计量包括t检验和z分数,用于评估两个样本均值之间的 差异是否具有统计学上的显著性。
配对样本均值的假设检验
总结词
配对样本均值的假设检验是检验两个相关样本的均值是否存在显著差异。
Part
0(H0)
样本数据来自的总体均值等于某一固 定值。
备择假设(H1)
样本数据来自的总体均值不等于该固 定值。
选择合适的检验统计量
• 常用的检验统计量有t统计量、Z统计量等,根据具体情况选择合适的统计量。
确定显著性水平
• 显著性水平(α):在假设检验中,原假设为真但被拒绝 的概率,通常取值在0.01至0.05之间。
正态分布在统计学中的重要性
基础性
正态分布是统计学中最重要的概 率分布之一,许多统计方法和理 论都基于正态分布。
广泛应用性
正态分布在自然和社会科学领域 都有广泛的应用,如生物学、医 学、经济学、心理学等。
理论依据
正态分布在统计学中提供了理论 依据,许多统计推断和决策方法 都基于正态分布的性质和假设。
1 2
判断假设是否成立
通过假设检验,可以判断一个假设是否成立,从 而为进一步的研究或决策提供依据。
第二节 正态总体均值的假设检验8-2

14
三、基于成对数据的检验(t 检验):
设X和Y是两个正态总体, 均值分别为 1 和 2 , X 和 Y不是相互独立的。取成对样本 : (X1 , Y1) , (X2 , Y2) , … , ( Xn , Yn )。 要检验: H0 : 1 = 2 , H1 : 1 ≠ 2 . 可以把这个问题转化成单个总体的假设检验 , 令Z = X - Y , 它服从 N ( , 2) , 这里 (= 1- 2) , 2 均未知。 Zi = Xi – Yi (i=1 , 2 , … , n)是来自该正态总体的样本。 显然 , 检验 H0 : 1= 2 , H1 : 1 ≠ 2 等价于检验 H0 : =0 , H1: ≠0,
11
例 2. 在平炉上进行一项试验以确定改变操作方法的建 议是否会增加钢的得率, 试验是在同一只平炉上进行 的. 每炼一炉钢时除操作方法外, 其它条件都尽可能 做到相同. 先用标准方法炼一炉, 然后用建议的方法 炼一炉, 以后交替进行, 各炼了10炉, 其得率分别为: 标准方法: 78.1 72.4 76.2 74.3 77.4 78.4 新方法: 79.1 76.0 81.0 75.5 76.7 77.3 80.0 77.3 79.1
16
解: 分别作各对数据的差 zi = xi - yi ,如上表 ,
并假设 z1 , z2 , … , z9 来自正态总体N ( , 2 ) ,
这里 , 2 均属未知 。若两台仪器的性能一样, 则各对数据的差异可看作是随机误差, 而随机误差可以认为服从正态分布, 其均值为零, 因此本题归结为检验假设: H0: =0 , H1: ≠ 0. 由前面的结论知,可取 T =
问是否有理由认为元件的平均寿命大于225小时?
解 : 按题意需检验 H 0 : 0 = 225 , H 1 : > 225 . X- 取 a = 0 .05,统计量: t = 。 S n 当 H 0 成立时,由 X - 0 S n X- S n ,
双样本均值假设检验

双样本均值假设检验在统计学中,双样本均值假设检验是一种常用的方法,用于比较两个样本的均值是否存在显著差异。
该方法广泛应用于医学、社会科学和工程等领域,能够帮助研究者判断两个样本的均值是否真正有所区别。
本文将介绍双样本均值假设检验的基本原理、假设检验的步骤以及实际应用案例。
1. 双样本均值假设检验的基本原理双样本均值假设检验旨在通过对两个样本的均值进行比较,以确定两者之间是否存在显著差异。
在进行检验之前,我们需要明确以下两个假设:- 零假设(H0):两个样本的均值相等,即μ1 = μ2- 备择假设(H1):两个样本的均值不相等,即μ1 ≠ μ2为了进行假设检验,我们需要进行以下步骤。
2. 双样本均值假设检验的步骤(1)收集数据:从两个不同的样本中分别收集数据,并记录相关信息。
(2)分析数据:计算两个样本的均值、标准差以及样本容量等统计指标。
(3)计算检验统计量:根据样本数据和假设,计算检验统计量的值。
常用的检验统计量有t值和Z值。
(4)设置显著性水平:根据研究需要设置显著性水平α,通常为0.05或0.01。
(5)计算p值:根据检验统计量的分布情况,计算出对应的p值。
p值表示在零假设成立的前提下,出现当前观察结果或更极端结果的概率。
(6)假设检验:根据p值与显著性水平的比较,对零假设进行接受或拒绝。
如果p值小于显著性水平,则拒绝零假设,认为两个样本的均值存在显著差异。
3. 双样本均值假设检验的实际应用双样本均值假设检验最常见的应用场景之一是医学实验中的治疗效果评估。
举个例子,某研究想要比较一种新药物对患者的疗效是否显著优于传统药物。
研究者会将患者分为两组,一组接受新药物治疗,另一组接受传统药物治疗。
收集完数据后,研究者可以通过双样本均值假设检验来比较两组患者的均值是否存在显著差异。
如果p值小于设定的显著性水平,可以得出结论:新药物的疗效优于传统药物。
相反,如果p值大于显著性水平,则无法拒绝零假设,即无法得出明确的结论,需要进一步研究。
总体均值的假设检验

总体均值的假设检验一、正态总体均值的检验设n X X X ,,, 21为总体),(2σμN 的一个容量为n 的样本. 1.方差2σ已知,μ的检验——u 检验法. 当202σσ=已知时,假设检验问题:0100μμμμ≠=:;:H H . 选择检验统计量nX U /00σμ-=,当0H 成立时,)1,0(~N U .给定显著性水平α,由标准正态分布分位点的定义, 有αα=>}|{|2/u U P ,故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= ,这种利用服从正态分布的检验统计量的检验方法称为u 检验法.有时我们只关心总体的均值是否增大(或减小).比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值μ是小于等于原来的均值0μ,还是大于0μ,即检验假设 0100μμμμ>≤:;:H H . 可以证明,在显著性水平α下,上述假设检验问题和检验假设0100μμμμ>=:;:H H 有相同的拒绝域,因此,遇到形如00μμ≤:H 的检验问题,可归结为后一个假设检验问题讨论. 类似地,形如0100μμμμ<≥:;:H H 的检验问题, 可归结为检验假设 0100μμμμ<=:;:H H .这都是单边检验问题.给定显著性水平α,求得的临界值点是上α分位点或上α-1分位点.例1 某厂生产的某种钢索的断裂强度X 服从),(2σμN ,其中40=σ(kg/cm 2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值x 较以往正常生产的μ大20(kg/cm 2),设总体方差不变,问在1.00=α下,能否认为这批钢索质量有显著提高?解 依题意,检验假设0100μμμμ>≤:;:H H , 由于40=σ已知,选择检验统计量nX U /0σμ-=因为0H 中的μ全部都比1H 中的μ要小,从直观上看,当0H 成立时,X 的取值x 不应比μ大很多,若偏差0μ-x 过大,则拒绝0H 而接受1H .因为 0100μμμμ>=:;:H H 的拒绝域为}{αu U W >=, 故在显著性水平1.00=α下原假设的拒绝域为}{}{0nu X u U W σμαα+>=>=.本题中,9=n ,40=σ,200=-μx ,33.201.0=u , 计算U 的值33.25.1/0<=-=nx u σμ因此在显著性水平1.00=α下不能拒绝0H ,即认为这批钢索质量没有显著提高.2.方差2σ未知,μ的检验——t 检验法. 检验假设0100μμμμ≠=:;:H H .因为2σ未知,而样本方差2S 是总体方差2σ的无偏估计量,用S 代替σ. 选择检验统计量 nS X T /0μ-=,当0H 成立时,)1(~-n t T .给定显著性水平α,由t 分布分位点的定义, 有αα=->)}1(|{|2/n t T P ,故拒绝域)}1({)}1({)}1(|{|2/2/2/->--<=->=n t T n t T n t T W ααα , 这种利用服从t 分布的检验统计量的检验方法称为t 检验法.例2 某切割机工作正常时,切割每段金属棒的平均长度为10.5cm .今在某段时间内随机地抽取15段进行测量,其结果如下(cm):10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7问此段时间内该机工作是否正常(5.00=α)?假设金属棒长度服从正态分布.解 依题意,检验假设0100.510μμμμ≠==:;:H H , 由于2σ未知,故选择检验统计量nS X T /0μ-=.在0H 下,)1(~-n t T ,15=n .给定显著性水平5.00=α,查t 分布表, 得临界值1448.2)14()1(025.02/==-t n t α,故拒绝域)}1(|{|2/->=n t T W α.由已知条件可得48.102.15715111=⨯==∑=n i i x n x056.0784.0141)(11122=⨯=--=∑=n i ix x n s 故2366.0=s .计算统计量的值3274.015/2366.05.1048.10/0-=-=-=ns x t μ因为)1(||2/-<n t t α,所以接受0H ,认为切割机工作正常.例3 设木材的小头直径),(~2σμN X ,12≥μcm 为合格,今抽出12根测得小头直径的样本均值为2.11=x cm ,样本方差为44.12=s cm 2,问该批木材是否合格(5.00=α)?解 依题意,检验假设010012μμμμ<=≥:;:H H ,选择检验统计量nS X T /0μ-=.在假设0100μμμμ<=:;:H H 下,)1(~-n t T ,12=n .给定显著性水平5.00=α,查t 分布表,得临界值7959.1)11()1(05.0==-t n t α,故拒绝域)}1({--<=n t T W α,也是假设010012μμμμ<=≥:;:H H 的拒绝域. 由于2.11=x ,44.12=s ,计算统计量的值3094.212/44.1122.11/0-=-=-=ns x t μ因为)1(--<n t t α,故拒绝0H ,认为该批木材是不合格的. 二、正态总体方差的检验——2χ检验法设n X X X ,,, 21为来自总体),(2σμN 的一个样本,检验假设 20212020σσσσ≠=:;:H H .1.均值μ已知. 因为)1,0(~N X i σμ-,n i ,,2,1 =,则选取检验统计量∑∑==-=⎪⎪⎭⎫ ⎝⎛-=ni ini i XX 12201202)(1μσσμχ.当0H 成立时,)(~22n χχ,给定显著性水平α,由2χ分布表分位点的定义,有αχχχχαα=><-))}(())({(22/222/12n n P ,故得拒绝域)}({)}({22/222/12n n W ααχχχχ><=- .2.均值μ未知.因为X 是总体均值μ的无偏估计量,用X 代替μ.选择检验统计量202122)1(σσχS n XX ni i -=⎪⎪⎭⎫ ⎝⎛-=∑=. 当0H 成立时,)1(~22-n χχ,给定显著性水平α,由2χ分布表分位点的定义,有αχχχχαα=->-<-))}1(())1({(22/222/12n n P故得拒绝域)}1({)}1({22/222/12->-<=-n n W ααχχχχ .类似地,在μ已知和μ未知时,可以求出检验假设20212020σσσσ>≤:;:H H 和20212020σσσσ<≥:;:H H的拒绝域.例如,在μ未知时,检验假设2020σσ≤:H 的拒绝域为)}1({22->=n W αχχ.上述检验所用的检验统计量均服从2χ分布,称这种检验方法为2χ检验法例4 某无线电厂生产的一种高频管,其中一指标服从正态分布),(2σμN ,今从一批产品中抽取8只管子,测得指标数据:68 43 70 65 55 56 60 72(1) 总体均值60=μ时,检验228=σ(取5.00=α); (2) 总体均值μ未知时,检验228=σ(取5.00=α). 解 本题是在显著性水平5.00=α下,检验假设2021220208σσσσ≠==:;:H H ,这里8=n .(1) 60=μ已知时临界值35.517)8()(2025.022/==χχαn ,80.12)8()(2975.022/1==-χχαn ,而检验统计量的值359.10663641)(811222=⨯=-=∑=ni i x μχ, 由于)()(22/222/1n n ααχχχ<<-,故接受0H .(2) μ未知时临界值13.016)7()1(2025.022/==-χχαn ,90.61)7()1(2975.022/1==--χχαn ,而125.614898111=⨯==∑=n i i x n x ,875.652)()1(122=-=-∑=ni i x x s n ,检验统计量的值2012.1075.86526412=⨯=χ, 由于)1()1(22/222/1-<<--n n ααχχχ,故接受0H .§8.3 两个正态总体参数的假设检验设121n X X X ,,, 为总体),(~112σμN X 的一个样本,221n Y Y Y ,,, 为总体),(~222σμN Y 的一个样本.∑==1111n i i X n X 和∑==2121n i iYn Y 分别是两个样本的样本均值,∑=--=112121)(11n i i X X n S 和∑=--=212222)(11n i i Y Y n S 是相应的两个样本方差.设这两个样本相互独立..一、两个正态总体均值的检验考虑检验假设 211210μμμμ≠=:;:H H . 1.方差21σ与22σ已知——u 检验法. 选取 22212121)()(n n Y X U σσμμ+---=.当0H 成立时,检验统计量)1,0(~222121N n n YX U σσ+-=.给定显著性水平α,由标准正态分布表分位点的定义,有αα=>}|{|2/u U P ,故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= .例1 设从甲乙两场所生产的钢丝总体X ,Y 中各取50束作拉力强度试验,得1208=x ,1282=y ,已知801=σ,942=σ,请问两厂钢丝的抗拉强度是否有显著差别(5.00=α)?解 本题是在显著性水平5.00=α下, 检验假设211210μμμμ≠=:;:H H , 这里5021==n n .选取检验统计量222121n n YX U σσ+-=.给定显著性水平05.0=α,查标准正态分布表,得临界值96.1025.02/==u u α,故拒绝域}|{|2/αu U W >=.由于1208=x ,1282=y ,801=σ,942=σ, 计算检验统计量的值2392.450/)(2221-=+-=σσy x u .由于2/||αu u >,故拒绝0H ,认为两厂钢丝的抗拉强度有显著差别. 2.方差21σ与22σ未知,但2221σσ=——t 检验法.选取 212111)()(n n S Y X T w+---=μμ.这里2)1()1(21222211-+-+-=n n S n S n S w .当0H 成立时,检验统计量)2(~112121-++-=n n t n n S Y X T w.给定显著性水平α,由t 分布表分位点的定义, 有αα=-+>)}2(|{|212/n n t T P ,故拒绝域)}2({)}2({212/212/-+>-+-<=n n t T n n t T W αα .例2 某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22 乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平5.00=α下,判断两种香烟的尼古丁含量有无显著差异?解 检验假设211210μμμμ≠=:;:H H ,这里621==n n ..525=x ,67.625=y ,7386.21=s ,3267.32=s ,0469.3=w s . 选取检验统计量2111n n S Y X T w+-=.给定显著性水平5.00=α,查t 分布表,得临界值2281.2)10()2(025.0212/==-+t n n t α,故拒绝域)}2(|{|212/-+>=n n t T W α.计算统计量的值0949.00469.33)667.255.25(1121-=⨯-=+-=n n s y x t w.由于)2(||212/-+<n n t t α,故接受0H ,认为两种香烟的尼古丁含量无显著差异. 二、两个正态总体方差的检验——F 检验法 考虑检验假设 2221122210σσσσ≠=:;:H H . 1.均值1μ与2μ已知.因为)(~)(11212121211n Xn i iχμσχ∑=-=,)(~)(12212222222n Yn i iχμσχ∑=-=,选取221222211211222121/)(1/)(1//21σμσμχχ∑∑==--==n i i n i i Y n X n n n F . 当0H 成立时,检验统计量),(~)(1)(1211222121121n n F Y n X n F n i i n i i ∑∑==--=μμ.给定显著性水平α,由F 分布分位点的定义,有ααα=><-))},(()),({(212/212/1n n F F n n F F P , 故得拒绝域)},({)},({212/212/1n n F F n n F F W αα><=- . 2.均值1μ与2μ未知.因为)1(~)1()(112212111221211--=-=∑=n S n X X n i i χσσχ,)1(~)1()(122222221222222--=-=∑=n S n Y Yn i iχσσχ,选取22222121222121//)1/()1/(σσχχS S n n F =--=.当0H 成立时,检验统计量)1,1(~212221--=n n F S S F .给定显著性水平α,由F 分布分位点的定义,有ααα=-->--<-))}1,1(())1,1({(212/212/1n n F F n n F F P , 故得拒绝域)}1,1({)}1,1({212/212/1-->--<=-n n F F n n F F W αα .例3某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22 乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平5.00=α下,判断两种香烟的尼古丁含量的方差是否相等? 解 考虑检验假设2221122210σσσσ≠=:;:H H . 由于两个正态总体的均值都未知,选取检验统计量)1,1(~212221--=n n F S S F .给定显著性水平α,查F 分布表,得两个临界值:15.7)5,5()1,1(025.0212/==--F n n F α1399.015.71)5,5(1)5,5()1,1(025.0975.0212/1====---F F n n F α,故得拒绝域}15.7{}1399.0{><=F F W . 计算统计量的值6777.03267.37386.2222221===s s F .由于15.71399.0<<F , 故接受0H ,认为两种香烟的尼古丁含量的方差也无显著差异.§8.4 非正态总体参数的大样本检验本节讨论一般总体参数的检验.设总体X 的均值为μ,方差为2σ, n X X X ,,, 21为总体X 的一个样本.由中心极限定理可知,当样本容量n 足够大时,nX U /σμ-=近似地服从标准正态分布.因此,我们可以用正态分布去近似.如果对均值μ进行检验,方差2σ未知时,可以用样本方差2S 代替2σ;如果对方差2σ进行检验,均值μ未知时,可以用样本均值X 代替μ.下面举两个例子.例1 设某段高速公路上汽车限速为104.6km/h ,现检验85辆汽车的样本,测出的平均车速为106.7km/h ,已知总体标准差为.413=σ km/h ,但不知总体是否服从正态分布.在显著性水平50.0=α下,试检验高速公路上的汽车是否比限制速度104.6km/h 显著地快?解 依题意,检验假设0100.6104μμμμ>=≤:;:H H , 由于.413=σ已知,n =85足够大, 选择检验统计量nX U /0σμ-=近似地服从)10(,N .其拒绝域}{αu U W >=,其中65.105.0==u u α. 计算U 的值449.4185/4.136.1047.106=-=u ,由于αu u <,因此接受0H ,没有理由认为高速公路上的汽车比限制速度104.6km/h 显著地快.例2 为比较甲乙两种小麦植株的高度(单位:cm),分别抽得甲、乙小麦各100穗,在相同条件下进行高度测定,算得甲乙小麦样本均值和样本方差分别为28=x ,8.3521=s ,26=y ,3.3222=s ,问这两种小麦的株高有无显著差异(50.0=α)?解 依题意,检验假设 211210μμμμ≠=:;:H H , 选取 22212121)()(n n Y X U σσμμ+---=,这里两个方差用样本方差代替.当0H 成立时, 检验统计量 222121n Sn S Y X U +-=近似地服从)1,0(N .给定显著性水平05.0=α,查附表3,得临界值96.1025.02/==u u α, 得拒绝域}|{|2/αu U W >=.计算U 的值4236.21003.328.352628=+-=u ,由于αu u >,因此拒绝0H ,认为这两种小麦的株高有显著差异.当总体服从(0-1)分布),1(p b 时,由于只有一个参数p ,总体均值p 和方差)1(p p -均只与p 有关,这时对参数p 进行假设检验时,检验统计量可以直接用样本和参数p 表示出来.例3 某厂有一批产品须经检验后方可出厂.按规定二级品率不得超过10%,从中随机抽取100件产品进行检查,发现有二级品14件,问这批产品是否可以出厂(50.0=α)?解 这里n =100,14.0=x .检验假设01001.0p p H p p H >=≤:;:, 选取检验统计量 np p p X U )1(000--=,U 近似地服从)1,0(N .由显著性水平50.0=α,可以得到拒绝域}{αu U W >=,其中65.105.0==u u α,计算U 的值333.31100.90.10.104.10=⨯-=u ,由于αu u <,因此接受0H ,认为这批产品二级品率没有超过10%,可以出厂.§8.5 分布的拟合检验前几节的检验都是参数的检验.实际问题中,有时需要对分布作出假设,进行检验.本节只介绍一种分布的检验方法——皮尔逊2χ检验法,它只适合于大样本的情形,一般要求样本容量50≥n .设总体X 的分布函数为)(x F ,)(0x F 为一个已知的分布函数,n X X X ,,, 21为总体X 的一个样本,我们来检验关于总体分布的假设)()()()(0100x F x F H x F x F H ≠=:;:.一、基本原理2χ检验法的基本思想是:将随机试验的所有可能结果的全体分成k 个两两互不相容的事件k A A A ,,, 21,在n 次试验中,将i A 发生的次数i f 叫做i A 发生的频数,如果0H 为真,则由大数定律,在n 次试验中(n 足够大),i A (k i ,,, 21=)出现的实际频率nf i与理论频率)(i i A P p =(可由分布函数)(0x F 算出)不应相差很大.基于这种想法,皮尔逊构造了统计量∑=-=ki i i i np np f 122)(χ或∑=-=ki i i i p n p n f 122ˆ)ˆ(χ, 其中i p ˆ是由)(ˆ0x F 计算出来的理论频率,)(ˆ0x F 是)(0x F 中未知参数估计出后的分布函数,并证明了如下定理:定理1 若n 足够大,当0H 成立时,统计量2χ总是近似地服从自由度为1--r k 的2χ分布,其中r 是已知的分布函数)(0x F 中未知参数的个数.直观上看,2χ值表示实际观测结果与理论期望结果的相对差异的总和,当它的取值大于临界值时,应拒绝0H . 二、检验步骤如果)(0x F 为不带有未知参数的已知分布,皮尔逊2χ检验法的具体步骤如下: (1) 将总体X 的值域划分成k 个不交的区间i A (k i ,,, 21=),使得每个区间包含的理论频数满足5≥i np ,否则将区间适当调整; (2) 在0H 成立时,计算各理论频率即概率i p 的值:)()()(100--==i i i i y F y F A P p ,k i ,,, 21=.这里1-i y 与i y 为区间i A 的端点,即](1i i i y y A ,-=;(3) 数出i A 中含有样本值的个数,即i A 的频数i f ,并计算统计量∑=-=ki ii i np np f 122)(χ 的值2χ;(4) 由2χ分布,对于给定的显著性水平α,找出临界值)1(2-k αχ; (5) 判断:若)1(22->k αχχ,则拒绝0H ,否则可接受0H . 如果总体X 是离散型的,则假设0H 相当于假设总体X 的概率分布00}{i i p x X P H ==:, ,,21=i .如果总体X 是连续型的,则假设0H 相当于)()(00x f x f H =:,这里)(x f 为总体的概率密度.例1 至1984年底,南京市开办有奖储蓄以来,13期兑奖号码中诸数码的频数汇总如表8.1:表8.1试检验器械或操作方法是否有问题(50.0=α).解 设抽取的数码为X ,它可能的取值为0~9,如果检验器械或操作方法没有问题,则0~9出现是等可能的,即检验假设 1010=i p H :,9210,,,, =i ,这里}{i X P p i ==. 依题意知k =10,令}{i A i =,9210,,,, =i ,n =350,则理论频数35=i np .57.61935688)(922==-=∑=i i i i np np f χ给定显著性水平5.00=α,查2χ分布表,得临界值9.16)9()1(205.02==-χχαk .由于19.675>16.9,故拒绝0H ,即认为器械或操作方法有问题.如果)(0x F 为带有未知参数的已知分布,未知参数为r θθθ,,, 21,这时用这r 个未知参数的极大似然估计量r θθθˆˆˆ21,,, 来代替)(0x F 中的参数r θθθ,,, 21,得到分布函数)(ˆ0x F ,然后建立统计量∑=-=ki i i i p n p n f 122ˆ)ˆ(χ, 这里i p ˆ是由)(ˆ0x F 计算出来的理论频率,再用以上检验步骤进行检验,但此时检验统计量2χ近似服从)1(2--r k χ分布(这里k >r +1).例2 某高校对100名新生的身高(厘米)做了检查,把测得的100个数据按由大到小的顺序排列,相同的数合并得表8.2:表8.2试问,在显著性水平5.00=α下是否可以认为学生身高X 服从正态分布? 解 这里n =100,我们来检验假设222)(021)(σμσπ--=x ex f H :,+∞<<∞-x ,这里)(x f 为正态分布),(2σμN 的概率密度,设其分布函数为)(x F ,μ与0>σ为未知参数.先求μ与2σ的极大似然估计值μˆ,2ˆσ: 33.1661ˆ1==∑=n i i x n μ, 06.28)ˆ(1ˆ212=-=∑=μσn i i x n . 设服从正态分布)ˆ,ˆ(2σμN 的随机变量为Y ,分布函数为)(ˆy F .按照分组要求,每个小区间的理论频数i pn ˆ不应小于5,因此我们将数据分成了7个组,使得每组的实际频数不小于5,各计算结果如下表8.3所示.表8.3中第3列i pˆ的计算如下: )(ˆ)(ˆ}{ˆ11---=≤<=i i i i i y F y F y Y y P p ,7210,,,, =i , 例如,}06.2833.1665.164ˆˆ06.2833.1665.161{}5.1645.161{ˆ3-≤-<-=≤<=σμY P Y P p1837.0)911.0()345.0(=-Φ--Φ=.给定显著性水平5.00=α,查2χ分布表,得临界值488.9)4()127()1(205.0205.02==--=--χχχαr k .由于1.8843<9.488,故接受0H ,即认为学生身高服从正态分布.。
正态总体均值的假设检验

假设检验
正态总体均值的假设检验
1.1 单个正态总体均值的假设检验
3.大样本单个正态总体均值的检验
设总体为 X ,它的分布是任意的,方差 2 未知, X1 ,X2 , ,Xn 为 来自总体 X 的样本,H0 : 0( 0 已知).当样本容量 n 很大( n 30 )
时,无论总体是否服从正态分布,统计量 t X 0 都近似服从正态分 S/ n
解 依题意,建立假设 由于 2 未知,故选取统计量
H0 : 0 72,H1 : 72 . t X 0 , S/ n
已知 0.05 ,故此检验问题的拒绝域为
W t | | t |
x 0
s/ n
t
/
2
(n
1)
.
又知 n 26,x 74.2,s 6.2,查表得 t /2 (25) t0.025 (25) 2.06 ,则有 | t | x 0 74.2 72 1.81 2.06 , s/ n 6.2/ 26
解 依题意,建立假设 由于 2 未知,取检验统计量
H0 : 0.8,H1 : 0.8 .
t X 0 ~ t(n 1) , S/ n
已知 0.05 ,故此检验问题的拒绝域为
W t | t x 0 s/ n
t (n 1) .
又知 n 16 ,x 0.92,s 0.32 ,查表得 t0.05 (16 1) t0.05 (15) 1.75,则有 t x 0 0.92 0.8 1.50 1.75 , s/ n 0.32/ 16
假设检验 H0 : 0 ,H1 : 0 的拒绝域为 W {t | t t (n 1)}.
(7-8) (7-9)
假设检验
正态总体均值的假设检验
1.1 单个正态总体均值的假设检验
总体均值的假设检验

学
Z X 0 ~ N (0,1)
2
n
天津财经大学 统计学系
(二)总体分布未知,总体方差已知,大 样本
统 • 来自总体的样本为(x1, x2, …, xn)。对于
假设:H0: = 0,在H0成立的前提下,
计 如果样本足够大(n≥30),近似地有检 验统计量
学
Z X 0 ~ N (0,1)
(四)总体分布未知,总体方差未知,大 样本
统
• 来自总体的样本为(x1, x2, …, xn)。对于
假设:H0: = 0,在H0成立的前提下,
计
如果总体偏斜适度,且样本足够大,近 似地有检验统计量
学
Z X - m0 ~ N (0,1)
S2
n
天津财经大学 统计学系
• 例:某厂采用自动包装机分装产品,假 定每包产品的重量服从正态分布,每包
新方法(x2) 35 31 29 25 34 40 27 32 31
旧方法(x1) 32 37 35 38 41 44 35 31 34
天津财经大学 统计学系
• 解:原假设与备择假设如下:
统
H0:旧 - 新 0 H1:旧 - 新 > 0
计 该题属于两个正态总体,方差相等(但
学 未知)的情况。因此,可利用下式计算 检验统计量。
x2i
i 1
,
s
2 2
1 n2Biblioteka n2 1 i1x2i
x2
2
并且,两样本独立。
天津财经大学 统计学系
• 那么,只要n1和n2都足够大,在原假设
H0: 1 = 2成立的条件下,以下检验统
统 计量近似服从标准正态分布。
计
假设检验的八种情况的公式

假设检验的八种情况的公式假设检验是统计学中常用的一种方法,用于判断样本数据与总体参数的关系是否具有显著性差异。
在进行假设检验时,我们需要根据实际问题和已知条件确定相应的假设检验公式。
以下是八种常见的假设检验情况及相应的公式。
1.单样本均值检验:在这种情况下,研究者想要判断一个样本的均值是否与一个已知的总体均值有显著性差异。
假设检验的公式为:其中,x̄为样本均值,μ为总体均值,s为样本标准差,n为样本容量,t为t分布的临界值。
2.双样本均值检验(方差已知):在这种情况下,研究者想要判断两个样本的均值是否有显著性差异,且已知两个样本的方差相等。
假设检验的公式为:其中,x̄1和x̄2分别为样本1和样本2的均值,μ1和μ2分别为总体1和总体2的均值,s为样本标准差,n1和n2分别为样本1和样本2的容量,z为标准正态分布的临界值。
3.双样本均值检验(方差未知):在这种情况下,研究者想要判断两个样本的均值是否有显著性差异,且两个样本的方差未知且不相等。
假设检验的公式为:其中,x̄1和x̄2分别为样本1和样本2的均值,μ1和μ2分别为总体1和总体2的均值,s1和s2分别为样本1和样本2的标准差,n1和n2分别为样本1和样本2的容量,t为t分布的临界值。
4.单样本比例检验:在这种情况下,研究者想要判断一个样本的比例是否与一个已知的总体比例有显著性差异。
假设检验的公式为:其中,p̄为样本比例,p为总体比例,n为样本容量,z为标准正态分布的临界值。
5.双样本比例检验:在这种情况下,研究者想要判断两个样本的比例是否有显著性差异。
假设检验的公式为:其中,p̄1和p̄2分别为样本1和样本2的比例,p1和p2分别为总体1和总体2的比例,n1和n2分别为样本1和样本2的容量,z为标准正态分布的临界值。
6.简单线性回归检验:在这种情况下,研究者想要判断自变量与因变量之间的线性关系是否显著。
假设检验的公式为:其中,β1为回归系数,se(β1)为标准误差,t为t分布的临界值。
8.2正态总体均值的假设检验

t t ( n1 n2 2).
x y 因为 t 4.295, 1 1 sw 10 10
t0.05 (18) 1.7341,
所以拒绝 H 0 ,
即认为建议的新操作方法较原来的方法为优.
例5 有甲、乙两台机床加工相同的产品, 从这两台机床加工 的产品中随机地抽取若干件, 测得产品直径(单位:mm)为 机床甲: 20.5, 19.8, 19.7, 20.4, 20.1, 20.0, 19.0, 19.9
X 0 P Z / n
拒绝域为 Z Z
或 H0: 0;H1:0
X 0 P Z / n
拒绝域为 Z Z
2、方差未知 问题:总体 X~N(,2),2未知 假设 H0:=0;H1:≠0 构造T统计量 T X 0 ~ t (n 1)
t检验 双边检验
X 0 由 P t 2 (n 1) S n 确定拒绝域 T t 2 (n 1) x 0 如果统计量的观测值 T t 2 (n 1) S n
则拒绝原假设;否则接受原假设
S
n
例2 化工厂用自动包装机包装化肥,每包重量服从正态 分布,额定重量为100公斤。某日开工后,为了确定包 装机这天的工作是否正常,随机抽取9袋化肥,称得平 均重量为99.978,均方差为1.212,能否认为这天的包 装机工作正常?(=0.1) 解 由题意可知:化肥重量X~N(,2),0=100 方差未知,要求对均值进行检验,采用T检验法。
得 k t / 2 (n1 n2 2).
故拒绝域为
( x y) t t / 2 ( n1 n2 2). 1 1 sw n1 n2
正态总体均值的假设检验

于是
x
0
/n
0.516
z0.05
1.645,
故接受 H0 , 认为该机工作正常.
2. 2为未知, 关于 的检验( t 检验)
设总体 X ~ N (, 2 ), 其中, 2 未知, 显著性水平为 .
求检验问题 H0 : 0 , H1 : 0 的拒绝域.
设 X1 , X2 ,, Xn 为来自总体 X 的样本,
正态总体均值的假设检验
一、单个总体均值 的检验
二、两个总体均值差的检验(t 检验) 三、基于成对数据的检验(t 检验)
一、单个总体N(, 2)均值 的检验
1. 2 为已知, 关于 的检验( Z 检验)
在正态总体 N(, 2) 讨论中
当
2为已知时,
关于
的检验问题
0
:
(1) 假设检验 H0 : 0 , H1 : 0 ; (2) 假设检验 H0 : 0 , H1 : 0 ; (3) 假设检验 H0 : 0 , H1 : 0 .
设两样本独立. 注意两总体的方差相等. 又设 X ,Y 分别是总体的样本均值, S12 , S22 是样本方
差, 1, 2 , 2 均为未知,
求检验问题 H0 : 1 2 , H1 : 1 2 ( 为已知常数)的拒绝域.
取显著性水平为 .
引入 t 统计量作为检验统计量:
t
(X Sw
11 n1 n2
k
得 k t / 2 (n1 n2 2).
故拒绝域为
t
(x sw
y)
11 n1 n2
t / 2 (n1
n2
2).
关于均值差的其它两个检验问题的拒绝域见表
8.1, 常用 0 的情况.
正态总体均值的假设检验

拒绝域为 u u u0.05 1.645 .
现在 u x 0 41.25 40 3.125 1.645 , / n 2 / 25
即 u 的取值落在拒绝域中,所以在显著性水
平 = 0.05下拒绝 H0,接受 H1,即认为这
2
2 0
2 0
H0:
,H1:
.
其中
为已知常数.检验统计量
T
1
2 0
n
(Xi )2
i 1
~ 2 (n) .
对于给定的显著性水平 ,拒绝域为
t 12 / 2 (n) 或
t
2
/
2
(n)
.
上述检验的统计量服从 2 分布,称此种检
验为 2 检验,类似地可以进行单边检验(见表
右边检验的拒绝域为 t k ,左边检验的拒绝域为 t k .
例2 某工厂生产的固体燃料推进器的燃烧率
服从正态分布 N (, 2 ), 40cm / s , 2cm/ s ,
现在用新方法生产了一批推进器,从中抽取 n=25 只,测得样本均值为 x 41.25cm / s .设在新方
二、两类错误
由于检验法则是依据样本作出的,因此假设 检验的结果可能犯两类错误:
第一类错误:当原假设H0为真时,作出的决 定却是拒绝H0,犯这类错误的概率记为 ,即
P{拒绝H0|H0为真}= . 第二类错误:当原假设H0不正确时,作出的决定却是接受H0,犯这类错 误的概率记为 ,即
P{接受H0|H0不正确} = .
在H0成立时,检验统计量
统计学假设检验公式整理

统计学假设检验公式整理统计学假设检验是统计学中常用的一种方法。
通过使用统计学的方法,我们可以根据样本数据对总体的某种假设进行检验,以确定该假设是否得到支持。
在进行假设检验时,我们需要使用一些公式来计算统计量,从而得到检验结果。
本文将对常见的统计学假设检验公式进行整理和介绍。
一、单样本均值假设检验公式单样本均值假设检验用于确定总体均值是否与给定值相等。
常见的统计学公式包括:1. Z检验公式Z检验适用于大样本(样本容量大于30)的情况,公式如下:$$Z = \frac{\overline{x} - \mu}{\frac{\sigma}{\sqrt{n}}}$$其中,$\overline{x}$ 表示样本均值,$\mu$ 表示总体均值,$\sigma$ 表示总体标准差,$n$ 表示样本容量。
2. t检验公式t检验适用于样本容量较小(30以下)或总体标准差未知的情况,公式如下:$$t = \frac{\overline{x} - \mu}{\frac{s}{\sqrt{n}}}$$其中,$\overline{x}$ 表示样本均值,$\mu$ 表示总体均值,$s$ 表示样本标准差,$n$ 表示样本容量。
双样本均值假设检验常用于比较两个样本之间的均值是否有显著差异。
常见的统计学公式包括:1. 独立双样本t检验公式独立双样本t检验适用于两个样本是相互独立的情况,公式如下:$$t = \frac{(\overline{x}_1 - \overline{x}_2) - (\mu_1 -\mu_2)}{\sqrt{\frac{{s_1}^2}{n_1} + \frac{{s_2}^2}{n_2}}}$$其中,$\overline{x}_1$ 和 $\overline{x}_2$ 分别表示第一个样本和第二个样本的均值,$\mu_1$ 和 $\mu_2$ 分别表示第一个总体和第二个总体的均值,$s_1$ 和 $s_2$ 分别表示第一个样本和第二个样本的标准差,$n_1$ 和 $n_2$ 分别表示第一个样本和第二个样本的容量。
单样本均值假设检验

单样本均值假设检验在统计学中,单样本均值假设检验是一种常见的假设检验方法。
当我们想要比较一个样本的均值与一个已知或者预期的总体均值是否存在显著差异时,可以使用单样本均值假设检验的方法。
本文将介绍单样本均值假设检验的原理和步骤,并通过一个案例来说明。
1.假设在进行单样本均值假设检验之前,首先需要明确研究问题和制定假设。
例如,我们想要研究某个药物的疗效是否显著,我们可以将药物的平均疗效设为总体均值,并将我们观察到的样本均值作为样本均值。
假设我们认为药物无显著疗效,则零假设可以表示为H0: μ = μ0,其中μ是总体均值,μ0是我们认为的理论值。
备择假设可以表示为H1: μ ≠μ0,即我们认为药物具有显著疗效。
2.收集数据接下来,我们需要收集相关的数据。
假设我们随机选择了100名病患,并给予他们药物治疗。
在治疗结束后,我们记录下每个病患的治疗效果,得到样本数据。
3.计算统计量为了进行假设检验,我们需要计算一个适当的统计量。
在单样本均值假设检验中,常用的统计量是t值。
计算公式为:t = (x - μ0) / (s / √n),其中x是样本均值,μ0是假设的总体均值,s是样本标准差,n是样本容量。
4.确定显著性水平在进行假设检验之前,我们需要确定显著性水平。
显著性水平通常设定为0.05或0.01,分别表示5%和1%的错误接受零假设的概率。
5.比较统计量将计算得到的t值与t分布的临界值进行比较。
临界值可以通过查表或者使用统计软件来获取。
如果t值在临界值的拒绝域之外,则可以拒绝零假设,接受备择假设。
6.得出结论根据比较结果,给出对假设的结论。
如果拒绝了零假设,则说明样本均值与总体均值存在显著差异;如果无法拒绝零假设,则说明样本均值与总体均值没有显著差异。
案例分析:假设有一家公司声称他们生产的电池平均寿命为100小时。
我们想要验证这个声称是否成立。
1.假设零假设:H0: μ = 100备择假设:H1: μ ≠ 1002.收集数据我们随机选取了50个电池进行测试,并记录下它们的寿命。
6.假设检验方法--均值

统计假设检验中的两类错误
例 箱中有白、黑球共100个,已知两种颜色的球一种 99个,另一种1个,判断哪种颜色的球为99个。 假设检验的思想如下: 首先,假设白颜色的球有99个;进行检验,从箱 子中抽取一个球,若抽到的为黑球,我们认为小概率 事件发生了(因为在原假设条件下,抽到黑球的概率 为0.01,小概率事件),小概率事件发生了,说明假设错误. 但实际上,也存在抽到了黑球,但实际上白球的个数 就是99的事实,因此我们的推断存在着错误,为第一类错 误. 第一类错误,弃真.原假设符合实际情况,但检验结果 却否定了原假设,称为弃真,即把”对”说成”不对”,把真 说成假;
0
备择假设为
H1 : 65
单总体假设检验
•
• • • • • •
单总体假设检验是对样本统计量与已 知总体参数之间差异的显著性进行检验. 根据总体的分布形态、总体方差是否 已知、样本大小不同,平均数显著性检 验采用不同的检验方法。 1、总体正态分布,总体标准差已知 2、总体正态分布,总体标准差未知 (大样本和小样本情况) 3、总体非正态分布
统计假设检验方法
统计假设检验是统计推断的重要方法,根据一定原理,利用样本信息,根 据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断.基本 思想是假设检验(类似于反正法)在一前提假设下进行推断;基本原则是小 概率事件原理(即,小概率事件在一次试验中实际上是不可能发生的);根 据研究对象分布情况我们所选的统计量不同,相对应的检验方法有Z检验、 t检验、F检验、卡方检验。本章主要介绍: 1、理解统计假设检验的一般原理 2、掌握单\双总体均值\方差假设检验的方法
统计假设检验的一般原理
理解统计假设检验的思想,掌握统计假 设检验的原理是掌握假设检验方法的关键。 本节主要介绍: 1、统计假设检验的一般思想(基本想法、 小概率事件原理、统计假设检验的逻辑思 想); 2、统计假设检验的一般步骤(4步); 3、统计假设检验中的两类错误(弃真、 取伪); 4、统计假设检验的两种方式(单侧检验、 双侧检验)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 若P值小于或等于显著性水平时,拒绝零假设;反之, 则不拒绝零假设。
24
• 总体平均数的单一样本Z检验(「P值」法)
(The One-Sample z-Test for a Population Mean (P-Value Approach ))
– 假设:
• 正态总体或大样本。 • σ已知。
– 步驟一:零假设为H0 : = 0 ,备择假设为 H a : 0 或 H a : 0 或 H a : 0 (双侧) (左侧) (右侧) – 步驟二:确定显著水平「α」。
二、一个总体平均数的假设检验
Hypothesis Test for One Population Mean
1
1 .假设检验的本质
The Nature of Hypothesis Testing
2
• 假设(hypothesis)
– 关于某事为真的陈述: – 每包xx饼干的平均重量与包装袋上记载的454 g 不 同 – 排课时间影响选修统计学同学的成绩表现 – 姚明本周的表现是否失常 – 一种新药的临床实验表现要好到什么程度才能说它 不是安慰剂
– 假设:
• 正态总体或大样本。 • σ已知。
– 步驟一:零假设为H0 : = 0 ,备择假设为 H a : 0 或 H a : 0 或 H a : 0 (双侧) (左侧) (右侧) – 步驟二:决定显著性水平「α」。
16
– 步驟三:计算检验统计量
x 0 z n
Terms, Errors, and Hypotheses
9
• 检验统计量,拒绝区,非拒绝区,临界值(Test
Statistic, Rejection Region, Nonrejection Region, Critical Values)
–检验统计量(Test Statistic): 为了检验是否拒绝零假设时所计算的统计数。 –拒绝区(Rejection Region): 可以拒绝零假设的检验统计量之区间。 –非拒绝区(Nonrejection Region): 无法拒绝零假设的检验统计量之区间。 –临界值(Critical Values): 区隔拒绝区与非拒绝区的检验统计量之值。临界值 被视为拒绝区的一部分。
25
– 步驟三:计算检验统计量
并标记为z0。 – 步驟四:临界值为
x 0 z n
或 z 或 z (双尾) (左尾) (右尾) 使用表A-5找出临界值。
2
z
26
– 步驟五:若P≤α,则拒绝H0;反之,无法拒绝H0 。 – 步驟六:解释此假设检验的结果。
• 此假设检验在正态总体是精确的,在非正态总 体中的大样本里则是趋近于正确的。
– 步驟四:临界值为
或 t 或 t (双尾) (左尾) (右尾) 使用表A-6找出临界值。
2
t
34
– 步驟五:若此统计检验量的值落在拒绝区內,则拒 绝H0;反之,则无法拒绝H0 。 – 步驟六:解释此假设检验的结果。
• 此假设检验在正态总体是精确的,在非正态总 体中的大样本里则是趋近于正确的。
45
• 第Ⅰ与第Ⅱ类型错误机率之间的关系
(Relation Between Type Ⅰand Type Ⅱ Error Probabilities)
–理想上,假设检验时第一类型与第二类型错误的机 率都应越低越好,但是…. –样本大小固定时,当显著水平α越小时,β(虚无 假设为伪时,未拒绝虚无假设的机率)越大。为什 么?
– 步驟四:临界值为
z 2或 z 或 z
(双尾) (左尾) (右尾) 使用表A-5找出临界值。
17
–步驟五:若此统计检验量的值落在拒绝区內,则拒 绝H0;反之,则无法拒绝H0 。 –步驟六:解释此假设检验的结果。
• 此假设检验在正态总体是精确的,在非正态总 体中的大样本中则是趋近于正确的。
– 假设:
• 正态总体/大样本。 • σ未知。
– 步驟一:零假设为H0 : = 0 ,备择假设为 H a : 0 或 H a : 0 或 H a : 0 (双侧) (左侧) (右侧) – 步驟二:确定显著水平「α」。
33
– 步驟三:计算检验统计量
x 0 t s n
36
– 步驟三:计算检验统计量
并标记为t0。 – 步驟四:临界值为
x 0 t s n
或 t 或 t (双尾) (左尾) (右尾) 使用表A-6找出临界值。
2
t
37
– 步驟五:若P≤α,则拒绝H0;反之,无法拒绝H0 。 – 步驟六:解释此假设检验的结果。
• 此假设检验在正态总体是精确的,在非正态总 体中的大样本里则是趋近于正确的。
27
「临界值」法 vs. 「p值」法
临界值法
步驟二:确定显著性水平,α 步驟三:计算统计检验数的值 步驟四:计算临界值
P值法
步驟二:确定显著性水平,α 步驟三:计算统计检验数的值 步驟四:计算P值
步驟一:写出零假设及备择假设 步驟一:写出零假设及备择假设
步驟五:若此统计检验数的值落 步驟五:若P≤α,拒绝H0;反之, 入拒绝区,拒绝H0;反之,则不 则不拒绝H0 拒绝H0 步驟六:解释假设检验的结果 步驟六:解释假设检验的结果
3
• 然而统计假设实际上包含两部分,「零」与 「备择」假设 (Null and Alternative Hypotheses)
–零假设(Null Hypotheses):被检验的假设。 我们使用符号「H0」来表示零假设。
• H0: = 0
–备择假设(Alternative Hypotheses):与零假设形成对 立的假设,使用符号「 H0 」或「 H1 」来表示对立 假设。
• Ha : 0,双侧,双尾检验(two-tailed test) • Ha : > 0 ,右侧(right-tailed test),单侧 或单尾检验(one-tailed test) • Ha : < 0 ,左侧(left-tailed test),单侧 或单尾检验(one-tailed test)
4
• 假设检验之逻辑(The Logic of Hypothesis Testing)
–先假设零假设为真,自总体取一随机样本,倘若样 本资料与零假设一致,则不拒绝零假设;倘若样本 资料与零假设不一致(且其方向与备择假设一致), 则拒绝零假设,并结论备择假设为真。 • 何谓与零假设(不)一致?--需订出具体标准。 • 有时我们也说接受零假设,但这并不准确。就像 打官司的时候,我们说某人无罪,是应为无法证 明其有罪,不利于被告的证据不足以采信。所以, 准确的说法是无法拒绝零假设。
35
• 总体平均数的单一样本t检验(「P值」法)
(The One-Sample t-Test for a Population Mean (P-Value Approach ))
– 假设:
• 正态总体/大样本。 • σ未知。
– 步驟一:零假设为H0 : = 0 ,备择假设为 H a : 0 或 H a : 0 或 H a : 0 (双侧) (左侧) (右侧) – 步驟二:确定显著性水平「α」。
38
7 .应该选用何种方法?
Which Procedure Should be Used?
39
类型
假设
统计检验数
z检验
1.正态分布或大样本 2.σ已知
x 0 z n
t检验
1.正态分布/小样本 2.σ未知
x 0 t s n
自由度=(n-1) W=绝对值排序后,符号为 「+」的加总
28
当σ未知, 一个总体平均数的假设检验
Hypotheses Tests for One Population Mean When σ is Unknown
29
• 当检验为(a)双尾;(b)左尾;(c)右尾时, t检验的P值。
• 但由于t-table不够详尽,t检验的p值只能以区 间表示(可用统计验值t = -1.938,来估 计左尾t检验的P值。
31
• 以样本大小为25及统计检验值t=-0.895,来估 计双尾t检验的P值。
32
• 总体平均数的单一样本t检验(「临界值」法)
(The One-Sample t-Test for a Population Mean (Critical-Value Approach ))
19
P值
P-Values
20
• 若零假设H0为真,得到检验统计量的值等于目 前的值或比之更极端的机率。称为P值(pvalue),observed significance level, probability value。 • P值越小,越支持备择假设,也就是备择假设成 立的证据越強。
21
• 当检验为(a)双尾;(b)左尾;(c)右尾时, Z检验的P值。
W检验
对称总体
40
41
开始
正态总体? 否 大样本? 否
是
标准差 已知? 否
是
使用 单一样本 z检验
是
使用 单一样本 t检验
使用 是 Wilcoxon Signed-Rank检验
对称总体? 否
与统计员討论
42
Alpha 越大,检验越有说服力?
43
Type I & II error
• 第一型错误及第二型错误(Type Ⅰ and Type Ⅱ Errors)
–第一类型错误(Type Ⅰ Error): 当零假设为真时,错误地拒绝零假设。佘祥林案 –第二类型错误(Type Ⅱ Error): 当零假设为伪时,错误地沒有拒绝零假设。辛普森案
44
• 显著水平(Significance Level)