假设检验
假设检验
假设检验原理
显著性水平
假设检验中犯第Ι类错误的概率被称为显著性水平 (Level of significance),记为α ,著名英国统计学家 Ronald Fisher在他的研究中把小概率的标准定为 0.05,这也是个通用的原则。 实际情况 H0为真 正确决策 第Ι 类错误α H0为假 第Π 类错误β 正确决策
单样本Z检验
Minitab 输出
length 的概率图
正态
99
分析结果
用正态性检验来检验一组样本数据是否来自服从正 态分布的总体: 如果数据来自正态分布的总体,数据点应该紧 密紧靠在拟合线上。 如果数据不是来自正态分布的总体,数据就是 远离拟合线。
Anderson-darling正态性检验也是假设检验的一种 • H0:数据来源于正态分布的总体 • H1:数据不是来源于正态分布的总体 正态性检验的 P=0.88,大于显著性水平α=0.05,所 以没有足够的证据拒绝原假设H0 ,即认为样本数据 来自正态分布的总体。
查看概率
Minitab 输出
分布图
正态, 均值=0, 标准差=1 0.4
分析结果
从图形可以看出,在标准正态分布的双侧检验下, α =0.05所对应的分位数为+/-1.96. 按此方法,可以计算T分布、weibull分布等分布下的 概率、概率密度和分位数。
0.3
密度
0.2
0.1
0.025 0.0 -1.96 0 X 1.96
单样本Z检验
增加图形输出,在Minitab中操作:
1、Ctrl + E 或者 点击 2、完成下图对话框,点击 图形
选中 数据箱线图,两次点击确定
单样本Z检验
Minitab 输出
假设检验
P1 P 1 PP2
2
P1 P
P
s
n
P1 P n
H0 : P 1 P 2 0
H1 : P 1 P 2 0
PS1 PS 2 ~ N (0, PS1 PS 2 )
P
S 1 PS 2
12
n1
2 2
n2
P1 1 P1 P2 1 P2 n1 n2
t 分布
例2.3-1
原假设:
备则假设:
T X S n
40 40
=1.6
检验统计量
其中 0 40
X 42
n 16
S 5
TC = TINV(2 ,n -1) = 1.75
检验的标准为: 如果 T ≥1.75 拒绝原假设 如果 T <1.75 接受原假设
0.008
1240000 1240000 =456 11 13
T
X Y S X Y
3500 3590 456
=-0.1976
3、配对样本的 t 检验
H 0 : (d ) 0
H1 : (d ) 0(or (d ) 0or (d ) 0)
d 0 T S d n
一、基本概念
1、统计假设
关于总体分布或总体参数的推测、论断、假定或设想统称为统计假设,简称 假设。依据一定统计规律和程序 由样本推断所作假设是否成立的过程称为假 设检验。因此假设检验就是研究者对随机波动是否足够大到能够影响结果的 准确性作出判断。
2、两种类型的假设
• • 原假设(null hypothesis) 用 假设。 备择假设(Alternative hypothesis)用
假设检验名词解释
假设检验名词解释假设检验是统计学中一种重要的推断方法,用于判断针对总体参数的某个假设是否成立。
在进行假设检验时,我们首先提出一个关于总体参数的虚无假设(null hypothesis)和一个备择假设(alternative hypothesis),然后通过收集样本数据来进行推断和决策。
虚无假设是我们想要拒绝或证伪的假设,通常是基于无效、无差异或不相关等假设。
备择假设是我们希望接受的假设,即我们认为总体参数存在某种特定的差异或关联性。
假设检验的步骤可以分为以下几个阶段:1. 确定假设:根据问题的要求和研究的目标,明确虚无假设和备择假设。
2. 选择显著性水平:显著性水平(significance level)决定了拒绝虚无假设的标准。
常见的显著性水平有5%和1%。
3. 收集样本数据:从总体中抽取样本,并得到所需的统计指标。
4. 计算检验统计量:根据样本数据计算出与虚无假设相关的检验统计量。
常见的检验统计量有t检验、F检验和卡方检验等。
5. 确定拒绝域:通过设定显著性水平和计算的检验统计量,确定拒绝域(rejection region)。
如果检验统计量的计算值落在拒绝域内,就拒绝虚无假设。
6. 进行假设检验:将计算得到的检验统计量与拒绝域进行比较,根据比较结果得出对虚无假设的结论。
7. 给出结论:根据对虚无假设的判断,得出是否拒绝虚无假设,并给出相应的推断结论。
需要注意的是,假设检验并不能直接证明备择假设的正确性,只是提供了一种基于样本数据的推断方法。
假设检验面临两种错误,即第一类错误和第二类错误。
第一类错误是拒绝了真实的虚无假设,即误认为有差异存在;第二类错误是接受了虚无假设,即认为两个总体没有差异,而实际上有差异存在。
在实际应用中,假设检验广泛应用于医学、生物学、商业和社会科学等领域。
通过假设检验,我们能够在一定程度上验证假设、支持决策,并为进一步研究提供可靠的数据分析方法。
假设检验
1 假设检验的一般问题1.1假设检验的定义假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
1.2 参数估计与假设检验统计推断是由样本的信息来推测母体性能的一种方法,它又可以分为两类问题,即参数估计和假设检验,它们都是利用样本对总体进行某种推断,然而推断的角度不同。
参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。
而在假设检验中,则是预先对总体参数的取值提出一个假设,然后利用样本数据检验这个假设是否成立,如果成立,我们就接受这个假设,如果不成立就拒绝原假设。
当然由于样本的随机性,这种推断只能具有一定的可靠性。
实际生产和科学实验中,大量的问题是在获得一批数据后,要对母体的某一参数进行估计和检验。
例如,我们对45钢的断裂韧性作了测定,取得了一批数据,然后要求45钢断裂韧性的平均值,或要求45钢断裂韧性的单侧下限值,或要求45钢断裂韧性的分散度(即离散系数),这就是参数估计的问题。
又如,经过长期的积累,知道了某材料的断裂韧性的平均值和标准差,经改进热处理后,又测得一批数据,试问新工艺与老工艺相比是否有显著差异,这就是假设检验的问题。
这样可以看出,参数估计是假设检验的第一步,没有参数估计,也就无法完成假设检验。
1.3假设检验的基本思想假设检验的基本思想是小概率反证法思想。
小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。
反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。
1.4假设检验的基本概念1.4.1原假设和备择假设为了对假设检验的基本概念有一个直观的认识,不妨先看下面的例子。
例 1 某厂生产一种日光灯管,其寿命X 服从正态分布)200 ,(2μN ,从过去的生产经验看,灯管的平均寿命为1550=μ小时,。
什么是假设检验?
减少主观臆断
假设检验基于客观数据和事实, 而非主观臆断,从而能够减少决 策过程中的主观性和不确定性。
提高决策科学性
假设检验能够提供一种相对可靠 的决策依据,提高决策的科学性 和准确性。
假设检验的未来发展
不断扩展应用领域
方法的改进和完善
随着科学技术的发展,假设检验的应 用领域将会越来越广泛,如人工智能 、生物技术、医学、社会科学等领域 。
随着数据的复杂性和规模的增加,假 设检验的方法也需要不断改进和完善 ,以适应不同场景和需求。
提高可解释性和透明 度
为了更好地理解和解释假设检验的结 果,需要提高其可解释性和透明度, 以便更多的人能够理解和应用。
正确理解和运用假设检验
01
理解基本概念
正确理解和运用假设检验需要深入理解其基本概念和方法,包括如何
社会学研究
社会调查
利用假设检验对社会现象进行调查研究,以揭示社会现象之间的内在联系和 规律。
行为研究
通过假设检验探讨人类行为和社会影响之间的相互作用,为政策制定和社会 干预提供依据。
06
结论
假设检验的意义
科学探究的基础
假设检验是科学探究中最为核心 的方法之一,它能够通过严谨的 逻辑和数学推理来验证或否定一 个特定的假设。
假设检验是统计分析的一部分,它是 一种方法论,用于根据样本数据推断 总体参数。
统计分析包括多种方法和技术,如描 述性统计、推断性统计和回归分析等 ,它们都是为了帮助我们更好地理解 和解释数据。
在进行假设检验时,需要使用统计分 析方法来对数据进行处理和分析,从 而得出结论。
02
假设检验的基本原理
假设的设定与分类
病因研究
通过对暴露因素与疾病之间关系的假设检验,探讨病因和预防策 略的有效性。
第八章 假设检验
x z2
x z2 /
s n
上例,我们用求置信区间的方法,来判断 原假设是否合理。 大样本下满足中心极限定理,样本均值的 抽样分布服从正态分布,从而有置信区间:
x z2 s 24 =986 1.96 n 40
假设检验的步骤
1.确定原假设和备选假设 2.选择检验统计量 3.指定检验的显著性水平 4.建立拒绝原假设的规则 5.收集样本数据,计算检验统计量的值 6.将检验统计量的值域拒绝规则的临界值比较, 以决定是否拒绝原假设。或者,由检验统计量 的值计算p值,利用p值确定是否拒绝原假设。
x 2.92 3 z 2.67 / n 0.18 / 6
x z ~ N (0,1) / n
根据显著性水平α=0.01,对应的拒绝域面积为 0.01,临界值为-2.33 Z<-2.33,所以拒绝H0,即可认为没听咖啡的容量 不足3磅。 统计证据支持对HILLTOP咖啡重量不足采取投诉措 施。
(978.56,993.44)该区间不包含u0=1000, 因此我们拒绝原假设H0.检验表明,该包 装机未能正常工作。
总体均值的检验:小样本情形
小样本下,已知总体为正态分布,我们考 虑以下两种情况: 1.总体方差已知 2.总体方差未知 在总体方差已知的情况下,即使样本容量 较小,但样本平均数的抽样分布总是以平 均值 为均值,以 x 为标准差的正态分 布。因此其检验过程和检验统计量同大样 本情形。
拒绝域为α/2 拒绝域为α/2
z / 2
拒绝域
0
z / 2
假设检验
U | X 0 | ~ N (0,1)
/ n
3° 在假设 H0成立的条件下,由样本判断 y 小概率事件是否发生。 y pU ( x )
P{| U | u / 2 }
2
2
当 0很小时 ,
uα / 2
O uα / 2
x
{| U | u / 2 }是个小概率事件 (如上图) .
第一节
假设检验的 基本概念
一、假设检验的基本原理 二、假设检验的基本概念 三、两类错误
回
四、假设检验的一般步骤
停 下
实验设计 数理统计 统计推断
参数估计 假设检验 (回归分析)
统计推断: 研究如何加工、处理数据,从而 对所考察对象的性质做出尽可能精确和可靠的 推断.
很难发生. 但“很难发生”不等于“不发生”, 因而 假设检验所作出的结论有可能是错误的. 这种错误 有两类: (1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 错误, 这类错误是“以真为假”. 犯第Ⅰ类错误的概 率就是显著性水平 .
= P { 拒绝原假设H0 | H0为真 }
H0称为原假设或零假设, H1称为备择假设.
4. 拒绝域与临界点样本值x=(x1, x2, · · · , xn)所组成的集合. W1 = { x x 且使H0不成立}
W1 W1 : 拒绝原假设H0的检验统计量的取值范围.
W1 x x , U U
根据小概率原理, 如果H 0为真,则 | x 0 | 不应太大,则由一次试验得到
满足不等式
| u |
| x 0 |
/ n
假设检验的名词解释
假设检验的名词解释在统计学中,假设检验是一种通过收集和分析样本数据,用以对总体参数做出统计推断的方法。
简而言之,它帮助我们判断一个统计假设是否在给定的数据中是有效的。
一、什么是假设检验?假设检验是一种从样本推断总体特征的方法,它基于两个互补的假设:原假设(H0)和备择假设(H1或Ha)。
原假设通常是我们要进行推断的现象不存在或没有关联,而备择假设则相反。
通过收集样本数据并使用适当的统计方法,我们根据样本数据对两个假设进行比较,并得出结论。
二、假设检验的基本步骤假设检验通常分为以下几个基本步骤:1. 陈述原假设和备择假设:在开始假设检验之前,我们需要明确原假设和备择假设。
原假设通常是表达无关联或无效果的假设,备择假设则相反。
2. 选择适当的显著性水平:显著性水平代表了我们作出拒绝原假设的临界值。
通常使用的显著性水平是0.05或0.01,表示我们愿意在5%或1%的概率下犯出错误的可能性。
3. 收集样本数据并进行统计分析:根据采样设计,收集足够数量的样本数据。
然后使用适当的统计方法,如t检验、方差分析或卡方检验等,分析样本数据。
4. 计算检验统计量:根据样本数据和所选择的统计方法,计算出相应的检验统计量。
检验统计量是一个数值,用于度量样本数据与原假设之间的偏差程度。
5. 判断拒绝域:根据所选择的显著性水平和计算的检验统计量,确定拒绝域的范围。
拒绝域是样本数据落在其中,我们将拒绝原假设并接受备择假设的区域。
6. 做出判断和推断:比较计算得到的检验统计量与拒绝域的位置。
如果检验统计量落在拒绝域内,我们拒绝原假设并接受备择假设;否则,我们无法拒绝原假设。
7. 做出结论:根据判断和推断结果,给出对原假设的结论。
结论可以是关于总体参数是否存在、是否有效或是否有差异的。
三、常见的假设检验在实际应用中,有许多不同类型的假设检验方法,以下是其中一些常见的假设检验示例:1. 单样本t检验:用于比较一个样本平均值与一个已知或预期的总体平均值是否存在显著差异。
假设检验
假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
中文名假设检验外文名 hypothesis test提出者 K.Pearson 提出时间 20世纪初1、简介假设检验又称统计假设检验(注:显著性检验只是假设检验中最常用的一种方法),是一种基本的统计推断形式,也是数理统计学的一个重要的分支,用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
[1]2、基本思想假设检验的基本思想是小概率反证法思想。
小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。
反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设成立。
[2] 假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。
设A是关于总体分布的一项命题,所有使命题A成立的总体分布构成一个集合h0,称为原假设(常简称假设)。
使命题A不成立的所有总体分布构成另一个集合h1,称为备择假设。
如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数统计)。
如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设。
对一个假设h0进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题A正确),还是拒绝它(否认命题A正确)。
假设检验
产品检验: ■全数检验 ■抽样检验
能最真实、完整的反映所有产品的特性结果 GB/T2828.1-2003 存在抽样误差
总体与样本
判断
总体
随机抽取
样本
测量
数据
根据样本的信息推断总体
2. 假设检验的基本原理:小概率反证法 小概率原理:指小概率事件(通常概率 α≤0.05称为“小概率事件)在一次试 验中基本不会发生,反证法思想是先提 出某项假设(H0 ),用统计方法确定假 设的可能性(即检验假设是否正确): 可能性小,即假设不成立,应拒绝原假 设;如果可能性大,则接受假设,则假 设成立。
⑹根据显著性水平α 及统计量、样本自由 度查概率分布表。获取在此显著性水平α 下的置信区间,即临界值。 双侧检验:根据α/2或(1-α/2)确定临界值 单侧检验:根据α或(1 -α) 确定临界值
⑺做出判断:将计算出的统计量与查表得 出的临界值进行比较,作出拒绝或接受H0 的判断。
五、应用实例
1.单个正态总体的均值检验——t 检验
s12 0.0955 F 2 3.66 s2 0.0261 计算统计量:
n1=8,则样本的自由度 1 n1 1 7 n2=9,则样本的自由度 2 n2 1 8 α =0.05,查F检验临界值(F2)表,P(F >F2)= α 得到:F0.05(7、8)= 3.50 F在拒绝域内 结论:原假设H0不成立,即甲机床的精度比乙机床低。
因此,可用计算确定均值µ及1—α 置信区间的 方法来检验上述假设是否成立。 如果计算出来的置信区间包括µ 0 ,则接受H0 ; 如果计算出来的置信区间不包括µ 0 ,则拒绝H0
三、假设检验类型
• 参数假设:总体分布类型已知,对未知参数 的统计假设。检验参数假设问题称为参数假 设检验。当总体分布类型为正态分布时,则 为正态总体参数检验。 • 非参数假设:总体分布类型不明确,对参数 的各种统计假设。检验非参数假设问题称为 非参数假设检验,也称分布检验。参数假设 检验和非正态总体参数检验都比较复杂,在 QC小组活动中很少应用。
假设检验的八种情况的公式
假设检验的八种情况的公式假设检验是统计学中常用的一种方法,用于判断样本数据与总体参数的关系是否具有显著性差异。
在进行假设检验时,我们需要根据实际问题和已知条件确定相应的假设检验公式。
以下是八种常见的假设检验情况及相应的公式。
1.单样本均值检验:在这种情况下,研究者想要判断一个样本的均值是否与一个已知的总体均值有显著性差异。
假设检验的公式为:其中,x̄为样本均值,μ为总体均值,s为样本标准差,n为样本容量,t为t分布的临界值。
2.双样本均值检验(方差已知):在这种情况下,研究者想要判断两个样本的均值是否有显著性差异,且已知两个样本的方差相等。
假设检验的公式为:其中,x̄1和x̄2分别为样本1和样本2的均值,μ1和μ2分别为总体1和总体2的均值,s为样本标准差,n1和n2分别为样本1和样本2的容量,z为标准正态分布的临界值。
3.双样本均值检验(方差未知):在这种情况下,研究者想要判断两个样本的均值是否有显著性差异,且两个样本的方差未知且不相等。
假设检验的公式为:其中,x̄1和x̄2分别为样本1和样本2的均值,μ1和μ2分别为总体1和总体2的均值,s1和s2分别为样本1和样本2的标准差,n1和n2分别为样本1和样本2的容量,t为t分布的临界值。
4.单样本比例检验:在这种情况下,研究者想要判断一个样本的比例是否与一个已知的总体比例有显著性差异。
假设检验的公式为:其中,p̄为样本比例,p为总体比例,n为样本容量,z为标准正态分布的临界值。
5.双样本比例检验:在这种情况下,研究者想要判断两个样本的比例是否有显著性差异。
假设检验的公式为:其中,p̄1和p̄2分别为样本1和样本2的比例,p1和p2分别为总体1和总体2的比例,n1和n2分别为样本1和样本2的容量,z为标准正态分布的临界值。
6.简单线性回归检验:在这种情况下,研究者想要判断自变量与因变量之间的线性关系是否显著。
假设检验的公式为:其中,β1为回归系数,se(β1)为标准误差,t为t分布的临界值。
假设检验
第十章假设检验第一节假设检验的基本问题一、假设与假设检验1.假设检验的意义从样本的差异推论总体差异的过程,就是假设检验。
一个研究的概括程度越高,可推论的范围就越大。
2.虚无假设H0在推论研究假设之前所提出来的与研究假设相反的假设,这一假设是不存在的,故称之为虚无假设。
一般虚无假设都假设两个总体之间没有差异。
3.研究假设H1研究中所要证明的假设,称为科学假设、对立假设。
一般为假设两个总体参数之间有差异。
二、检验中的两类错误1、α错误:(1)概念:又称为显著性水平,I型错误,是指在否定虚无假设、接受对立假设时所犯的错误,即是将属于没有差异的总体推论为有差异的总体时,所犯的错误。
(2)α错误的确定原则:α错误的概率一般根据统计学原则,规定为5%-1%。
2.β错误:β错误是指在接受H0 为真时所犯的错误,在接受H0 为真,而拒绝H1时,势比有一部分属于H1总体的部分样本,被视为H0 的部分,而被否定在H1之外。
(3)α错误和β错误的关系:α错误和β错误是在两个前提下的概率。
两个总体的关系若是确定的,则α增大,β减小;α减小,β增大;二者相反。
三、单侧检验和双侧检验1、单测检验(1)概念:查统计表时,按分布的一侧计算显著性水平概率的检验,称作单侧检验。
(2)应用条件:凡是检验大于、小于、高于、低于、优于、劣于等有确定性大小关系的假设检验问题。
这类问题的确定是有一定的理论依据的。
假设检验写作H1:μ1<μ2 或μ1>μ2。
2.双侧检验(1)概念:查统计表时,按分布的两端计算显著性水平概率的检验,称作双侧检验。
(2)应用条件:凡是理论上不能确定两个总体一个一定比另一个大或小的假设检验。
一般写作H1:μ1≠μ2。
第二节平均数差异显著性检验一、平均数显著性检验(一)概念:是指研究样本的总体与已知总体μ0差异是否显著的假设检验。
(二)原理:总体分布正态分布或接近正态分布的样本平均数的分布为正态分布或t分布,按分布率进行推论。
假设检验
例2:某种零件的尺寸,要求其平均长度为4厘米,大于或小于4 厘米均属于不合格。该企业生产的零件平均长度是4厘米吗?
提出原假设 H0: = 4厘米
提出备择假设 H1: 4厘米
单边检验
例1:某灯泡制造商声称,该企业所生产的灯泡的平均使用 寿命在1000小时以上。该批产品的平均使用寿命超过1000小 时吗?
x 0 t ~ t (n 1) s n
正态总体、方差未知、小样本情况下,样本统计量的抽样分布
t
正态 分布
X S n
~ t (n 1)
正态分布 t (df = 13) t (df = 5)
t 分布
Z
X
t 分布与正态分布的比较
不同自由度的t分布
t
总体均值的检验—— t 检验(双边)
提出原假设H0: 1000 选择备择假设 H1: < 1000
例2:学生中通宵上网的人数超过25%吗?
提出原假设H0: 25%
选择备择假设 H1: 25%
例3:消费者协会接到消费者投诉,指控某品牌纸包装饮料 容量不足,有欺骗消费者之嫌。消费者协会从市场上随机抽 取50盒该品牌纸包装饮品,包装上标明的容量为250毫升, 但测试发现平均含量为248毫升,小于250毫升。这是生产中 正常的波动,还是厂商的有意行为?消费者协会能否根据该 样本数据,判定饮料厂商欺骗了消费者呢?
2 2
Z 1.96
2
决策准则
当 Z Z ,即Z Z 或Z Z 时 拒绝H 0
2 2 2
当 Z Z ,即 Z Z Z 时 接受H 0
假设检验
四 假设检验一 基本内容1.假设检验对总体分布或分布中的某些参数作出假设,然后利用样本的观测值所提供的信息,检验这种假设是否成立,这一统计推断过程,称为假设检验。
(1) 待检验假设或零假设记为0H ,正在被检验的与0H 相对立的假设1H 称为备选假设或对立假设。
(2) 假设检验的依据——小概率原理:小概率事件在一次试验中实际上不会发生。
(3) 假设检验的思路是概率性质的反证法。
即首先假设成立,然后根据一次抽样所得的样本值得信息,若导致小概率事件发生,则拒绝原假设,否则接受原假设。
(4) 假设检验可能犯的两类错误:① 第一类错误(弃真错误):即假设0H 为真而被拒绝,记为α,即00{|}P H H α=拒绝为真。
② 第二类错误(存伪错误):假设0H 不真而被接受,记为β,即00{|}P H H β=接受不真。
③ 当样本容量n 一定时,,αβ不可能同时减少,在实际工作中总是控制α适当的小。
2.假设检验的程序对任何实际问题进行假设检验,其程序一般为五步,即: ⑴ 根据题意提出零假设0H (或相应备选假设1H )。
⑵构造样本统计量并确定其分布;⑶给定显著性水平α,查表确定临界值,从而得出接受域和拒绝域; ⑷由样本观测值计算出统计量的值;⑸作出判断:若统计量的值落入拒绝域则拒绝0H ,若统计量的值落入接受域则接受0H 。
3.假设检验的主要方法Z 检验法、t 检验法、2λ检验法、F 检验法。
4.关于一个正态总体的假设检验⑴2200(,),H X N μδδμμ 已知,检验假设:=Z 检验法:①001000H H μμμμμμμμ≠><:= (:或或)②统计量0(0,1)()Z N H -=成立时。
③给出1122{}P Z ZZαααα--<=,,查正表定④ 由样本值12n x x x (,,,) 计算Z 的值 ⑤ 判断:若1122Z ZZαα--∈∞∈∞0(-,-)或Z (-,+),则拒绝H(这是对双侧检验提出的Z 检验法步骤,若是单侧可仿比) (2)2200(,),H X N μδδμμ 未知,检验假设:=t 检验法:①001000H H μμμμμμμμ≠><:= (:或或)②0(1)()t t n H -=- 成立时。
假设检验
2
2 0
2 0
H0:
,H1:
.
其中
为已知常数.检验统计量
T
1
2 0
n
(Xi )2
i 1
~ 2 (n) .
对于给定的显著性水平 ,拒绝域为
t 12 / 2 (n) 或
t
2
/
2
(n)
.
上述检验的统计量服从 2 分布,称此种检
验为 2 检验,类似地可以进行单边检验(见表
一、方差已知时,两个正态总体均值差的假设检验—u 检验
设
2 1
,
2 2
为已知,要检验的假设为
也可以写成
H0:1 2 ,H1:1 2 ,
H0:1 2 0 ,H1:1 2 0 .
检验统计量为
u X Y ~ N (0, 1) .
2 1
2 2
mn
对于给定的显著性水平 , 查表得 u / 2, 使得
t 12 / 2 (n 1) 或 t 2 / 2 (n 1) .
这里
2 1
/
2
(n
1)
2 0.95
(4)
0.711
,
2 /2
(n
1)
2 0.05
(4)
9.488
,
x =1.414,s 2 =0.00778,
t
(5
1) 0.00778 0.0482
例2 某车间加工一种零件,要求长度为150mm, 今从一批加工后的这种零件中抽取 9 个,测得长度如 下:
假设检验
σ 22
n2
例:已知同年龄组男生50米跑成绩服从正态分 布。根据以往的资料得知A、B两校男生50 米跑成绩的标准差分别为0.4秒和0.2秒。今 从两校中分别抽测了25名和28名男生,其 50米跑平均成绩分别为8.1秒和7.9秒。问两 校男生50米跑水平是否相同?
练习: 练习 已知甲地某 年龄组男生身 高的 标准差为
西班牙队的比赛中发动93次进攻,成功率为53.8﹪。
是否可以认为该场比赛的进攻成功率高于以往?
练习:某排球队根据近期大量资料统计出比赛扣 球成功率为30%。该队今年参加排球联赛 6场,共扣球326次,成功112次,问今年 扣球成功率是否比以前有提高?
二、两样本率的差异显著性检验(π1=π2) 两样本率的差异显著性检验(
一、样本率与总体率差异显著性检验( P =π) 样本率与总体率差异显著性检验( ) 已知总体率为πo ,样本率为 P。要检验样本率P 所 属总体率π与已知总体率πo是否相同,当 n>30,且 n P>5,统计量为u =p −π π o (1 − π o ) n
例:中国男篮进攻成功率为46.3﹪,第12届世锦赛与
未知, (三)两总体为正态分布,σ1 、σ2 未知,且为小样本的假设检验 两总体为正态分布
当两总体服从正态分布, σ1 、σ2未知,但σ12 = σ22 (方差齐性,即方差间差异不具显著性),n1、 n2均小于 30,则统计量为
t= x1 − x2 (n1 − 1) S1 + (n2 − 1) S 2 1 1 ( + ) n1 + n2 − 2 n1 n2
例: 已知某县14岁女生50米跑成绩服从正态分布, 且 µ o = 8 .8 s。现从某中学随机抽取29名同龄女生 测验50米跑,其成绩 , = 8.5s x
假设检验
一.基本概念:(1)对总体参数的数值所作的陈述,称为统计假设。
(2)对总体参数的数值提出某种假设,然后利用样本所提供的信息检验假设是否成立的过程,称为假设检验。
(3)通常将研究者想收集证据予以支持的假设称为备(选)择假设,记作Hα或H1。
(4)通常将研究者想收集证据予以反对的假设称为原假设,或零假设,用H0表示。
(5)能够作出拒绝原假设这一结论的所有可能样本取值范围,称为拒绝域。
(6)根据样本数据计算出来的,并据以对原假设和备择假设作出决策的某种统计量,称为检验统计量。
(7)当原假设为真时拒绝原假设,称所犯错误为第一类错误,犯第一类错误的概率通常记为α。
(8)当原假设为假时没有拒绝原假设,称为所犯错误为第二类错误,犯第二类错误的概率通常记为β。
(9)假设检验中犯第一类错误的概率,称为显著性水平,通常用α表示。
二.确定检验类型:观察备择假设的符号:如果是“<”就是左侧检验(原假设的拒绝域在左边);如果是“>”就是右侧检验(原假设的拒绝域在右边);如果是“≠”就是双侧检验(原假设的拒绝域在两侧)。
三.常见数值:1. α=0.1(置信水平是90%)(1)左侧检验:Z=-1.28(2)右侧检验:Z=1.28(3)双侧检验(区间估计):Z=+1.645 Z=-1.6452. α=0.05(置信水平是95%)(1)左侧检验:Z=-1.645(2)右侧检验:Z=1.645(3)双侧检验(区间估计):Z=+1.96 Z=-1.963. α=0.01(置信水平是99%)(1)左侧检验:Z=-2.33(2)右侧检验:Z=2.33(3)双侧检验(区间估计):Z=+2.58 Z=-2.58四.计算时采用的分布:(1)均值检验:阅读题目,看看是大样本还是小样本(30)。
如果是大样本,就用标准正态分布分位数表;如果是小样本,再看总体方差是否已知,如果知道,仍然用标准正态分布分位数表;如果是小样本,而且总体方差还不知道,就用t分布临界值表。
假设检验
H 0 : X = X 0; H1 : X ≠ X
0
或 H 0 : P = P0 ; H 1 : P ≠ P0
2.单侧检验:如果不仅仅检验样本平均数( 2.单侧检验:如果不仅仅检验样本平均数(或成 单侧检验 和总体平均数(或成数)有没有显著的差异, 数)和总体平均数(或成数)有没有显著的差异, 而且追究是否发生预先指定方向的差异( 而且追究是否发生预先指定方向的差异(正差 异或负差异),则原假设取不等式形式, ),则原假设取不等式形式 异或负差异),则原假设取不等式形式,如:
其次,确定显著性水平。 其次,确定显著性水平。 我们所以拒绝原假设, 我们所以拒绝原假设,并不是因为它存在逻辑的 绝对矛盾,或实际上不可能存在这种假设, 绝对矛盾,或实际上不可能存在这种假设,而仅 仅因为它存在的可能性很小。 仅因为它存在的可能性很小。根据小概率事件原 理,概率很小的事件在一次试验中几乎是不会发 生的。 生的。如果根据原假设的条件正确计算出某一结 果发生的概率很小, 果发生的概率很小,理应在一次试验中不至于发 然而在一次试验中事实上又发生了, 生,然而在一次试验中事实上又发生了,则我们 认为原假设不正确,而拒绝接受。 认为原假设不正确,而拒绝接受。 进行假设检验时应该事先规定一个小概率的标 作为判断的界限, 准,作为判断的界限,这个小概率标准称为显 著性水平。 著性水平。
(一)设立假设 首先提出原假设,记为H 首先提出原假设,记为H0,原假设总是假定 总体没有显著性差异, 总体没有显著性差异,所有差异都是由随机 原因引起的。所以这种假设又称无效假设。 原因引起的。所以这种假设又称无效假设。 其次提出备择假设,记为H 其次提出备择假设,记为H1,如果原假设被 拒绝等于接受了备择假设, 拒绝等于接受了备择假设,所以备择假设也 就是原假设的对立事件。 就是原假设的对立事件。
假设检验
本的取值,按一定原则进行检验,然后作出接受或拒绝所作假设
的决定. 参数假设检验:对总体分布中参数做假设。 分类: 分布假设检验:对总体分布做假设。
假设检验的过程
提出假设
我认为人口的平 均年龄是50岁
作出决策 拒绝假设
别无选择!
总体
抽取随机样本
均值 x = 20
一、引例
X 68 可以确定一个常数c 使得 P c 3.6 / 6
取 0.05,则
c z z0.025 1.96
2
X 68 1.96 由 3 .6 6
X 69.18或 X 66.824
即区间( ,66.824 )与( 69.18 , + )为检验的拒绝域
2 设 X 1 , , X n是取自正态总体 N , 的一个样本, 其中 , 2 都是未知参数。
具体步骤:
(1)先考虑假设检验问题
H 0 : 0
H1 : 0
(2)选择检验统计量,在此处,由于, 2 未知,所以用总
1 n ( X i X ) 2 来代替,则采用 体方差 2 的无偏估计 S n 1 i 1
这是小概率事件 ,一般在一次试验中是不会发生的, 现一 次试验竟然发生, 故认为原假设不成立, 即该批产品次品 率 p 0.04 , 则该批产品不能出厂.
1 P (1) C12 p1 (1 p)11 0.306 0.3 12
这不是小概率事件,没理由拒绝原假设,而接受原假设, 即该批产品可以出厂. 注1 直接算 1 / 12 0.083 0.04
0.01 0.05,0.1 ,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 假设检验一、教材说明本章主要介绍统计假设检验的基本概念和基本思想、正态总体参数的统计假设的显着性检验方法.。
1、本章的教学目的与要求(1)使学生了解假设检验的基本概念; (2)使学生了解假设检验的基本思想; (3)使学生掌握假设检验的基本步骤;(4)使学生会计算检验的两类错误,搞清楚两类错误的关系;(5)使学生掌握正态总体参数的假设检验,主要是检验统计量及其分布,检验拒绝域的确定;(6)使学生灵活运用所学知识解决实际问题。
2、本章的重点与难点本章的重点是正态总体参数的各种假设检验中的检验统计量及其分布,难点是假设检验拒绝域的确定。
二、教学内容下面主要分3节来讲解本章的主要内容。
§ 假设检验的基本概念对总体分布或分布中的某些参数作出假设,然后利用样本的观测值所提供的信息,运用数理统计的分析方法,检验这种假设是否成立,从而决定接受或拒绝“假设”,这一统计推断过程,称为假设检验。
1.引例我们先举一个简单的实例来说明假设检验的基本思想及推理方法.例1:某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布.且知标准差为0.015千克.当机器正常时, 其均值为0.5千克,某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(千克): , 问机器是否正常?分析:用μ和σ分别表示这一天袋装糖重总体X 的均值和标准差,则)015.0,(~2μN X ,其中μ未知。
问题: 已知总体2(,)X N μσ:,且00.015,σσ==根据样本值判断0.5μ=还是0.5μ≠。
提出两个对立假设00:0.5H μμ==(原假设或零假设)和 10:H μμ≠(备择假设).再利用已知样本作出判断是接受假设0H ( 拒绝假设1H ) , 还是拒绝假设0H (接受假设1H ). 如果作出的判断是接受0H , 则0μμ=即认为机器工作是正常的, 否则, 认为是不正常的.因为X 是μ的无偏估计量,所以,若0H 为真,则0μ-x~(0,1)N ,衡量0μ-xX 的大小。
于是可以选定一个适当的正数k ,当观察值xX k ≥时,拒绝假设0H ;反之,当观察值x 满足时k nX <-/0σμ,接受假设0H 。
因为当0H为真时,~(0,1)X U N =,由标准正态分布分位点的定义得:/2,k u α=/20/20,,, .u H u H αα≥<时拒绝时接受假设检验过程如下: 在实例中,(1)若取定 0.05, α=则/20.025 1.96,k u u α===我们有(|| 1.96) 1.96)0.05.X P U P >=>=又已知0 9, 0.015, n σ==由样本算得 0.511, x =即有 2.2 1.96,=>于是根据小概率事件实际不可能性原理,拒绝假设0H , 认为包装机工作不正常. (2)若取定 0.01, α=则/20.005 2.58,k u u α=== 2.2 2.58, =<于是接受假设0H , 认为包装机工作正常.注:上述α称为显着性水平.此例表明假设检验的结论与选取的显着性水平α有密切的关系.所以,必须说明假设检验的结论是在怎样的显着水平α下作出的. 2.假设检验的基本思想及推理方法 1)假设检验基本思想(1) 在假设检验中,提出要求检验的假设,称为原假设或零假设,记为0H ,原假设如果不成立,就要接受另一个假设,这另一个假设称为备择假设或对立假设,记为1H 。
(2) 假设检验的依据——小概率原理:小概率事件在一次试验中实际上不会发生。
(3) 假设检验的思路是概率性质的反证法。
即首先假设成立,然后根据一次抽样所得的样本值得信息,若导致小概率事件发生,则拒绝原假设,否则接受原假设。
(4) 假设检验可能犯的两类错误:① 第一类错误(弃真错误):即假设0H 为真而被拒绝,记为α,即00{|}P H H α=拒绝为真。
② 第二类错误(存伪错误):假设0H 不真而被接受,记为β,即00{|}P H H β=接受不真。
③ 当样本容量n 一定时,,αβ不可能同时减少,在实际工作中总是控制α适当的小。
2)假设检验的程序对任何实际问题进行假设检验,其程序一般为五步,即: ⑴根据题意提出零假设0H (或相应备选假设1H )。
⑵构造样本统计量并确定其分布;⑶给定显着性水平α,查表确定临界值,从而得出接受域和拒绝域; ⑷由样本观测值计算出统计量的值;⑸作出判断:若统计量的值落入拒绝域则拒绝0H ,若统计量的值落入接受域则接受0H 。
3)假设检验的主要方法U 检验法、t 检验法、2χ检验法、F 检验法。
例2 已知某产品使用寿命X 服从正态分布,要求平均使用寿命不低于1000小时,现从一批这种产品中随机抽出25只,测得平均使用寿命为950小时,样本方差为100小时。
则可用( )① t--检验法 ②2χ--检验法 ③Z--检验法 ④F--检验法 解 选①例3 假设检验时,只减少样本容量,犯两类错误的概率( ) ①都增大 ②都减少③不变 ④一个增大,一个减少 解 选①例4 正态总体()n X X X N X ,,,,,~212Λσμ为样本,,11∑==ni i X n X 假设检验()为已知数0220:σσσ≤H ,在显着性水平α下,则当()20122σχ∑=-=ni ix x ( )时拒绝0H①()221;n αχ≥- ②()2121n αχ-≤-③()21n αχ≤- ④()21n αχ≥-解 由于当0H 成立时,*2*222(1)(1),n S n S σσ--≤而*222(1)(1)n S n χσ--:,故*2*22222(1)(1)((1))((1))n S n S P n P n ααχχασσ--≥-≤≥-=,于是选④§ 单个正态总体的假设检验⑴2200X :N(μ,σ),σ已知,检验假设H :μ=μU 检验法:①001000H H μμμμμμμμ≠><:= (:或或)②统计量0(0,1)()U N H -=:成立时。
③给出22{}P U u u αααα>=,,查正表定.④ 由样本值12n x x x L L (,,,) 计算u 的值 ⑤ 判断:若/2||u u α>0,则拒绝H(这是对双侧检验提出的U 检验法步骤,若是单侧可仿比)(2)2200X ∼N(μ,σ),σ未知,检验假设H :μ=μt 检验法:①001000H H μμμμμμμμ≠><:= (:或或)②0(1)()T t n H -=-:成立时。
③给出22{(1)}(1).P T t n t n αααα>-=-,,查t 分布表定④由样本值计算T 的值.⑤判断:若0022(1),(1),t t n H H t n αα≥--则拒绝,否则接受(若是单侧可查t 表定 同样得出拒绝域).(3)222200(,),H X N μσσσσ:未知,检验假设:= ①2222000H σσσσ≠1:=(H :)②*2221022(1)(1)()i n Sn H χχσσ=-==-∑:n-2i(X -X )成立时。
③给出2222122{(1)}{(1)}2P n P n ααααχχχχ-<-=>-=,,查2χ分布表定22(1)n αχ-及212(1).n αχ--④由样本值计算2χ的值 ⑥ 判断:若222200122(1)(1)n n H H ααχχχχ->-<-或,则拒绝,反之则接受. (一)已知方差例5 设某产品的某项质量指标服从正态分布,已知它的标准差150σ=,现从一批产品中随机地抽取26个,测得该项指标的平均值为1637。
问能否认为这批产品的该项指标值为1600(0.05α=) ?解 (1)提出原假设: H 0:μ=1600,H 1:μ≠1600; (2)选取统计量X U -=(3)对于给定的显着性水平0.05α= ,查标准正态分布表0.02521.96u u α==(4)计算统计量观察值1.258x u ==≈(5)结论 121.258 1.96u uα-=<=接受原假设H 0即不能否定这批产品该项指标为1600。
(二)未知方差,检验00μμ=:H例6某厂生产乐器用合金弦线,其抗拉强度服从均值为10560(kg/2cm )的正态分布。
现从一批产品中抽取10根测得其抗拉强度(单位:kg/2cm )为: 10512 10623 10668 10554 10776 10707 10557 10581 10666 10670⑴对显着性水平α=,问这批产品的抗拉强度有无显着变化? ⑵对显着性水平α=,结果如何?(已知()()()()0.050.0250.010.0059 1.833,9 2.262,9 2.821,9 3.250t t t t ====)解 ①假设检验10560,10560:10≠=μμ:对H H ②方差未知时,检验数学期望选用统计量()*22011~1()1n i i X T H T T n Sx x n ==-=--∑在成立时,其中 ③对给定样本值,计算得()4.1063110670106231015210111=+++==∑=Λn i i x n x ()22222211159044*10512106701010631.4199n i i s x nx n =⎛⎫=-=++-⋅= ⎪-⎝⎭∑L所以,统计量的样本值0* 2.788x t μ-=== ④当显着性水平α=时,拒绝域为()0.0259 2.262T t ≥=,02.788 2.262,0.05,t H α=>=这里落入拒绝域,所以在不应接受即认为抗拉强度有显着变化。
当显着性水平α=时,拒绝域为 0.005||(9) 3.250T t ≥=,即认为这批产品的抗拉强度无显着性变化。
例7已知某种元件的寿命服从正态分布,要求该元件的平均寿命不低于1000 小时,现从这批元件中随机抽取25 只,测得平均寿命 980X =小时 标准差65s =小时 试在显着水平0.05α= 下,确定这批元件是否合格(附表0.900.950.975(24) 1.138,(24) 1.171,(24) 2.064t t t ===)分析 元件是否合格,应通过寿命低于1000 小时来判断(1000≥小时都合格),这里对总体均值的单测检验, 2σ未知,用 t -检验法解 ①提出检验假设0010:1000,:1000H H μμμμ==<=②选取统计量*X T μ-=,当 0H 成立时~(1)T t n - ③由样本观测值,计算统计量所取的值。
这里*980,65x s == 得98010001.53865t -==-④对显着水平0.05α= 拒绝域(临界域)10.95(1)(24) 1.711t t n t α-≤--=-=- 因为0.95(24) 1.711t t >-=- ,未落入拒绝域,应接受0H ,否定1H :即认为这批元件合格。