假设检验

合集下载

假设检验

假设检验

假设检验原理
显著性水平
假设检验中犯第Ι类错误的概率被称为显著性水平 (Level of significance),记为α ,著名英国统计学家 Ronald Fisher在他的研究中把小概率的标准定为 0.05,这也是个通用的原则。 实际情况 H0为真 正确决策 第Ι 类错误α H0为假 第Π 类错误β 正确决策
单样本Z检验
Minitab 输出
length 的概率图
正态
99
分析结果
用正态性检验来检验一组样本数据是否来自服从正 态分布的总体: 如果数据来自正态分布的总体,数据点应该紧 密紧靠在拟合线上。 如果数据不是来自正态分布的总体,数据就是 远离拟合线。
Anderson-darling正态性检验也是假设检验的一种 • H0:数据来源于正态分布的总体 • H1:数据不是来源于正态分布的总体 正态性检验的 P=0.88,大于显著性水平α=0.05,所 以没有足够的证据拒绝原假设H0 ,即认为样本数据 来自正态分布的总体。
查看概率
Minitab 输出
分布图
正态, 均值=0, 标准差=1 0.4
分析结果
从图形可以看出,在标准正态分布的双侧检验下, α =0.05所对应的分位数为+/-1.96. 按此方法,可以计算T分布、weibull分布等分布下的 概率、概率密度和分位数。
0.3
密度
0.2
0.1
0.025 0.0 -1.96 0 X 1.96
单样本Z检验
增加图形输出,在Minitab中操作:
1、Ctrl + E 或者 点击 2、完成下图对话框,点击 图形
选中 数据箱线图,两次点击确定
单样本Z检验
Minitab 输出

假设检验

假设检验

P1 P 1 PP2
2
P1 P
P
s

n

P1 P n
H0 : P 1 P 2 0
H1 : P 1 P 2 0
PS1 PS 2 ~ N (0, PS1 PS 2 )
P
S 1 PS 2

12
n1

2 2
n2

P1 1 P1 P2 1 P2 n1 n2
t 分布
例2.3-1
原假设:
备则假设:
T X S n
40 40
=1.6
检验统计量
其中 0 40
X 42
n 16
S 5
TC = TINV(2 ,n -1) = 1.75
检验的标准为: 如果 T ≥1.75 拒绝原假设 如果 T <1.75 接受原假设
0.008
1240000 1240000 =456 11 13

T
X Y S X Y
3500 3590 456
=-0.1976
3、配对样本的 t 检验
H 0 : (d ) 0
H1 : (d ) 0(or (d ) 0or (d ) 0)
d 0 T S d n
一、基本概念
1、统计假设
关于总体分布或总体参数的推测、论断、假定或设想统称为统计假设,简称 假设。依据一定统计规律和程序 由样本推断所作假设是否成立的过程称为假 设检验。因此假设检验就是研究者对随机波动是否足够大到能够影响结果的 准确性作出判断。
2、两种类型的假设
• • 原假设(null hypothesis) 用 假设。 备择假设(Alternative hypothesis)用

假设检验名词解释

假设检验名词解释

假设检验名词解释假设检验是统计学中一种重要的推断方法,用于判断针对总体参数的某个假设是否成立。

在进行假设检验时,我们首先提出一个关于总体参数的虚无假设(null hypothesis)和一个备择假设(alternative hypothesis),然后通过收集样本数据来进行推断和决策。

虚无假设是我们想要拒绝或证伪的假设,通常是基于无效、无差异或不相关等假设。

备择假设是我们希望接受的假设,即我们认为总体参数存在某种特定的差异或关联性。

假设检验的步骤可以分为以下几个阶段:1. 确定假设:根据问题的要求和研究的目标,明确虚无假设和备择假设。

2. 选择显著性水平:显著性水平(significance level)决定了拒绝虚无假设的标准。

常见的显著性水平有5%和1%。

3. 收集样本数据:从总体中抽取样本,并得到所需的统计指标。

4. 计算检验统计量:根据样本数据计算出与虚无假设相关的检验统计量。

常见的检验统计量有t检验、F检验和卡方检验等。

5. 确定拒绝域:通过设定显著性水平和计算的检验统计量,确定拒绝域(rejection region)。

如果检验统计量的计算值落在拒绝域内,就拒绝虚无假设。

6. 进行假设检验:将计算得到的检验统计量与拒绝域进行比较,根据比较结果得出对虚无假设的结论。

7. 给出结论:根据对虚无假设的判断,得出是否拒绝虚无假设,并给出相应的推断结论。

需要注意的是,假设检验并不能直接证明备择假设的正确性,只是提供了一种基于样本数据的推断方法。

假设检验面临两种错误,即第一类错误和第二类错误。

第一类错误是拒绝了真实的虚无假设,即误认为有差异存在;第二类错误是接受了虚无假设,即认为两个总体没有差异,而实际上有差异存在。

在实际应用中,假设检验广泛应用于医学、生物学、商业和社会科学等领域。

通过假设检验,我们能够在一定程度上验证假设、支持决策,并为进一步研究提供可靠的数据分析方法。

假设检验

假设检验

1 假设检验的一般问题1.1假设检验的定义假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。

其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。

1.2 参数估计与假设检验统计推断是由样本的信息来推测母体性能的一种方法,它又可以分为两类问题,即参数估计和假设检验,它们都是利用样本对总体进行某种推断,然而推断的角度不同。

参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。

而在假设检验中,则是预先对总体参数的取值提出一个假设,然后利用样本数据检验这个假设是否成立,如果成立,我们就接受这个假设,如果不成立就拒绝原假设。

当然由于样本的随机性,这种推断只能具有一定的可靠性。

实际生产和科学实验中,大量的问题是在获得一批数据后,要对母体的某一参数进行估计和检验。

例如,我们对45钢的断裂韧性作了测定,取得了一批数据,然后要求45钢断裂韧性的平均值,或要求45钢断裂韧性的单侧下限值,或要求45钢断裂韧性的分散度(即离散系数),这就是参数估计的问题。

又如,经过长期的积累,知道了某材料的断裂韧性的平均值和标准差,经改进热处理后,又测得一批数据,试问新工艺与老工艺相比是否有显著差异,这就是假设检验的问题。

这样可以看出,参数估计是假设检验的第一步,没有参数估计,也就无法完成假设检验。

1.3假设检验的基本思想假设检验的基本思想是小概率反证法思想。

小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。

反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。

1.4假设检验的基本概念1.4.1原假设和备择假设为了对假设检验的基本概念有一个直观的认识,不妨先看下面的例子。

例 1 某厂生产一种日光灯管,其寿命X 服从正态分布)200 ,(2μN ,从过去的生产经验看,灯管的平均寿命为1550=μ小时,。

什么是假设检验?

什么是假设检验?

减少主观臆断
假设检验基于客观数据和事实, 而非主观臆断,从而能够减少决 策过程中的主观性和不确定性。
提高决策科学性
假设检验能够提供一种相对可靠 的决策依据,提高决策的科学性 和准确性。
假设检验的未来发展
不断扩展应用领域
方法的改进和完善
随着科学技术的发展,假设检验的应 用领域将会越来越广泛,如人工智能 、生物技术、医学、社会科学等领域 。
随着数据的复杂性和规模的增加,假 设检验的方法也需要不断改进和完善 ,以适应不同场景和需求。
提高可解释性和透明 度
为了更好地理解和解释假设检验的结 果,需要提高其可解释性和透明度, 以便更多的人能够理解和应用。
正确理解和运用假设检验
01
理解基本概念
正确理解和运用假设检验需要深入理解其基本概念和方法,包括如何
社会学研究
社会调查
利用假设检验对社会现象进行调查研究,以揭示社会现象之间的内在联系和 规律。
行为研究
通过假设检验探讨人类行为和社会影响之间的相互作用,为政策制定和社会 干预提供依据。
06
结论
假设检验的意义
科学探究的基础
假设检验是科学探究中最为核心 的方法之一,它能够通过严谨的 逻辑和数学推理来验证或否定一 个特定的假设。
假设检验是统计分析的一部分,它是 一种方法论,用于根据样本数据推断 总体参数。
统计分析包括多种方法和技术,如描 述性统计、推断性统计和回归分析等 ,它们都是为了帮助我们更好地理解 和解释数据。
在进行假设检验时,需要使用统计分 析方法来对数据进行处理和分析,从 而得出结论。
02
假设检验的基本原理
假设的设定与分类
病因研究
通过对暴露因素与疾病之间关系的假设检验,探讨病因和预防策 略的有效性。

第八章 假设检验

第八章 假设检验
或 n 若所得的置信区间不包含u0,则拒绝H0, 否则不能拒绝。
x z2

x z2 /
s n


上例,我们用求置信区间的方法,来判断 原假设是否合理。 大样本下满足中心极限定理,样本均值的 抽样分布服从正态分布,从而有置信区间:
x z2 s 24 =986 1.96 n 40
假设检验的步骤

1.确定原假设和备选假设 2.选择检验统计量 3.指定检验的显著性水平 4.建立拒绝原假设的规则 5.收集样本数据,计算检验统计量的值 6.将检验统计量的值域拒绝规则的临界值比较, 以决定是否拒绝原假设。或者,由检验统计量 的值计算p值,利用p值确定是否拒绝原假设。
x 2.92 3 z 2.67 / n 0.18 / 6

x z ~ N (0,1) / n


根据显著性水平α=0.01,对应的拒绝域面积为 0.01,临界值为-2.33 Z<-2.33,所以拒绝H0,即可认为没听咖啡的容量 不足3磅。 统计证据支持对HILLTOP咖啡重量不足采取投诉措 施。

(978.56,993.44)该区间不包含u0=1000, 因此我们拒绝原假设H0.检验表明,该包 装机未能正常工作。
总体均值的检验:小样本情形


小样本下,已知总体为正态分布,我们考 虑以下两种情况: 1.总体方差已知 2.总体方差未知 在总体方差已知的情况下,即使样本容量 较小,但样本平均数的抽样分布总是以平 均值 为均值,以 x 为标准差的正态分 布。因此其检验过程和检验统计量同大样 本情形。
拒绝域为α/2 拒绝域为α/2
z / 2
拒绝域
0
z / 2

假设检验

假设检验

本的取值,按一定原则进行检验,然后作出接受或拒绝所作假设
的决定. 参数假设检验:对总体分布中参数做假设。 分类: 分布假设检验:对总体分布做假设。
假设检验的过程
提出假设
我认为人口的平 均年龄是50岁
作出决策 拒绝假设
别无选择!
总体

抽取随机样本
均值 x = 20
一、引例
X 68 可以确定一个常数c 使得 P c 3.6 / 6
取 0.05,则
c z z0.025 1.96
2
X 68 1.96 由 3 .6 6
X 69.18或 X 66.824
即区间( ,66.824 )与( 69.18 , + )为检验的拒绝域
2 设 X 1 , , X n是取自正态总体 N , 的一个样本, 其中 , 2 都是未知参数。


具体步骤:
(1)先考虑假设检验问题
H 0 : 0
H1 : 0
(2)选择检验统计量,在此处,由于, 2 未知,所以用总
1 n ( X i X ) 2 来代替,则采用 体方差 2 的无偏估计 S n 1 i 1
这是小概率事件 ,一般在一次试验中是不会发生的, 现一 次试验竟然发生, 故认为原假设不成立, 即该批产品次品 率 p 0.04 , 则该批产品不能出厂.
1 P (1) C12 p1 (1 p)11 0.306 0.3 12
这不是小概率事件,没理由拒绝原假设,而接受原假设, 即该批产品可以出厂. 注1 直接算 1 / 12 0.083 0.04

0.01 0.05,0.1 ,

假设检验

假设检验
X是的无偏估计量,
U | X 0 | ~ N (0,1)
/ n
3° 在假设 H0成立的条件下,由样本判断 y 小概率事件是否发生。 y pU ( x )

P{| U | u / 2 }
2

2
当 0很小时 ,
uα / 2
O uα / 2
x
{| U | u / 2 }是个小概率事件 (如上图) .
第一节
假设检验的 基本概念
一、假设检验的基本原理 二、假设检验的基本概念 三、两类错误

四、假设检验的一般步骤
停 下
实验设计 数理统计 统计推断
参数估计 假设检验 (回归分析)
统计推断: 研究如何加工、处理数据,从而 对所考察对象的性质做出尽可能精确和可靠的 推断.
很难发生. 但“很难发生”不等于“不发生”, 因而 假设检验所作出的结论有可能是错误的. 这种错误 有两类: (1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 错误, 这类错误是“以真为假”. 犯第Ⅰ类错误的概 率就是显著性水平 .
= P { 拒绝原假设H0 | H0为真 }
H0称为原假设或零假设, H1称为备择假设.
4. 拒绝域与临界点样本值x=(x1, x2, · · · , xn)所组成的集合. W1 = { x x 且使H0不成立}
W1 W1 : 拒绝原假设H0的检验统计量的取值范围.
W1 x x , U U
根据小概率原理, 如果H 0为真,则 | x 0 | 不应太大,则由一次试验得到
满足不等式
| u |
| x 0 |
/ n

假设检验的名词解释

假设检验的名词解释

假设检验的名词解释在统计学中,假设检验是一种通过收集和分析样本数据,用以对总体参数做出统计推断的方法。

简而言之,它帮助我们判断一个统计假设是否在给定的数据中是有效的。

一、什么是假设检验?假设检验是一种从样本推断总体特征的方法,它基于两个互补的假设:原假设(H0)和备择假设(H1或Ha)。

原假设通常是我们要进行推断的现象不存在或没有关联,而备择假设则相反。

通过收集样本数据并使用适当的统计方法,我们根据样本数据对两个假设进行比较,并得出结论。

二、假设检验的基本步骤假设检验通常分为以下几个基本步骤:1. 陈述原假设和备择假设:在开始假设检验之前,我们需要明确原假设和备择假设。

原假设通常是表达无关联或无效果的假设,备择假设则相反。

2. 选择适当的显著性水平:显著性水平代表了我们作出拒绝原假设的临界值。

通常使用的显著性水平是0.05或0.01,表示我们愿意在5%或1%的概率下犯出错误的可能性。

3. 收集样本数据并进行统计分析:根据采样设计,收集足够数量的样本数据。

然后使用适当的统计方法,如t检验、方差分析或卡方检验等,分析样本数据。

4. 计算检验统计量:根据样本数据和所选择的统计方法,计算出相应的检验统计量。

检验统计量是一个数值,用于度量样本数据与原假设之间的偏差程度。

5. 判断拒绝域:根据所选择的显著性水平和计算的检验统计量,确定拒绝域的范围。

拒绝域是样本数据落在其中,我们将拒绝原假设并接受备择假设的区域。

6. 做出判断和推断:比较计算得到的检验统计量与拒绝域的位置。

如果检验统计量落在拒绝域内,我们拒绝原假设并接受备择假设;否则,我们无法拒绝原假设。

7. 做出结论:根据判断和推断结果,给出对原假设的结论。

结论可以是关于总体参数是否存在、是否有效或是否有差异的。

三、常见的假设检验在实际应用中,有许多不同类型的假设检验方法,以下是其中一些常见的假设检验示例:1. 单样本t检验:用于比较一个样本平均值与一个已知或预期的总体平均值是否存在显著差异。

假设检验

假设检验

假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。

具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。

常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。

中文名假设检验外文名 hypothesis test提出者 K.Pearson 提出时间 20世纪初1、简介假设检验又称统计假设检验(注:显著性检验只是假设检验中最常用的一种方法),是一种基本的统计推断形式,也是数理统计学的一个重要的分支,用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。

其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。

[1]2、基本思想假设检验的基本思想是小概率反证法思想。

小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。

反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设成立。

[2] 假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。

设A是关于总体分布的一项命题,所有使命题A成立的总体分布构成一个集合h0,称为原假设(常简称假设)。

使命题A不成立的所有总体分布构成另一个集合h1,称为备择假设。

如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数统计)。

如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设。

对一个假设h0进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题A正确),还是拒绝它(否认命题A正确)。

假设检验

假设检验

产品检验: ■全数检验 ■抽样检验
能最真实、完整的反映所有产品的特性结果 GB/T2828.1-2003 存在抽样误差
总体与样本
判断
总体
随机抽取
样本
测量
数据
根据样本的信息推断总体
2. 假设检验的基本原理:小概率反证法 小概率原理:指小概率事件(通常概率 α≤0.05称为“小概率事件)在一次试 验中基本不会发生,反证法思想是先提 出某项假设(H0 ),用统计方法确定假 设的可能性(即检验假设是否正确): 可能性小,即假设不成立,应拒绝原假 设;如果可能性大,则接受假设,则假 设成立。
⑹根据显著性水平α 及统计量、样本自由 度查概率分布表。获取在此显著性水平α 下的置信区间,即临界值。 双侧检验:根据α/2或(1-α/2)确定临界值 单侧检验:根据α或(1 -α) 确定临界值
⑺做出判断:将计算出的统计量与查表得 出的临界值进行比较,作出拒绝或接受H0 的判断。
五、应用实例
1.单个正态总体的均值检验——t 检验
s12 0.0955 F 2 3.66 s2 0.0261 计算统计量:
n1=8,则样本的自由度 1 n1 1 7 n2=9,则样本的自由度 2 n2 1 8 α =0.05,查F检验临界值(F2)表,P(F >F2)= α 得到:F0.05(7、8)= 3.50 F在拒绝域内 结论:原假设H0不成立,即甲机床的精度比乙机床低。
因此,可用计算确定均值µ及1—α 置信区间的 方法来检验上述假设是否成立。 如果计算出来的置信区间包括µ 0 ,则接受H0 ; 如果计算出来的置信区间不包括µ 0 ,则拒绝H0
三、假设检验类型
• 参数假设:总体分布类型已知,对未知参数 的统计假设。检验参数假设问题称为参数假 设检验。当总体分布类型为正态分布时,则 为正态总体参数检验。 • 非参数假设:总体分布类型不明确,对参数 的各种统计假设。检验非参数假设问题称为 非参数假设检验,也称分布检验。参数假设 检验和非正态总体参数检验都比较复杂,在 QC小组活动中很少应用。

假设检验的八种情况的公式

假设检验的八种情况的公式

假设检验的八种情况的公式假设检验是统计学中常用的一种方法,用于判断样本数据与总体参数的关系是否具有显著性差异。

在进行假设检验时,我们需要根据实际问题和已知条件确定相应的假设检验公式。

以下是八种常见的假设检验情况及相应的公式。

1.单样本均值检验:在这种情况下,研究者想要判断一个样本的均值是否与一个已知的总体均值有显著性差异。

假设检验的公式为:其中,x̄为样本均值,μ为总体均值,s为样本标准差,n为样本容量,t为t分布的临界值。

2.双样本均值检验(方差已知):在这种情况下,研究者想要判断两个样本的均值是否有显著性差异,且已知两个样本的方差相等。

假设检验的公式为:其中,x̄1和x̄2分别为样本1和样本2的均值,μ1和μ2分别为总体1和总体2的均值,s为样本标准差,n1和n2分别为样本1和样本2的容量,z为标准正态分布的临界值。

3.双样本均值检验(方差未知):在这种情况下,研究者想要判断两个样本的均值是否有显著性差异,且两个样本的方差未知且不相等。

假设检验的公式为:其中,x̄1和x̄2分别为样本1和样本2的均值,μ1和μ2分别为总体1和总体2的均值,s1和s2分别为样本1和样本2的标准差,n1和n2分别为样本1和样本2的容量,t为t分布的临界值。

4.单样本比例检验:在这种情况下,研究者想要判断一个样本的比例是否与一个已知的总体比例有显著性差异。

假设检验的公式为:其中,p̄为样本比例,p为总体比例,n为样本容量,z为标准正态分布的临界值。

5.双样本比例检验:在这种情况下,研究者想要判断两个样本的比例是否有显著性差异。

假设检验的公式为:其中,p̄1和p̄2分别为样本1和样本2的比例,p1和p2分别为总体1和总体2的比例,n1和n2分别为样本1和样本2的容量,z为标准正态分布的临界值。

6.简单线性回归检验:在这种情况下,研究者想要判断自变量与因变量之间的线性关系是否显著。

假设检验的公式为:其中,β1为回归系数,se(β1)为标准误差,t为t分布的临界值。

假设检验

假设检验

第十章假设检验第一节假设检验的基本问题一、假设与假设检验1.假设检验的意义从样本的差异推论总体差异的过程,就是假设检验。

一个研究的概括程度越高,可推论的范围就越大。

2.虚无假设H0在推论研究假设之前所提出来的与研究假设相反的假设,这一假设是不存在的,故称之为虚无假设。

一般虚无假设都假设两个总体之间没有差异。

3.研究假设H1研究中所要证明的假设,称为科学假设、对立假设。

一般为假设两个总体参数之间有差异。

二、检验中的两类错误1、α错误:(1)概念:又称为显著性水平,I型错误,是指在否定虚无假设、接受对立假设时所犯的错误,即是将属于没有差异的总体推论为有差异的总体时,所犯的错误。

(2)α错误的确定原则:α错误的概率一般根据统计学原则,规定为5%-1%。

2.β错误:β错误是指在接受H0 为真时所犯的错误,在接受H0 为真,而拒绝H1时,势比有一部分属于H1总体的部分样本,被视为H0 的部分,而被否定在H1之外。

(3)α错误和β错误的关系:α错误和β错误是在两个前提下的概率。

两个总体的关系若是确定的,则α增大,β减小;α减小,β增大;二者相反。

三、单侧检验和双侧检验1、单测检验(1)概念:查统计表时,按分布的一侧计算显著性水平概率的检验,称作单侧检验。

(2)应用条件:凡是检验大于、小于、高于、低于、优于、劣于等有确定性大小关系的假设检验问题。

这类问题的确定是有一定的理论依据的。

假设检验写作H1:μ1<μ2 或μ1>μ2。

2.双侧检验(1)概念:查统计表时,按分布的两端计算显著性水平概率的检验,称作双侧检验。

(2)应用条件:凡是理论上不能确定两个总体一个一定比另一个大或小的假设检验。

一般写作H1:μ1≠μ2。

第二节平均数差异显著性检验一、平均数显著性检验(一)概念:是指研究样本的总体与已知总体μ0差异是否显著的假设检验。

(二)原理:总体分布正态分布或接近正态分布的样本平均数的分布为正态分布或t分布,按分布率进行推论。

假设检验

假设检验
备择假设H1: ≠3190(克)
例2:某种零件的尺寸,要求其平均长度为4厘米,大于或小于4 厘米均属于不合格。该企业生产的零件平均长度是4厘米吗?

提出原假设 H0: = 4厘米
提出备择假设 H1: 4厘米
单边检验
例1:某灯泡制造商声称,该企业所生产的灯泡的平均使用 寿命在1000小时以上。该批产品的平均使用寿命超过1000小 时吗?

x 0 t ~ t (n 1) s n
正态总体、方差未知、小样本情况下,样本统计量的抽样分布
t
正态 分布
X S n
~ t (n 1)
正态分布 t (df = 13) t (df = 5)
t 分布
Z
X
t 分布与正态分布的比较
不同自由度的t分布
t
总体均值的检验—— t 检验(双边)


提出原假设H0: 1000 选择备择假设 H1: < 1000
例2:学生中通宵上网的人数超过25%吗?

提出原假设H0: 25%

选择备择假设 H1: 25%
例3:消费者协会接到消费者投诉,指控某品牌纸包装饮料 容量不足,有欺骗消费者之嫌。消费者协会从市场上随机抽 取50盒该品牌纸包装饮品,包装上标明的容量为250毫升, 但测试发现平均含量为248毫升,小于250毫升。这是生产中 正常的波动,还是厂商的有意行为?消费者协会能否根据该 样本数据,判定饮料厂商欺骗了消费者呢?
2 2
Z 1.96
2
决策准则
当 Z Z ,即Z Z 或Z Z 时 拒绝H 0
2 2 2
当 Z Z ,即 Z Z Z 时 接受H 0

假设检验

假设检验

四 假设检验一 基本内容1.假设检验对总体分布或分布中的某些参数作出假设,然后利用样本的观测值所提供的信息,检验这种假设是否成立,这一统计推断过程,称为假设检验。

(1) 待检验假设或零假设记为0H ,正在被检验的与0H 相对立的假设1H 称为备选假设或对立假设。

(2) 假设检验的依据——小概率原理:小概率事件在一次试验中实际上不会发生。

(3) 假设检验的思路是概率性质的反证法。

即首先假设成立,然后根据一次抽样所得的样本值得信息,若导致小概率事件发生,则拒绝原假设,否则接受原假设。

(4) 假设检验可能犯的两类错误:① 第一类错误(弃真错误):即假设0H 为真而被拒绝,记为α,即00{|}P H H α=拒绝为真。

② 第二类错误(存伪错误):假设0H 不真而被接受,记为β,即00{|}P H H β=接受不真。

③ 当样本容量n 一定时,,αβ不可能同时减少,在实际工作中总是控制α适当的小。

2.假设检验的程序对任何实际问题进行假设检验,其程序一般为五步,即: ⑴ 根据题意提出零假设0H (或相应备选假设1H )。

⑵构造样本统计量并确定其分布;⑶给定显著性水平α,查表确定临界值,从而得出接受域和拒绝域; ⑷由样本观测值计算出统计量的值;⑸作出判断:若统计量的值落入拒绝域则拒绝0H ,若统计量的值落入接受域则接受0H 。

3.假设检验的主要方法Z 检验法、t 检验法、2λ检验法、F 检验法。

4.关于一个正态总体的假设检验⑴2200(,),H X N μδδμμ 已知,检验假设:=Z 检验法:①001000H H μμμμμμμμ≠><:= (:或或)②统计量0(0,1)()Z N H -=成立时。

③给出1122{}P Z ZZαααα--<=,,查正表定④ 由样本值12n x x x (,,,) 计算Z 的值 ⑤ 判断:若1122Z ZZαα--∈∞∈∞0(-,-)或Z (-,+),则拒绝H(这是对双侧检验提出的Z 检验法步骤,若是单侧可仿比) (2)2200(,),H X N μδδμμ 未知,检验假设:=t 检验法:①001000H H μμμμμμμμ≠><:= (:或或)②0(1)()t t n H -=- 成立时。

假设检验

假设检验


2


2 0

2 0
H0:
,H1:

其中
为已知常数.检验统计量
T
1


2 0
n
(Xi )2
i 1
~ 2 (n) .
对于给定的显著性水平 ,拒绝域为
t 12 / 2 (n) 或
t


2
/
2
(n)

上述检验的统计量服从 2 分布,称此种检
验为 2 检验,类似地可以进行单边检验(见表
一、方差已知时,两个正态总体均值差的假设检验—u 检验


2 1
,

2 2
为已知,要检验的假设为
也可以写成
H0:1 2 ,H1:1 2 ,
H0:1 2 0 ,H1:1 2 0 .
检验统计量为
u X Y ~ N (0, 1) .

2 1


2 2
mn
对于给定的显著性水平 , 查表得 u / 2, 使得
t 12 / 2 (n 1) 或 t 2 / 2 (n 1) .
这里
2 1
/
2
(n

1)


2 0.95
(4)

0.711
,
2 /2
(n
1)

2 0.05
(4)

9.488
,
x =1.414,s 2 =0.00778,
t

(5
1) 0.00778 0.0482
例2 某车间加工一种零件,要求长度为150mm, 今从一批加工后的这种零件中抽取 9 个,测得长度如 下:

假设检验

假设检验

σ 22
n2
例:已知同年龄组男生50米跑成绩服从正态分 布。根据以往的资料得知A、B两校男生50 米跑成绩的标准差分别为0.4秒和0.2秒。今 从两校中分别抽测了25名和28名男生,其 50米跑平均成绩分别为8.1秒和7.9秒。问两 校男生50米跑水平是否相同?
练习: 练习 已知甲地某 年龄组男生身 高的 标准差为
西班牙队的比赛中发动93次进攻,成功率为53.8﹪。
是否可以认为该场比赛的进攻成功率高于以往?
练习:某排球队根据近期大量资料统计出比赛扣 球成功率为30%。该队今年参加排球联赛 6场,共扣球326次,成功112次,问今年 扣球成功率是否比以前有提高?
二、两样本率的差异显著性检验(π1=π2) 两样本率的差异显著性检验(
一、样本率与总体率差异显著性检验( P =π) 样本率与总体率差异显著性检验( ) 已知总体率为πo ,样本率为 P。要检验样本率P 所 属总体率π与已知总体率πo是否相同,当 n>30,且 n P>5,统计量为u =p −π π o (1 − π o ) n
例:中国男篮进攻成功率为46.3﹪,第12届世锦赛与
未知, (三)两总体为正态分布,σ1 、σ2 未知,且为小样本的假设检验 两总体为正态分布
当两总体服从正态分布, σ1 、σ2未知,但σ12 = σ22 (方差齐性,即方差间差异不具显著性),n1、 n2均小于 30,则统计量为
t= x1 − x2 (n1 − 1) S1 + (n2 − 1) S 2 1 1 ( + ) n1 + n2 − 2 n1 n2
例: 已知某县14岁女生50米跑成绩服从正态分布, 且 µ o = 8 .8 s。现从某中学随机抽取29名同龄女生 测验50米跑,其成绩 , = 8.5s x

假设检验

假设检验

一.基本概念:(1)对总体参数的数值所作的陈述,称为统计假设。

(2)对总体参数的数值提出某种假设,然后利用样本所提供的信息检验假设是否成立的过程,称为假设检验。

(3)通常将研究者想收集证据予以支持的假设称为备(选)择假设,记作Hα或H1。

(4)通常将研究者想收集证据予以反对的假设称为原假设,或零假设,用H0表示。

(5)能够作出拒绝原假设这一结论的所有可能样本取值范围,称为拒绝域。

(6)根据样本数据计算出来的,并据以对原假设和备择假设作出决策的某种统计量,称为检验统计量。

(7)当原假设为真时拒绝原假设,称所犯错误为第一类错误,犯第一类错误的概率通常记为α。

(8)当原假设为假时没有拒绝原假设,称为所犯错误为第二类错误,犯第二类错误的概率通常记为β。

(9)假设检验中犯第一类错误的概率,称为显著性水平,通常用α表示。

二.确定检验类型:观察备择假设的符号:如果是“<”就是左侧检验(原假设的拒绝域在左边);如果是“>”就是右侧检验(原假设的拒绝域在右边);如果是“≠”就是双侧检验(原假设的拒绝域在两侧)。

三.常见数值:1. α=0.1(置信水平是90%)(1)左侧检验:Z=-1.28(2)右侧检验:Z=1.28(3)双侧检验(区间估计):Z=+1.645 Z=-1.6452. α=0.05(置信水平是95%)(1)左侧检验:Z=-1.645(2)右侧检验:Z=1.645(3)双侧检验(区间估计):Z=+1.96 Z=-1.963. α=0.01(置信水平是99%)(1)左侧检验:Z=-2.33(2)右侧检验:Z=2.33(3)双侧检验(区间估计):Z=+2.58 Z=-2.58四.计算时采用的分布:(1)均值检验:阅读题目,看看是大样本还是小样本(30)。

如果是大样本,就用标准正态分布分位数表;如果是小样本,再看总体方差是否已知,如果知道,仍然用标准正态分布分位数表;如果是小样本,而且总体方差还不知道,就用t分布临界值表。

假设检验

假设检验

H 0 : X = X 0; H1 : X ≠ X
0
或 H 0 : P = P0 ; H 1 : P ≠ P0
2.单侧检验:如果不仅仅检验样本平均数( 2.单侧检验:如果不仅仅检验样本平均数(或成 单侧检验 和总体平均数(或成数)有没有显著的差异, 数)和总体平均数(或成数)有没有显著的差异, 而且追究是否发生预先指定方向的差异( 而且追究是否发生预先指定方向的差异(正差 异或负差异),则原假设取不等式形式, ),则原假设取不等式形式 异或负差异),则原假设取不等式形式,如:
其次,确定显著性水平。 其次,确定显著性水平。 我们所以拒绝原假设, 我们所以拒绝原假设,并不是因为它存在逻辑的 绝对矛盾,或实际上不可能存在这种假设, 绝对矛盾,或实际上不可能存在这种假设,而仅 仅因为它存在的可能性很小。 仅因为它存在的可能性很小。根据小概率事件原 理,概率很小的事件在一次试验中几乎是不会发 生的。 生的。如果根据原假设的条件正确计算出某一结 果发生的概率很小, 果发生的概率很小,理应在一次试验中不至于发 然而在一次试验中事实上又发生了, 生,然而在一次试验中事实上又发生了,则我们 认为原假设不正确,而拒绝接受。 认为原假设不正确,而拒绝接受。 进行假设检验时应该事先规定一个小概率的标 作为判断的界限, 准,作为判断的界限,这个小概率标准称为显 著性水平。 著性水平。
(一)设立假设 首先提出原假设,记为H 首先提出原假设,记为H0,原假设总是假定 总体没有显著性差异, 总体没有显著性差异,所有差异都是由随机 原因引起的。所以这种假设又称无效假设。 原因引起的。所以这种假设又称无效假设。 其次提出备择假设,记为H 其次提出备择假设,记为H1,如果原假设被 拒绝等于接受了备择假设, 拒绝等于接受了备择假设,所以备择假设也 就是原假设的对立事件。 就是原假设的对立事件。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

假设检验初步准备再尝试一下,用大白话叙述一遍统计推断中最基础的东西(假设检验、P值、……),算是把这段时间的阅读和思考做个梳理(东西不难,思考侧重在如何表述和展示)。

这次打算用一种“迂回的”表达方式,比如,本文从我们的日常逻辑推理开始说起。

0.普通逻辑复习一下普通逻辑的基本思路。

假设以下陈述为真:你打了某种疫苗P,就不会得某种流行病Q。

我们把这个先决条件表述如下:如果P则非Q其中,P表示打了疫苗P,Q表示得流行病Q或者,更形式化一点:if P then NOT Q然后,如果观察到你得了流行病Q,那么就可以推出你没有打疫苗P——这个推断只不过是上述前提条件的逆反命题而已。

我们把以上推理过程表述如下:if P then NOT Q (先决条件)Q (前提)———————–then NOT P (结论)还有,如果你没有得流行病Q,就能推断出你打了疫苗P吗?显然不能。

打疫苗P是不得流行病Q的充分条件,但非必要条件:你没有得流行病Q,可能是因为打了疫苗P,也可以是因为其他任何原因。

即,if P then NOT Q,不能够推出if NOT Q then P。

到此为止没有任何令人惊奇的地方。

下面将表明,假设检验背后的统计推断规则也只不过是我们以上日常逻辑推理的一个衍生而已。

这只需要思维的一次小小的“跳跃”。

1.假设检验在统计推断中,我们不说“你打了疫苗P,就不会得流行病Q”,而是说,比如,“你打了疫苗P,就有95%的把握不会得流行病Q”,即if P then probably NOT Q。

把上面的逻辑推理规则改写成统计推断规则:if P then probably NOT Q (先决条件)Q(前提)———————–then probably NOT P (结论)回到以前“万能”的硬币实验,我们做实验来考察一枚硬币是不是均匀的。

改写成现在我们熟悉的形式:P:硬币是均匀的。

Q:在100次投掷中,得到90次正面,10次反面。

我们说,如果是一个均匀的硬币,就不太可能发生这样的情形:投100次,出现90次正面,10次反面(if P then probably NOT Q)。

现在如果在100次投掷实验中,观察到出现90次正面,10次反面(Q),那就可以有把握地说,这个硬币不是均匀的(NOT P)。

这个推理可以写成与上面一致的统计推断的形式,其中,P是原假设H0,NOT P是备择假设Ha:H0:硬币是均匀的(P)Ha:硬币是有偏的(NOT P)如果原假设为真,即硬币是均匀的,就不太可能发生这样极端的事情,比如:在100次投掷实验中,观察到出现90次正面,10次反面(Q)。

如果真的观察到这样极端的事情,你就有把握认为硬币不是均匀的,即拒绝原假设(P),接受备择假设(NOT P)。

另外,如果在100次投掷实验中,观察到60个正面,40个反面(NOT Q)。

这时你就不好下结论了,因为一个均匀的硬币可能投出这样的结果,一个有偏的硬币也可能投出这样的结果。

最后,你只能说,如果实验结果是这样的,那就没有把握拒绝原假设。

这枚硬币是否有偏,需要更多的证据来证明(这通常意味着更多的实验,比如,再投1000次)。

总结一下。

在搜集数据之前,我们把想证明的结论写成备择假设,把想拒绝的结论写成原假设。

之所以写成这个形式,因为从上面不厌其烦的讨论中得知,这是方便逻辑/统计推断的形式:当我们难以拒绝原假设时,只能得到结论,原假设也许是真的,现在还不能拒绝它;而当我们能够拒绝原假设时,结论是:它就很有把握是不真的。

注意,在看到数据之前,我们不知道自己想证明的结论是否能够被证据所支持。

在确定假设检验的形式的同时,我们对之前一直随意说的“把握”、“可能”也做一个限定,即指定一个显著性水平α(significance level),也叫犯第一类错误的概率(type I error,在上面的硬币实验中,就是否定一个均匀硬币的错误,也叫“弃真”错误)。

根据某些保守或稳健的原则(比如,我们认为,把一个无辜的人判决为有罪,比放掉一个有罪的人,后果更为严重),我们要尽量把犯“弃真”错误的概率控制在一个很小的水平里。

通常α=0.05,这时候就是说,如果拒绝了原假设,你就有95%的把握说原假设是不真的。

这里,95%(=1-α)就是置信水平(confidence level)。

又,放掉一个有罪的人,即把一个有罪的人判为无罪,这犯的是第二类错误β(type II error,在硬币实验中,就是把一个有偏的硬币当成均匀硬币的错误,也叫“取伪”错误)。

关于第一类和第二类错误之间的权衡取舍(trade off),详见《决策与风险》。

在我们的假设检验里,我们认为犯一类错误的后果比犯第二类错误的后果更为严重。

需要注意的是,在这里,我强调的是先提出需要检验的假设,然后再搜集收据。

这是统计推断的原则之一。

如果看到了数据之后再提出假设,你几乎可以得到所有你想要的结果,这是不好的机会主义的倾向。

强调这些,是因为在学校里,我们大多是看了别人搜集好的数据之后再做统计练习。

事先确定好你想拒绝/证明的假设,在看到数据之前,你不知道结果如何。

2.P值(P Value)上面提到“极端”事件,比如,在100次硬币投掷实验中,观察到出现90次正面,10次反面(Q)。

怎么样的事件才是“极端的”?简单地说,一个事件很极端,那么少比它本身“更极端”的事件就非常少(比如,只有“91次正面,9次反面”、“91次反面,9次正面”等情况才比它更极端)。

但这个Q只是从一次实验中得出的。

我们可以重复做这个实验,比如100次,每次都投掷100次,记录下的正面数X,它构成一个二项分布,X~B(n,p),其中,n=100,p=0.5。

根据某个中心极限定理,正态分布是二项分布的极限分布,上面的二项分布可以由均值为np=50,方差为np(1-p)=25的正态分布来近似。

我们在这个近似的正态分布的两端来考察所谓“更极端”的事件,那就是正面数大于90或者小于10。

重复一遍,“P值就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率”。

如果P值很小,就表明,在原假设为真的情况下出现的那个分布里面,只有很小的部分,比出现的这个事件(比如,Q)更为极端。

没多少事件比Q更极端,那就很有把握说原假设不对了。

在上述近似的正态分布中,P值就等于X>90 或 X<10的概率值(记做,P{X>90 or X<10})。

根据对称性,这个概率值等于2*P{X<10}=1.2442E-15。

上面我们的确求出了一个非常小的P值,但如何不含糊地确定它就是很“极端”呢?事先确定的显著性水平α,本身就是一个判定法则。

只要P值小于显著性水平α,我们就认为,在认为原假设为真的情况下出现的事件Q,是如此地极端,以至于我们不再相信原假设本身。

一句话,我们的判定法则是:P值小于显著性水平α,拒绝原假设。

3.一个手算示例用一个双侧的单样本T检验做例子。

假设我们想知道,螃蟹的平均温度,跟空气的温度(24.3)有没有统计差别(α=0.05)。

事先确定的假设检验的形式表达如下:零假设(H0):μ=24.3°C备择假设(Ha): μ≠24.3°C以下是25只螃蟹在温度为24.3°C下的体温(单位:°C):25.8 24.6 26.1 22.9 25.127.3 24 24.5 23.9 26.224.3 24.6 23.3 25.5 28.124.8 23.5 26.3 25.4 25.523.9 27 24.8 22.9 25.4一些基本的算术结果:样本均值:X¯=25.3样本量:n=25样本方差:s2 =1.8样本均值的标准误差:s(X¯)=s2/n−−−−√=0.27这里T检验的思路如下:1.我们先假设H0为真,即认为螃蟹的平均温度跟空气温度没有差异(P),μ=24.3°C。

有一个极端事件Q,如果原假设H0成立,Q就不成立(if H0 then probably NOT Q);但如果在原假设为真的情况下,出现了这么一个Q,那我们就有把握拒绝原假设。

2.样本均值:X¯是总体均值μ的最好的估计,在本例中,X¯=25.03。

3.这个样本均值只是一个估计值。

它只是从总体的一个随机样本中得到的(样本是上述25只螃蟹)。

我们不知道这次实验结果是不是“极端”事件。

而判断一个事件是不是极端事件,根据第二节的讨论,我们可以重复做上述实验,比如100次,每次都抓25只螃蟹,都在空气温度24.3的状态下测量其体温,然后也各自求出一个样本均值来。

4.容易得出,这种实验出来样本均值,辅以适当的数学形式,就服从一个自由度为24(=25-1)的t分布,即(X¯−μ)/s(X¯)∼t(24)。

5.样本均值X¯=25.03,在这个自由度为24的t分布下,有一个对应的t值,t=25.03-24.3/0.27=2.704。

现在我们可以在整个分布里考察这个t值。

在这个自由度为24的t分布里,我们看 t=2.704是不是一个“极端”事件Q。

根据对称性,比Q更极端的是那些大于2.704或者小于-2.704的点。

从上图可以看到,在这个t分布里,比t=2.704更“极端”的点占整个分布的0.0124。

这个0.0124就是我们要求的P值。

这个P值小于我们事先选定的显著性水平α=0.05,因此我们可以拒绝原假设,认为这批螃蟹的平均体温不等于空气温度。

这个双侧P值可以手算如下:在SAS里,P=2*(1-probt(t,df))=2*(1-probt(2.704,24))=0.012392 在R里, P=2*(1-pt(t,df))=2*(1-pt(2.704,24))=0.012392———-以上是用P值作为判定条件。

一个等价的做法是用临界值来判断。

我们事先给定的显著性水平α=0.05,在这个自由度为24的t分布里,就对应着一个临界t值2.064。

下图的阴影部分,也称作拒绝区域。

上面求出的跟样本均值X¯=25.03对应的t值=2.704,处在这个拒绝区域内(2.704>2.064),于是我们一样拒绝原假设。

又,上述临界值可以手算(或查表)如下:在SAS里,tCritic=tinv(1-alpha/tail,df)=2.06390其中,alpha=0.05,tail=2表示双侧检验,df=24.在R里,tCritic=qt(1-alpha/tail,df)=2.0638994.注本文是对近期阅读做的一个笔记。

作为一个非统计科班出身的程序员,我一直在思考,如何来理解统计概念,以及如何把自己的理解向同行传达。

相关文档
最新文档