剖析假设检验的两类错误并举例说明
假设检验的错误分析
假设检验的错误分析苏新富【摘要】假设检验中有两种不同检验方法,即原假设和备择假设,而应用不同的方法经常会得到不同的结论。
较好的结果是在第一类错误相同的条件下,犯第二类错误小的方法得到的结论。
指出在比较第二类错误的大小过程中常见的错误及其产生的原因,并给出在实际应用中选取原假设的原则% Therearetwodifferentinspection methodsinhypothesistest.Theyaretheprimary hypothesisandalternativehypothesis.Weoftengetdifferentconclusionsintheu seofdifferentmethods. Thegoodresultisthatthesecondtypeoferrorissmallerwhenthefirsttypeoferrori sinthesame conditions.Theauthorpointsoutthecommon mistakesandthecauseoftheerrorincomparisonofthe secondtypeoferror.Meanwhiletheauthoralsopointsouttheprincipleofchoosi ngprimaryhypothesisin thepracticalapplication.【期刊名称】《辽宁师专学报(自然科学版)》【年(卷),期】2012(000)002【总页数】2页(P7-8)【关键词】单侧假设检验;原假设;备择假设;第二类错误【作者】苏新富【作者单位】锦州师专,辽宁锦州121000【正文语种】中文【中图分类】O21假设检验是数理统计中的一种重要方法,该方法已经在各领域得到广泛应用.在单侧检验中,对于同一问题有两种不同检验方法,即原假设和备择假设,而应用不同的方法经常会得到不同的结论.人们总是希望在第一类错误相同的条件下,选取犯第二类错误小的方法的结论.此时,我们经常会比较它们第二类错误的大小.在比较过程中有一种常见的错误,现对这一问题作深入探讨.1 同一问题,两种方法例某工厂生产的某种元件,其寿命不小于1 000小时才算合格,现从这批元件中抽取25个,测得其平均寿命为980小时,已知元件寿命X~N(μ,1002),试在α=0.05之下判断这批元件是否合格?分析:本题是假设检验中的单侧检验问题,应用统计量方法一,H0:μ=μ0≥1000,H1:μ=μ1<1000,此时U=-1>-λ1-α=-1.65,因此接受原假设,认为元件合格.方法二,H0:μ=μ0≤1000,H1:μ=μ1>1000,此时U=-1<λ1-α=1.65,因此接受原假设,认为元件不合格.对于同一问题,应用同一统计量,两种方法出现了“相反”的结论,我们应相信哪个结论呢?能不能比较它们第二类错误的大小呢?2 常见的错误及其探讨假设检验的基本思想是根据小概率原理,即小概率事件在一次实验中几乎不可能发生而作出推断的一种“反证法”.由于样本存在随机性,因此有可能会出现误判,导致犯两类错误[1].第一类错误,当原假设H0为真时,却错误拒绝它,于是犯了弃真的错误.犯第一类错误的概率记为:P(拒绝H0|H1为真)=α,也称α为显著性水平.第二类错误,当原假设H0不真(即H1为真)时,却错误地接受了它,于是犯了取伪的错误.犯第二类错误的概率记为:P(接受H0|H1为真)=β.以上两种方法的第一类错误为α=0.05,下面计算犯第二类错误的概率的大小.方法一:方法二:比较(1),(2)两式,由分布函数的单调性,似乎可以立刻得出β2>β1且β2>1-α=0.95的结论,从而认为方法一的结论更可靠.通过以上分析可知,总体参数的真实值越接近假设检验中用到的特定值,犯第二类错误的概率就越大,但不会超过1-α;总体参数的真实值与假设检验中用到的特定值的差距越大,犯第二类错误的概率就越小.由于总体参数的真实值未知,所以无法比较以上两种方法第二类错误的大小.分析(3),(4)式知,由于μ1未知,当固定n时,同时减小两类错误是不可能的,增加样本容量n是同时减小两类错误的必要条件.那么,应如何解决两个结论的“矛盾”呢?其实它们并不矛盾.严格来讲,方法一的结论应该是还没有95%的把握认为该元件不合格,方法二的结论应该是还没有95%的把握认为该元件合格.在实际问题中,在判定这批元件合格与否时就要借鉴过去的经验和已掌握信息,如果该种元件的质量过去一直很好,由方法一,我们没有找到否定它的充分理由(95%的把握),我们就应该判定这批元件合格.相反,如果该种元件的质量过去一直不好,最近也没有采取改进的措施,由方法二,若没有找到肯定它的充分理由(95%的把握),我们就应该判定这批元件不合格.3 选取原假设的原则既然很难通过比较犯第二类错误的概率的大小来确定原假设,那么可具体通过以下原则选取原假设:(1)保护原假设原则.原假设应该是过去经验和已掌握信息的总结,是一个需要保护的假设,没有充分的理由(一般为1-α的把握)就不能轻易否定它.(2)利己原则.假设检验是为我们的实践目的服务的,这就不可避免地带有一种主观色彩.(3)根据样本信息确定原假设.(4)把希望验证得到的结论放在备择假设的位置.如果试验推翻了原假设,我们就有1-α的把握肯定备择假设的正确性.(5)把后果严重的错误设置为第一类错误.以上就是假设检验中选择原假设时行之有效的原则,在实际应用中可以参照使用.【相关文献】[1]叶慈南,曹伟丽.应用概率统计[M].北京:机械工业出版社,2004.102-114.。
3[1].1假设检验初述,二类错误
第三章 假设检验3.1 假设检验 两类错误(1)假设检验(hypothesis test ) 假设检验是统计推断的另一类重要问题,是概率意义下的一种反证法。
一般,当母体X 的分布完全未知,或只知其形式而不知其参数时,为推断母体的有关特性,提出针对母体的某项假设;再对母体进行抽样,依据子样值对所提假设做出接受或拒绝的决策。
(2)决策依据——实际推断原理 小概率事件在一次试验中几乎不发生。
若抽样结果是小概率事件在这一次试验中发生了,就有理由怀疑假设的正确性,从而做出拒绝原假设的决策;否则接受原假设。
例 3.1.1 某饮料厂在自动流水线上装饮料,每瓶的重量(单位:克))10,(~2μN X ,正常生产情况下500=μ,一段时间后,为检查机器工作是否正常,抽取9个样品,称重后算得494=x ,试问:此时自动流水线的工作是否正常?解:①提出假设母体)10,(~2μN X ,其中μ未知,在母体上作原假设0H 和备择假设(或称对立假设)1H 如下:↔==500:00μμH 500:01=≠μμH ②构造检验统计量X ∴的值应与μ很接近,想到用X 的值来检验原假设0H .当原假设成立时,10),,(~0200=σσμN X ,故),(~200n N X σμ,从而)1,0(~/10500/000N n X n X U H -=-=σμ(3-1)③给定小概率,找出拒绝域取小概率02.0=α,则有2αu 使}{2αα=≥u U P (3-2)}{2αu U ≥是一个小概率事件,如果一次抽样的结果是这一小概率事件发生了,则认为原假设不合理,应予拒绝。
即应取拒绝域}),,,{(221αu U x x x W n ≥= }),,,{(221ασμu n X x x x n ≥-= (3-3)④做出决策 这时,494=x ,5000=μ,9,100==n σ,8.1=∴U ;02.0=α,33.201.02==u u α,故2αu U <,∴应接受0H ,即认为机器工作正常.注:①假设检验又称为差异显著性检验;②假设检验是具有概率性质的反证法;③拒绝H的说服力强,接受0H的说服力不强;④α越小,拒绝H的说服力越强。
t检验两类错误
(1) 建立假设:H0:0, H1:≠0, (2) 检验水准: 0.05 (3) x 0 x 0 74.2 72.0
t sx s/ n 6.5 / 25
1.692
(4)自由度df=25-1=24,查t界值表,得t0.05(24) = 2.064,t = 1.692<2.064 , 则 P>0.05 , 按 0.05 检验水准,不拒绝H0,尚不能认为该山
7.5
9.0 15.0 13.0 10.5
6.5
5.5 8.0 6.5 9.5
1.0
3.5 7.0 6.5 1.0 39 (d)
1.00
12.25 49.00 42.25 1.00 195 ( d 2 )
1. 建立假设:H0:d=0,
H1:d0,0.05 。
d为治疗前后差值的总体均数。
例:将29名钩端螺旋体病人的血清随机分 成两组,分别用标准株或水生株作凝集 试验,测得稀释倍数如下,问两组的平 均效价有无差别?
X1:标准株(11人)100,200,400,400,400, 800,1600,1600,1600,3200
X2:水生株(9人)100,100,100,200,200, 200,200,400,400
要求两组方差齐同
[例3]某克山病区测11例克山病患者与13 名健康人的血磷值(nmol/L)如下,问该 地急性克山病患者与健康人的血磷值是 否有差别?
患者 健康 人
0.84
1.05
1.20
1.20
1.39 0.76 1.56
1.53 0.81 1.87
1.67 1.16
1.80 0.54 1.20
t 检验
样本均数与总体均 数的比较--单个样本t检验
假设检验中两类错误分析与实验
本 质 . 文 拟 通 过 理 论 推 导 并 结 合 图 形 分 析 , 出犯 两 类 错 误 的 概 率 、 以及 样 本 数 量 n之 间 的 数 量 关 系 表 达 式 , 设 计 显 本 给 卢 并 著性 检 验 的 数 值 实 验 对 本 文 给 出 的 理 论 公 式 加 以验 证 .
1 两 类 错 误 分 析
两类 错 误 的 分 类 见 表 1 犯 “ 真 ” 误 的 前 提 条 件 是 . 弃 错
为 真 , “ 伪 ” 误 的 前 提 条 件 是 犯 取 错
为 假 , 于 犯 两 类 错 误 的 由
前 提 条件 不 同 , 犯 “ 真 ” 误 与 “ 伪 ” 误 不 是 对 立 事 件 , 故 弃 错 取 错 因而 , 一 般 情 况 下 十 在 卢≠1 关 于 犯 “ 伪 ” 误 的概 率 卢的 计 . 取 错 算 问题 , 以及 犯 两 类 错 误 的 概 率 n与 口 以及 样 本 数 量 n之 间 的数 量 关 系 问 题 , 较 复 杂 , 要 知 道 总 体 的 分 布 及 其 相 关 参 数. 比 需
策 , 类 错 误 称 为 “ 真 ” 误 , 发 生 的概 率 通 常 用 表 示 ( 即显 著 性 水 平 ) 另 一 类 是 在 原 假 设 为 假 时 没 有 拒 绝 原 假 设 , 这 弃 错 其 也 ; 这 类 错 误 称 为 “ 伪 ” 误 , 发 生 的概 率 通 常 用 卢表 示 . 两 类 错 误 的概 率 、 以及 样 本 数 量 n之 间 具 有 什 么 样 的 数 量 关 系 ? 取 错 其 犯 卢 与 口的 和 等 于 1 ? 有 学 者 对 假设 检 验 中两 类 错 误 及 相 关 问 题 做 过 一 些研 究 吗 , 关 于犯 两类 错 误 的 概 率 、 以及 样 本 但 卢
概率统计20 假设检验可能产生的两类错误
小概率事件在一次试验中几乎不可能发生
假设检验可能产生的两类错误
第一类错误 弃真
原假设H0 本来是正确的,而小概率 事件发生了,于是否定了H0
引例: 完全有可能次品率的确满足 p ≤ 0.01(200件 产品中次品不超过2件),但仍然抽中了次 品:A 发生。
= P{ A | H0}: 犯第一类错误的概率
P( A |
Ai
)
C5 200i C5 200
i 0,1, 2
件 竟 然
P(
A)
P(
A
|
A2
)
C5 198
/
C5 200
0.95
发
生
P( A) 1 P( A) 0.05
了
假设检验的基本思想
“反证法”
为了检验一个“假设”是否成立,就先假定这 个“假设”成立,而看由此会产生的后果:
第二届四川高校青年教师教学竞赛
《概率统计 II》
假设检验可能产生的 两类错误
(Two Types of Errors in Hypothesis Testing)
2014年7月
姓名:
学校:
问题的提出
某厂有一批产品共200件,须检验合格才能 出厂。按国家标准,次品率不得超过0.01, 今从产品中任取5件,发现这5件中有次品, 问这批产品能否出厂?
假设检验可能产生的两类错误
第二类错误 纳伪
原假设H0 本来不真,而经检验,接受 了H0
引例: 完全有可能次品率p超过了 0.01(200件产 品中次品大于2件),但抽了5次都没抽到
次品:A 发生。
β :犯第二类错误的概率
显著性检验
假设检验的类型和两类错误
假设检验的类型和两类错误关键词:假设检验导语:作为质量改进的重要工具之一,假设检验是数理统计学中的一种统计推断方法,其根据一定假设条件,由样本推断总体,从而判断样本与样本、样本与总体的差异是由抽样误差引起的,还是本质差别造成的。
作为质量改进的重要工具之一,假设检验是数理统计学中的一种统计推断方法,其根据一定假设条件,由样本推断总体,从而判断样本与样本、样本与总体的差异是由抽样误差引起的,还是本质差别造成的。
假设检验的类型统计假设一般可分为参数假设与非参数假设。
参数假设是指总体分布类型已知,对未知参数的统计假设。
检验参数假设问题成为参数检验。
当总体分布类型为正态分布时,则为正态总体参数检验。
非参数假设是指总体分布类型不明确,对参数的各种统计假设。
检验非参数假设问题称为非参数检验,也称分布检验。
由于非参数检验和非正态分布总体的参数检验都比较复杂,在QC小姐活动中很少应用。
假设检验的两类错误在假设检验中,常将“小概率事件”的概率表示为α,称为显著性水平,把原先设定的假设称为原假设,记做H0,把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记做H1。
做出接受或拒绝原假H0的判断,都可能犯如下的两类错误:●Ⅰ类错误——弃真错误,发生的概率为α;●Ⅱ类错误——取伪错误,发生的概率为β,见下表。
假设健谈决策的两类错误检验决策H0为真H0非真拒绝H0犯Ⅰ类错误的概率为α正确接受H0正确犯Ⅱ类错误的概率为β样本均值的显著性水平为α时,则得到该样本置信度为1-α的置信区间。
如果,显著性水平为α,均值为μ时,原假设H0是均值μ=μ0.那么,与H0相反的假设,即备择假设H1就是均值μ≠μ0。
因此,我们可以用计算确定出均值μ的1-α置信区间的方法来检验上述假设是否成立。
如果计算出来的置信区间包含μ0,就接受H0;如果不包含就拒绝H0。
最后,值得注意的是,假设检验在判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。
假设检验
一般来说,样本容量一定时,若减少犯第一类错误 的概率,则犯第二类错误的概率则会增加,反之亦然 . 若要使两类错误都减小,除非增加样本容量。
三、 单边假设检验 双边假设检验
H 0 : 0 H1 : 0
单边假设检验 右边检验 H 0 : 0
H1 : 0 H1 : 0
X 0 k 0 P 0 n n
( x)
X k 0 P 0 n n
n
0 z
x
k 0 z / n
拒绝域为
k 0
n z
z
x 0
x 0 即 z z n
第三章
§3.1
假设检验
假设检验
假设检验的思想
假设检验的两类错误 单边假设检验
在总体的分布函数完全未知或只知其形式,但不知其 参数的情况下,为了推断总体的某些性质,提出某些 关于总体的论断或猜测,这就是假设。 假设检验就是根据样本对所提出的假设作出判断: 接受,还是拒绝。 假设检验 总体分布已知, 检验关于未知参数 的某个假设 总体分布未知时的 假设检验问题
2
则接受H0。
前例中,取 0.05 , 则有 k
z 2 z0.025 1.96 ,
x 0.511 ,
x 0 0 . 511 0 . 5 2.2 1.96 n 0.015 9
于是拒绝H0,认为这天包装机工作不正常。
基本概念:
原假设(零假设) H 0 : 0 备择假设(双边备择假设) H1 : 0 检验统计量 Z 拒绝域
X 0 当假设H0为真时, ~ N (0, 1) n
假设检验的两类错误.ppt
谢谢观看
X0 n
u0.05
1.645
否定域为W : u u0.05 =1.645
代入 σ=2, n=25, 并由样本值计算得统计量U的实测值:
u=3.125>1.645
落入否定域
故拒绝H0 , 即认为这批燃料率较以往生产的有显著的提高。
例2: 某织物强力指标X的均值 μ0=21公斤. 改进工艺后生产一批织物, 今从中取30件,
If I'd gone alone, I couldn't have seen nearly as much, because I wouldn't have known my way about.
。2020年11月8日星期日2020/11/82020/11/82020/11/8
• 15、会当凌绝顶,一览众山小。2020年11月2020/11/82020/11/82020/11/811/8/2020
• 16、如果一个人不知道他要驶向哪头,那么任何风都不是顺风。2020/11/82020/11/8November 8, 2020
•
THE END 17、一个人如果不到最高峰,他就没有片刻的安宁,他也就不会感到生命的恬静和光荣。2020/11/82020/11/82020/11/82020/11/8
假设检验的两类错误
实际情况
决定
H0ቤተ መጻሕፍቲ ባይዱ真
H0不真
数理统计
拒绝H0 第一类错误
正确
接受H0
正确
第二类错误
犯两类错误的概率: P{拒绝H0|H0为真}=α,
P{接受H0|H0不真}=β.
显著性水平 α为犯第一类错误(Type I error)的概率; β为犯第二类错误(Type II error)的概率.
假设检验问题的两类错误和 p 值
假设检验16.2假设检验问题的两类错误和p 值假设检验两类错误原假设成立原假设不成立接受√第二类错误(受伪)拒绝第一类错误(拒真)√第一类错误即为显著性水平()()W X P H H P ∈==αθ为真拒绝00|,第二类错误的概率表达为()()W X P H H P ∈==βθ为真接受10|,1Θ∈θ。
**********************************************************假设检验中,两类错误的概率不能同时减小,二者相互制约。
犯第一类错误的概率越小,则犯第二类错误的概率越大,犯第二类错误的概率越小,则犯第一类错误的概率越大。
原假设和备择假设不能随意互换位置,原假设是人们经验上认为正常的假设。
理想的检验应该是在控制犯第一类错误的基础上,尽量少犯第二类错误。
显著性检验具有“保护原假设”的特点,显著性水平α也不是越小越好。
固定第一类错误的概率,可通过增加样本量降低犯第二类错误的概率。
**********************************************************例16.2.1某厂生产一种标准长度35mm的螺钉,实际生产的产品长度服从正态分布()2,3N μ。
做假设检验,样本容量36n =,0:35H μ=,1:35H μ≠,拒绝域为{}:351W x x =->。
(1)犯第一类错误的概率。
(2)μ=36时,犯第二类错误的概率。
解(1)检验统计量X 的分布为~,212X N μ⎛⎫⎛⎫ ⎪ ⎪ ⎪⎝⎭⎝⎭,第一类错误的概率为{}35135P X αμ=->={}135135P X μ=--≤=351223512X P μ⎧⎫-=--<>=⎨⎬⎩⎭()()()1222220.0455=-Φ+Φ-=-Φ=。
(2)第二类错误的概率为{}35136P X βμ=-≤=()|135136P X μ=-≤-≤=|36403612X P μ⎛⎫ ⎪-=-≤≤= ⎪ ⎪⎝⎭()()()()040410.5=Φ-Φ-=Φ+Φ-=。
剖析假设检验的两类错误并举例说明资料
案例阐明
• 例子:一个公司有员工3000 人(研究 旳总体) ,为了检验公司员工工资统计 报表旳真实性,研究者作了 50 人旳大 样本随机抽样调查,人均收入旳调查结 果是: X (样本均值)=871 元;S(标 准差)=21 元 问能否定为统计报表中人 均收入μ0=880 元旳数据是真实旳? (显著性水平α=0.05 )
β 错误出现原因
• 第二个问题是,统计检验旳逻辑犯了从结论推 断前提旳错误。命题 B 是由命题 A 经演绎推 论出来旳,或写作符号 A→B,命题 C 是我们 在检验中所根据操作法则。假如A 是真旳,且 我们从 A 到 B 旳演绎推论假如也是正确旳, 那么B 可能是真实旳。相反,假如成果 B是真 实旳,那么就不能得出A 肯定是真实旳结论。 这就是 β错误出现旳原因。
假设检验时应注意旳事项
• 要有严密旳抽样研究设计,样本必须是从同质 总体中随机抽取旳;要确保组间旳均衡性和资 料旳可比性。
• 根据既有旳资料旳性质,设计类型,样本含量 大小,正确选用检验措施
• 对差别有无统计学意义旳判断不能绝对化,因 检验水准只是人为要求旳界线,是相正确。差 别有统计意义时,是指无效假设H0被接受旳可 能性只有5%或不到5%,甚至不到1%,根据小 概率事件一次不可能拒绝H0,但尚不能排除有 5%或1%出现旳可能,所以可能产生第一类错误: 一样,若不拒绝H0,可能产生第二类错误
两类错误旳危害
• 犯第一类错误旳危害较大,因为报告了原来不 存在旳现象,则所以现象而衍生出旳后续研究 、应用旳危害将是不可估计旳。想对而言,第 二类错误旳危害则相对较小,因为研究者假如 对自己旳假设很有信心,可能会重新设计试验 ,再次来过,直到得到自己满意旳成果(但是 假如对本就错误旳观点坚持旳话,可能会演变 成第一类错误)。
假设检验中两类错误的几何解释
所 以接受域 l _ A
l 19 < 6,
.
即 作为统 计 量 的接受域 为
( 0 0—19 10 . 6×4 10 ,0 0+19 . 6×4 )= ( 9 . 6 10 . 4 , 9 2 1 ,0 7 8 )
对于 I 类错 误 , 比较 容 易理 解 , 第 1 错 误 犯 类 的概率 值 即为显著 水 平 , 犯 第 1 类 错误 的概 记 I 率 为 , 检验 结果 概括 如下 将
类错 误 的产生及 变化 情况 , 使知 识更 直观 , 更容 易 被学 生接 受 。
进 行 检查 , 显著 水平 :00 , 取 .5 试计 算第 1类错 I
误 的概率 。
解 如 果洗 衣粉 的重 量 不 足将 使 消 费者 损 失, 而超重 将使 厂方 受损 , 计 假设 应 为 统
V 】 2 .3 o. 8No
S p 07 e .2 0
假设检验 中两类错误 的几何解释
刘 凤 霞
( 抚顺师范高等专科学 校 , 辽宁 抚顺 l3 0 106)
摘 要 :以正 态分布 为例 ,提 出 了一 种假 设 检 验 问题 中两类 错误 及 有 关 问题 的 几何 解
释 ,使 某 些结论 更 直观 。
跟参数 的真值有关。
2 第 1 类错误 的概率计算及理 解 I
例 1 某 品牌 洗 衣 粉 由 自动 包 装 机 包 装 , 每 袋 的标 准 重 量 是 10 g 根 据 以往 的 经验 知 标 准 00 ,
( 见 图 12 。 ( )
差为 4 g为 了保证洗衣粉 的重量符合 出厂 的规 0,
收稿 日期 :0 6—1 2 20 0—1 .
如果 自动包装机因为偏离 , 每袋洗衣粉的平
假设检验的两类错误
知识点8.2假设检验的两类错误由于样本具有随机性, 小概率事件也可能发生, 所以假设检验所得出的决策并不总是正确的.原假设H 0为真客观事实决策结果原假设H 0为假拒绝H 0接受H 0拒绝H 0接受H 0错误这种错误称为第一类错误又称“弃真”错误.犯第一类错误的概率记为α.错误这种错误称为第二类错误又称“取伪”错误.犯第二类错误的概率记为β.正确正确理想1:α和β的关系α和β都是0.现实:那不可能!理想2:α和β都很小.现实:如果样本容量n固定, 那也不可能!大↑↓小固定的样本容量nαβα和β真的不能都变小?除非样本容量够大!为了检验火柴的质量, 把火柴厂一天生产的所有火柴都划一遍?!经常在影视中看到的“地毯式搜索”意义何在?如果有人告诉你,本课程所有的考试题均来自于某一本习题集,但不知具体是哪几道,你将怎样复习?哪种错误的后果更严重?“宁可错杀一千,不可放过一个”又是什么意思?显著性检验方法:对犯第一类错误的概率严格加以控制.显著性检验体现了“保护原假设”的原则:只有当小概率事件发生时, 才会拒绝原假设, 所以原假设很难被拒绝.此外, 无论是原假设还是备择假设, 都应该是不可证明的命题, 否则就无需使用假设检验方法了.(2)在H0成立的前提下选取检验统计量W, 确定其概率分布;(1)提出原假设H0与备择假设H1;假设检验问题的基本步骤(3)选取显著性水平α及样本容量n;(4)确定临界值及H的拒绝域;(5)计算W的观测值, 作出拒绝H0还是接受H的决策.。
t检验两类错误
作假设检验时,有可能发生两种错误,现以样 本均数和总体均数的单侧检验为例说明。
(1)Ⅰ型错误是指拒绝了实际上成立的 H0 , 也即“弃真”。在 H0 成立的前提下, 由于抽样的偶然性,得到了较大的 t 值, 若t>t0.05(),则P<0.05,按 0.05水 准拒绝 H0 ,则犯了Ⅰ型错误。确定以 tα 为临界值时,犯Ⅰ型错误的概率就 是α。
7.5
9.0 15.0 13.0 10.5 -
6.5
5.5 8.0 6.5 9.5 -
1.0
3.5 7.0 6.5 1.0 39 (d)
1.00
12.25 49.00 42.25 1.00 195 ( d 2 )
1. 建立假设:H0:d=0,
H1:d0,0.05 。
d为治疗前后差值的总体均数。
小, 愈大;反之,愈大,
愈小。
假设检验的注意事项
(一)保证组间的可比性:严密的实验设计,样本从同质总体中 随机抽取; (二)根据研究目的、设计和资料类型选用恰当的检验方法;
(三)正确理解差别有无统计学意义和实际意义的区别:差别有
无统计意义与有无专业上的实际意义是两个不同的概念; (四)结论不能绝对化:当P接近检验水准时,下结论要慎重 单侧和双侧检验 选用单侧检验的条件是在研究开始之前,表明不会出现 0的情况(或不会出现0的情况),才能选用单侧检验。若 没有这方面的依据,一般选用双侧检验。 (五)u检验和t检验理论上要求样本来自正态分布总体,还要注 意方差齐性。
若 t t0.05(),P>0.05, 差别无统计
学意义
t ≥t0.05(),P≤0.05,差别有统计
学意义
t ≥t0.01(), P≤0.01,差别有高度
谈谈假设检验中的两类错误
作者: 樊元侃
出版物刊名: 东华理工大学学报:社会科学版
页码: 21-24页
主题词: 假设检验;第二类错误;原假设;显著性水平;正态总体;总体方差;试验结果;随机抽样;
总体平均;数卜
摘要:<正> 众所周知,由于样本的随机性,以样本结果进行假设检验而作出推断时,人们并不能百分之百地肯定不发生错误。
一般而论,假设检验可能有两类错误:如果原假设H。
是正确的,但通过试验结果的检验后却否定了它,这就是造成所谓第一类错误(弃真错误);反之,如果原假设H。
是错误的,而通过试验结果的检验后却接受了它,这就是造成所谓第二类错误。
假设检验案例集
案例一:假设检验设备判断中的应用[1]例如:某公司想从国外引进一种自动加工装置。
这种装置的工作温度X服从正态分布(μ,52),厂方说它的平均工作温度是80度。
从该装置试运转中随机测试16次,得到的平均工作温度是83度。
该公司考虑,样本结果与厂方所说的是否有显著差异?厂方的说法是否可以接受?类似这种根据样本观测值来判断一个有关总体的假设是否成立的问题,就是假设检验的问题。
我们把任一关于单体分布的假设,统称为统计假设,简称假设。
上例中,可以提出两个假设:一个称为原假设或零假设,记为H0:μ=80(度);另一个称为备择假设或对立假设,记为H1 :μ≠80(度)这样,上述假设检验问题可以表示为:H0:μ=80H1:μ≠80原假设与备择假设相互对立,两者有且只有一个正确,备择假设的含义是,一旦否定原假设H0,备择假设H1备你选择。
所谓假设检验问题就是要判断原假设H0是否正确,决定接受还是拒绝原假设,若拒绝原假设,就接受备择假设。
应该如何作出判断呢?如果样本测定的结果是100度甚至更高(或很低),我们从直观上能感到原假设可疑而否定它,因为原假设是真实时,在一次试验中出现了与80度相距甚远的小概率事件几乎是不可能的,而现在竟然出现了,当然要拒绝原假设H0。
现在的问题是样本平均工作温度为83度,结果虽然与厂方说的80度有差异,但样本具有随机性,80度与83度之间的差异很可能是样本的随机性造成的。
在这种情况下,要对原假设作出接受还是拒绝的抉择,就必须根据研究的问题和决策条件,对样本值与原假设的差异进行分析。
若有充分理由认为这种差异并非是由偶然的随机因素造成的,也即认为差异是显著的,才能拒绝原假设,否则就不能拒绝原假设。
假设检验实质上是对原假设是否正确进行检验,因此,检验过程中要使原假设得到维护,使之不轻易被否定,否定原假设必须有充分的理由;同时,当原假设被接受时,也只能认为否定它的根据不充分,而不是认为它绝对正确。
我来尝试给你讲清统计学中的假设检验和两类错误
我来尝试给你讲清统计学中的假设检验和两类错误学习过统计的同学一定对“两类错误”不会陌生,但是否已经完全理清了其中的逻辑,想必要打一个问号了。
希望我今天能“不辱使命”,用你听得懂的语言给你讲清楚这整套内容。
1. 从玩色子看假设检验到底在干嘛首先,两类错误是出现在假设检验过程中的,所以我们得先弄明白假设检验到底在做什么。
简单举一个赌桌上的例子。
看完周润发的《赌神》之后,朋友小金也来到赌场赌色子,一个色子,买单双号:1、3、5为单,2、4、6为双。
小金玩了100把,但是就只有4次买中,气的小金直跺脚,直呼运气太背……难道小金的运气就这么差吗?咱们回头看看,是否哪里有猫腻。
你肯定已经想到,每一把小金就算瞎猜,也会有50%的可能性猜对,这样重复玩100把,平均而言有50把的机会能买中,现在他只买中4把,这怎么可能呢?那原因在哪?很简单,问题出在色子上,我们说平均会有50把买中是建立在一个假设上的:色子是均匀的,没有人动手脚。
但现在的情况是,他确实只买中了4把,而如果色子是均匀的,那么这种情况发生的概率及其微小,接近0,概率接近0的事情一般在一次试验(这100把游戏)下是不可能发生的,但现在却真真切切的发生了,于是,我们就有理由怀疑假设的真实性。
在这个例子中,我们就会怀疑色子可能不是均匀的,或者被人为操控了。
所以,假设检验的基本逻辑就是:我们为了解决一个疑问,就先做一个假设,然后在这个假设的基础上推测已经发生了的事情的概率(在这个例子里面就是“小金猜中4次或少于4次的概率”),如果这个概率低于我们设定的参考值(如0.05),则我们就拒绝假设;而如果这个概率大于0.05,则我们就没有理由来拒绝原假设。
2. 第一类错误的概率为什么是α明白了假设检验的逻辑之后,我们就可以开始分析第一类错误。
统计学上把原假设H0为真而拒绝原假设称为犯了第一类错误。
回到小金的例子,因为他只买中4把,根据推测,他是有理由拒绝色子是均匀的这个原假设,但事后通过专业人员检验发现:色子没有问题,纯粹是小金的运气太背了,那么这时,小金就犯错了,这便是第一类错误的由来,接着我们会问,犯这个错误的概率是多少呢?为了便于理解,我们可以看另外一个计算简单的例子。
假设检验中两类错误问题
作者: 阳妮
出版物刊名: 广西财经学院学报
页码: 65-70页
主题词: 假设检验;第二类错误;拒绝域;自学者;教学工作;原假设;学习过程;样本空间;显著性水平;检验法
摘要: 假设检验是概率论与数理统计的一个重要课题。
其中关于“两类错误”的概念、控制、关系等一系列问题构成其中心内容,并在质量管理等经济研究工作中有着广泛的应用。
但目前现行的经济类教科书中,对上述问题缺乏系统详细的论述,偏向于简单的纯应用化,这给教学及自学者学习过程带来诸多不便。
针对这一情况,本文将对两类错误的几个主要问题作一系统的阐述,并对各类问题附上一定的例题。
旨在能给从事教学工作的同行一点方便,给经济工作者一点启发与帮助。
参数假设检验中的两类错误
参数假设检验中的两类错误
沈荣泸
【期刊名称】《数学学习与研究:教研版》
【年(卷),期】2015(000)023
【摘要】本文在正态总体的总体均值右侧假设检验前提下,对假设检验的两类错误进行探讨,进而得出犯两种错误的概率α和β的关系式,最后在得到的关系式下形成三点结论.
【总页数】1页(P133-133)
【作者】沈荣泸
【作者单位】泸州职业技术学院,646005
【正文语种】中文
【中图分类】O212.1
【相关文献】
1.参数假设检验中两类错误的剖析
2.假设检验中两类错误的计算及其关系的探讨
3.假设检验中两类错误分析与实验
4.基于课程思政的教学案例——假设检验中的两类错误
5.案例式教学在心理统计教学中的应用
——以假设检验的两类错误为例
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
β 错误出现原因
• 第二个问题是,统计检验的逻辑犯了从结论推 断前提的错误。命题 B 是由命题 A 经演绎推 论出来的,或写作符号 A→B,命题 C 是我们 在检验中所依据操作法则。如果A 是真的,且 我们从 A 到 B 的演绎推论如果也是正确的, 那么B 可能是真实的。相反,如果结果 B是真 实的,那么就不能得出A 必定是真实的结论。 这就是 β错误出现的原因。
案例说明
• 例子:一个公司有员工3000 人(研究 的总体) ,为了检验公司员工工资统计 报表的真实性,研究者作了 50 人的大 样本随机抽样调查,人均收入的调查结 果是: X (样本均值)=871 元;S(标 准差)=21 元 问能否认为统计报表中人 均收入μ0=880 元的数据是真实的? (显著性水平α=0.05 )
第二类错误—取伪错误
• 即H0本不真,却接受了他,犯这类错误 的概率记为β,即P{接受H0/H1为真}=β • 可能产生原因:1:实验设计不灵敏 • 2.样本数据变异性过大 • 3.处理效应本身比较小
两类错误的关系
• 1:α与β是在两个前提下的概率,所以 α+β不一定等于1 • 2:在其他条件不变的情况下,α与β不 能同时增加或减少
对相关命题的说明
• 命题 1:在统计检验中,在样本容量一 定的条件下,α 错误和 β 错误不可能同 时减小。这个命题可以借助前面的图形1 来理解,一旦正态分布A 的拒绝域减小 即 α 错误减小,则( 2 1 Χ − Χ )这个 区域将增大,而图 A 上阴影部分的面积 (β错误)也将增大。
• 命题 2:真实的总体参数(μ)与假设的 总体参数(μ0)之间的差异(△μ)越 小, 犯β 错误的概率越大。 这个命题也 可以从图形1 得到说明。 因为△μ越小, 两个正态图就相距越近,阴影部分面积 就增大。
出现两类错误的概率计算
• α 错误是由实际推断原理引起的,即
“小概率事件不会发生”的假定所引起 的,所以有理由将所有小概率事件发生 的概率之和或者即显著性水平(α=0.05) 看作α错误发生的概率,换言之,α错误 发生的概率为检验所选择的显著性水平。 如果是单侧检验,弃真错误的概率则为 α/2。
β错误的概率的计算
两类错误的危害
• 犯第一类错误的危害较大,由于报告了本来不 存在的现象,则因此现象而衍生出的后续研究、 应用的危害将是不可估量的。想对而言,第二 类错误的危害则相对较小,因为研究者如果对 自己的假设很有信心,可能会重新设计实验, 再次来过,直到得到自己满意的结果(但是如 果对本就错误的观点坚持的话,可能会演变成 第一类错误)。
研究假设
• 原假设 H0:调查数据 871 元与报表数 据 880 元之间没有显著性差异,公司员 工工资均值的真实情况为880 元; 假设 H1:调查数据和报表数据之间有显著性 的差异,公司员工工资均值的真实情况 不是880 元。
α 错误出现原因
• 我们只抽了一个样本,而个别的样本可能是特 殊的,不管你的抽样多么符合科学抽样的要求。 理论上讲,在 3000 个员工中随机抽取 50 人 作为调查样本,有很多种构成样本的可能性, 相当于 3000 选 50,这个数目是很大的。这 样,在理论上就有存在很多个样本平均数。也 就是说,由于小概率事件的出现,我们把本来 真实的原假设拒绝了。这就是 α 错误出现的原 因。
• 命题 3:犯 α 错误的概率和犯 β 错误的 概率之和不为 1。α 错误的概率是在图 A 上被指示的显著性水平的大小,而 β 错 误的概率是图 A 上阴影部分的面积。既 然假设的总体均值并不与真值相等(这 是错β 误产生的前提) ,图 A 与图 B 就不可能重合,因此α 和之 β 和不可能 为1。
假设检验时应注意的事项
• 要有严密的抽样研究设计,样本必须是从同质 总体中随机抽取的;要保证组间的均衡性和资 料的可比性。 • 根据现有的资料的性质,设计类型,样本含量 大小,正确选用检验方法 • 对差别有无统计学意义的判断不能绝对化,因 检验水准只是人为规定的界限,是相对的。差 别有统计意义时,是指无效假设H0被接受的可 能性只有5%或不到5%,甚至不到1%,根据小 概率事件一次不可能拒绝H0,但尚不能排除有 5%或1%出现的可能,所以可能产生第一类错误: 同样,若不拒绝H0,可能产生第二类错误
剖析假设检验的两类 错误并举例说明
组长:胡立文 PPT制作:吴思远 演讲人:胡立文 组员:胡立文、吴思远、林君豪、白鲁宁、殷的判断,即拒绝H0或不拒绝H0并不 是100%的正确,可能发生两种错误
第一类错误—弃真错误
• 即H0本来正确,却拒绝了它,犯这类错 误的概率不超过α,即P{拒绝H0/H0为 真}≤α • 可能产生的原因:1.样本中极端数值 • 2.采用决策标准较宽松
• 犯 β错误的概率大小就是相对正态曲线A 而言, 图 1 中阴影部分的面积: • ZX1=1.41 ;ZX2=5.59 • 查标准正态分布表可知,β=Φ(ZX2)-Φ (ZX1)=0.0793 • 结果表明,如果总体的真值为 870 元,而虚 无假设为880元的话,那么,平均而言每100 次抽样中,将约有8次把真实情况当作880 元 被接受,即犯β错误的概率大小是0.0793。