假设检验的基本问题
第六章 假设检验1
二,假设检验的过程
1,提出假设 3,作出决策
拒绝假设 别无选择
总体
我认为人口的 平均年龄是50 50岁 平均年龄是50岁
2,抽取随机样本
均值 X = 20
二,假设检验的过程 假设检验的具体步骤: 假设检验的具体步骤: 第一,提出原假设 第一,提出原假设(null hypothesis)和备择假设 和备择假设 (alternative hypothesis); ; 第二,确定合适的检验统计量; 第二,确定合适的检验统计量; 第三,规定显著性水平 ; 第三,规定显著性水平α; 第四,根据数据计算检验统计量的实现值; 第四,根据数据计算检验统计量的实现值; 第五,统计决策. 第五,统计决策.
原假设
(null hypothesis)
1. 2. 3. 4. 研究者想收集证据予以反对的假设 又称"0假设" 总是有符号 =, ≤ 或 ≥ 表示为 H0
– – –
H0 : = 某一数值 指定为符号 =,≤ 或 ≥ ≤ 例如, H0 : = 10cm
备择假设
(alternative hypothesis)
什么是P 值?
(P-value)
1.p值(p-value)是在零假设下, 1.p值(p-value)是在零假设下,检验统计量取其实现 是在零假设下 值及(沿着备择假设的方向)更加极端值的概率. 值及(沿着备择假设的方向)更加极端值的概率.
第五章假设检验
Hypothesis test
(二)P值假设检验的步骤 值假设检验的步骤
14
Hypothesis test
(一)假设检验中的两类错误 实际情况
决策结果 不拒绝H0 拒绝H0
H0为真 √ type I error
H0为伪 type II error √
•第Ⅰ类错误:指原假设为真,却拒绝原假设而犯的 类错误:指原假设为真,
错误, 错误,即弃真错误 发生概率为α 发生概率为α •第Ⅱ类错误:原假设为假时,未拒绝原假设而犯 第 类错误:原假设为假时, 的错误, 的错误,即取伪错误 发生概率为β 发生概率为β 15
27
Hypothesis test
3、利用P值决策的优点: 利用P 决策的优点: 直接给出了拒绝原假设犯第一类错误的真实概率; 直接给出了拒绝原假设犯第一类错误的真实概率; 避免了不同检验问题用同一个显著性水平; 避免了不同检验问题用同一个显著性水平; 当前计算机软件通常可以直接输出检验统计量的P值, 当前计算机软件通常可以直接输出检验统计量的P 免于查表, 免于查表,可直接判定
例如,针对特效药治愈率假定 例如,针对特效药治愈率假定H0 :θ≥97% 医疗周期假定H0 :t≤2个月 个月 服药后病情稳定情况H0 :d=2人 人
7
Hypothesis test
(2)备择假设(alternative hypothesis) 备择假设(alternative
★研究者收集证据想予以支持的假设 研究者收集证据想予以支持 予以支持的假设 ★表示为H1 ★表示形式:≠, >或<某一假定数值 表示形式:
Hypothesis test
4、决策规则 给定显著性水平α 给定显著性水平α,查统计量的对应分布表得出相 应的临界值。 应的临界值。 临界值通常取正值, 临界值通常取正值,应结合假设形式准确确定分布 中的临界值和拒绝域。 中的临界值和拒绝域。 将检验统计量的值与临界值进行比较 给出决策结果。 给出决策结果。 双侧检验: 统计量的值| 临界值, 双侧检验:|统计量的值|>临界值,则拒绝H0 左侧检验:统计量的值<临界值, 左侧检验:统计量的值<临界值,则拒绝H0 右侧检验:统计量的值>临界值, 右侧检验:统计量的值>临界值,则拒绝H0
假设检验PPT课件
【学习目标】通过对本章的学习,掌握假设检验的概念和 类型、假设检验的两类错误和假设检验的一般步骤;重点掌握 单个总体均值的检验和比率的检验。
第一节 假设检验的基本问题 第二节 △ 假设检验的应用
假设检验
第一节 假设检验的基本问题
一、假设检验的概念 二、假设检验的两类错误 三、假设检验的类型 四、假设检验的类型一般步骤
假设检验
第一节 假设检验的基本问题
什么小概率?
1.在一次试验中,一个几乎不可能发生的事件发生的概率; 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假 设; 3.小概率由研究者事先确定。
假设检验
第一节 假设检验的基本问题
二、假设检验的两类错误(决策风险)
(一) 第一类错误 第一类错误,亦称拒真(弃真)错误。是指当原假设为 真时,但由于样本的随机性使样本统计量的具体值落入 了拒绝区域,这时所作的判断是拒绝原假设。 犯第一类错误的概率亦称拒真概率,它实质上就是前面
t
986 1000 24
2.333>
t n 1 2.1315
16
2
所以接受 H1,即这天包装机工作不正常。
假设检验
第二节 假设检验的应用
二、单个总体比率(成数)的假设检验
比率P是平均数的一种特殊形式,因而前面讲的平均 数检验理论都适用于总体比率P的假设检验,只是估计量 的形式略有不同。
【例4】我国出口的参茸药酒畅销于某国市场。据以往调查, 购买此种酒的顾客中40岁以上的男子占50%。经营该药酒 的进出口公司经理关心这个比率是否发生了变化,于是, 委托一个咨询机构进行调查,这个咨询机构从众多购买该 药酒的顾客中随机抽取了400名进行调查,结果有210名为 40岁以上的男子。试问在0.05的显著水平上,能否认为购 买此种药酒的顾客中40岁以上男子所占比率变化了?
第8章 假设检验
ˆ H0 : 0 ˆ H :
0 0
备择
假设
研究者想收集证据予以支持的假设。
1. 与原假设对立的假设 2. 总是有, 或 3. 表示为 H1
例如:
ˆ H0 : 0 ˆ H0 : 0 ˆ H :
0 0
ˆ H1 : 0 ˆ H1 : 0 ˆ H :
拒绝 H0
.025
拒绝 H0
.025
t
ta
2 . 262 /2
-2.262
0
2.262
t
不拒绝原假设,没有证据表明该供 货商提供的配件是不符合要求的。
二、总体比例的检验
大样本
p ~ N(,
(1 )
n
)
设假设的总体比例为0,总体比例的检验统计量为:
z
p 0
0 (1 0 )
拒绝 H0
.025
拒绝 H0
.025
-1.96
0
1.96
Z
由于是双侧检验,拒绝域在左右两侧,所以临界值为:
z za / 2 1.96
在显著性水平a=0.05上不拒绝原假设,表明样本提供的证据还 不足以推翻原假设,因此,没有证据表明该天生产的饮料不符
合标准要求。
【例】某批发商欲从生产厂家购进一批灯泡,根据 合同规定,灯泡的使用寿命平均不能低于1000小时。 已知灯泡使用寿命服从正态分布,标准差为20小时。 在总体中随机抽取100只灯泡,测得样本均值为960 小时。批发商是否应该购买这批灯泡? (a=0.05)
n
假设
双侧检验
左侧检验
右侧检验
假设形式
H0 : 0 H1 : 0
第五章 假设检验
0.05
结论:
改良后的新品种产量有显著提高
0
1.645
z
总体均值的检验
(大样本检验方法的总结)
假设 双侧检验 H0 : =0 H1 : 0 左侧检验 H0 : 0 H1 : <0 右侧检验 H0 : 0 H1 : >0
假设形式
已知:
统计量
z
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
拒绝H0 置信水平
第 5章 假设检验
5.1 假设检验的基本问题 5.2 总体均值的检验 5.3 总体比例的检验
假设检验在统计方法中的地位
统计方法
推断统计
描述统计
参数估计
假设检验
5.1 假设检验的基本问题
是否法国人的地理知识要比美国 人丰富?
1988年7月28日的纽约时报上刊登了一篇有关 人们地理知识的文章。这篇文章中描述了一个 由国家地理协会委托GalluP公司所做的研究结 果。研究者们从一些国家抽取许多成年人并请 他们鉴别在一个地图上的16个地方(包括13个 国家、中非、波斯湾和太平洋);然后把每个 人答对的个数加起来。 四个国家的样本中答对的个数的均值为:美国 6.9;墨西哥 8.2;大不列颠 9.0;法国 9.2。
应用统计学7假设检验
应用统计学第九章假设检验朱佳俊博士Applied Statistics 第一节假设检验的基本问题一、假设检验的基本概念对总体的概率分布或分布参数作出某种“假设”,根据抽样得到的样本观测值,运用数理统计的分析方法,检验这种“假设”是否正确,从而决定接受或拒绝“假设”,这就是本章要讨论的假设检验问题。
1、假设定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。
是对总体参数的一种假设。
常见的是对总体均值或比例和方差的检验;在分析之前,被检验的参数将被假定取一确定值。
2、假设检验(hypothesis test)(1)概念–事先对总体参数或分布形式作出某种假设–然后利用样本信息来判断原假设是否成立(2)类型–参数假设检验–非参数假设检验(3)特点–采用逻辑上的反证法–依据统计上的小概率原理... 因此我们拒绝假设 =20... 如果这是总体的真实均值样本均值μ= 50抽样分布H0这个值不像我们应该得到的样本均值...203、假设检验的基本思想小概率原理是假设检验的基本依据,即认为小概率事件在一次试验中几乎是不可能发生的。
当进行假设检验时,先假设H 0正确,在此假设下,若小概率事件A出现的概率很小,例如P (A )=0.01,经过取样试验后,A 出现了,则违反了上述原理,我们认为这是一个不合理的结果。
4、小概率原理5、原假设和备择假设(1)原假设(null hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H 1–H 1 :μ<某一数值,或μ>某一数值–例如, H 1 :μ< 10cm ,或μ>10cm(2)备择假设(alternative hypothesis)研究者想收集证据予以支持的假设也称“研究假设”总是有符号≠, <或>表示为H1–H1 :μ<某一数值,或μ>某一数值–例如, H1 :μ< 10cm,或μ>10cm6、双侧检验与单侧检验(1)备择假设没有特定的方向性,并含有符号“≠”的假设检验,称为双侧检验或双尾检验(two-tailed test)(2)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test)–备择假设的方向为“<”,称为左侧检验–备择假设的方向为“>”,称为右侧检验双侧检验与单侧检验(假设的形式)单侧检验H1: μ> μ0H1:μ< μ0H1: μ≠μ0备择假设H: μ≤μ0H: μ≥μ0H: μ= μ0原假设右侧检验左侧检验双侧检验假设二、假设检验中的两类错误与显示性水平1、假设检验中的两类错误(1)第Ⅰ类错误(弃真错误)–原假设为真时拒绝原假设–第Ⅰ类错误的概率记为α•被称为显著性水平(2)第Ⅱ类错误(取伪错误)–原假设为假时未拒绝原假设–第Ⅱ类错误的概率记为β(Beta)2、显著性水平(significant level)(1)是一个概率值(2)原假设为真时,拒绝原假设的概率–被称为抽样分布的拒绝域(3)表示为α(alpha)–常用的α值有0.01, 0.05, 0.10(4)由研究者事先确定三、检验统计量与拒绝域(一)检验统计量(test statistic)1、根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2、对样本估计量的标准化结果–原假设H为真–点估计量的抽样分布点估计量的抽样标准差假设值—点估计量标准化检验统计量=3.标准化的检验统计量显著性水平和拒绝域(双侧检验)抽样分布临界值临界值α/2α/2 样本统计量拒绝H 0拒绝H 01 -α1 -置信水平显著性水平和拒绝域(单侧检验)0临界值α样本统计量拒绝H 0抽样分布1 -α置信水平(二)决策规则1、给定显著性水平α,查表得出相应的临界值z α或z α/2,t α或t α/22、将检验统计量的值与α水平的临界值进行比较3、作出决策–双侧检验:I 统计量I > 临界值,拒绝H 0–左侧检验:统计量< -临界值,拒绝H 0–右侧检验:统计量> 临界值,拒绝H 0四、利用P 值进行决策(一)什么是P 值(P -value)1、在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率–双侧检验为分布中两侧面积的总和2、反映实际观测到的数据与原假设H 0之间不一致的程度3、被称为观察到的(或实测的)显著性水平4、决策规则:若p 值<α, 拒绝H 0双侧检验的P 值α/ 2α/ 2Z拒绝H 0拒绝H 0临界值计算出的样本统计量计算出的样本统计量临界值1/2 P 值1/2 P 值临界值α样本统计量拒绝H 0抽样分布1 -1 -α置信水平计算出的样本统计量P 值左侧检验的P 值临界值α拒绝H 0抽样分布 1 -1 -α置信水平计算出的样本统计量P 值右侧检验的P 值五、假设检验步骤1、陈述原假设和备择假设2、从所研究的总体中抽出一个随机样本3、确定一个适当的检验统计量,并利用样本数据算出其具体数值4、确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5、将统计量的值与临界值进行比较,作出决策–统计量的值落在拒绝域,拒绝H 0,否则不拒绝H 0–也可以直接利用P 值作出决策第二节一个总体参数的检验z 检验(单尾和双尾)z 检验(单尾和双尾)t 检验(单尾和双尾)t 检验(单尾和双尾)z 检验(单尾和双尾)z 检验(单尾和双尾)χ2 检验(单尾和双尾)χ2 检验(单尾和双尾)均值均值一个总体一个总体比率比率方差方差是z 检验x z nμσ−=否z 检验ns x z 0μ−=一、总体均值的检验σ是否已知小样本容量n大σ是否已知否t 检验ns x t 0μ−=是z 检验nx z σμ0−=(一)总体均值的检验(大样本)•1.假定条件–正态总体或非正态总体大样本(n ≥30)2.使用z 检验统计量σ2已知:σ2未知:)1,0(~0N nx z σμ−=)1,0(~0N nsx z μ−=1、总体均值的检验(σ2已知)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml ,标准差为5ml 。
假设检验的基本问题
假设检验的基本问题一、什么是假设检验原假设H 0是接受检验的假设。
备择假设H 1是当原假设被否定时另一种可成立的假设。
原假设和备择假设相互对立,在任何情况下只能有一个成立。
二、假设检验中的小概率事件假设检验的基本思想——根据小概率的原理,可以做出是否接受原假设的决定。
小概率原理:指发生概率很小的随机事件在一次试验中几乎不可能发生的。
E : 据报载,某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、绿两色球各10个的暗箱中连续摸10次(摸后放回),若10次都是摸得绿球,则中大奖。
某人按规则去摸10次,皆为绿球,商店认定此人作弊,拒付大奖,此人不服,最后引出官司。
所谓“小概率事件”,究竟多大概率为小概率事件?在一个问题中,通常是指定一个正数10,<<αα,认为概率不超过α的事件是在一次试验中不会发生的事件,这个α称为显著性水平(Level of significance)。
通常可选取α=0.01,0.05,0.10等。
下面我们用假设检验的语言来模拟商店的推断:10提出假设:0H :此人未作弊;1H :此人作弊。
20 构造统计量,并由样本算出其具体值:统计量取为10次摸球中摸中绿球的个数N .由抽样结果算出N=1030求出在H 0下统计量N 的分布,构造对H 0不利的小概率事件。
40给定显著性水平α,确定临界值。
50得出结论。
在这些步骤中,关键的技术问题是确定一个适当的用以检验假设的统计量,这个统计量至少应该满足在H 0成立的情况下,其抽样分布易于计算(查到)。
在统计量选定以后,便可构造出由该统计量T 描述某个显著性水平下的一小概率事件{αB T ∈},我们称使得这一小概率事件发生的样本空间的点的全体 });,,,(:),,,{(2121αθB X X X T X X X V n n ∈X ∈=为H 0的否定域或拒绝域,最后的检验即是判断所给的样本是否落在V 内。
第五章 假设检验1
假设。设总体参数θ 的假设值为θ0 ,那么原假设记为:
H0:θ = θ0 它表示总体参数值与其假设值之间没有显著差异。
是其所要遵循的基本原则。由抽样分布理论可知,若原假设 H0 成立,则样本统
计值与总体参数假设值偏差很大的事件是一个小概率事件。倘若在一次抽样中, 样本统计值与总体参数假设值相差很大,那么在原假设成立的条件下,就是出现 了一个小概率事件。一旦出现小概率事件,就要怀疑原假设的正确性,从而否定 原假设。若一次抽样的样本统计值与总体参数假设值相差不大,那么就没有理由 拒绝原假设,也就只好接受原假设。
的,就要否定原假设,即 X ≠ 0.04 ;如果这种差异由随机抽样的偶然性引起,那
么这种差异就是不显著的,就不能否定原假设,即应认为 X = 0.04 。因此,假设
检验的实质就是样本信息是否有充分的理由来否定原假设。必须指出的是,我们 不是根据样本的结果去判断原假设与备择假设哪一个更有可能正确,这两个假设
“用什么标准来判断一项显著性检验的应用是正确的还是不正确的呢?” ——J.尼曼
第五章 假设检验
本章介绍假设检验的基本原理和一些常见的假设检验。具体要求:①正确理 解假设检验的含义与种类;②熟知如何建立原假设和备择假设,以及两者的意义; ③掌握假设检验的判断规则和基本步骤;④掌握一些常见的假设检验;⑤正确理
Hale Waihona Puke 形式,其构造公式为Z
=
θˆ −θ SE(θˆ)
或t
=
第六章假设检验-PPT课件
货物进行检测一下,看看这部货物次品率是否超过1%, 由于你抽取的货物是随机的,因此所抽查货物的次品率也 是随机的。为此,我们假定前面的假设是正确的,在这基 础上计算题目中的事件A:“随机抽取产品中次品率不超 过1%”发生的概率。
6 0.01 p0.01 200 P(A ) P {z } p(1 p) 0.01(10.01 ) n 200 P {z 2.619 }0.0044
例2 某地区小麦的一般生产水平是亩产250公斤,其标准 差是6公斤。现在经过品种改良试验,从25个小区抽样, 结果为小麦平均亩产比原来提高20公斤。对检验假设 H 5 0 , H 5 0 的问题,求 270 0 : 2 1 : 2 时,不犯第二类错误的概率。假设小麦亩产服从正态分布 ( 0.05 )。
在(1)式中,z 正好是统计量,并且其分布是标准正态
(1)
分布,计算结果及示意图是
y
0.0044
2.61
x
从(1)的计算结果可以看出,在超市提出的假设成立的 情况下,随机抽取的200件产品中,有6件是次品的概率 为0.0044,显然这是一个小概率事件,认为在一次抽查中 不应该发生,现在它发生了,我们怀疑超市提出的假设不 应该成立。也就是拒绝这批产品进入超市。 在这个例子中,超市提出了假设,通过抽样获得样本数
次试验中不发生原理,照样乘车、乘飞机等。 2、假设检验问题的提出 在用统计学研究自然科学和社会科学问题时,有时提出一 个假设,这个假设称为原假设,然后依据小概率事件在一 次试验中不发生原理,检验这个假设正确与否。 例1 某超市从厂家进货,双方达成协议,如果次品率超 过1% ,则超市拒收货物,今有一批货物,随机抽取200 0.05 下, 件检查,发现有次品3件,在显著性水平 试问超市是否要接受这批货物? 作为超市来说,可以提出一个假设:次品率小于或等于 1%,再抽取样本,检验这个假设对不对, 若假设成立,就 允许这批货物进入超市,相反,若假设不成立,就拒绝这 批货物进入超市。现在问题的关键在于如何判断这批货物 的次品率是否超过1%,有些同学可能会说可以抽一部分
假设检验
第十章假设检验第一节假设检验的基本问题一、假设与假设检验1.假设检验的意义从样本的差异推论总体差异的过程,就是假设检验。
一个研究的概括程度越高,可推论的范围就越大。
2.虚无假设H0在推论研究假设之前所提出来的与研究假设相反的假设,这一假设是不存在的,故称之为虚无假设。
一般虚无假设都假设两个总体之间没有差异。
3.研究假设H1研究中所要证明的假设,称为科学假设、对立假设。
一般为假设两个总体参数之间有差异。
二、检验中的两类错误1、α错误:(1)概念:又称为显著性水平,I型错误,是指在否定虚无假设、接受对立假设时所犯的错误,即是将属于没有差异的总体推论为有差异的总体时,所犯的错误。
(2)α错误的确定原则:α错误的概率一般根据统计学原则,规定为5%-1%。
2.β错误:β错误是指在接受H0 为真时所犯的错误,在接受H0 为真,而拒绝H1时,势比有一部分属于H1总体的部分样本,被视为H0 的部分,而被否定在H1之外。
(3)α错误和β错误的关系:α错误和β错误是在两个前提下的概率。
两个总体的关系若是确定的,则α增大,β减小;α减小,β增大;二者相反。
三、单侧检验和双侧检验1、单测检验(1)概念:查统计表时,按分布的一侧计算显著性水平概率的检验,称作单侧检验。
(2)应用条件:凡是检验大于、小于、高于、低于、优于、劣于等有确定性大小关系的假设检验问题。
这类问题的确定是有一定的理论依据的。
假设检验写作H1:μ1<μ2 或μ1>μ2。
2.双侧检验(1)概念:查统计表时,按分布的两端计算显著性水平概率的检验,称作双侧检验。
(2)应用条件:凡是理论上不能确定两个总体一个一定比另一个大或小的假设检验。
一般写作H1:μ1≠μ2。
第二节平均数差异显著性检验一、平均数显著性检验(一)概念:是指研究样本的总体与已知总体μ0差异是否显著的假设检验。
(二)原理:总体分布正态分布或接近正态分布的样本平均数的分布为正态分布或t分布,按分布率进行推论。
统计学第5章 假设检验
假设检验
第 5 章
假设检验
• 5.1 假设检验的基本问题 • 5.2 一个总体参数的检验 • 5.3 两个总体参数的检验(自学)
5.1
假设检验的基本原理
一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 四、利用P值进行决策
假设检验的基本概念
在实际工作中常会遇到这样的问题: (1)某药物在改进工艺后的疗效是否有提高? (2)假定总体服从某种分布是否成立? 如何通过抽检的样本对上述问题做出判断? 此时常常作出适当的假设,然后进行试验或 观测,得到统计样本,构造统计方法进行判断,以 决定是否接受这个假设。
1. 基本原理
小概率推断原理: 0 α 0.05 小概率事件 (概率接近0的事件),在一次试验中,实际上可认为 不会发生(这是人们长期积累起的普遍经验!).
2. 基本思想方法
采用概率性质的反证法: 先提出假设H0 , 再根 据一次抽样所得到的样本值进行计算. 若导致小 概率事件发生,则否认假设H0 ;否则,接受假设H0 . 下面结合实例来说明假设检验的基本思想.
H0 :π ≤30%
H1 :π >30%
提出假设 (练习)
• 某厂生产的化纤的纤度服从正态分布,纤 维纤度的标准均值为1.04。某天测得25根 纤维的纤度均值为x=1.39,检验与原来设 计的标准均值相比是否有所变化,要求的 显著性水平为α =0.05,则假设形式为: •
H0 :μ =1.04
H1 :μ ≠1.04
假设检验的基本思想
抽样分布 这个值不像 我们应该得 到的样本均 值 ... ... 如果这是 总体的假设 均值 = 50 H0
... 因此我们 拒绝假设 = 50
20
假设检验的基本问题
2011-6-13
苏州职业大学
24
α 和 β 的关系
α和β 的关系就像 翘翘板, 翘翘板,α小β 就 大, α大β 就小
费希尔是现代数理统计学的主要奠基人之一 。
其重要成就有: 系统地发展了正态总体下种种统计量的抽样分布, 其重要成就有: 系统地发展了正态总体下种种统计量的抽样分布, 建立了以最大似然估计为中心的点估计理论; 建立了以最大似然估计为中心的点估计理论; 与耶茨合作创立了实验设计; 与耶茨合作创立了实验设计; 发展了方差分析法; 发展了方差分析法; 在假设检验的发展中也起过重要作用。 在假设检验的发展中也起过重要作用。
解:研究者抽检的意图是倾向于证实这种洗涤剂的平 均净含量并不符合说明书中的陈述 。
H0 :
µ ≥ 500
绿叶 洗涤剂
H1 :
µ < 500
500g
2011-6-13
苏州职业大学
12
3.假设检验 假设检验
(1)什么是假设检验 ) 先对总体的参数(或分布形式 提出某种假设, 或分布形式)提出某种假设 先对总体的参数 或分布形式 提出某种假设, 然后利用样本信息判断假设是否成立的过程。 然后利用样本信息判断假设是否成立的过程。
你要同时减少两类 错误的惟一办法是 增加样本容量! 增加样本容量
β α
2011-6-13 苏州职业大学 25
两类错误的控制
一般来说, 一般来说,发生哪一类错误的后果更为严 重,就应该首要控制哪类错误发生的概率。 就应该首要控制哪类错误发生的概率。
第七章 假设检验
若统计量的值落在否定域内(包括临界 值),说明H0与样本描述的情况有显著差异, 应该否定原假设;若该值落在接受域内,就 说明H0与样本描述的情况无显著差异,则应 接受原假设。 本例Z值为2.5落入拒绝域,故拒绝原假设, 认为08年国有单位职工月平均工资与07年相 比有显著差异。
15
end
三、假设检验中的两类错误 假设检验是依据样本信息进行判断,是由部 分来推断整体,因而不可能绝对准确,可能 犯错误。
end
0.55 0.60
三、总体方差的假设检验 ( 2检验)
1. 检验一个总体的方差或标准差 2. 假设总体近似服从正态分布 3. 检验统计量服从 2分布
( n 1) s 2 ~ ( n 1) 2 0
Байду номын сангаас2 2
假设的总体方差
34
end
【例 6-9】啤酒生产企业采用自动生产线灌 装啤酒,每瓶的装填量为 640ml ,但由于 受某些不可控因素的影响,每瓶的装填量 会有差异。此时,不仅每瓶的平均装填量 很重要,装填量的方差同样很重要。如果 方差很大,会出现装填量太多或太少的情 况,这样要么生产企业不划算,要么消费 者不满意。假定生产标准规定每瓶装填量 的标准差不应超过 4ml 。企业质检部门抽 取了10瓶啤酒进行检验,得到的样本标准 差为s=3.8ml。试以0.05的显著性水平检验 装填量的标准差是否符合要求? 方差检验经常是右侧检验
17
end
第二节总体参数的假设检验
总体参数假设检验就是检验已知分布形 式的总体某些参数是否与事先所做的假 设存在显著性差异,又称为显著性检验。 主要包括对总体均值、总体比例和总体 方差的假设检验。
18
end
一、总体均值的假设检验
第六章 假设检验
《统计学》
statistics
广东白云学院
《统计学》
statistics
广东白云学院
《统计学》
statistics
广东白云学院
《统计学》
statistics
三.假设检验的过程
即:如果样本信息不是偏离总体参数或分布形式的
假设很远的话,就可以认为这个假设是正确的、可以接受 的。
广东白云学院
www.bvtபைடு நூலகம்
《统计学》
statistics
(3)两类错误
小概率原理认为小概率事件在一次试验中是不可能出现的,但 现实中,确实出现过,如有人确实中了500万,那小概率原理说明的 问题就不对了,我们把这种情况叫做“统计学所犯的错误”。
第一节 假设检验的基本问题
假设检验方法的背景: 皮尔逊,费希尔 法律中对人有罪的判断以及裁判
广东白云学院
《统计学》
statistics
一.假设检验的概念
(1)假设(hypothesis) 一般定义:对事物未知事实的一种陈述。
如:明天会下雨等 引申到统计学中,我们所关心的“事物未知事实”是什么?
statistics
2)错误和错误的关系 在同一个检验中,和的关系为(如图) :
小,就大 大,就小 不能同时减少两类错误 接受域:把接受(原)假设的区域叫做接受域; 拒绝域:把拒绝(原)假设的区域叫做拒绝域。
【思考】有没有其他办法同时减小和?
增加样本容量n 广东白云学院
《统计学》
statistics
1.总体均值μ的检验(使用样本信息 (1)提出假设 H 0 : 0 双侧检验: H1 : 0
假设检验的基本问题
精品ppt模板
0
样本统计量
临界值
总结 决策规则
1. 给定显著性水平a,查表得出相应的临 界值za或za/2, ta或ta/2
2. 将检验统计量的值与a水平的临界值进 行比较
3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
解:研究者想收集证据予以证明的假设应 该是“生产过程不正常”。建立的原假设 和备择假设为
H0 : m = 10cm H1 : m 10cm
What is 城市轨道交通 urban rail transport
精品ppt模板
提出假设(例题分析)
【例】某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造 商的说明是否属实。试陈述用于检验的原假设与备择 假设
提出假设(例题分析)
【例】一种零件的生产标准是直径应为10cm,为对生 产过程进行控制,质量监测人员定期对一台加工机床检 查,确定这台机床生产的零件是否符合标准要求。如果 零件的平均直径大于或小于10cm,则表明生产过程不 正常,必须进行调整。试陈述用来检验生产过程是否正 常的原假设和被择假设
解:研究者抽检的意图是倾向于证实这 种洗涤剂的平均净含量并不符合说明书 中的陈述 。建立的原假设和备择假设为
H0 : m 500 H1 : m < 500
500g
What is 城市轨道交通 urban rail transport
精品ppt模板
提出假设(例题分析)
【例】一家研究机构估计,某城市中家庭 拥有汽车的比例超过30%。为验证这一估 计是否正确,该研究机构随机抽取了一个 样本进行检验。试陈述用于检验的原假设 与备择假设
统计学第四版第7章假设检验(简)总结
~ 2 n 1
2 n 1 s 当H 为真时,统计量 2
2 n 1 s 20 10.0042 2 统计量的值 31.92
2
0.0025
2 0.10, 查 2分布表得 02.05 ( 19) 30.14, 0 19 10.12 .95
假设检验分为两类:参数检验、非参数检验/自
由分布检验
2
例1
消费者协会接到消费者投诉,指控品牌纸包装饮
料存在容量不足,有欺骗消费者之嫌。包装上标 明的容量为250毫升。消费者协会从市场上随机抽 取50盒该品牌纸包装饮品,测试发现平均含量为 248毫升,小于250毫升。这是生产中正常的波动, 还是厂商的有意行为?消费者协会能否根据该样 本数据,判定饮料厂商欺骗了消费者呢?
提出原假设和备择假设→根据抽样分布,计算样本统 计量→选择显著性水平α ,查表确定临界值→判断并 得出结论。
8
第一步:确定原假设与备择假设
: =255;
:
≠250
原假设H0:通常是研究者 想收集证据予以反对的假 设,也称为零假设
备择假设H1:通常是研究 者想收集证据予以支持的 假设,也称为研究假设。
3
例2
一种罐装饮料采用自动生产线生产,每罐
的容量是255ml,标准差为5ml。为检验每罐
容量是否符合要求,质检人员在某天生产
的饮料中随意抽取了40罐进行检验,测得每
罐平均容量为255.8ml。检验该天生产的饮
料容量是否符合标准要求。
4
例3
根据过去大量资料,某厂生产的产品的使
用寿命服从正态分布N(1020,1002)。现
假设检验
二 几种常见的假设检验
2 两个总体均值之差的检验
(1)两个总体服从正态分布且方差已知
(2)两个总体服从正态分布,但方差未知
(3)两个总体方差未知但为大样本
二 几种常见的假设检验
3 两总体成数之差的检验
4 总体方差的检验 5 两总体方差比的检验
类错误与功效
一 假设检验的基本问题
2 假设检验的基本原理
假设检验的基本原理就是小概率原理
小概率事件在一次试验中几乎是不可能发生的,至于什么算小概
率事件,那就是我们在计算前明确的决策标准,也就是显著性水平α。 在检验过程中,我们假设原假设是真实的,同时计算出观测到的差异 完全是由于随机误差所致的概率。之后将其与我们事先定好的显著性 水平比较,从而考虑是否依据小概率原理来拒绝原假设。
假设检验
一 假设检验的基本问题
二 几种常见的假设检验 三 假设检验的两类错误
一 假设检验的基本问题
1 假设检验的概念
假设检验也叫显著性检验,是统计推断的基本内容之一。而所谓
的假设检验,就是事先对总体参数或总体分布形态做出一个规定或假 设,然后利用样本提供的信息,以一定的概率来检验假设是否成立, 或者说判断总体的真实情况是否与原假设存在显著性的差异。因此, 统计假设就是关于统计总体分布特征的某种论断。
一 假设检验的基本问题
3 假设检验的步骤
①根据问题要求,提出原假设H0和备择假设H1
②选择适当的检验统计量
③给定显著性水平α,当H0为真时,求出临界值
④计算检验统计量的值
统计学假设检验概念和方法
临界值
H0值
计算出旳样本统计量
样本统计量
右侧检验旳P 值
抽样分布
置信水平
拒绝域
1 -
P值
H0值
临界值 计算出旳样本统计量
利用 P 值进行检验
(决策准则)
1. 单侧检验
– 若p-值 ,不拒绝 H0 – 若p-值 < , 拒绝 H0
2. 双侧检验
– 若p-值 /2, 不拒绝 H0 – 若p-值 < /2, 拒绝 H0
零假设总是一种与总体参数有关旳问题,所以 总是用希腊字母表达。有关样本统计量如样本 均值或样本均值之差旳零假设是没有意义旳, 因为样本统计量是已知旳,当然能说出它们等 于几或是否相等
提出原假设和备择假设
什么是备择假设?(alternative hypothesis) 1. 与原假设对立旳假设,也称“研究假设” 2. 研究者想搜集证据予以支持旳假设总是有不
(单尾和双尾)
是
z 检验
Z X 0 n
总体均值旳检验
(检验统计量)
总体 是否已知 ?
大
z 检验
Z X 0
Sn
否
样本容量 n
小
用样本标 准差S替代
检验
t X 0 Sn
总体均值旳检验
(2 已知或2未知大样本)
1. 假定条件
– 总体服从正态分布 – 若不服从正态分布, 可用正态分布来近似
– 右侧检验时,P-值为曲线上方不小于等于
检验统计量部分旳面积
3. 被称为观察到旳(或实测旳)明显性水平
– H0 能被拒绝旳 旳最小值
双侧检验旳P 值
/ 2 拒绝
1/2 P 值
/ 2 拒绝
1/2 P 值
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验的基本问题
一、什么是假设检验
原假设H 0是接受检验的假设。
备择假设H 1是当原假设被否定时另一种可成立的假设。
原假设和备择假设相互对立,在任何情况下只能有一个成立。
二、假设检验中的小概率事件
假设检验的基本思想——根据小概率的原理,可以做出是否接受原假设的决定。
小概率原理:指发生概率很小的随机事件在一次试验中几乎不可能发生的。
E : 据报载,某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、绿两色球各10个的暗箱中连续摸10次(摸后放回),若10次都是摸得绿球,则中大奖。
某人按规则去摸10次,皆为绿球,商店认定此人作弊,拒付大奖,此人不服,最后引出官司。
所谓“小概率事件”,究竟多大概率为小概率事件?在一个问题中,通常是指定一个正数10,<<αα,认为概率不超过α的事件是在一次试验中不会发生的事件,这个α称为显著性水平(Level of significance)。
通常可选取α=0.01,0.05,0.10等。
下面我们用假设检验的语言来模拟商店的推断:
10
提出假设:0H :此人未作弊;1H :此人作弊。
20 构造统计量,并由样本算出其具体值:
统计量取为10次摸球中摸中绿球的个数N .由抽样结果算出N=10
30
求出在H 0下统计量N 的分布,构造对H 0不利的小概率事件。
40
给定显著性水平α,确定临界值。
50
得出结论。
在这些步骤中,关键的技术问题是确定一个适当的用以检验假设的统计量,这个统计量至少应该满足在H 0成立的情况下,其抽样分布易于计算(查到)。
在统计量选定以后,便可构造出由该统计量T 描述某个显著性水平下的一小概率事件{αB T ∈},我们称使得这一小概率事件发生的样本空间的点的全体 });,,,(:),,,{(2121αθB X X X T X X X V n n ∈X ∈=
为H 0的否定域或拒绝域,最后的检验即是判断所给的样本是否落在V 内。
因此,设计一个检验,本质上就是找到一个恰当的否定域V ,使得在0H 下,它的概率:a H V P 0)()|(≤=或 依据小概率原理推断可能会犯错误!
检验的原理是“小概率事件在一次试验中不发生”,以此作为推断的依据,决定是接受H 0或拒绝H 0.但是这一原理只是在概率意义下成立,并不是严格成立的,即不能说小概率事件在一次试验中绝对不可能发生。
仍以上例来说,尽管按统计推断结论,认为摸球人作弊,但事实上也完全可能没有作弊。
当摸奖人事实上的确是未作弊的话,商店的统计推断就犯了错误。
三、第一类错误、第二类错误与显著水平
第一类错误(弃真错误):原假设H 0本来为真,却错误地否定
了。
(属于弃真错误)
第二类错误(取伪错误):原假设H 0非真,但做出接受H 0的选择。
(属于取伪错误)
犯两错误的概率:在假设检验中,犯第一类错误的概率记为α,α也称为显著性水平。
犯Ⅱ类错误的概率记为β。
人们自然希望犯这两类错误的概率越小越好。
但对于一定的样本容量n ,两类错误有相反的关系,减小α会引起β增大,减少β会引起α增大。
可能带来的后果越严重,危害越大的一类错误,在假设检验中作为首要的控制目标!它是谁呢? 假设检验中,遵守首先控制犯α错误原则大家都在执行这样一个原则。
α
β 对H 0的行动 H 0是真的 H 1是真的
你的 态度 接受H 0 你正确
你犯第二类错误β 拒绝H 0
你犯第一
类错误α 你正确
原因是:原假设是什么常常是明确的,而替换假设常常是模糊的。
所以,人们常把最关心的问题作为原假设提出,将较严重的错误放到了α,这就能够在假设检验中对α错误实施有效控制。
假设检验中犯两类错误的概率如下图所示:
µ=µ0 µ0 (a )
µ=µ1>µ0
µ1 (b )
注意:
(1)在假设检验中,原假设0H 与备选假设1H 的地位不对等。
检验推断是“偏向”原假设,而“歧视”备选假设的。
在应用中一定要慎重提出原假设。
(2)对于0H 的否定是有力的,且 越小,小概率事件越难于发生,一旦发生了,这种否定就越有力,也就越能说明问题。
综上所述,处理参数的假设检验问题的步骤如下:
β
α
接受H 0 拒绝H 0
(1)根据实际问题的要求,给出原假设和备择假设;
(2)给定显著性水平α0和样本容量n;
(3)确定检验统计量以及拒绝域的形式;
(4)按P{当H0为真拒绝H0}≤α0求出拒绝域;
(5)取样,根据样本观察值做出决策,是接受H0还是拒绝H0。
四、SPSS中假设检验的判定原则
在SPSS系统中,所有的假设检验(包括非参数检验)都只要求使用者记住(必须记住!)检验的原假设H0是什么,并且按照以下的准则去判断是否应该接受原假设:
若sig>α0,则接受原假设H0;若sig<α0,则拒绝原假设H0。
One-Sample T Test过程检验单个变量的均值是否与给定的常数之间存在差异。
该过程对每个检验变量给出的统计量有:均值、标准差和均值的标准误。
该过程计算每个数据值与总体均值之间差的平均值,进行该差值为0的t检验及计算该差值的置信区间,用户可以指定检验的显著性水平。
(如:0.05)
〖练习〗数据文件“公司职工.sav”,试检验假设:
H0:平均受教育年限μ=13 H1:μ≠13
H0:平均受教育年限μ=13.5 H1:μ≠13.5
H0:平均当前薪金μ=13.5 H1:μ≠13.5
H0:平均年龄μ=40 H1:μ≠40。