统计学原理:第8章 假设检验
第8 假设检验(共80张PPT)
8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。
第8章假设检验
二、两均数比较的u检验
完全随机设计中两组计量资料的比较
观察性研究中分别从两个总体中随机抽取两个计 量资料样本进行比较,且两组的样本含量n1和n2要 求等于或大于30 基本原理:在H0成立的条件下,即两样本是从 同一总体随机抽取的,其均数之差可以大于0,或小 于0,围绕0分布。 差值 X1 X 2 服从均数为 1 2 0,标准差(两均数 差的标准误)为 S X X 的正态分布
0
所代表的未知总体均数记作μ;检验的目的是推断μ与μ0
是否有差别
u
X 0 S/ n
例 8 –2
n 85
S 5.3cm
X 171.2cm
168.5cm
1. 建立假设、确定检验水准α。
H 0 : 168.5 (与1995年相比,2003年当地20岁应征男青年的身 高没有变化)
2
p
的正态分布
统计量:
u p 0 p 0 0 (1 0 ) / n
p
例8 – 4
π0 =8.5% ,n=1000,p=5.5%
1.建立假设,确定检验水准。 H0:π=8.5% H1:π< 8.5% 单侧检验,α=0.05。 2.计算检验统计量u值
0.055 0.085 u 3.402 0.085(1 0.085) /1000
2. 样本数据不要求一定服从正态分布总体。
2. 两总体方差相等(方差齐性,即 12 22 )。
3. 理论上要求:单样本是从总体中随机抽取,两样本为随 机分组资料;观察性资料要求组间具有可比性,保证因果 推论的合理性。
一、单样本均数的u检验
样本均数与总体均数比较,总体均数指已知的理论值、 标准值或经过大量观察所得到的稳定值,记作 ;样本
概率论与数理统计(8)假设检验
概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
教育与心理统计学第八章:假设检验
临界值
H0值
样本统计量
左侧检验示意图
(显著性水平与拒绝域 )
抽样分布
置信水平
拒绝域
1- 接受域
临界值
H0值
样本统计量
观察到的样本统计量
右侧检验示意图 (显著性水平与拒绝域 )
抽样分布
置信水平
1- 接受域
拒绝域
H0值 观察到的样本统计量
临界值
样本统计量
双侧检验原假设与备择假设的确定
▪ 双侧检验属于决策中的假设检验。即不论是拒绝H0还 是接受H0,都必需采取相应的行动措施。
1、原假设真实, 并接受原假设,判断正确; 2、原假设不真实,且拒绝原假设,判断正确; 3、原假设真实, 但拒绝原假设,判断错误; 4、原假设不真实,却接受原假设,判断错误。
假设检验是依据样本提供的信息进行判断,有犯错误 的可能。所犯错误有两种类型:
第一类错误是原假设H0为真时,检验结果把它当成不 真而拒绝了。犯这种错误的概率用α表示,也称作α错 误(αerror)或弃真错误。
型错误
β错误(取伪错误) 1-β(正确决策)
要使犯这两类错误的概率α 和β都尽可能小, α也不能定
的过低 。
在一般研究中,我们总是控制犯型错误
为什么???
假设检验中人们普遍执行同一准则:首先控制弃真错误(α错 误)。假设检验的基本法则以α为显著性水平就体现了这一原
则。
两个理由: 统计推断中大家都遵循统一的准则,讨论问题会比较方便。
0.076mm。试问新机床加工零件 的椭圆度均值与以前有无显著差
异?(=0.05)
属于决策中 的假设!
解:已知:X0=0.081mm, =.25,n=200,
x 0.076
北京工业大学《概率论与数理统计》课件 第8章 正态总体均值的假设检验
在数理统计中,把 “ X 的均值 μ =10” 这样
的一个欲检验的假设称为 “原假设” 或 “零 假设”,记成 “ H0:μ =10”。这里的“H”是 从英文“ hypothesis ”的字头而来,“ 0 ” 是从 “null”或“zero” 含义而生。
该检验称为两样本 t 检验。
说明
上面,我们假定 12=22。当然,这是个 不得已而强加上去的条件。因为,如果不加 这个条件,就无法使用简单易行的 t 检验。
在实用中,只要我们有理由认为12和22 相差不是太大,就可使用上述方法。通常的 做法是:如果方差比检验未被拒绝(见下节), 就认为12和22相差不是太大。
又如:考察一项新技术对提高产品质量是 否有效,就把新技术实施前后生产的产品质量
指标分别看成正态总体 N(1, 12)和 N(2, 22)。
这时,所考察的问题就归结为检验这两个正态
总体的均值 1和 2是否相等的问题。
设X1, X2, …, Xm与Y1, Y2, …, Yn 分别为抽
自正态总体 N(1, 12) 和N(2, 22) 的样本,记
的大小检验 H0 是否
成立。
合理的做法应该是:找出一个界限 c,
这里的问题是:如何确定常数 c 呢? 细致地分析:根据定理 6.3.1,有
于是,当原假设 H0:μ =10 成立时,有
为确定常数 c,我们考虑一个很小的正数, 如 =0.05。当原假设H0:μ =10 成立时,有
于是,我们就得到如下检验准则:
即新技术或新配方对提高产品质量确实有效。
单边检验 H0: μ =μ0 ‹–› H1: μ >μ0
现代心理与教育统计学 第八章-假设检验(张厚粲)
p值 >0.05 ≤0.05 ≤0.01
显著性 不显著 显著 极显著
符号表示
* **
虽然我们比较习惯取α=0.05和α=0.01,但也可以取其 它的显著性水平值,如0.005或0.001。
三、假设检验中的两类错误
(一)定义
错误(I型错误): H0为真时却被拒绝,弃真错误; 错误是 指虚无假设本身是正确的,但由于抽样的随机性而使 检验值落入了拒绝虚无假设的区域,致使我们作出了 拒绝虚无假设的结论,
正解:
1、提出零假设和备择假设 备择假设:用H1表示,即研究假设,希望证实的假设。 H1 : 1 0 (该班智力水平确实与常模有差异) 1100 零假设:用H0表示,即虚无假设、原假设、无差异假 设。 H0: 1=0 1 =100
2、确定适当的检验统计量
用于假设检验问题的统计量称为检验统计量。与参数 估计相同,需要考虑:
又或者是样本统计量与总体参数之间存在真实的差异, 是一种有差假设,用H1表示。 3.表达方式,如:
H1: X 0 或 X ;1 2 或 1 2 0 。
(二)虚无假设
1.研究人员为了证实研究假设是真的而利用概率论的 反证法所进行的假设,即从研究假设的反面进行假设。
第八章 假设检验
李金德
第一节 假设检验的原理 第二节 平均数的显著性检验 第三节 平均数差异的显著性检验 第四节 方差的差异检验 第五节 相关系数的显著性检验 第六节比率的显著性检验
第一节 假设检验的原理
在统计学中,通过样本统计量得出的差异做出一般性 结论,判断总体参数之间是否存在差异,这种推论过 程称作假设检验(hypothesis testing)
β μ0
统计学-第八章 假设检验
假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)
2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;
统计假设检验的原理和步骤是什么
统计假设检验的原理和步骤是什么
假设检验是一种统计推断方法,用于判断样本数据是否支持某个假设,并进行统计显著性推断。
原理:
假设检验的原理基于概率统计学,它通过比较观察到的样本数据与一个假设模型之间的差异,来做出关于总体参数的推断。
假设检验从概率的角度出发,将观察到的样本结果与被试验的假设进行比较,进而得出是否拒绝原假设的结论。
步骤:
1. 建立原假设(H0)和备择假设(H1):
原假设通常是关于总体参数的断言,备择假设是对原假设的否定或补充。
2. 选择显著性水平(α):
显著性水平表示对原假设不正确的容忍度,通常选取0.05或0.01作为显著性水平。
3. 计算检验统计量:
根据样本数据计算出特定的检验统计量,如Z值、t值等。
检验统计量的选择取决于样本量和总体分布的已知信息。
4. 确定拒绝域:
拒绝域是一组可能的观测结果,如果样本数据的检验统计量落在拒绝域内,则在给定显著性水平下拒绝原假设。
5. 计算p值:
p值是指当原假设为真时,观察到的统计量比原假设更"极端"的概率。
p值可以用来判断是否拒绝原假设,一般小于显著性水平α时拒绝原假设。
6. 得出统计结论:
根据检验统计量和p值,结合显著性水平,对原假设进行推断,判断是否拒绝原假设,得到统计结论。
总结:
假设检验是一种用于进行统计推断的方法,它通过假设与观察到的样本数据的比较,进行显著性推断。
假设检验的步骤包括建立原假设和备择假设、选择显著性水平、计算检验统计量、确定拒绝域、计算p值、得出统计结论。
统计学原理——假设检验与方差分析
二、假设检验中的两类错误**
第Ⅰ类错误/弃真错误 (type Ⅰ error)
当原假设为真时拒绝原假设。犯第Ⅰ类错误的概率
通常记为 。
第Ⅱ类错误/取伪错误(type Ⅱ error)
n1 P 40010.2 320 f 5
所以为大样本分布,检验统计量 Z 近似服从 正态分布。样本数据显示:
p 100 0.25 400
Z p P0 0.25 0.20 0.05 2.5
P 1 P 0.21 0.2 0.02
n
400
在显著性水平 0.05 情况下,查表可知,
比RMB 245.95小或者比RMB 274.05大。所以,在双侧 检验(见下图8-1)中有两个拒绝域。
拒绝域
接受域
拒绝域
245.95
260.00
274.05
图8-1 双边检验的拒绝域与接受域
[例8-2] 在例8-1的假设检验中,如果样本的均值
为 X 240.00 ,当显著性水平为0.05时,原假设是否被 拒绝。
重点是三种不同情况下的假设检验方法,总体方差已 知时正态总体均值和总体比例的假设检验。
难点是总体方差未知时正态总体均值的假设检验和方 差分析。
第一节 假设检验
一、假设检验的概念
一、假设检验的概念
假设(hypothesis),又称统计假设,是对总体参数 的具体数值所作的陈述。
假设检验(hypothesis test) 是先对总体参数提出 某种假设,然后利用样本信息判断假设是否成立的过程。
(3) H0:μ = μ0 H1:μ<μ
第八章:统计检验的基本方法.
经济、管理类基础课程 《统计学原理》
【例3】设某异常区磁场强度服从正态分布N~
(56,20)现有一台新型号的仪器,用它对该区 进行磁测,抽测了41个点,其平均数为=61.1,今 以α=0.05检验用此仪器测出的结果,是否符合要 求? 解:双侧检验, Z=(61.1-56)/4.47/
经济、管理类基础课程 《统计学原理》
黔南民族师范学院管理科学系
经济、管理类基础课程 《统计学原理》
(三)、单侧检验与双侧检验 1、双侧检验:只强调差异而不考虑方向性的 检验称为双侧检验。 (显著性概率集中于概
率分布两侧)
①临界值:取双侧临界值,检验中临界值常 =±1.96、 记为 、t 。 Z 分布中, 2 2 0.01 =±2.58。 2 ②假设符号:“=、≠”。
黔南民族师范学院管理科学系
经济、管理类基础课程 《统计学原理》
【检验结果】
H0: 40000 H1: < 40000 = 0.05 df = 20 - 1 = 19
x 0 41000 40000 t 0.894 s n 5000 20
结论:该制造商的产品同他所说的标准相符。
经济、管理类基础课程 《统计学原理》
(二)、假设检验的两类错误 1、α错误:拒绝属于真实的H0所犯的错误 (弃真)。 2、β错误:接受错误的H0所犯的错误(纳 伪)。
为避免α类错误,可尽量增大置信区间,减 小显著性水平,但同时增大了犯β错误的可 能性;反之则增大犯α错误的可能性。
黔南民族师范学院管理科学系
黔南民族师范学院管理科学系
经济、管理类基础课程 《统计学原理》
统计检验的思路: 进行统计检验,就是首先假定H0成立, 然后运用概率论的原理,计算H0成立的概 率P有多大,P大则接受,P小(一般小于 0.05或0.01)则说明H0成立的可能性极小, 此时要拒绝或否定H0 。
贾俊平版统计学课件 第8章
▽与原假设对立的假设称备择假设,记为 H1 ,用 、 或 表示。 对于新生儿体重的例子,可以表示为
H 0 : 3190
H1 : 3190
(2)确定检验统计量及其分布
▽用于检验假设的统计量称为检验统计量
▽根据 H 0 及相应条件选择适当的统计量,并确定统计量
的分布 对于新生儿体重的例子,可利用 x 0 构造检验统计量. 若新生儿体重为正态分布 N ( , 2 ) ,且 已知,则在 H 0 为真 时,用 z 作为检验统计量,并且
H 0 : 3190 H1 : 3190
并已知 x 3210, 80, n 100 ,则
z0 x 0
n
3210 3190 80 100
2.5
于是
p 2Pz z0 2 0.00621 0.01242
双侧检验的P值
/ 2
/ 2 拒绝
▽犯第二类错误的概率为 。
表8-1 假设检验中各种可能结果的概率
实际情况
H 0 为真 H 0 不真
决策
接受 H 0
1
拒绝 H 0
1
假设检验中的两类错误(决策结果)
H0: 无罪
假设检验就好像一场审判过程 统计检验过程
陪审团审判
实际情况 裁决 无罪 无罪 有罪 正确 错误 有罪 错误 正确 接受H0 拒绝H0 决策
若p-值 /2, 不能拒绝 H0 若p-值 < /2, 拒绝 H0
8.1.6 假设检验的形式
研究的问题 假设
双侧检验
H0 H1
左侧检验
右侧检验
= 0 ≠0
第八章 假设检验 (《统计学》PPT课件)
第二节 一个正态总体的假设检验
一、正态总体
设总体X ~ N(m, 2),抽取容量为n的样本 x1, x2, xn
样本均值 X 与方差S2 计算公式分别为:
2
1 n 1
n i1
(xi
X)
我们将利用上述信息,来检验关于未知参数均值 和方差的假设。
总体参数
均值
方差
总体方差已知
z 检验
(单尾和双尾)
总体方差已知
t 检验
(单尾和双尾)
2 检验
(单尾和双尾)
第二节 一个正态总体的假设检验
二、均值m的假设检验
1.H0:m=m0
2.选择检验统计量:
2已知: Z X m0 ~ N(0,1)
/ n
2未知:
小样本: t X m0 ~ t(n 1)
这个值不像我 们应该得到的 样本均值 ...
...因此我们拒绝 原假设μ=50
... 如果这是总 体的假设均值
60
μ=80
H0
样本均值
第一节 假设检验概述
三、假设检验的程序
一个完整的假设检验过程,通常包括以下几个步骤:
首先,设立原假设H0与备选假设H1; 第二步,构造检验统计量,并根据样本观察数据
小样本:当 t t
2
,则拒绝原假设,反之则接受H0;
5.得出结论。
二、均值m的假设检验
6.例题分析
[例8.3] 某广告公司在广播电台做流行歌曲磁带广告 ,它的插播广告是针对平均年龄为21岁的年轻人的,标 准差为16。这家广告公司经理想了解其节目是否为目标 听众所接受。假定听众的年龄服从正态分布,现随机抽 取400多位听众进行调查,得出的样本结果为x 25 岁S2,18 。以0.05的显著水平判断广告公司的广告策划是否符合 实际?
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第8章 假设检验)【圣才出品】
3.单侧检验和双侧检验 表 8-2 常用假设检验形式
【总结】假设检验:①依据的是小概率原理; ②小概率标准在抽样前依照需要确定; ③假设检验的结果只能是拒绝或不拒绝原假设,而不能证明原假设成立; ④统计假设检验的结果不是绝对正确。
考点二:一个总体参数的检验
1.检验统计量的确定 一个总体参数的检验中,检验统计量主要有三个:z 统计量,t 统计量,χ2 统计量。 选择检验统计量需要考虑的因素:样本量、总体方差 σ2 是否已知。
2 / 48
圣才电子书 十万种考研考证电子书、题库视频学习平台
α 的最大允许值,一般是人们事先指定的。 显著性水平 α 越小,犯第Ⅰ类错误的可能性越小,但犯第Ⅱ类错误的可能性则随之增
大。
【真题精选】 下列哪种情况下属于犯第二类错误?( )[浙江财经大学 2019 研] A.H0 为真,接受 H1 B.H0 不真,接受 H0 C.H0 为真,拒绝 H1 D.H0 不真,拒绝 H0 【答案】B 【解析】在假设检验中,第一类错误指原假设 H0 为真却被拒绝了,犯这种错误的概率 用 α 表示,所以也称其为 α 错误或弃真错误;第二类错误是当原假设 H0 为伪却没有被拒绝, 犯这种错误的概率用 β 表示,所以也称其为 β 错误或取伪错误。
考点三:两个总体参数的检验
1.检验统计量的确定(如图 8-1 所示)
6 / 48
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 8-1 检验统计量的确定 2.两个总体均值之差的检验
7 / 48
圣才电子书 十万种考研考证电子书、题库视频学习平台
大样本时,若 np>5,n(1-p)>5,样本比例近似服从正态分布。
检验统计量: z
管理定量分析课程第8章:假设检验
判决
无罪 有罪
陪审团审判
真实的情况
无罪
有罪
判决正确
判决错误
判决错误
判决正确
结论
未拒绝原假设 拒绝原假设
假设检验 总体参数的实际情况
原假设为真 备择假设为真 结论正确 第二类错误 第一类错误 结论正确
11
假设检验中犯Ⅰ型错误的概率,称为显著性水平(level of significance),即指当零假设实际上是正确时,检验统计量落
7
又如:教育部要检验2012年录取的大学新生平均身高是否 达到了170cm标准,这样需要提出原假设(H0):2012
年大学新生(总体)的平均身高(µ )是170cm。为了检
验这个假设是否正确,需要根据随机取样的原则,从2012 年的大学新生总体中选取样本并计算样本的平均高度,以 此来检验原假设的正确性。
8
假设检验一般分为参数假设检验和非参数假设检验两种类型。参 数假设检验对变量的要求较为严格,适合于等距变量和比率变量 ,非参数假设检验对变量的要求较为自由,既适合于等距变量和 比率变量,也适用于类别变量和顺序变量。
变量测量层次
分类(nominal)变 量
数学性(interval)变量
4
一、假设与假设检验
假设是科学研究中广泛应用的方法,它是根据已知理 论与事实对研究对象所作的假定性说明。统计学中的 假设一般专指用统计学术语对总体参数所做的假定性 说明。在进行任何一项研究时,都需要根据已有的理 论和经验事先对研究结果作出一种预想的假设。这种 假设叫科学假设,在统计学上称为研究假设。对这种 研究假设进行证实或证伪的过程叫假设检验。
非参数检验是一种与总体分布状况无关的检验方法,它不 依赖于总体分布的形式。
第八章假设检验_0
第八章假设检验作为统计推断的重要组成部分,假设检验也称为显著性检验,就是对所估计的总体先提出一个假设,然后再根据样本信息来检验对总体所做的假设是否成立。
假设检验可分为参数检验和非参数检验,对总体分布中未知参数的假设检验称为参数检验,而对未知分布函数的类型或其某些特征提出的假设称为非参数检验。
第一节假设检验概述在实际生活中,许多事例都可以归结为假设检验问题。
为了便于理解,下面我们结合具体实例来说明假设检验的思想方法。
例8.1 某厂生产中药地黄丸,药丸的重量服从正态分布N( , 2),按规定每丸的标准重量为10克。
根据以往经验得知,生产药丸的标准差为 3.2克。
现从一批药丸中随机抽取100个,其平均重量为9.6克,试问这批药丸重量是否符合标准?从直观上来看,这批药丸重量不符合标准,两者差异显著。
但能否仅凭100个药丸的平均重量比标准重量小0.4克,而立即得出这批药丸不符合标准的结论呢?从统计学上来看,这样得出的结论是不可靠的。
这是因为,差异可能是这批药丸品质所造成的,也可能是由于抽样的随机性所造成的。
如果我们再随机抽取100个药丸进行检测重量,又可得到一个样本资料。
由于抽样误差的随机性,样本平均数(100个药丸的平均重量)就不一定是9.6克。
那么,我们对样本进行分析时,必须判断样本的差异是抽样误差造成的,还是因本质不同而引起的。
如何区分两类性质的差异?怎样通过样本来推断总体?这正是假设检验要解决的问题。
在假设检验中,先要根据问题的需要建立检验假设,假设有两种,一种是原假设或零假设,用H0表示,通常就是将要进行检验的假设;另一种是备择假设- 1 -或对立假设,用H1表示,是原假设H0相对立的假设。
例8.1中,如果将该批药丸的重量记作总体X,该问题就是检验总体X的均值 的变化情况。
那么,可以设原假设H0: 10( 0),即认为这批药丸重量是符合标准的;而备择假设,即认为这批药丸重量是符合标准的 10( 0),即认为这批药丸重量不H1:10( 0)符合标准的。
第八章假设检验
需要考虑因素
1. 总体方差是否已知
2. 总体分布是否正态
3. 样本容量大小
4. 双侧检验还是单侧检验 5. 右侧还是左侧
二、平均数的显著性检验的种类
• (一)总体正态分布,总体方差已知(Z)
• (二)总体正态,总体方差未知(t) • (三)总体非正态分布,大样本(Z′)
(一)总体正态分布,总体方差已知
H:1 0 新的教学法与原来的教学法无显著差异 0 H:1 0 新的教学法比原来的教学法差 0 H:1 0 新的教学法比原来的教学法好 0
假设检验的原理
• 费舍:“可以说,每一实验的存在,仅仅 是为了给事实一个反驳虚无假设的机会。”
二、假设检验中的小概率事件
• 样本统计量的值(随机事件)在其抽样分 布上出现的概率小于或等于事先规定的水 平,这时,就认为小概率事件发生了。
差异原因——误差
• 偶然误差:由于随机抽样引起的差异。
• 系统误差 :的确存在差异。
如何检验
Z X 0
X
N (0,1)
11 X 2.008 n 30 Z X 0
0
X
84 79 2.49 2.008
2
0.05, Z 0.05 1.96 0.01, Z 0.01 2.58
SE X
0
n
X 0 Z SE X
例1
• 某小学采用一种实验教材,使用一年以后, 随机抽取10名学生进行测试,得到平均成 绩82分。而过去使用旧教材的全体学生的 平均成绩为77分,标准差为5分,问实验教 材与旧教材的效果有无显著性差异?
例2
• 某地区统考数学,假设该统考数学成绩服 从正态分布,已知其总平均分为50分,标 准差为12分。从该地区随机选择一个班作 为样本,该班有学生50人,经计算该班平 均成绩为53分,试问该班成绩与总成绩的 差异是否显著。
假设检验的原理是什么
假设检验的原理是什么
假设检验的原理是基于统计学原理和概率论的一种做法。
它用于判断一个样本所代表的总体是否满足某个给定的假设,即根据观察到的样本数据推断总体的真实情况。
假设检验的过程通常包括以下步骤:
1. 建立原假设(H0)和备择假设(H1):原假设是针对总体参数所提出的某种假设,备择假设是对原假设的补集。
通常,原假设是一种默认假设,而备择假设是我们想要得到支持的假设。
2. 选择合适的统计量:统计量是根据样本数据计算得出的一个数值,它可以用于推断总体参数的情况。
3. 设定显著性水平:显著性水平是在进行假设检验时所容许的犯错误的概率。
通常,常用的显著性水平是0.05或0.01。
4. 计算样本数据的统计量,并进行假设检验:根据样本数据计算得出统计量的值,然后将其与预先设定的临界值进行比较,以决定是否拒绝原假设。
5. 得出结论:根据计算结果,对原假设的拒绝或接受进行判断并给出相应的结论。
假设检验的目的是通过统计推断的方法来对总体的均值、方差等参数进行推断和判断。
它在科学研究、质量控制等领域中得到广泛应用。
通过假设检验可以帮助我们进行科学决策,并得出对总体参数的信心区间和推断结果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8 - 12
统计学
STATISTICS (第五版)
假设检验中的两类错误 (决策风险)
8 - 13
统计学
STATISTICS
(第五版)
假设检验中的两类错误
1. 第一类错误(弃真错误)
原假设为真时拒绝原假设 第一类错误的概率为
被称为显著性水平
2. 第二类错误(取伪错误)
原假设为假时接受原假设 第二类错误的概率为
8 - 11
统计学
STATISTICS
(第五版)
什么是假设检验?
(hypothesis testing)
1. 事先对总体参数或分布形式作出某种假 设,然后利用样本信息来判断原假设是 否成立
2、采用逻辑上的反证法,依据统计上的小 概率原理
小概率原理:发生概率很小的随机事件在一 次试验中是几乎不可能发生的。
常用的 值有0.01, 0.05, 0.10
4. 由研究者事先确定
8 - 18
统计学
STATISTICS
(第五版)
作出统计决策
1. 计算检验的统计量
2. 根据给定的显著性水平,查表得出相应
的临界值z或z/2, t或t/2
3. 将检验统计量的值与 水平的临界值进
行比较
4. 得出拒绝或不拒绝原假设的结论
5、作出统计决策
因为(Z0.975 1.96) (Z 2.5),所以在显著性水平0.0.5的情况下拒绝H0
8 - 20
认为与1989年相比,1990年新生儿的体重有显著差异
统计学
STATISTICS (第五版)
利用P值进行决策
8 - 21
统计学
STATISTICS
(第五版)
什么是P 值?
(P-value)
STATISTICS
(第五版)
什么是假设?
(hypothesis)
对总体参数的的数值所作的一种陈述
总体参数包括总体均值、比例、方差等
分析之前必需陈述
统计的语言是用一个等式或不等式表示问题的原 假设,不表示它是既定事实,仅是假设。
8 -7
统计学
STATISTICS
(第五版)
假设问题的提出例题8.1
是大样本还是小样本 总体方差已知还是未知
3. 检验统计量的基本形式为
Z X 0
8 - 17
n
统计学
STATISTICS
(第五版)
规定显著性水平
(significant level)
什么是显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域
3. 表示为 (alpha)
8 -4
统计学
STATISTICS
(第五版)
8.1 假设检验的基本问题
8.1.1 假设问题的提出 8.1.2 假设的表达式 8.1.3 两类错误 8.1.4 假设检验的流程 8.1.5 利用P值进行决策 8.1.6 单侧检验
8 -5
统计学
STATISTICS (第五版)
假设问题的提出
8 -6
统计学
8 - 15
统计学
STATISTICS
(第五版)
双侧检验为例图示说明
/ 2 拒绝
/ 2 拒绝
1/2 P 值
1/2 P 值
临界值
计算出的样本统计量
H0值
Z
临界值
计算出的样本统计量
8 - 16
统计学
STATISTICS
(第五版)
确定适当的检验统计量
什么是检验统计量? 1. 用于假设检验决策的统计量 2. 选择统计量的方法与参数估计相同,需考虑
1. 待检验的假设,又称“0假设”
2. 研究者想收集证据予以反对的假设
3. 总是有等号 , 或
4. 表示为 H0
H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克)
8 -9
统计学
STATISTICS
(第五版)
提出原假设和备择假设
什么是备择假设?(alternative hypothesis)
(第五版)
第 8 章 假设检验
8.1 假设检验的基本问题 8.2 一个总体参数的检验 8.4 检验问题的进一步说明
8 -3
统计学
STATISTICS
(第五版)
学习目标
1. 了解假设检验的基本思想 2. 掌握假设检验的步骤 3. 对实际问题作假进行假设检验
统计学
STATISTICS
(第五版)
第 8 章 假设检验
8 -1
统计学
STATISTICS
(第五版)
参数估计和假设检验
相同点:利用样本对总体进行推断 不同点:
参数估计中是利用样本统计量估计总体参数; 假设检验是先对参数真值进行假设,然后利用 样本信息检验假设成立与否。
8 -2
统计学
STATISTICS
1. 是一个概率值,被称为观察到的(或实测 的)显著性水平,H0 能被拒绝的最小值
2. 如果原假设为真,所得到的样本观测结果 出现的概率。
8 - 22
统计学
STATISTICS (第五版)
由统计资料得知,1989年某地新生 儿的平均体重为3190克,
现从1990年的新生儿中随机抽取100 个,测得其平均体重为3210克,
问1990年的新生儿与1989年相比, 体重有无显著差异?
8 -8
统计学
STATISTICS
(第五版)
提出原假设和备择假设
什么是原假设?(null hypothesis)
(Beta)
对于一定量的样 本量,不能同时 使犯两类错误的 概率都很小。此 消彼长。
要使犯两类错误 的概率都变小, 只能是增加样本 量。
8 - 14
统计学
STATISTICS
(第五版)
假设检验的流程
▪ 1、提出假设 ▪ 2、确定适当的检验统计量
▪ 3、规定显著性水平 ▪ 4、计算检验统计量的值 ▪ 5、作出统计决策
8 - 19
统计学例题8.1 1、提出假设
STATISTICHS 0: 3190(克) H1: 3190(克)
(第五版)
2、确定适当的检验统计量 Z X 0 n
3、规定显著性水平(0.05 )Z0.025=-1.96 Z0.975=-1.96
4、计算检验统计量的值 Z X 0 3210 3109 2.5 n 80 100
1. 与原假设对立的假设,也称“研究假设”
2. 研究者想收集证据予以支持的假设总是有不 等号: , 或
3. 表示为 H1
H1: <某一数值,或 某一数值 例如, H1: < 3910(克),或 3910(克)
8 - 10
统计学
STATISTICS
(第五版)
提出原假设和备择假设
原假设与备择假设互斥, 肯定原假设,意味着放弃备择假设; 否定原假设,意味着肯定备择假设。