2011第五章 改-统计假设检验
教育与心理统计学 第五章 假设检验考研笔记-精品
假设检验中的小概率原理[一级][16J]
假设检验的基本思想是概率性质的反证法,即其基本思想是基于〃小概率事件在一次实验中不可能发生”这一原理。首先假定虚无假设为
真,在虚无假设为真的前提下,如果小概率事件在一次试验中出现,则表明〃虚无假设为真"的假定是不止确的,因为假定小概率事件在
一次试验中是不可能出现的,所以也就不能接受虚无假设,应当拒绝零假设。若没有导致小概率事件出现,那就认为"虚无假设为真”的
假定是正确的,也就是说要接受虚无假设。假设推断的依据:小概率事件是否出现,这是对假设作出决断的依据。
检验的假设
Ho为真
真实情况
检验的事件发生的概率在99%或95%的范围内
检验的事件发生的概率在5%或1%以内
错误的概率,其前提是“Ho为假
②它们都是在做假设检验的统计决策时可能犯的错误,决策者同时面临犯两种错误的风险,因此都极力想避免或者减少它们,但由于在忠
体间真实差异不变情况下,它们之间是一种此消彼长的关系,即a大时,0小;c(和B不能同时减少。
③在其他条件不变的情况下,不可能同时减小或增大两种错误的发生可能,常用的办法是固定a的情况下尽可能减小B,比如通过增大样本
若进行假设检验时总体的分布形态已知,需要对总体的未知参数进行假设检验,称其为参数假设检验。
(三)非参数检验[一级]
若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称为非参数假设检验。
(四)小概率事件和显著性水平
(1)假设推断的依据就是小概率原理
小概率事件:通常情况下,将概率不超过0.05(即5%)的事件当作“小概率事件",有时也定为概率不超过0.01(即1%)或0.001(0.1%\
第二讲-第五章 t检验-2011
二、配对设计两样本平均数的差异显著性检验
非配对设计要求试验单位尽可能一致。如 果试验单位变异较大,如试验动物的年龄、体 重相差较大,若采用上述方法就有可能使处理 效应受到系统误差的影响而降低试验的准确性 与精确性。 为了消除试验单位不一致对试验结 果的影响,正确地估计处理效应,减少系统误 差,降低试验误差,提高试验的准确性与精确 性,可以利用局部控制的原则,采用配对设计。
表 非配对设计资料的一般形式
非配对设计两样本平均数差异显著性检 验的基本步骤如下:
(一)提出无效假设与备择假设
H0:1 2 ,H A:1 2
(二)计算t值 计算公式为:
t x1 x2 S x1x2
df (n1 1) (n2 1)
其中:
S x1x2
受 H A:1 2 ,表明长白后备种猪与蓝塘后
备种猪90kg背膘厚度差异极显著,这里表现 为长白后备种猪的背膘厚度极显著地低于蓝 塘后备种猪的背膘厚度。
【例5.4】 某家禽研究所对粤黄鸡进行饲 养对比试验,试验时间为60天,增重结果如 表5-4,问两种饲料对粤黄鸡的增重效果有无 显著差异?
一是非配对设计或成组设计两样本平均数差 异显著性检; 二是配对设计两样本平均数差异显著性检。
一、非配对设计两样本平均数的差异显著性检验 非配对设计或成组设计是指当进行只有两个处
理的试验时,将试验单位完全随机地分成两个组, 然后对两组随机施加一个处理。在这种设计中两组 的试验单位相互独立,所得的二个样本相互独立, 其含量不一定相等。非配对设计资料的一般形式见 下表。
两尾概率为0.01的临界t值:t0.01(18) =2.878,即:
P(|t|>2.101)= P(t>2.101) + P(t <-2.101)=0.05
第五章假设检验
第五章假设检验本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。
通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2. 熟练掌握总体均值与总体成数指标的各种检验方法;包括:z 检验、t 检验和p- 值检验;4. 掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验; 5. 能利用Excel 进行假设检验。
第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。
假设检验与区间估计结合起来,构成完整的统计推断内容。
假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。
本章分别讨论这两类检验方法。
进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理” ,对假设的正确性做出判断。
这种思维方法与数学里的“反证法” 很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。
反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。
其实,我们在日常生活中,不仅不肯接受概率为0 的事件,而且对小概率事件,也持否定态度。
比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。
所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。
这种事件称为“实际不可能事件” 。
小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平 a 0<加1)作为小概率的界限,a的取值与实际问题的性质有关。
所以,统计检验又称显著性检验。
下面通过一个具体例子说明假设检验是怎样进行的。
【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。
第五章假设检验
Hypothesis test
(二)P值假设检验的步骤 值假设检验的步骤
14
Hypothesis test
(一)假设检验中的两类错误 实际情况
决策结果 不拒绝H0 拒绝H0
H0为真 √ type I error
H0为伪 type II error √
•第Ⅰ类错误:指原假设为真,却拒绝原假设而犯的 类错误:指原假设为真,
错误, 错误,即弃真错误 发生概率为α 发生概率为α •第Ⅱ类错误:原假设为假时,未拒绝原假设而犯 第 类错误:原假设为假时, 的错误, 的错误,即取伪错误 发生概率为β 发生概率为β 15
27
Hypothesis test
3、利用P值决策的优点: 利用P 决策的优点: 直接给出了拒绝原假设犯第一类错误的真实概率; 直接给出了拒绝原假设犯第一类错误的真实概率; 避免了不同检验问题用同一个显著性水平; 避免了不同检验问题用同一个显著性水平; 当前计算机软件通常可以直接输出检验统计量的P值, 当前计算机软件通常可以直接输出检验统计量的P 免于查表, 免于查表,可直接判定
例如,针对特效药治愈率假定 例如,针对特效药治愈率假定H0 :θ≥97% 医疗周期假定H0 :t≤2个月 个月 服药后病情稳定情况H0 :d=2人 人
7
Hypothesis test
(2)备择假设(alternative hypothesis) 备择假设(alternative
★研究者收集证据想予以支持的假设 研究者收集证据想予以支持 予以支持的假设 ★表示为H1 ★表示形式:≠, >或<某一假定数值 表示形式:
Hypothesis test
4、决策规则 给定显著性水平α 给定显著性水平α,查统计量的对应分布表得出相 应的临界值。 应的临界值。 临界值通常取正值, 临界值通常取正值,应结合假设形式准确确定分布 中的临界值和拒绝域。 中的临界值和拒绝域。 将检验统计量的值与临界值进行比较 给出决策结果。 给出决策结果。 双侧检验: 统计量的值| 临界值, 双侧检验:|统计量的值|>临界值,则拒绝H0 左侧检验:统计量的值<临界值, 左侧检验:统计量的值<临界值,则拒绝H0 右侧检验:统计量的值>临界值, 右侧检验:统计量的值>临界值,则拒绝H0
医学统计学假设检验
❖ 例如,根据大量调查,已知正常成年男性 平均脉搏数为72次/分,现随机抽查了20名 肝阳上亢成年男性病人,其平均脉搏为84 次/分,标准差为6.4次/分。问肝阳上亢男 病人的平均脉搏数是否较正常人快?
❖ 以上两个均数不等有两种可能:
第一,由于抽样误差所致;
第二,由于肝阳上亢的影响。
例如
已知正常成年男子脉搏平均为72 次/分,现随机检查20名慢性胃炎所致 脾虚男病人,其脉搏均数为75次/分, 标准差为6.4次/分,问此类脾虚男病人 的脉搏快于健康成年男子的脉搏?
2、假设检验的目的
判断是由于何种原因造成的不同,以做出决策。
3、假设检验的原理
反证法:当一件事情的发生只有两种可能A和B,为了肯
定其中的一种情况A,但又不能直接证实A,这时否定另一 种可能B,则间接的肯定了A。
概率论(小概率) :如果一件事情发生的概率很小,那
么在进行一次试验时,我们说这个事件是“不会发生的”。 从一般的常识可知,这句话在大多数情况下是正确的,但是 它一定有犯错误的时候,因为概率再小也是有可能发生的。
α是在统计推断时,预先设定的一个小概率值,是当H0 为真时,允许错误地拒绝H0的概率。
双侧与单侧检验界值比较
(2) 选定适当的检验方法,计算检验
统计量值 t 检验 Z 检验
❖ 设计类型 ❖ 资料的类型和分布 ❖ 统计推断的目的 ❖ n的大小 ❖ 如完全随机设计实验中,已知样本均数
与总体均数比较,n又不大,可用t检验, 计算统计量t值。
(1)建立假设,选定检验水准:
假设两种:一种是检验假设,假设差异完全由抽样误差造 成,常称无效假设,用H0表示。另一种是和H0相对立的备 择假设,用H1表示。假设检验是针对H0进行的。
假设检验《统计学原理》课件
X=X1>X0
H0为伪
从上图可以看出,如果临界值沿水平方向右移,α将变小而β变大,即若减小 α错误,就会增大犯β错误的机会;如果临界值沿水平方向左移,α将变大而 β变小,即若减小β错误,也会增大犯α错误的机会,
a 错误和 错误的关系
在样本容量n一定的情况下,假设检验不能同时做到犯α和 β两类错误的概率都很小,若减小α错误,就会增大犯β错误 的机会;若减小β错误,也会增大犯α错误的机会,要使α和 β同时变小只有增大样本容量,但样本容量增加要受人力、 经费、时间等很多因素的限制,无限制增加样本容量就会 使抽样调查失去意义,因此假设检验需要慎重考虑对两类 错误进行控制的问题,
参数假设检验举例
例2:某公司进口一批钢筋,根据要求,钢筋的 平均拉力强度不能低于2000克,而供货商强 调其产品的平均拉力强度已达到了这一要 求,这时需要进口商对供货商的说法是否真 实作出判断,进口商可以先假设该批钢筋的 平均拉力强度不低于2000克,然后用样本的 平均拉力强度来检验假设是否正确,这也是 一个关于总体均值的假设检验问题,
假设检验的两类错误
正确决策和犯错误的概率可以归纳为下表:
假设检验中各种可能结果的概率
H0 为真
接受H0
1-α 正确决策
拒绝H0,接受H1
α 弃真错误
H0 为伪
β 取伪错误
1-β 正确决策
•假设检验两类错误关系的图示
以单侧上限检验为例,设H0 :X≤X0 , H1:X>X0
图a X≤X0 H0为真
a
H0值
样本统计量 临界值
观察到 的样本 统计量
5、假设检验的两类错误
根据假设检验做出判断无非下述四种情况:
1、原假设真实, 并接受原假设,判断正确; 2、原假设不真实,且拒绝原假设,判断正确; 3、原假设真实, 但拒绝原假设,判断错误; 4、原假设不真实,却接受原假设,判断错误, 假设检验是依据样本提供的信息进行判断,有犯错误的可 能,所犯错误有两种类型: 第一类错误是原假设H0为真时,检验结果把它当成不真而 拒绝了,犯这种错误的概率用α表示,也称作α错误 αerror 或弃真错误, 第二类错误是原假设H0不为真时,检验结果把它当成真而 接受了,犯这种错误的概率用β表示,也称作β错误 βerror 或取伪错误,
《统计学》第5章 假设检验
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),
第五章 假设检验
应 用 统 计 第 五 章
6
解:设这台机床生产的所有零件平均直径的
真值为m 。如果m =10表明生产过程正常,如 果m >10或m <10,则表明机床的生产过程不正 常,研究者要检测这两种可能情况中的任何 一种。根据原假设和备择假设的定义,研究 者想收集证据予以证明的假设应该是“生产 过程不正常” 所以建立的原假设和备择假设 应为: H0: m =10 (生产过程正常) H1: m ≠10 (生产过程不正常)
第五章 假设检验
应 用 统 计 第 五 章
2
5.1 假设检验的基本原理 5.2 一个总体参数的检验 5.3 两个总体参数的检验(自习) 本章总结
5.1 假设检验的基本问题
应 用 统 计 第 五 章
3
5.1.1 假设的陈述 “假设”(hypothesis)就是对总体参数的具体
图5.1 显著性水平、拒绝域和临界值
置信水平(1–a)
应 用 统 计 第 五 章
15
拒绝域
a
拒绝域
拒绝域
a/2
临界值
a/2
o
(a)双侧检验
临界值
置信水平(1–a)
置信水平(1–a)
拒绝域
a
o 临界值 (b)左侧检验
o
临界值
(c)右侧检验
5.1.4 利用P值进行决策
应 用 统 计 第 五ห้องสมุดไป่ตู้章
16
如果原假设H0为真,所得到的样本结果会像
例5.1
应 用 统 计 第 五 章
5
一种零件的生产标准是直径应为10cm,为对
生产过程进行控制,质量监测人员定期对一 台加工机床进行检查,确定这台机床生产的 零件是否符合标准要求。如果零件的平均直 径大于或小于10cm,则表明生产过程不正常, 必须进行调整。试陈述用来检验生产过程是 否正常的原假设和备择假设。
统计学假设检验方法
统计学假设检验方法一、背景介绍统计学假设检验是统计学中最基本的方法之一,其主要目的是通过对样本数据进行分析,判断某个假设是否成立。
假设检验可以用于各种领域的研究,如医学、社会科学、商业等。
在现代社会中,假设检验已经成为了科学研究和决策制定的重要工具。
二、基本概念1. 假设:假设是对某个问题或现象的一种猜测或推断。
2. 零假设:零假设是对某个问题或现象的一种默认假设,通常表示没有显著差异或效应。
3. 对立假设:对立假设是与零假设相反的一种猜测或推断,通常表示有显著差异或效应。
4. 显著性水平:显著性水平是指在进行假设检验时所采用的判断标准。
通常情况下,显著性水平取值为0.05或0.01。
5. P值:P值是指在进行假设检验时得到的结果与零假设相符合的概率。
P值越小,表示得到该结果的可能性越小,从而越容易拒绝零假设。
三、假设检验步骤1. 确定研究问题和假设:首先需要明确研究问题和所要检验的假设。
2. 确定显著性水平:在进行假设检验时,需要事先确定显著性水平。
3. 收集样本数据:根据研究问题和所要检验的假设,收集相应的样本数据。
4. 计算统计量:根据所采用的统计方法,计算出相应的统计量。
5. 计算P值:根据计算出的统计量和所选择的显著性水平,计算出P 值。
6. 判断是否拒绝零假设:如果P值小于所选显著性水平,则拒绝零假设;否则不拒绝零假设。
四、常见假设检验方法1. 单样本t检验:用于判断一个样本均值是否与已知均值有显著差异。
2. 双样本t检验:用于判断两个样本均值是否有显著差异。
3. 方差分析(ANOVA):用于判断多个样本均值是否有显著差异。
4. 卡方检验:用于判断两个变量之间是否存在相关性。
5. 相关分析:用于判断两个变量之间的相关性。
6. 回归分析:用于建立一个变量与另一个或多个变量之间的关系模型。
五、常见错误1. 忽略样本大小:在进行假设检验时,样本大小对结果有很大影响,因此需要注意样本大小的选择。
第五章 假设检验
样本统计量
统计学
STATISTICS
显著性水平和拒绝域
(右侧检验 )
置信水平 拒绝H 拒绝H0
抽样分布
α
1-α
0
6 - 32
样本统计量 临界值
统计学
STATISTICS
决策规则
1. 给定显著性水平α,查表得出相应的临界 值zα或zα/2, tα或tα/2 2. 将检验统计量的值与α 水平的临界值进行 比较 3. 作出决策 双侧检验: 统计量I 临界值,拒绝H 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验: 临界值,拒绝H 左侧检验:统计量 < -临界值,拒绝H0 右侧检验: 临界值,拒绝H 右侧检验:统计量 > 临界值,拒绝H0
6 - 23
统计学
STATISTICS
显著性水平和拒绝域 (双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
α/2
α/2
临界值
6 - 24
0
临界值
样本统计量
统计学
STATISTICS
显著性水平和拒绝域 (双侧检验 )
置信水平 拒绝H 拒绝H0 1-α
抽样分布
拒绝H 拒绝H0
H0:µ = 某一数值 指定为 = 号,即 ≤ 或 ≥ 例如, 3190( 例如, H0:µ = 3190(克)
6-9
统计学
STATISTICS
什么是备择假设 什么是备择假设
(alternative hypothesis)
1. 研究者想收集证据予以支持的假设 研究者想收集证据予以支持的假设 2. 也称“研究假设” 也称“研究假设” 3. 总是有符号 ≠, < 或 > 4. 表示为 H1 H1 : µ <某一数值,或µ >某一数值 某一数值, 例如, 例如, H1 : µ < 10cm,或µ >10cm 10cm, 10cm
第五章 假设检验
• 设“| X -μ0 |≥K”为小概率事件,若给定α (α为很小的正数),K可由下式确定,令 • P{| X -μ0 | ≥ K }=α α为显著性水平 X 0 • T ~ t (n 1) t为检验统计量
s/ n
K X 0 于是, P{ X 0 K } P s/ n s/ n
K P{ X 0 K } P{ } s/ n s/ n P{T t (n 1)}
X 0
1- α
α
t α(n-1) 接受域 拒绝域
即t ≥t (n-1)时,拒绝H0,认为μ>μ0
类似地,检验-H0:μ≥μ0, H1:μ<μ0
P{T t (n 1)}
检验 小概率事件 发 生
提出原假设和备择假设
什么是原假设?(null hypothesis) 1. 待检验的假设,又称“0假设” 2. 研究者想收集证据予以反对的假设,或稳定、保守、 受到保护的经验看法 3. 总是有等号 , 或 4. 表示为 H0
– – –
H0: 某一数值 指定为 = 号,即 或 例如, H0: 250(克)
1、利用P 值进行决策
(1)单侧检验:若p值> ,不拒绝H0;若p值< , 拒绝H0。 (2)双侧检验:若p值> /2, 不拒绝H0;若p值< /2, 拒绝H0。 (在计算机软件中,通常只比较P同 的关系)
2、P 值检验法的优点
(1)结论对任何统计量均适用,不需要改变。 (2)在改变显著性水平时,无须重新计算p值。( 临界值法需要重新 计算临界值。)
抽样分布
拒绝域
置信水平
1- 接受域
第五章假设检验与统计推断
5-9
Types of Hypothesis Tests
5-8
1.Hypothesis Formulation
Null hypothesis, H0 – a statement that is accepted as correct
Alternative hypothesis, H1 – a proposition that must be true if H0 is false
Example: To seek evidence that technical support calls average less than 30 minutes
(Customer Support Survey file), the correct
hypotheses are:
H0: Mean response time ≥ 30 minutes H1: Mean response time < 30 minutes
Chapter 5: Hypothesis Testing and Statistical Inference
5-1
一、假设检验的概念与思想
什么是假设(hypothesis)?
对总体参数的的数值所作 的一种陈述
总体参数包括总体均值、比 例、方差等
分析之前必需陈述
其动机主要是企图利用人们 掌握的反映现实的数据来找 出假设与现实之间的矛盾, 从而否定这个假设
假设检验 全
1
信号检测与估计
假设检验
问题如何提出:雷达需要从回波信号中判断有 无目标存在,通信需要判断接收到的究竟是几 个可能的发射信号中的哪一个○1 。
由于接收机热噪声、信道畸变或目标起伏,使 得我们观测到的信号具有不确定性○2 ,因此有必 要运用统计的方法来指导我们进行选择。
统计假设检验就是根据观测样本对几种可能
型,并按照某种最优准则设计接收机,最后对
接收机的性能进行评估。本章重点讨论最后两
点○4 。
3
信号检测与估计
假设检验
5.1 引言-introduction
4
信号检测与估计
假设检验
5.2 简单检测问题-A Simple Detection Problem
假定消息取值为 m0 (比如 0)或 m1 (比如 1), 由于事先并不知道传递的是什么消息,所以将 其视作取值为 m0 或 m1 的随机变量 m ,各自出现的 概率分别为 P0 和 P1 :
(7)
其中可将参数α 或它的函数定义为“信噪比”
(SNR)。
图 5.2 给出了以(7)式中信噪比 SNR 为参量
时, P(D1 | H0 ) 和 P(D1 | H1) = 1− P(D0 | H1) 的关系曲线。 图 5.2 也是接收机工作特性(Receiver operating
characteristic, ROC)的一种形式。
p0 ( y)P(H0 )
py (y)
所以判决规则成为,若
λ(y) =
p0 ( y) p1( y)
>
P(H0 )
P(H1)
(3)
则选择 H1,即 m = m1 。 p0 ( y) 和 p1( y) 都称为似然函数 (likelihood function),λ(y) 称为似然比(likelihood
统计学--假设检验(第五章)-(1)-2
左侧检验:
×
抽样分布
Region of Rejection
拒绝H0
置信水平
1 -
Region of Non rejection
临界值
H0
观察到的样本统计量
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
36.6
36.9
36.7
37.2
36.3
37.1
36.7
36.8
37.0
37.0
36.1
37.0
根据样本数据,计算的平均值为36.8oC,标准差为0.36oC 根据参数估计方法,健康成年人平均体温的95%的置信区
间为(36.7,36.9) 研究人员发现这个区间内并没有包括37oC! 因此,提出了“不应该再把37oC作为正常人体温的一个有
解:研究者抽检的意图是倾向于证实这种洗涤剂的平均
净含量并不符合说明书中的陈述。
建立的原假设和备择假设为:
H0 : 500 H1 : < 500
<提出假设>
【例3】一家研究机构估计,某城市中家庭拥有汽车的比例超 过30%。为验证这一估计是否正确,该研究机构随机抽取 了一个样本进行检验。试陈述用于检验的原假设与备择 假设。
传统上,做出决策所依据的是样本统 计量,现代检验中人们直接使用由统计量
算出的犯第一类错误的概率,即所谓的P
值。
注:假设检验不能证明原假设正确。
① 假设检验只提供不利于原假设的证据。当拒绝原假设时, 表明样本提供的证据证明它是错误的;当没有拒绝原假设时 ,我们也不说“接受原假设”,因为没法证明原假设是正确 的
第五章_假设检验
? 如果实际非法赌博的金额远低于 $200 , 即H 0并不正确,但你运气欠佳,得到的样 本估计的均值十分接近 200 ,则你应该推 翻H 0。但样本数据却不足以推翻错误的假 设,此时你犯了型 II 的错误
检验统计量的值
检验统计量的值
第3步
确定显著性水平,计算 临界值及拒绝域
第3步
计算P值
第4步 作比较,并给出假设检 第6步 判断P值的大小,并给
验的结论
出假设检验的结论
单个总体的假设检验
? 单个总体均值检验
? 例解
? 某电子元件批量生产的质量标准为平均使用寿 命1200小时。某厂宣称他们采用一种新工艺生 产的元件质量大大超过规定标准。为了进行验 证,随机抽取了100件作为样本,测得平均使用 寿命1245小时,标准差300小时。在显著性水平 为0.05时,能否说该厂生产的电子元件质量显 著地高于规定标准?
? P-value 是不仅止于告诉我们在某一显著水平下是 否拒绝H 0,如果我们知道P-value = .002 则我们 知道H 0不但在.05 的显著水平下会被拒绝,在 .005 的水平下也会被拒绝
– 如果仅知道P-value =.04 ,则是否拒绝H 0可以由读 者来决定,如果某一研究人员决得.01才算显著, 则H 0不会被拒绝,如果将显著水平置于.05 ,则拒 绝
统计量部分的面积
? 被称为观察到( the observed significant level ) 的显著性水平
? P-value 告诉我们:「如果零假设为真,我们观
察到目前数据显示的检验统计量的概率有多高?」 如果这个概率很小,则我们可以拒绝零假设,因 为如果假设为真,则仅有很小的概率抽取任意的 随机样本会得到目前的观察值
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
显著性检验就是要分析样本平均数之间的差数是由品种 显著性检验就是要分析样本平均数之间的差数是由品种 不同引起,还是抽样误差(试验误差)造成。 不同引起,还是抽样误差(试验误差)造成。
一、显著性检验的意义与内容 (二)显著性检验的内容
1、假设检验(hypothesis test): 、假设检验( ): 又叫显著性检验,对未知的总体或不完全知道的总体根据 又叫显著性检验, 某种需要 首先作出假设; 首先作出假设; 作出假设 然后由样本的实际结果经过一定的计算(主要计算由误差引 然后由样本的实际结果经过一定的计算(主要计算由误差引 由样本的实际结果经过一定的计算 起的概率); 起的概率); 最后从概率的意义上作出应当接受何种假设的结论, 最后从概率的意义上作出应当接受何种假设的结论,这个分 从概率的意义上作出应当接受何种假设的结论 析方法就称为统计假设检验。 析方法就称为统计假设检验。 统计假设检验
两个假设是非此即彼的关系,否定了无效假设,必须接受备择假设。 非此即彼的关系 两个假设是非此即彼的关系,否定了无效假设,必须接受备择假设。
2.选定显著水平ɑ 常用的为0.05、 2.选定显著水平ɑ:常用的为0.05、0.01 选定显著水平 0.05
二、显著性检验的基本步骤
3.在无效假设H 成立的前提下计算 计算t 3.在无效假设H0成立的前提下计算t值 在无效假设 即计算样本实得差异由误差引起的概率或指计算无效假设 即计算样本实得差异由误差引起的概率或指计算无效假设 正确的概率( 正确的概率(P)。 经统计学研究, 经统计学研究,得到一个统计量t :
一、显著性检验的意义与内容 (二)显著性检验的内容
2、参数估计: 参数估计: 用样本统计量来估计总体参数, 包括点估计和区间估 样本统计量来估计总体参数, 计。 (1)点估计——直接用样本的统计数作为总体参数的估 点估计 直接用样本的统计数作为总体参数的估 计值。 计值。 在一定概率保证下, (2)区间估计——在一定概率保证下,由样本的统计数 区间估计 在一定概率保证下 估计出总体参数的取值区间。 估计出总体参数的取值区间。
犯Ⅰ类错误的概率不会超过α 类错误的概率不会超过α 的概率不会超过 犯Ⅱ类错误的概率不会超过1-α 类错误的概率不会超过1 的概率不会超过 减小α 减小犯Ⅰ类错误的概率,相反,增大犯Ⅱ 减小α,减小犯Ⅰ类错误的概率,相反,增大犯Ⅱ类 的概率 错误的概率。 错误的概率。 的概率
同时降低第一、二类错误的方法是增大样本容量 同时降低第一、二类错误的方法是增大样本容量n 。 第一
HA :u1 ≠ u2
三、显著水平与两种类型的错误
2、Ⅱ型错误:“纳伪”错误 型错误: 纳伪” 把真实差异错判为非真实差异 即:
H A : u1 ≠ u2为真,却否定了它
H 0 : u1 = u2错误,却接受了它。
三、显著水平与两种类型的错误
如 何 避 免 犯 Ⅰ 类 错 误 和 Ⅱ 类 错 误
参数估计
t 检验的主要内容
第一节 显著性检验的基本原理 第二节 样本平均数与总体平均数差异显著性检验 第三节 两样本平均数的差异显著性检验 第四节 百分数资料差异显著性检验 第五节 总体参数的区间估计 作业
第一节
显著性检验的基本原理
一、显著性检验的意义与内容 二、显著性检验的基本步骤 三、显著水平与两种类型的错误 四、双侧检验与单侧检验
x1 − x2 的差异是否显著
实际上是检验( 的差异是否存在。 实际上是检验(u1-u2)的差异是否存在。 先假设u1=u2(无差异存在) 无差异存在) 先假设 则 :
x1 − x2 = ( µ1 − µ 2 ) + (ε 1 − ε 2 )
= ε1 − ε 2
x1 − x 2 t= S x1 − x2
4.80,
4.58
显著性检验就是要分析样本平均数之间的差数是由生态 显著性检验就是要分析样本平均数之间的差数是由生态 样本平均数之间的差数是由 环境不同引起 还是抽样误差造成。 引起, 环境不同引起,还是抽样误差造成。
(一)显著性检验的意义
例、随机抽测10头长白猪和10头大白猪经产母猪的产仔数, 随机抽测10头长白猪和10头大白猪经产母猪的产仔数, 10头长白猪和10头大白猪经产母猪的产仔数 资料如下: 资料如下: 长白:11,11, 长白:11,11,9,12,10,13,13,8,10,13 12,10,13,13, 10, 大白: 大白:8,11,12,10,9,8,8,9,10,7 11,12,10, 10, 经计算得: 经计算得: 头 头 x1 =11头,S1=1.76头 头 头 x2 =9.2头,S2=1.549头 头 x1 - x 2 =1.8头
(三)显著性检验的基本思路
x1 = ε 1 + u1
x2 = ε 2 + u 2
x1 − x2 = (µ1 − µ2 ) + (ε1 − ε 2 )
表观差异 = 真实差异 + 非真实差异
(三)显著性检验的基本思路
显著性检验的推理方法,实际上是一种“反证法” 显著性检验的推理方法,实际上是一种“反证法”
第五章 均数差异显著性检验( t检验或t-test) 均数差异显著性检验( 检验或t
样本
统计推断
总体
根据样本和假定模型对总体作出的以概率形式表述的推断。 根据样本和假定模型对总体作出的以概率形式表述的推断。 样本和假定模型对总体作出的以概率形式表述的推断
假设检验 (显著性检验 显著性检验) 显著性检验
B
有μA>μB或μA<μB两种可能
t检验用双侧检验 检验用双侧检验
图5 - 3
双侧检验
四、双侧检验与单侧检验
2、单侧检验: 单侧检验: 否定域为 在α水平上, H 0 否定域为 (− ∞ , − t α ,左侧的概率为α, 水平上, ] 左侧的概率为α 这种利用一尾概率进行的检验叫单侧检验也叫单尾检验 这种利用一尾概率进行的检验叫单侧检验也叫单尾检验 一尾概率 此时 否定域为 在α水平上 H 0 否定域为 [t , +∞ α
x1 − x 2 t = S x1 − x 2
df =(n1 -1)+(n2 -1)
二、显著性检验的基本步骤
S x1 − x 2 =
∑
( x1 − x1 ) 2 +
∑
( x2 − x2 ) 2
( n1 − 1) + ( n 2 − 1)
×(
1 1 ) + n1 n 2
1 1 × + n n2 1
tα
为双侧检验的临界 为双侧检验的临界t值
例如,比较A 例如,比较A、B两药的效果,如果试验者认为A、B两药的 两药的效果,如果试验者认为A 效果不同, 效果不同,则A药有可能比B药好,也有可能比B药差。 药有可能比B药好,也有可能比B药差。 无效假设H 无效假设H0 :μA=μB 备择假设HA :μA≠μ 备择假设H
(三)显著性检验的基本思路
利用小概率原理得结论:是否该接受无效假设u 利用小概率原理得结论:是否该接受无效假设u1=u2 小概率原理得结论
未知;试验的表面效应可以计算; u1-u2未知;试验的表面效应可以计算;借助数理统计方法 可以对试验误差作出估计。 可以对试验误差作出估计。 从试验的表面效应与试验误差的权衡比较 表面效应与试验误差的权衡比较中间接地推断处 从试验的表面效应与试验误差的权衡比较中间接地推断处 理效应u 是否存在。 理效应u1-u2是否存在。
四、双侧检验与单侧检验
1、双侧检验: 、双侧检验 水平上否定域 在α水平上否定域为 水平上否定域为
(− ∞,−tα ] 和 [t α
, +∞
,
)
分布曲线的两侧尾部,每侧的概率为α 对称地分配在t分布曲线的两侧尾部,每侧的概率为α/2 这种利用两尾概率进行的检验叫双侧检验也叫双尾检验。 这种利用两尾概率进行的检验叫双侧检验也叫双尾检验。 双侧检验也叫双尾检验
当df一定时 df一定时 值越大, |t|值越大,概率越小 值越小, |t| 值越小,概率越大
二、显著性检验的基本步骤
4.根据“小概率原理”判断假设是否成立( 4.根据“小概率原理”判断假设是否成立(否定或接受无效 根据 假设) 假设) P>5%,差异不显著,则接受H 而否定H 若|t|<t0.05即 P>5%,差异不显著,则接受H0 ,而否定HA,用 “ns”表示或不标记符号 。 ns”表 1%<P<5%,差异显著,则接受H 若t0.05≤|t|<t0.01即1%<P<5%,差异显著,则接受HA,而否定 表示。 H0,用“*”表示。 表示 P<1%,差异极显著,则接受H 而否定H 若t0.01≤|t|即P<1%,差异极显著,则接受HA,而否定H0,用 “* *”表示。 表示。 表示 5、专业解释
)
,右侧的概率为α, 右侧的概率为α
t α 为单侧检验的临界t值
单侧检验的
tα
=双侧检验的 t2α
四、双侧检验与单侧检验
例如,比较 、 两药的效果 如果试验者认为A药不 两药的效果, 例如,比较A、B两药的效果,如果试验者认为 药不 可能比B药差。 可能比 药差。 药差 无效假设H0 :μA=μB; 无效假设H 备择假设H 备择假设HA :μA>μB
二、显著性检验的基本步骤
1.首先对试验样本所在的总体作假设 首先对试验样本所在的总体作假设 无效假设 :
H0 : u1 = u2
或 或
µ 2 − u1 = 0
备择假设 : HA:u1≠u2
µ1 - u2 ≠ 0 −
无效假设是被检验的假设,通过检验可能被接受, 无效假设是被检验的假设,通过检验可能被接受,也可能被否定 是被检验的假设 备择假设是在无效假设被否定时准备接受的假设 备择假设是在无效假设被否定时准备接受的假设