第五章 假设检验
教育与心理统计学 第五章 假设检验考研笔记-精品

假设检验中的小概率原理[一级][16J]
假设检验的基本思想是概率性质的反证法,即其基本思想是基于〃小概率事件在一次实验中不可能发生”这一原理。首先假定虚无假设为
真,在虚无假设为真的前提下,如果小概率事件在一次试验中出现,则表明〃虚无假设为真"的假定是不止确的,因为假定小概率事件在
一次试验中是不可能出现的,所以也就不能接受虚无假设,应当拒绝零假设。若没有导致小概率事件出现,那就认为"虚无假设为真”的
假定是正确的,也就是说要接受虚无假设。假设推断的依据:小概率事件是否出现,这是对假设作出决断的依据。
检验的假设
Ho为真
真实情况
检验的事件发生的概率在99%或95%的范围内
检验的事件发生的概率在5%或1%以内
错误的概率,其前提是“Ho为假
②它们都是在做假设检验的统计决策时可能犯的错误,决策者同时面临犯两种错误的风险,因此都极力想避免或者减少它们,但由于在忠
体间真实差异不变情况下,它们之间是一种此消彼长的关系,即a大时,0小;c(和B不能同时减少。
③在其他条件不变的情况下,不可能同时减小或增大两种错误的发生可能,常用的办法是固定a的情况下尽可能减小B,比如通过增大样本
若进行假设检验时总体的分布形态已知,需要对总体的未知参数进行假设检验,称其为参数假设检验。
(三)非参数检验[一级]
若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称为非参数假设检验。
(四)小概率事件和显著性水平
(1)假设推断的依据就是小概率原理
小概率事件:通常情况下,将概率不超过0.05(即5%)的事件当作“小概率事件",有时也定为概率不超过0.01(即1%)或0.001(0.1%\
第5章 假设检验

9
假设检验的基本步骤
(1) 对样本所属总体提出统计假设,包括无效假 设和备择假设. (2) 测验计算,即在无效假设正确的假定下,依 据统计数的抽样分布,计算因随机抽样而获得实 际差数的概率. (3) 统计推断,即将确定的值与算得的概率相比 较,依据“小概率事件实际不可能性”原理作出 接受或否定无效假设的推断
1.2021.817 13.226** 0.0465
df (n1 1) (n2 1)
=(12-1)+(11-1)=21
3、查临界t值,作出统计推断 当df=21时,查临界值得:t0.01(21)=2.831, |t|>2.831,P<0.01,否定 H 0:1 , 接 2 受 H A:1 ,表明长白后备种猪与蓝塘后备种猪 2 90kg背膘厚度差异极显著,这里表现为长白后备 种猪的背膘厚度极显著地低于蓝塘后备种猪的背 膘厚度。
3、查临界t值,作出统计推断 因为单侧
t 0.10(= 双侧 11)
t 0.05 = 1.796 ,t=2.281 (11 )
> 单侧t0.05(11), P < 0.05 , 否定H0 : =246,
>246,可以认为该批饲料维生素C含量 接受HA :
符合规定要求。
第三节 两个样本平均数的差异 显著性检验
克服假设检验中可能犯的两类错误的方法: ① 适当增加样本容量 ② 精细做好试验以控制试验误差
17
两类错误
影响 II 型错误概率大小的因素 - 显著性水平 - 样本含量 n - 假设分布与真实分布总体平均数之差 - 两个分布的总体方差
检验功效 一个错误的原假设能够被否定的概率 检验功效 = 1 - II 型错误概率 =1-β
第五章-假设检验与回归分析

件,得到拒绝域;
步骤 4:明确或计算样本均值 x ,得到U 变量的观测值 u x 0 n 0
若观测值 u 落入拒绝域,则拒绝零假设 H 0 ,即接受备择假设 H1 ,
否则不能拒绝零假设 H 0 。
第五章 假设检验与回归分析 例1、 已知某面粉自动装袋机包装面粉,每袋面粉重量 Xkg
服从正态分布 N(25,0.02) ,长期实践表明方差 2 比较稳定,从
第五章 假设检验与回归分析
U 检验的步骤:
步骤 1:提出零假设 H 0 : 0 与备择假设 H1 ;
步骤 2:明确所给正态总体标准差 0 值、样本容量 n 的
值,当零假设 H 0 成立时,构造变量
U X 0 n ~ N(0,1) 0
第五章 假设检验与回归分析
步骤 3:由所给检验水平 的值查标准正态分布表求出对应 的双侧分位数 u 的值或上侧分位数 u 的值,构造小概率事
u
2
0.05, u 1.96 ,
2
第五章 假设检验与回归分析
x 0 n
12.5 12 1 100
5 u
2
1.96
故拒绝 H0 ,即认为产品平均质量有显著变化。
小结与提问:
理解假设检验的基本原理、概念;掌握假设检验的步骤。
课外作业:
P249 习题五 5.01, 5.02,5.03。
0.10,再在表中第一列找到自由度 m n 1 7 1 6 ,
其纵横交叉处的数值即为对应的 t 分布双侧分位数 t 1.943
2
,使得概率等式
PT 1.943 0.10
成立。这说明事件 T 1.943是一个小概率事件,于是得到
拒绝域
t 1.943
第五章 假设检验与回归分析
第五章假设检验

★适用于近似地采用u 检验所需的二项分布百分数资料 的样本含量n见表5-8。
上一张 下一张 主 页 退 出
一、样本百分数与总体百分数差异显著性检验
★检验一个服从二项分布的样本百分数与已知的二项总 体百分数差异是否显著。
★目的是检验一个样本百分数 pˆ 所在 二项总体百分数
p是否与已知二项总体百分数 p0相同,换句话说,检
95%置信上限为 x t0.05(df )Sx 1.2 0.18 1.38
★所以该品种仔猪初生重总体平均数μ的95%置信区 间为:
1.02(kg) 1.38(kg)
上一张 下一张 主 页 退 出
★又因为
99%置信半径为 99%置信下限为 99%置信上限为
t0.01(df ) Sx 3.25 0.08 0.26 x t0.01(df )Sx 1.2 0.26 0.94
上一张 下一张 主 页 退 出
(一)提出无效假设与备择假设
H 0 : P1 P2 , H A : P1 P2
(二)计算u值或uc值 u pˆ1 pˆ 2 S pˆ1 pˆ2
Hale Waihona Puke (5-11)uc
pˆ1 pˆ 2
0.5 n1 0.5 n2 S pˆ1 pˆ2
(5-12)
其中 pˆ1 x1 n1 ,pˆ 2 x2 n2 为两个样本百分
根据 df n 1 10 1 9 查t值表(P337-338) t0.05(9) 2.262
t0.01(9) 3.250
上一张 下一张 主 页 退 出
★因此
95%置信半径为 t0.05(df )Sx 2.262 0.08 0.18
95%置信下限为 x t0.05(df ) Sx 1.2 0.18 1.02
(完整word版)第五章 假设检验的功效与样本量

第五章 假设检验的功效与样本量∙ 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。
∙ 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。
5.1 两类错误与功效1. 两类错误的概率H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0-(5.2) (略) ∙ 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) ∙ 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) ∙ 两类错误的背景:拒绝H 0时可能犯第Ⅰ类错误不拒绝H 0时可能犯第Ⅱ类错误∙ 两类错误的后果:第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 ∙ 一般α, β的数值要在科研设计时事先确定2. 功效 (power)∙ 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β(5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β(5.5) ∙ 功效就是真实有效的药物被发现的概率∕疾病被诊断出来的概率5.2 影响功效的四要素∙ 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6) ∙ 功效的影响因素为:δ=0μ-x ,σ,n ,αX ≥μ0+Z αn σ (5.7) (略) ∙ 现用X 分布图形来定性地讨论四要素对功效的影响1. 客观差异越大,功效越大X ~N(μ,σ2/n) (5.8) (略)若H 0为真,X ~N(μ0,σ2/n) (5.9) (略)若H 1为真,X ~N(μ0+δ,σ2/n) (5.10) (略)2. 个体间标准差越小, 功效越大。
第五章 假设检验

Di
4.1 3.8
1.0
4.2
5 15.3 12.0
3.3
6 13.9 14.7 -0.8
7 20.0 18.1 1.9
8 16.2 13.8 2.4
9 15.3 10.9 4.4
作业(以下任选一道)
1、查阅近两年的心理学和教育学权威杂志各一套(例 如,可查阅这几个年度的《心理学报》和《教育研究》 各一套),对其论文中使用的统计方法进行一项描述
(两个样本的“t”检验) 五、相关系数的显著性检验 六、方差差异的显著性检验
假设检验的一般步骤
(1)建立虚无假设和备择假设
双侧检验为:H0:µ=µ0
H1:µ‡µ0
单侧检验为:H0:µ<=µ0 或 H0:µ>=µ0
H1:µ>µ0 或 H1:µ<µ0
(2)寻找合适的统计量及其抽样分布,并计算统计量
T’=-1.929;SE2=3.468;t’ a/2=2.049
练习题5
对9个被试进行两种夹角(15o,30o)的缪 勒—莱依尔错觉实验结果如下,问两种夹角的 情况下错觉量是否有 显著差异?
被试 1
2
3
4
15o 14.7 18.9
17.2 15.4
30o 10.6 15.1
16.2 11.2
Z1.84;SE1.793
两类错误
H0为真
接受H0 拒绝H0
正确 α错误
前提 H0为假 β错误 正确
总体平均数的假设检验例题1
全区统一考试物理平均分μo=50,标准差σo=10.某 校的一个班(n=41)平均成绩 X =52.5.问该班成 绩与全区平均成绩差异是否显著.
(总体正态,总体方差已知)
第五章假设检验

Hypothesis test
(二)P值假设检验的步骤 值假设检验的步骤
14
Hypothesis test
(一)假设检验中的两类错误 实际情况
决策结果 不拒绝H0 拒绝H0
H0为真 √ type I error
H0为伪 type II error √
•第Ⅰ类错误:指原假设为真,却拒绝原假设而犯的 类错误:指原假设为真,
错误, 错误,即弃真错误 发生概率为α 发生概率为α •第Ⅱ类错误:原假设为假时,未拒绝原假设而犯 第 类错误:原假设为假时, 的错误, 的错误,即取伪错误 发生概率为β 发生概率为β 15
27
Hypothesis test
3、利用P值决策的优点: 利用P 决策的优点: 直接给出了拒绝原假设犯第一类错误的真实概率; 直接给出了拒绝原假设犯第一类错误的真实概率; 避免了不同检验问题用同一个显著性水平; 避免了不同检验问题用同一个显著性水平; 当前计算机软件通常可以直接输出检验统计量的P值, 当前计算机软件通常可以直接输出检验统计量的P 免于查表, 免于查表,可直接判定
例如,针对特效药治愈率假定 例如,针对特效药治愈率假定H0 :θ≥97% 医疗周期假定H0 :t≤2个月 个月 服药后病情稳定情况H0 :d=2人 人
7
Hypothesis test
(2)备择假设(alternative hypothesis) 备择假设(alternative
★研究者收集证据想予以支持的假设 研究者收集证据想予以支持 予以支持的假设 ★表示为H1 ★表示形式:≠, >或<某一假定数值 表示形式:
Hypothesis test
4、决策规则 给定显著性水平α 给定显著性水平α,查统计量的对应分布表得出相 应的临界值。 应的临界值。 临界值通常取正值, 临界值通常取正值,应结合假设形式准确确定分布 中的临界值和拒绝域。 中的临界值和拒绝域。 将检验统计量的值与临界值进行比较 给出决策结果。 给出决策结果。 双侧检验: 统计量的值| 临界值, 双侧检验:|统计量的值|>临界值,则拒绝H0 左侧检验:统计量的值<临界值, 左侧检验:统计量的值<临界值,则拒绝H0 右侧检验:统计量的值>临界值, 右侧检验:统计量的值>临界值,则拒绝H0
医学统计学假设检验

❖ 例如,根据大量调查,已知正常成年男性 平均脉搏数为72次/分,现随机抽查了20名 肝阳上亢成年男性病人,其平均脉搏为84 次/分,标准差为6.4次/分。问肝阳上亢男 病人的平均脉搏数是否较正常人快?
❖ 以上两个均数不等有两种可能:
第一,由于抽样误差所致;
第二,由于肝阳上亢的影响。
例如
已知正常成年男子脉搏平均为72 次/分,现随机检查20名慢性胃炎所致 脾虚男病人,其脉搏均数为75次/分, 标准差为6.4次/分,问此类脾虚男病人 的脉搏快于健康成年男子的脉搏?
2、假设检验的目的
判断是由于何种原因造成的不同,以做出决策。
3、假设检验的原理
反证法:当一件事情的发生只有两种可能A和B,为了肯
定其中的一种情况A,但又不能直接证实A,这时否定另一 种可能B,则间接的肯定了A。
概率论(小概率) :如果一件事情发生的概率很小,那
么在进行一次试验时,我们说这个事件是“不会发生的”。 从一般的常识可知,这句话在大多数情况下是正确的,但是 它一定有犯错误的时候,因为概率再小也是有可能发生的。
α是在统计推断时,预先设定的一个小概率值,是当H0 为真时,允许错误地拒绝H0的概率。
双侧与单侧检验界值比较
(2) 选定适当的检验方法,计算检验
统计量值 t 检验 Z 检验
❖ 设计类型 ❖ 资料的类型和分布 ❖ 统计推断的目的 ❖ n的大小 ❖ 如完全随机设计实验中,已知样本均数
与总体均数比较,n又不大,可用t检验, 计算统计量t值。
(1)建立假设,选定检验水准:
假设两种:一种是检验假设,假设差异完全由抽样误差造 成,常称无效假设,用H0表示。另一种是和H0相对立的备 择假设,用H1表示。假设检验是针对H0进行的。
《统计学》第5章 假设检验

假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),
第五章假设检验与回归分析

第五章假设检验与回归分析本章主要介绍了假设检验和回归分析两种统计方法。
一、假设检验假设检验是通过收集样本数据来对总体参数的假设进行推断的一种统计方法。
假设检验的步骤如下:1.建立原假设和备择假设:原假设是需要进行检验的参数的假设值,备择假设是对原假设的一种否定或补充。
通常将备择假设设置为我们要验证的假设。
2.收集样本数据:根据样本数据进行统计分析,并计算出检验统计量。
3.确定显著性水平:显著性水平是拒绝原假设的最大错误概率,通常取0.05或0.014.计算拒绝域的临界值:根据显著性水平和自由度,在统计表中查找检验统计量的临界值。
5.比较检验统计量和临界值:如果检验统计量落在拒绝域内,则拒绝原假设,否则接受原假设。
二、回归分析回归分析是一种用于研究两个或多个变量之间关系的统计方法。
它可以用来建立一个变量对另一个变量的预测模型。
回归分析的步骤如下:1.收集数据:根据需要收集自变量和因变量的数据。
2.建立模型:选择适当的回归模型,将自变量和因变量进行数学表达。
3.估计参数:使用最小二乘法等方法,对模型参数进行估计。
4.检验模型:通过检验模型的显著性水平,确定模型是否合理。
5.利用模型:使用估计的模型来进行预测和分析。
回归分析可以分为简单线性回归和多元线性回归两种。
简单线性回归是指只有一个自变量和一个因变量之间的关系,多元线性回归是指有多个自变量和一个因变量之间的关系。
回归分析的应用非常广泛,可以用于市场营销、财务管理、经济预测等领域。
通过回归分析,可以找到影响因变量的主要因素,并对未来的变化进行预测。
总之,假设检验和回归分析是统计学中两种重要的方法。
假设检验用于对总体参数的假设进行验证,回归分析用于研究变量之间的关系。
这两种方法在实际应用中具有广泛的价值。
第五章 假设检验

应 用 统 计 第 五 章
6
解:设这台机床生产的所有零件平均直径的
真值为m 。如果m =10表明生产过程正常,如 果m >10或m <10,则表明机床的生产过程不正 常,研究者要检测这两种可能情况中的任何 一种。根据原假设和备择假设的定义,研究 者想收集证据予以证明的假设应该是“生产 过程不正常” 所以建立的原假设和备择假设 应为: H0: m =10 (生产过程正常) H1: m ≠10 (生产过程不正常)
第五章 假设检验
应 用 统 计 第 五 章
2
5.1 假设检验的基本原理 5.2 一个总体参数的检验 5.3 两个总体参数的检验(自习) 本章总结
5.1 假设检验的基本问题
应 用 统 计 第 五 章
3
5.1.1 假设的陈述 “假设”(hypothesis)就是对总体参数的具体
图5.1 显著性水平、拒绝域和临界值
置信水平(1–a)
应 用 统 计 第 五 章
15
拒绝域
a
拒绝域
拒绝域
a/2
临界值
a/2
o
(a)双侧检验
临界值
置信水平(1–a)
置信水平(1–a)
拒绝域
a
o 临界值 (b)左侧检验
o
临界值
(c)右侧检验
5.1.4 利用P值进行决策
应 用 统 计 第 五ห้องสมุดไป่ตู้章
16
如果原假设H0为真,所得到的样本结果会像
例5.1
应 用 统 计 第 五 章
5
一种零件的生产标准是直径应为10cm,为对
生产过程进行控制,质量监测人员定期对一 台加工机床进行检查,确定这台机床生产的 零件是否符合标准要求。如果零件的平均直 径大于或小于10cm,则表明生产过程不正常, 必须进行调整。试陈述用来检验生产过程是 否正常的原假设和备择假设。
第5章_假设检验

面向21世纪 课程教材
第五章
假设检验
第二节
某研究者估计本市居民家庭电脑拥有率为30%。现随机调查了200个家庭,其 中68家拥有电脑。试问研究估计是否可信?( =10%) 提出假设:原假设:Ho:P=0.3; 备择假设:Ha:p≠0.3
样本比例 P=m/n=68/200=0.34 由于样本容量相当大,因此可近似采用Z检验法 p p0 0.34 0.3 z 1.194 p (1 p ) 0.34 0.66 n 200
面向21世纪 课程教材
第五章
假设检验
第二节
2.方差检验过程 (1)提出原假设Ho和备择假设Ha。
2 H0 : 2 0
2 Ha : 2 0
(2)构造检验统计量:
(n 1) s 2
2
~
2
(n-1)
2 2分布。 在Ho成立的条件下,统计量 服从自由度为n-1的
(3)确定显著性水平。 (4)规定决策规则。 在双侧检验的情况下,拒绝区域在两侧,如果检验统计量大于右侧临界 值,或小于左侧临界值,则拒绝原假设。若是单侧检验,拒绝区域分布 在一侧,具体左侧还是右侧,可根据备择假设Ha的情况而定。 (5)进行判断决策。
面向21世纪 课程教材
第五章
假设检验
第二节
某厂采用自动包装机分装产品,假定每包重量报从正态分 布,每包标准重量为1000克,某日随机抽查9包,测得样本 平均重量为986克,标准差为24克,试问在0.05的检验水平 上,能否认为这天自动包装机工作正常?
;H 根据题意,提出假设: H0 : 1000 1: 1000
面向21世纪 课程教材
第二节 总体均值、比例和 方差的假设检验
假设检验

第五章假设检验本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。
通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2.熟练掌握总体均值与总体成数指标的各种检验方法;包括:z 检验、t 检验和p-值检验;4.掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验;5.能利用Excel 进行假设检验。
第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。
假设检验与区间估计结合起来,构成完整的统计推断内容。
假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。
本章分别讨论这两类检验方法。
进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理”,对假设的正确性做出判断。
这种思维方法与数学里的“反证法”很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。
反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。
其实,我们在日常生活中,不仅不肯接受概率为0的事件,而且对小概率事件,也持否定态度。
比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。
所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。
这种事件称为“实际不可能事件”。
小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平α(0<α<1)作为小概率的界限,α的取值与实际问题的性质有关。
所以,统计检验又称显著性检验。
下面通过一个具体例子说明假设检验是怎样进行的。
【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。
第五章 假设检验

• 设“| X -μ0 |≥K”为小概率事件,若给定α (α为很小的正数),K可由下式确定,令 • P{| X -μ0 | ≥ K }=α α为显著性水平 X 0 • T ~ t (n 1) t为检验统计量
s/ n
K X 0 于是, P{ X 0 K } P s/ n s/ n
K P{ X 0 K } P{ } s/ n s/ n P{T t (n 1)}
X 0
1- α
α
t α(n-1) 接受域 拒绝域
即t ≥t (n-1)时,拒绝H0,认为μ>μ0
类似地,检验-H0:μ≥μ0, H1:μ<μ0
P{T t (n 1)}
检验 小概率事件 发 生
提出原假设和备择假设
什么是原假设?(null hypothesis) 1. 待检验的假设,又称“0假设” 2. 研究者想收集证据予以反对的假设,或稳定、保守、 受到保护的经验看法 3. 总是有等号 , 或 4. 表示为 H0
– – –
H0: 某一数值 指定为 = 号,即 或 例如, H0: 250(克)
1、利用P 值进行决策
(1)单侧检验:若p值> ,不拒绝H0;若p值< , 拒绝H0。 (2)双侧检验:若p值> /2, 不拒绝H0;若p值< /2, 拒绝H0。 (在计算机软件中,通常只比较P同 的关系)
2、P 值检验法的优点
(1)结论对任何统计量均适用,不需要改变。 (2)在改变显著性水平时,无须重新计算p值。( 临界值法需要重新 计算临界值。)
抽样分布
拒绝域
置信水平
1- 接受域
第五章 对单个和两个总体平均数的假设检验

2
df1
2
df 2
1
df1 df2
2
df1 df2
(n1 1)S12 (n2 1)S2 2 n1 n2 2 n1 n2 2
(x1 x1 )2 (x1 x1 )2
(n1 1) (n2 1)
SS1 SS2 df1 df2
魏泽辉讲义
3
一、方差已知时μ 的假设检验
例 :某猪场称该场的猪在体重为100kg时的平均背膘厚度 为9±0.32 mm2。问如何检验该场的说法是否真确?(已
知该场猪的背膘厚服从正态分布)
• 由该场随机抽取了10头猪,测得它们在体重为100kg时的 平均背膘厚为8.7mm。
• 1)提出假设
H0 : 0,
魏泽辉讲义
5
3)确定否定域并作统计推断
若取 =5%,则 1 P(u0.05 z u0.05 ) 0.0
否定域 接受域 否定域
2.5% 95%
2.5%
-1.96
1.96
z = -3.1623 < -1.96 (落入)
接受备择假设
结论:该场猪的平均背膘厚与9mm差异显著6
5.1.2 t检验:总体方差未知
H 0:1 2 即犊牛和成年母牛之间血液中血糖含量无差异; H A:1 2 即犊牛和成年母牛之间血液中血糖含量有差异。
(2)计算检验统计量
12
2 2
=
15.642 12.072=3.3054
( X1X2 )
n1 n2
31
48
Z X1 X 2 =81.23-70.43=3.27
x1 x2 (1 1) (2 2 ) (1 2 ) (1 2 )
统计学第5章 假设检验

假设检验
第 5 章
假设检验
• 5.1 假设检验的基本问题 • 5.2 一个总体参数的检验 • 5.3 两个总体参数的检验(自学)
5.1
假设检验的基本原理
一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 四、利用P值进行决策
假设检验的基本概念
在实际工作中常会遇到这样的问题: (1)某药物在改进工艺后的疗效是否有提高? (2)假定总体服从某种分布是否成立? 如何通过抽检的样本对上述问题做出判断? 此时常常作出适当的假设,然后进行试验或 观测,得到统计样本,构造统计方法进行判断,以 决定是否接受这个假设。
1. 基本原理
小概率推断原理: 0 α 0.05 小概率事件 (概率接近0的事件),在一次试验中,实际上可认为 不会发生(这是人们长期积累起的普遍经验!).
2. 基本思想方法
采用概率性质的反证法: 先提出假设H0 , 再根 据一次抽样所得到的样本值进行计算. 若导致小 概率事件发生,则否认假设H0 ;否则,接受假设H0 . 下面结合实例来说明假设检验的基本思想.
H0 :π ≤30%
H1 :π >30%
提出假设 (练习)
• 某厂生产的化纤的纤度服从正态分布,纤 维纤度的标准均值为1.04。某天测得25根 纤维的纤度均值为x=1.39,检验与原来设 计的标准均值相比是否有所变化,要求的 显著性水平为α =0.05,则假设形式为: •
H0 :μ =1.04
H1 :μ ≠1.04
假设检验的基本思想
抽样分布 这个值不像 我们应该得 到的样本均 值 ... ... 如果这是 总体的假设 均值 = 50 H0
... 因此我们 拒绝假设 = 50
20
第五章假设检验

第五章假设检验5.1 现实中的统计案例一:时下不少大学生在一边学习的同时也不断寻找一些机会打些零工以赚点钱弥补学习和生活之需,这已经是学生们之间人所共知的事情。
这没有丝毫的让人好奇之处,让人好奇的是这些打工的学生究竟一个月平均能赚多少钱?假设有人说:这个数据是500元,你觉得信不信它呢?当然,你首先需要收集证据,没有证据是肯定说明不了任何问题的。
又假设有人通过组织调查取得过如下数据(调查到一共30人,单位:元):350 500 900 100 100 200 240 300 100 320450 260 650 380 290 400 800 400 250 400290 870 540 320 140 160 300 400 500 340 这时你该做何结论?就算是你得到以上数据的平均数等于423元,你是否就可以作出“是”或“不是”的回答?因为你要作出的回答是针对整个总体的,根据却又只是来自部分总体——即样本,所以事实上不论你最终作出的是“是”还是“不是”的回答,其实都存在犯错误的可能。
那么,如何以样本的数据去对总体参数下结论才最科学?才最不容易犯错误呢?这就是一个属于单个总体参数假设检验的问题了,是本章需要解决的问题。
案例二:你可能认为每一个美国人都知道像这样一些简单历史问题的答案“在美国国旗上有多少颗星?有多少条条纹?星代表什么?条纹又代表什么?”。
非常有意思的是,并非每一个人都知道问题的答案,而且当你知道问题的答案时,你也许会大吃一惊的。
1998年美国杂志《Today’s America》就确实做过这么一个调查,所得到的数据肯定多多少少会出乎很多人的意料之外。
下面就是按性别和美国地区列出的知道星的数目的成年人的百分比:男士女士大城市小城镇农村n(知道)72 72 57 56 31n(不知道)22 34 25 16 15在纽约的伊利县里200个成人被问及在美国国旗上有多少颗星。
上面的表现是属于每一类的成人的数目。
医学统计5第五章 假设检验

二、双侧检验和单侧检验
在进行t 检验时,如果其目的在于检验两个总体均数 是否相等,即为双侧检验。例如检验某种新降压药与常 用降压药效力是否相同?就是说,新药效力可能比旧药 好,也可能比旧药差,或者力相同,都有可能。
如果我们已知新药效力不可能低于旧药效力,例如 磺胺药+磺胺增效剂从理论上推知其效果不可能低于单用 磺胺药,这时,无效假设为H0, 备择假设为H1: 1>2 , 统计上称为单侧检验。
第五章 假设检验
一、假设检验的基本思想
例:已知一般中学男生的心率平均数为74次/分钟, 标准差为6次/分钟,为研究经常参加体育锻炼的中学 生心脏功能是否增强,在某地区随机抽取常年参加体 育锻炼的男生100名,求得心率平均数为65次/分钟。
如果一个事件发生的概率很小,那么在只进行一次试 验时这个事件是“不会发生的”,一旦发生了,称其 为小概率事件。统计类错误
设H0:=0,H1:>0, =0.05, 将拒绝了正确的无效假设 H0 称为I 类错误(type I error):也称为假阳性错误,当实际上真的为0,即H0: =0原本是正确的,但由于偶然因素的影响,随机抽样时, 得 到 一个较 大 的检验 统 计量 t 值 ,故 t t, 时 , 则 P0.05 时,按所取检验水准 只能拒绝H0,接受H1,结 论为>0, 由于拒绝了实际上是正确的H0,此推断结论当 然是错误的,即犯了I 型错误。I 型错误的概率是=0.05。
本例是均数的比较,是将常年参加体育锻炼心率平均 数为65次/分钟(它代表的总体有一总体均数)与一般中学 男生的心率平均数为74次/分钟。
研究者可能有两种目的: – ① 推断两个总体均数有无差别。不管是常年参加体育锻
炼心率高于一般,还是常年参加体育锻炼心率低于一般, 两种可能性都存在,研究者同等关心,应当用双侧检验。 – ② 根据专业知识,已知常年参加体育锻炼心率不会低于 一般,或是研究者只关心常年参加体育锻炼心率是否高 于一般,不关心常年参加体育锻炼心率是否低于一般, 应当用单侧检验。
第五章-假设检验

H0: 1500 H1: 1500
1-29
第二十九页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,改进生产工艺后,会使 产品的废品率降低到2%以下。检验这 一结论是否成立
研究者总是想证明自己的研究结论(废品率 降低)是正确的
H0: 355 H1: 355
1-28
第二十八页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,采用新技术生产后,将 会使产品的使用寿命明显延长到1500小 时以上。检验这一结论是否成立
研究者总是想证明自己的研究结论(寿命延 长)是正确的
备择假设的方向为“>”(寿命延长)
假设其中真有99个白球,摸 出红球的概率只有 1/100 ,
这是小概率事件。
➢小概率事件在一次试验中竟然发生了,不能不 使人怀疑所作假设的正确性,因此可以认为这 个盒子应该不是装有99个白球的那个盒子。
这个例子中所使用的推理方法,称为“带概率性
质的反证法”,或“概率反证法”。
2022/8/9
1-11
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-26
第二十六页,编辑于星期五:十八点 三十四分。
双侧检验 (显著性水平与拒绝域)
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-27
第二十七页,编辑于星期五:十八点 三十四分。
单侧检验
第五章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 非参数检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
时拒绝HZ 0,Z当
时接受H0。
Z Z
Z Z
(二)两个总体方差未知但大样本
若两个总体方差S12
和S
2 2
未知且不相等,要分别以样
本方差s12 和s22 来估计,那么当n1和n2都足够大时,统
计量Z (x1 x2 ) ( X1 X 2 )
s12 s22
趋于服从标n1 准n2正态分布。
• 要进行假设检验,必须设立原假设和备择假设。
• 原假设也称零假设或虚无假设,是研究者对总体参数 值事先提出的假设,是被检验的假设。备择假设也称 对立假设,是研究者通过检验希望能够成立的假设, 是当原假设不成立时供选择的假设。
• 设总体参数 的假设值为 0 ,那么原假设记为:H0: 0 它表示总体参数值与其假设值之间没有显著差异。 备择假设记为:H1: 0 (双侧检验时) 或 H1: 0 (右单侧检验时) 或 H1: 0 (左单侧检验时)
t t
H0:X X 0
H1:X X 0 t t
• 设两个总体的均值分别为 X1 和 X2 ,两个总体的方差分 别样为本均S12 值和分S22 别,为来自和两个。总检体验的的样目本的容是量两分个别总为体n1的和均n2, 值是否相等,或两个总x1 体x的2 均值之差是否为零。我们
对于双侧检验,当
,接受原假设
而拒绝
备择假设
;t 若 t 2
,则要拒H绝0:HX 0而X0 接受H1。
同理,对于H1:左X 单 X0侧检验,t t当
时,拒绝
而
接受 验,当
;若 时,拒绝
。2 则t 接t 而受接H0受。对于H0右:X若单 X侧0 检,
则接受H1H:X0。 X0
t t
2
接受域1
2
拒绝域
拒绝域
Z
0
2
Z 2
图5-1 正态分布双侧检验接受域与拒绝域示意图
接受域1
接受域 1
拒绝域
拒绝域
Z
0
0
Z
(a)左单侧检验
(b)右单侧检验
图5-2 正态分布单侧检验接受域与拒绝域示意图
假设检验的基本原理
(一)提出原假设和备择假设;
(二)确定检验的显著性水平;
正态分布。
S12 S22 n1 n2
服从标准
如果原假设H0:X1 X2 成立,我们可构造检验统计量
为:Z x1 x2
S12 S22
受对H于0。双对侧n1 于检n2左验单,侧当检Z 验 Z,2 当时拒绝H0时,拒当绝Z HZ02,时当接
时接受H0。对于右单侧检验Z ,Z当
H0 ,当
时要接受H0 。对于右单侧检验, t t(,n1n22)
当
时要拒绝H ,当 t t( ,n1n2 2)
0
要接受H0 。
t t( ,n1 n2 2)
t t( ,n1 n2 2)
• 检验的目的是判断总体成数P是否等于P0,我们可以建 立假设如下:
H0:P P0(双侧检验)
• 在统计中,常见的统计假设有:总体均值(或总体成 数、总体方差等)等于(或大于、小于)某一数值, 总体相关系数等于0,两总体均值(或两总体成数、两 总体方差)相等,总体分布服从正态分布等。
• 根据检验的目的不同,假设检验可以分为双侧检验和 单侧检验两类。双侧检验是指同时注意总体参数估计 值与其假设值相比的偏高和偏低倾向的检验。单侧检 验是指只注意总体参数估计值比其假设值偏高或偏低 倾向的检验,它是单方向的。
H1:P P0
或
H0:P P0(左单侧检验)
H1:P P0
或
H0:P P0 (右单侧检验)
H1:P P0
• 根据抽样分布定理可知,当样本容量足够大,即nP和
n(1-P)都大于5时,样本成数p的抽样分布近似服从
正态分布,而统计量 Z p P P(1 P)
服从标准正态分布。其中,由n 于N一般都很大,因此
• 总体均值检验的目的是总体均值 X 是否等于(或大于, 或小于) 。我们可以建立假设如下:
X0
H0:X X0 (双侧检验)
H1:X X 0
或
H0:X X0 (左单侧检验)
或
H1:X X 0
H0:X X 0 H1:X X 0
(右单侧检验)
下面我们分几种情况加以介绍。
(一)总体服从正态分布且方差已知
第七章 假设检验
第一节 假设检验的基本问题 第二节 几种常见的假设检验 第三节 假设检验的两类错误与功效
第一节 假设检验的基本问题
• 一、假设检验的概念与种类 • 二、原假设和备择假设 • 三、显著性水平和拒绝域 • 四、假设检验的基本步骤
• 所谓假设检验,就是事先对总体参数或总体分布形态 做出一个规定或假设,然后利用样本提供的信息,以 一定的概率来检验假设是否成立(或是否合理),或 者说判断总体的真实情况是否与原假设存在显著的系 统性差异。
• 由抽样分布理论可知,若原假设成立,则样本统计值 与总体参数假设值偏差很大的事件是一个小概率事件。 倘若在一次抽样中,样本统计值与总体参数假设值相 差很大,那么在原假设成立的条件下,就是出现了一 个小概率事件。一旦出现小概率事件,就要怀疑原假 设的正确性,从而否定原假设。若一次抽样的样本统 计值与总体参数假设值相差不大,那么就没有理由拒 绝原假设,也就只好接受原假设。
时,
要接受H0;当
n时,则要拒绝H0而接受H1。
Z Z
2
Z Z 2
(二)总体分布及其方差均未知但大样本
根据中心极限定理,当样本容量足够大时(n>30),
样态估本分计均布,值。这但时x 由统也于 计趋量于S 2 服未Z从知 x 数, X0 学要期以趋望样于为本服方从X 差,标方准s2差正 为态(nxi分Sn12x的布)2 正。来
可以建立假设如下:
(双侧检验)
或 H0:X1 X 2 H1:X1 X 2
或 H0:X1 X 2 H1:X1 X 2
(左单侧检验)
H0:X1 X 2
(右单侧检验)
H1:X1 X 2
下面分几种情况加以介绍。
(一)两个总体服从正态分布且方差已知
根据抽样分布原理,统计量Z (x1 x2) (X1 X2)
根据抽样分布原理,当总体服从正态分布 N(X,S2) 时, 那么从中抽取容量为n的样本,其样本均值 服从正态 分布 S2 (为了简便,只讨论重复抽样情况x ),而统 计量 N(X , n ) 服从标准正态分布。 所以,Z 当x SnX 原假设为真时,我们可以构造检验统计量为:
对于双侧检验,Z针 x对SX给0 定的显著性水平 ,当
• 现在的问题是,概率小到多少的事件为小概率事件? 这个概率是在假设检验之前由人们事先主观选定的, 用 表示。 究竟取多大为宜,应视具体情况而定, 通常取0.05或0.01,有时也取0.10,而把概率小于上 述值的事件称为小概率事件。 越大,样本统计值与 总体参数假设值之间的差异成为显著性差异的可能性 越大; 越小,这种差异成为显著性差异的可能性越小。 因此的 大小就成了判定这种差异是否显著的一个标 准,故称为显著性水平。1- ,则是样本统计值与总 体参数假设值之差不超过一定范围的概率。
• 假设检验的实质就是样本信息是否有充分的理由来否 定原假设。
• 一方面原假设H0受到保护而不被轻易否定,使它处于 有利地位;另一方面当原假设H0被接收时,又认为它 不一定正确。
• 还须指出,备择假设的表达式中是不含有等号的,即 等号一定存在于原假设中。
• 进行假设检验,概率论中关于小概率事件在一次试验 中是不可能事件的原则是其所要遵循的基本原则。
Z
( p1 p2 ) Pˆ(1 Pˆ)( 1 1 )
Z ( p1 p2 ) (P1 P2 ) P1(1 P2 ) P2 (1 P2 )
由于P1、n1 P2未知n2,要以p1和p2来估计,因此在原假设H0 为真时,我们要以两个样本的合并成数作为两个总体 成数的共同的估计值,即:
Pˆ n1 p1 n2 p2
这样,n当1 原n2 假设成立时,检验统计量就成为:
差为ns-21估的计t分,布那。么当n 30
时,统计量 t
x
s
X
服从自由度
n
如果原假设 H0:X X 0
成立,则检验统计量为:t
x
X s
0
根据规定的显著性水平 来确定临界值
或n
,
通过比较t和 (或 ) ,来做出接受或t(拒2,n1)绝原t(假 ,n设1)
的判断。这种t检2 验称t为小样本t检验。
总体方差
简化为
。
因此,当NP(N原11假P)设为真时P(,1我P)们可以构造检验统计量为:
对于Z 给Pp定0(1P的0P0) 显著性水平 ,可查得临界值 或
。
通过比较n 与 或 ,可做出拒绝原假设H0或接受 原假设H0的判断。判断规 则与总体均值检验Z相2 同Z。
Z
Z
2
Z
• 设两个总体成数分别为P1和P2,来自两个总体的样本 容量分别为n1和n2,样本成数分别为p1和p2。检验两 个总体成数是否相等,或两个总体成数之差是否为零,
所以,如果原假设
s n
成立,我们也可以构造检验
统计量为:
H0:X X 0
根据与(一Z) x 相sX0 同的规则,通过比较 值与临界值
n
或 ,可以做出接受H0或拒绝H1的判断Z ,唯一不同之Z
处,Z 就是以 代替了 。 2
s
S
(三)总体为正态分布,但方差未知且小样本
若总体服从正态分布N(X , S2) ,但S 2 未知而要用样本方