学习_假设检验基础(第1部分)
第7章 假设检验(2014)
假设检验不能证明原假设正确
1. 假设检验中通常是先确定显著性水平,这就等 于控制了第Ι类错误的概率,但犯第Ⅱ类错误的 概率却是不确定的。
2. 在拒绝H0时,犯第Ⅰ类错误的概率不超过给定 的显著性水平a。在不能拒绝H0时,也难以确切 知道第Ⅱ类错误发生的概率
3. 采用“不拒绝”而非“接受”,避免了错误发 生的风险。
4、计算检验统计量的样本观测值
将检验统计量的值与a 水平的临界值进行比较 给定显著性水平a,查表对应的临界值za 或za/2
双侧检验
抽样分布
拒绝H0
a/2
1 -a
置信水平 拒绝H0
a/2
临界值 H0
临界值
抽样分布拒绝H0a左侧检验置信水平
1 -a
H0 临界值
右侧检验
抽样分布
1 -a
置信水平 拒绝H0
2、统计量落在拒绝域不同的地方,实际的显著性是不 同的。
3、P值给出的是实际算出的显著水平,比根据统计量 检验提供更多的信息,可根据需要决定是否拒绝 原假设。
统计上的显著与P值
1. 当拒绝原假设时,我们称样本结果是统计上 显著的(Significant),否则是统计上不显著的
2. “显著的”(Significant) 是指“非偶然的” 3. 统计上的“显著”是指这样的(样本)结果不是
解:研究者想收集证据予以支持的假 设是“该城市中家庭拥有汽车的比例 超过30%”。建立的原假设和备择假设 为
H0 : 30% H1 : 30%
提出假设
1. 原假设和备择假设是一个完备事件组,而且 相互对立
在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设 3. 等号“=”总是放在原假设上 4. 因研究目的不同,对同一问题可能提出不同
统计学——假设检验概念和方法
4. 我们想要证明(检验)大于或小于这两种可能 性中的任何一种是否成立
5. 建立的原假设与备择假设应为
6.
H0: = 10 H1:
10
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域
置信水平 拒绝域
/2
1 -
/2
临界值
H0值
样本统计量 临界值
双侧检验
(显著性水平与拒绝域)
抽样分布
拒绝域 /2
1 -
率原理
假设检验的基本思想
这个值不像我 们应该得到的 样本均值 ...
抽样分布
...因此我们拒绝 假设 = 50
... 如果这是总 体的真实均值
20
m = 50
H0
样本均值
假设检验的过程
总体
☺☺ ☺
☺☺ ☺☺ ☺☺
提出假设
我认为人口的平 均年龄是50岁
抽取随机样本
☺X均=值20☺
作出决策 拒绝假设! 别无选择.
一项研究表明, 采用新技术生产后, 将会 使产品的使用寿命明显延长到1500小时 以上。检验这一结论是否成立
研究者总是想证明自己的研究结论(寿命 延长)是正确的
备择假设的方向为“>”(寿命延长)
建立的原假设与备择假设应为
H0:
1500
H1:
1500
单侧检验
(原假设与备择假设的确定)
一项研究表明, 改进生产工艺后, 会使产 品的废品率降低到2%以下。检验这一结 论是否成立
Z X m0
Sn
否
样本容量 n
小
用样本标 准差S代替
t 检验
t X m0 Sn
总体均值的检验
(2 已知或2未知大样本)
统计学-第八章 假设检验
假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)
2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;
统计学原理——假设检验与方差分析
二、假设检验中的两类错误**
第Ⅰ类错误/弃真错误 (type Ⅰ error)
当原假设为真时拒绝原假设。犯第Ⅰ类错误的概率
通常记为 。
第Ⅱ类错误/取伪错误(type Ⅱ error)
n1 P 40010.2 320 f 5
所以为大样本分布,检验统计量 Z 近似服从 正态分布。样本数据显示:
p 100 0.25 400
Z p P0 0.25 0.20 0.05 2.5
P 1 P 0.21 0.2 0.02
n
400
在显著性水平 0.05 情况下,查表可知,
比RMB 245.95小或者比RMB 274.05大。所以,在双侧 检验(见下图8-1)中有两个拒绝域。
拒绝域
接受域
拒绝域
245.95
260.00
274.05
图8-1 双边检验的拒绝域与接受域
[例8-2] 在例8-1的假设检验中,如果样本的均值
为 X 240.00 ,当显著性水平为0.05时,原假设是否被 拒绝。
重点是三种不同情况下的假设检验方法,总体方差已 知时正态总体均值和总体比例的假设检验。
难点是总体方差未知时正态总体均值的假设检验和方 差分析。
第一节 假设检验
一、假设检验的概念
一、假设检验的概念
假设(hypothesis),又称统计假设,是对总体参数 的具体数值所作的陈述。
假设检验(hypothesis test) 是先对总体参数提出 某种假设,然后利用样本信息判断假设是否成立的过程。
(3) H0:μ = μ0 H1:μ<μ
假设检验
Page: 4
有了显著性水平α和与检验统计量模式,就可以查该模式对应分布的α分为数表,该分位 数就是临界值。再根据备择假设对应的拒绝域模式,确定具体的拒绝域。所分析的项目要求 不同,备择假设就不同,拒绝域和临界值与显著性水平α的关系也不同。 要求: 小于µ0才好 H1: µ > µ0 u1-α
拒绝H0
σ已知 1z检验 σ未知 n≥30 1t检验 σ未知 n<30 µ未知 σ0 已知
x
µ ≤ µ0 µ ≥ µ0 µ = µ0 µ ≤ µ0 µ ≥ µ0 µ = µ0
{ Z ≥ Z1-α} { Z ≤ Z1-α} { Z ≥ Z1-α/2}
Z=———
S/√‾‾ √ n -µ0
x x
{ t ≥ t1-α(n-1)} { t ≤ t1-α(n-1)} { t ≥ t1-α/2(n-1)}
假设检验
LSQ培训教材 LSQ培训教材
五、课程安排
Page:
内容 第一章 单样本假设检验 第二章 双样本假设检验 结束 课堂考试
时间 50 50 20
LSQ培训教材 LSQ培训教材
六、课堂纪律
Page: 4
手机打振动或关闭
LSQ培训教材 LSQ培训教材
七、学习效果
Page: 4
课堂考试 1、考试时间:10-20分钟 考试时间:10-20分钟 2、合格标准:≥80分者合格, 合格标准:≥80分者合格, 分者合格 <80分者不合格 80分者不合格 3、后续要求:不合格者补考 后续要求:
方法 拒绝域临界值法 P值法 置信区间法
符合情况 统计量值落入拒绝域 P<
α
结论 拒绝原假设 拒LSQ培训教材 LSQ培训教材 一、单样本假设检验基本概念与步骤
第八章 假设检验 (《统计学》PPT课件)
第二节 一个正态总体的假设检验
一、正态总体
设总体X ~ N(m, 2),抽取容量为n的样本 x1, x2, xn
样本均值 X 与方差S2 计算公式分别为:
2
1 n 1
n i1
(xi
X)
我们将利用上述信息,来检验关于未知参数均值 和方差的假设。
总体参数
均值
方差
总体方差已知
z 检验
(单尾和双尾)
总体方差已知
t 检验
(单尾和双尾)
2 检验
(单尾和双尾)
第二节 一个正态总体的假设检验
二、均值m的假设检验
1.H0:m=m0
2.选择检验统计量:
2已知: Z X m0 ~ N(0,1)
/ n
2未知:
小样本: t X m0 ~ t(n 1)
这个值不像我 们应该得到的 样本均值 ...
...因此我们拒绝 原假设μ=50
... 如果这是总 体的假设均值
60
μ=80
H0
样本均值
第一节 假设检验概述
三、假设检验的程序
一个完整的假设检验过程,通常包括以下几个步骤:
首先,设立原假设H0与备选假设H1; 第二步,构造检验统计量,并根据样本观察数据
小样本:当 t t
2
,则拒绝原假设,反之则接受H0;
5.得出结论。
二、均值m的假设检验
6.例题分析
[例8.3] 某广告公司在广播电台做流行歌曲磁带广告 ,它的插播广告是针对平均年龄为21岁的年轻人的,标 准差为16。这家广告公司经理想了解其节目是否为目标 听众所接受。假定听众的年龄服从正态分布,现随机抽 取400多位听众进行调查,得出的样本结果为x 25 岁S2,18 。以0.05的显著水平判断广告公司的广告策划是否符合 实际?
数学中的假设检验
数学中的假设检验假设检验是统计学中一种重要的方法,用于对统计样本数据进行推断与判断。
它可以帮助我们判断某个假设是否成立,从而为决策提供依据。
本文将通过介绍假设检验的基本概念、步骤和应用案例,深入探讨数学中的假设检验方法。
一、假设检验的基本概念假设检验是根据样本数据对总体进行统计推断的方法。
它基于两个互为对立的假设:原假设(H0)和备择假设(H1)。
原假设通常是我们认为成立的假设,而备择假设则是我们希望验证的假设。
在进行假设检验时,我们首先假设原假设成立,然后利用统计方法计算出样本数据的观察值,根据观察值与预期值之间的偏差,判断原假设的合理性。
如果观察值与预期值之间的差异显著大于正常情况下的偏差范围,我们就可以拒绝原假设,接受备择假设。
二、假设检验的步骤假设检验包括以下几个基本步骤:1. 确定假设:根据问题的背景和研究目的,明确原假设和备择假设。
2. 选择显著性水平:显著性水平(α)是假设检验中一个重要的参数,用于确定拒绝原假设的标准。
一般情况下,α取0.05或0.01。
3. 计算统计量:根据样本数据,选择合适的统计量进行计算。
常用的统计量有t值、F值和卡方值等。
4. 判断拒绝域:根据显著性水平和统计量的分布特性,确定拒绝原假设的临界值。
5. 比较统计量和临界值:将计算得到的统计量与拒绝域的临界值进行比较,判断是否拒绝原假设。
6. 得出结论:根据比较结果,给出对原假设的结论,并解释其统计意义和实际意义。
三、假设检验的应用案例1. 以某医院为例,研究员想要验证该医院使用的一种新型药物是否比常规药物更有效。
设定原假设为“新型药物不比常规药物更有效”,备择假设为“新型药物比常规药物更有效”。
收集一组患者的数据,比较两组患者接受新型药物和常规药物后的治疗效果,通过假设检验确定是否接受备择假设。
2. 在金融领域,分析师经常使用假设检验来验证股票市场的有效性。
他们可以将原假设设定为“股票市场不存在明显的投资机会”,备择假设设定为“股票市场存在明显的投资机会”。
生物统计学中的假设检验方法
生物统计学中的假设检验方法生物统计学是研究生物学现象的统计方法,是生物学研究的基础。
假设检验是生物统计学中常用的统计分析方法之一,在生物学研究中扮演着至关重要的角色。
本文将介绍生物统计学中的假设检验方法、其原理和应用。
一、什么是假设检验?假设检验(Hypothesis testing)是基于样本数据对总体或总体参数的假设进行判断和决策的统计推断方法。
在假设检验中,我们首先提出一个原假设(null hypothesis),也就是总体或总体参数的某种情况或性质。
然后我们去找到一些样本数据(sample),根据这些样本数据,我们来计算一个统计量(test statistic),比如t值或F值。
接着,我们根据该统计量和一些预设的显著水平(significance level)去判断原假设是否成立。
如果我们得出的统计量超过了一定的显著水平,即我们预设的极小概率,则我们拒绝原假设,否则我们接受原假设。
假设检验是一种重要的统计方法,至关重要的是,它能够帮助我们确定某一种实验结果是有意义的还是无意义的,是因为随机因素所致还是因为某一种大的趋势所致。
在生物学研究中,假设检验能够帮助我们确定实验结果与总体或总体参数之间的关系,例如,药物是否对人类有益,一种肿瘤治疗方法是否能够显著降低通过标志物来检测出的患病率等。
二、假设检验的基本原理要理解假设检验的基本原理,我们首先要了解一个重要的概念:零假设(null hypothesis)和备择假设(alternative hypothesis)。
零假设是一种默认的假设,我们在开始研究前就提出了一个关于总体或总体参数的假设,采取一个极为保守的观点来面对问题。
通常我们将零假设记为H_0,例如,我们假设某种药物对人类没有益处。
备择假设是与零假设相对应的假设,它是我们提出的真正想要验证的假设。
备择假设通常记为H_1,例如,我们想要验证某种药物是否对人类有益。
在判断零假设是否成立时,我们根据一些样本数据得到了一个统计量,并且计算出了该统计量的概率。
SPSS教学课件、假设检验基础
SPSS
SPSS
SPSS
• 上表是成组t检验的主要结果,分成两部分:第一 部分为Levene’s方差齐性检验的结果,可以看出P 值大于0.05,所以认为两个样本所来源的总体方 差齐性 • 第二部分为t检验结果,由于方差齐性,所以结果 看上行(Equal variances assumed),P值小于 0.05,认为两组有差别 • 两组样本均数差为19.68,差值的标准误为6.457, 差值的95%可信区间为6.594~32.759,认为配方I 大于配方II组 • 下一行结果为当方差不齐时(Equal variances not assumed)采用t’ 检验的结果
SPSS
SPSS
SPSS
此处 为p0
使用二项分布正态近似法计算
使用二项分布的累积概率直接计算
SPSS
Bin omial Test Category 异常 正常 N 1 135 136 Observed Prop. .01 .99 1.00 Test Prop. .01 Asymp. Sig. Exact Sig. (1-tailed) (1-tailed) a,b .605 .605
SPSS
SPSS
SPSS
• 配对t检验结果提示双侧P=0.006,故拒绝无 效假设,认为治疗前后有差别 • 结合可信区间,得出治疗后血压总体低于 治疗前的结论
SPSS
二项分布检验
• 检验二分类变量值出现的情况是否满足假 设的二项分布B(n,p) • 根据以往经验,新生儿染色体异常的概率 为1%,某医院观测了当地共136名新生儿, 发现1例染色体异常,问该地新生儿染色体 异常的概率是否低于一般情况? • 即可通过Compute直接计算概率,亦可通过 Analyze-nonparametric tests-Binomial 分析
统计学原理-假设检验
两独立样本均值之差的抽样分布
(1)正态总体,总体方差已知
两个正态总体
和
中分别独立地抽取容
量为n1和n2的样本,x1、x2分别为其样本均值, 则x1-x2也服从正态分布,那么
第六章 假设检验
Excel操作
l运用函数NORMSDIST计算Z检验的P值 l运用函数TDIST计算t检验的P值
37*/6
第六章
第三节 两总体参数的假设检验 假设检验 学习要点
l 1. 两独立样本均值的抽样分布 l 2. 两独立总体均值之差的假设检验
38*/6
1. 两独立样本均值的抽样分布
第六章 假设检验
9*/6
2. 假设检验的步骤
第六章 假设检验
例6-3
分析:以前的产品废品率在1%以上,改进生产工艺可以使产 品废品率下降是需要支持的命题,故,
予以否定的命题 予以支持的命题
10*/6
2. 假设检验的步骤
第六章 假设检验
(2)检验统计量
检验统计量需要满足以下两个条件
l一是检验统计量中必须含有要检验的总体参数 l二是检验统计量的概率分布必须是明确可知的
31*/6
1. 总体均值的假设检验
检验规则:
条件 原假设与备择假设 检验统计量及其分布
第六章 假设检验
拒绝域
小样本 (n<30)σ2已
知
小样本 (n<30)σ2未
知
32*/6
1. 总体均值的假设检验
第六章 假设检验
例6-9 小样本,总体方差未知
设立原假设和备择假设分别为:H0:μ=5600; H1:μ≠5600 检验统计量为:
标准化检验统计量
11*/6
2. 假设检验的步骤
《应用统计学》教学中原假设和备择假设建立探讨
《应用统计学》教学中原假设和备择假设建立探讨摘要:学习假设检验的第一步是建立原假设和备择假设,初学者对原假设和备择假设如何建立理解不透。
首先通过单侧检验的一个实例,采用建立不同的原假设和备择假设会导致矛盾的结论;其次,分析了产生矛盾的原因;最后,给出了建立原假设和备择假设的几个原则。
关键词:假设检验原假设备择假设第一类错误假设检验包括参数检验和非参数检验两种情形,是统计学中的核心内容之一。
在学习假设检验的这部分内容时,第一步根据资料对总体的参数或分布建立假设,然后我们假定在原假设是正确的条件下,利用抽样数据计算统计量对应的数值以及计算更不利于原假设的概率,由此判断是否拒绝原假设[1]。
但对于假设如何建立的问题,特别是对单侧检验的假设如何建立,目前仍然没有统一的标准,但不同的建立方式有时会得到相互矛盾的结论[2]。
这导致不少学习这门课程的大学生对此十分困惑,不知道究竟怎么建立假设检验的假设,影响了学生对这部分内容的掌握。
为此,结合教学中出现的问题,探讨如何建立假设的问题非常有必要。
一、原假设建立不同导致的问题学习假设检验这部分内容时,首先就是要依据问题建立需要检验的假设,其次就是根据抽样调查获得的数据来检验上述假设是否成立。
实际教学中,我们发现对于同一组抽样数据,如果原假设和备择假设设定不同,往往会得到不同的结果,甚至得到的结论相互矛盾,初学这部分内容的经管专业学生往往感觉到无所适从,不知道其中的原因是什么。
具体我们以下面的例子进行说明。
例某经销商准备从厂家采购一批蓄电池,合同规定该蓄电池的充电次数不能低于1000次。
已知蓄电池的充电次数服从。
从这批产品中随机抽取64个蓄电池进行检测,测得平均充电次数=990次,请问,经销商是否购进这批蓄电池()?分析:这是一个单侧假设检验的问题,我们可以采用不同的方法建立原假设,检验的统计量为。
方法一:设,取显著性水平,则临界值。
检验的统计量:。
因为,所以在显著性水平为5%下,不拒绝原假设,即样本提供的证据还不能推翻原假设,即该厂生产的蓄电池达到了规定的充电次数。
假设检验例题与习题
第21页/共39页
均值的单尾 t 检验
(计算结果)
H0: 40000H1: < 40000 = 0.05df = 20 - 1 = 19临界值(s):
检验统计量:
0
决策:
结论:
第22页/共39页
总体比例的检验
(Z 检验)
第23页/共39页
适用的数据类型
第24页/共39页
双侧检验
第11页/共39页
H0: = 0.081H1: 0.081 = 0.05n = 200临界值(s):
检验统计量:
决策:
结论:
0
有证据表明新机床加工的零件的椭圆度与以前有显著差异
第12页/共39页
2 已知均值的检验
(P 值的计算与应用)
第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击第3步:在函数分类中点击“统计”,在函数名的菜 单下选择字符“NORMSDIST”然后确定第4步:将Z的绝对值2.83录入,得到的函数值为 0.997672537 P值=2(1-0.997672537)=0.004654 P值远远小于,故拒绝H0
第3页/共39页
单侧检验
(原假设与备择假设的确定)
将研究者想收集证据予以支持的假设作为备择假设H1例如,一个研究者总是想证明自己的研究结论是正确的一个销售商总是想正确供货商的说法是不正确的备择假设的方向与想要证明其正确性的方向一致将研究者想收集证据证明其不正确的假设作为原假设H0先确立备择假设H1
第20页/共39页
【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05)
学习_参数估计基础与假设检验
• 可信区间的两个要素: 准确度 反映在可信度的大小 精密度 反映在区间的长度
• (二)区间估计的方法:
•
X - t/2, sx < <X + t/2,
sx ;
• 95% CI(X- t0.05/2, sx ,X+ t0.05/2, sx )
•
• 已知,X - z/2,x < <X + z/2,x ;
• a.区间估计的涵义: 有1-可能
包含总体均数在内的一个范围, 习 惯上使用95%与99%置信区间 (confidence interval,CI)。
• 1-:可信度( confidence level)
162
1
3
160
158
156
155.4
154
152
2
150
4
5
148
146 1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96
有左侧累计和右侧累计两种。单位 时间或空间内事件发生的次数 • 最多P为(Xk次 k的) 概P率(0) P(1) P(k)
• 最P少(X为 kk) 次 P(的k) 概P(率k 1) P(n) 1 P(X k 1)
• 5.Poisson分布的图形
• Poisson分布的形状取决于μ的大 小。μ值越小,分布越偏,随着μ的 增大,分布越趋于对称,当μ=20时, 分布接近正态分布,当μ=50时,可 以认为Poisson分布呈正态分布N(μ, μ),按正态分布处理。
• (二)正态近似法
• 当样本计数X>50时,可按正态近似 原 理 用 式 ( 7.15 ) 求 总 体 均 数 μ 的 95%或99%置信区间。
假设检验的学习和理解
假设检验的学习和理解本⽂⽬的最近在上学习,结合前⼀阵⼦阅读的《Head First Statistics》,发现好多计算⽅法都涉及了假设检验(Hypothesis Test,⼜称“显著性检验”,Significance Test),⽤于检验模型的显著性。
如回归分析,检测估计量的系数;卡⽅检验(运⽤卡⽅分布)检验模型的优度拟合和变量独⽴性。
所以,决定梳理⼀下相关知识,作为备忘。
原理&⽅法个⼈理解,假设检验就是利⽤反证法和⼩概率事件对原假设(Null Hypothesis)和备选假设(Alternative Hypothesis)进⾏选择。
⾸先,假设原假设成⽴,那么就可以利⽤原假设的⼀些条件,如统计量的概率分布。
然后,选定显著性⽔平α和对应的拒绝域(⼀个区间),⼀般选择α = 5%或α = 1%。
接下来,根据样本和假设的统计量,计算P值(P Value)。
如果P值对应的统计量在显著性⽔平以内,那么就拒原假设。
直观的理解,因为α⽐较⼩,属于⼩概率事件,⼀般不可能发⽣,但是现在却发⽣了,那么原假设有问题,所以拒绝原假设,接受备选假设。
需要指出的是,⽆论是否拒绝原假设,都不能保证100%正确,只能在⼀定程度上估计这件事情可能性。
⽽且检验结果很⼤程度上取决于样本,所以⼀旦样本出现偏倚(Biased),会直接影响检验结果。
假设检验,形式化的可以总结为以下6步:1. 确定原假设H0和备选假设H12. 根据H0,确定统计量的概率分布和相关参数3. 确定显著性⽔平α和拒绝域4. 根据步骤2的参数,求出P值5. 查看P值是否位于拒绝域以内6. 做出判断,如果P值在拒绝域以内,那么拒绝H0接受H1。
否则接受H0拒绝H1检验结果H0正确H0错误接收PASS第⼆类错误(False Discovery)拒绝第⼀类错误(FalsePositive)PASS上⾯提到,假设检验不会100%确保检验结果正确,会出现上⾯的两类错误:第⼀类错误:错误的拒绝原假设。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
446.12
12 7 2
t
X1 X2
Sc2
1 n1
1 n2
19 1.891 10.05
120 - 101
446.121/12 1/7
ν n1 n2 2 12 7 2 17
查t界值表t=1.891<t( 0.05/2,17)=2.110,
试验组孕妇补充选定的某种钙制剂,对照 组采用传统膳食。产后40-50天内测定两组孕妇 血清骨钙素的改变值(产前产后的差值)结果 如下,请问孕期补钙和传统膳食的孕妇骨钙素 改变值的总体均数有无差别?
试验组: 10.2 8.9 10.1 9.2 -0.8 10.6 6.5 11.2 9.3 8.0 10.7 9.5 12.7 14.4 11.9
学习重点
1.熟悉假设检验概念和基本原理。 2.掌握假设检验的基本步骤、三种不同设
计类型t检验相应的适用条件。
3.熟悉大样本资料均数比较的假设检验方
法。
4.了解正态性检验和方差齐性检验.
的差异不是由抽样误差引起,而存在本质上的不同。
若将样本来自的总体均数记为μ,已知的总体均数记
为μ0,则两个假设可表示为:
H : 14.1,
0
0
H : 14.1
1
0
步骤
三、假设检验的基本步骤
1. 建立假设并确定检验水准。
H0: 两总体均数相同。 H1: 两总体均数不同。
一、正态性检验:
1、图示法:P-P图和Q-Q图 P-P图:以样本累计频率(百分比)为横坐标,
按正态分布计算的累计概率作为纵坐标。 Q-Q图:以样本分位数作为横坐标,按正态分布
计算的分位数作为纵坐标。
2、统计检验法: W检验(Shapiro-Wilk) D检验(D’Agostino) 矩法:对峰度系数和偏度系数的检验均不拒绝
均数是否大于一般儿童? X 14.3月 s 5.08月 n 36
μ0=14.1月
μ=?
造成差异的可能原Байду номын сангаас:
① 目前的差异是由抽样误差造成的。 ② 两者差异不是由抽样误差造成的,而存在
本质上的不同。
检验中的两个假设:
H0 ,(又称零假设,null hypothesis):“样本来自均数 是14.1的总体”。该假设表示目前的差异是由抽样误差 引H起1 ,。(又称“备择假设”,alternative hypothesis): “样本来自均数大于14.1的总体”。该假设表示目前
88
10
104
96
治疗前后高血压病人的血压值(mmHg)
序号
治疗前
治疗后
差值
1
115
116
-1
2
110
90
20
3
129
108
21
..
…
…
…
..
…
…
…
9
120
88
32
10
104
96
8
HH00 :: μμdd = 00,, HH11 :: μμdd > 00 αα = 00..0055
d d 148 14.8m m Hg
对照组: 5.0 6.7 -1.4 4.0 7.1 -0.6 2.8 4.3 3.7 5.8 4.6 6.0 4.1 5.1 4.7
H0: 1=2即,两组孕妇骨钙素改变值的总体均数相等 H1: 1≠2 ,即两组孕妇骨钙素改变值的总体均数不等
α = 0.05 n1 = 15, X1 = 9.493mm, S1 = 3.4250mm n2 = 15, X2 = 4.127mm, S2 = 2.3741mm
配对设计是研究者为了控制可能存在的非处理 因素而采取的一种实(试)验设计方法。
常见三种情况: 1、将条件相同或相近的两个受试对象配成对子,再
将每对中的两个受试对象随机分配到不同处理组。 2、同一份样品分成两份,分别接受不同处理。 3、同一研究对象处理前后。
二、配对设计资料的t检验
(一)检验目的:差值d的总体均数d是否
本例
t X - 0
14.3 14.1
0.236
S/ n 5.08 / 36
n 1 36 1 35
t
t(0.05,35)
1.690,
p
0.05,
不
拒
绝H
。
0
按=0.05检验水准,尚不能该县儿童的前囟 门 闭合月龄的均数大于一般儿童。
二、配对设计资料的t检验
(为二0。)适用条件:要求差值d服从正态分
布。 (三)公式
t d 0 ~ t分布, n -1
Sd
t d 0 Sd / n
例6-2: 某地区随机抽取12名贫血儿童的家 庭,实行健康教育干预三个月,干预前后 儿童的血红蛋白(%)测量结果如表7-2所 示,试问干预前后该地区贫血儿童血红蛋 白(%)平均水平有无变化?
表6-2 健康教育干预三个月前后儿童的血红蛋白
(%)序号
干预前
干预后
1
36
45
2
46
64
3
53
66
..
…
…
..
…
…
10
55
80
11
51
60
12
59
60
表6-2 健康教育干预三个月前后儿童的血红蛋白
(序%号) 干预前
干预后
差值
1
36
2
46
45
9
64
18
3
53
4
57
..
…
66
13
57
0
…
…
10
55
80
首先假设两总体参数相同,然后根据样本 数据计算相应的检验统计量,以判断样本 信息支持这种假设成立的概率,并作出推 断结论。
例6-1:已知北方农村儿童前囟门闭合月龄为 14.1月。某研究人员从东北某县抽取36名儿 童,得囟门闭合月龄均值为14.3月,标准差 为5.08月。问该县儿童的前囟门闭合月龄的
查t界值表知P<0.001,在α=0.05水准上拒绝 H0,差别有统计学意义。可认为孕期补钙和 传统膳食的产妇骨钙素改变值的总体均数有 差别,且孕期补钙者骨钙素改变值较大。
实例3:分别给两组小白鼠高蛋白和低蛋白 饲料,实验期间自出生后28-84天共8周,观 察各鼠增重(mg),结果如下。问两组膳食 对小白鼠增加体重有无不同?
H0 : μ1 μ2 H1:μ1 μ2 α 0.05
n1 12, X1 120m g, S1 21.388m g
n2 7, X 2 101m g, S2 20.624m g
SC2
n1
1S12
n2
1S
2 2
n1 n2 2
12 1 21.3882 7 1 20.6242
第二节 t检验
一、一组样本资料的t检验
(一)检验目的:推断样本来自的总体均数μ 是否与某已知μ0相等。
(二)适用条件:要求样本来自正态总体。
(三)公式: t X 0 ~ t分 布, n - 1
Sx
t X 0
S/ n
H0 : 0 14.1, H1 : 0 14.1, 0.05
3. 判断P值并推断结论
获得大于等于现有统计量的概率即为P值,或H0成立的 概率。判断依据如下:
|t|t(,),P,拒绝H0,接受H1,可认为两总体均 数不同。或样本均数间的差别有统计学意义,表明目 前的差别是有本质上的不同。
|t|<t(,),P>,不拒绝H0,按检验水准,两总体均 数相同。或样本均数间的差别无统计学意义,表明目 前的差别是由抽样误差造成的。
故P>0.05,按α=0.05水准上尚不能拒绝 H0。即不能认为两组膳食对小白鼠增 重有影响。
若服从正态分布,但方差不齐时用:
定量资料的假设检验:
一组样本资料的t检验 配对设计资料的t检验 两组独立样本比较的t检验
各t检验的应用条件,基本步骤!
第六节 正态性检验和方差齐性检 验*
t检验的应用条件:符合正态总体以及方差 相等,可分别应用正态性检验和方差齐性检 验来验证。
25
11
51
60
9
12
59
60
1
H0 : d 0, 0.05
H1; d 0
n 12, d 10.67, Sd 11.18 t d 0 10.67 0 3.305
sd n 11.18 / 12
12 -1 11
因t > t0.05/2,11 = 2.201, 故0.005 < P < 0.01, 在α = 0.05的
零假设 可认为是正态分布。
二、方差齐性检验:
H0 : 12 = 22
H1 : 12 ≠ 22
F
S12 (较大) S22 (较小)
根据1=n1-1,2=n2–1查F界值表: 若FF(,1,2),则P,拒绝H0,可认为方差 不相等。
若FF(,1,2),则P,不拒绝H0,可认为方差 相等。
n 10
Sd
d
2
d
n
2
n1
3466 1482 10 11.89m m Hg
10 1
t 14.8 0 3.936 , ν 10 - 1 9 11.89 / 10
因t > t0.05,9 = 1.833, 故P < 0.05, 在α = 0.05的