假设检验1
假设检验1
µ
未知总体
x =74.2次/分 S=6.5次/分
差异的原因:
(1)由于抽样误差造成的.(实际上 0 ,但 由于抽样误差 不能很好代表 0 )
(2)该地成年男性的脉搏与正常成年男性脉搏均数
不同( 0 )
假设检验的目的就是判断差异的原因:
求出由抽样误差造成此差异的可能性(概率P) 有多大 !
医学院
王丽华
(一)假设检验的基本思想
例1 某医生在一山区随机抽查了25名健康成年 男性的脉搏,其均数为 74.2 次 / 分,标准差为 6.5次/分。已知正常成年男性脉搏的均数为72
次 / 分。试问能否认为该山区健康成年男子的
脉搏数与一般健康成年男子的脉搏数不同?
µ 0 =72次/分
已知总体
样本
例2
已知某小样本中含CaCO3的真值是
20.7mg/L。现用某法重复测定该小样本15
次,CaCO3含量(mg/L)分别为:20.99,
20.41,20.62, 20.75,20.10,20.00,
20.80,20.91,22.60,22.30,20.99,
20.41,20.50, 23.00,22.60。问该法测
n 1 25 1 24
(3)确定P值,作出推断结论
确定P 值:
(用求出的t 值与查表查出的t 值比较)
n 10, n 1 10 1 9 查t 值表:
P>0.05 P<0.01
t0.05,9 2.262, t0.01,9 3.250
(1) 求出t=1.833, (2) 求出t=4.18, (3) 求出t=2.96, (4) 求出t=3.25,
( t 越大,P 越小)
总体参数的假设检验
社会学研究数据分析
要点一
总结词
社会学研究中的假设检验主要用于探究社会现象、行为和 社会关系等。
要点二
详细描述
在社会学研究中,假设检验被广泛应用于社会调查、实验 研究和准实验研究中。研究者通过收集和分析数据,检验 关于社会现象、行为和社会关系的假设。例如,可以检验 教育程度与收入水平的关系、政策实施对居民生活的影响 等假设。这有助于深入了解社会现象,为政策制定和社会 发展提供科学依据。
P值是假设检验中的重要指标,表示观察到的数据或更极端情况出现的 概率。P值越小,表明观察到的数据越不可能发生,从而支持拒绝原假 设。
P值的解读
在解读P值时,应注意其与临界值的关系。通常,当P值小于显著性水 平(如0.05)时,我们拒绝原假设。
03
决策与P值
虽然P值提供了一定的决策依据,但不应过分依赖P值进行决策。在某
两个总体参数的假设检验
两个总体参数的假设检验的定义
对两个总体的参数提出假设,并利用样本数据对该假设进 行检验,以判断两个参数之间是否存在显著差异。
提出假设
根据研究目的或问题,提出关于两个总体参数的假设。
选择检验统计量
根据总体分布和假设,选择适当的统计量进行检验。
确定临界值
根据统计量的性质和显著性水平,确定临界值。
选择检验统计量
根据总体分布和假设,选择适当的统计量进行检验。
确定临界值
根据统计量的性质和显著性水平,确定临界值。
计算检验统计量的值
根据样本数据计算检验统计量的值。
做出决策
将计算出的检验统计量的值与临界值进行比较,做出接受 或拒绝假设的决策。
非参数假设检验
03
符号检验
总结词
第一讲 假设检验1
于是
x k 0 P x 0 k P 0 n 0 n
k P Z 0 n 由于正态分布的对称性,可使
பைடு நூலகம்
k P Z P Z z / 2 1 0 n 查标准正态分布表得到 ( z / 2 ) 1 / 2
然而,由于样本的随机性,如何才能根据抽样结
果判断总体(所有产品)的次品率是否不超过2%?
解
用假设检验法,步骤: 其中 p为总体的次品率.
1°提出假设 H0: p 0.02
1, 第i次抽取的产品是次品 2 设X i 否则 0,
则
Xi ~ b(1, p)
(i =1,2,3,∙∙∙,100)
故当p 0.02时, f ( p)单调增加
5 f ( p) P{Y 5; p} C100 p5 1 p95
( p 0 .02)
f (0.02) 0.035 0.05
从 而P { Y 5 ; p } 0.05
故{Y 5 }是小概率事件 .
解
用假设检验法,步骤:
1°提出假设 H0: 0 称为零假设或原假设
H1 : 0 称为对立假设或备择假设
如果零假设H 0 : 0 成立,那么的估计值 x 与 0 误差的绝对值 x 0 应该较小,一旦 x 0 太大,就应拒绝零假设H 0,即认为零 假设H 0不成立. 选定一个适当大的正数 k 当 x 0 k时,否定零假设H0 当 x 0 k时,接受零假设H0
第六章 假设检验
第一讲
一 假设检验 二 假设检验中的两类 错误
§1
假设检验
一、假设检验的基本原理 在实际工作中常会遇到这样的问题: (1)某药物在改进工艺后的疗效是否有提高?
假设检验的基本概念(1)
精选课件
•小概率 原理:
如果对总体的某种假设是真实的,那么不利于 或不能支持这一假设的事件A(小概率事件)在 一次试验中几乎不可能发生的;要是在一次试 验中A竟然发生了,就有理由怀疑该假设的真实 性,拒绝这一假设。
总体
抽样
(某种假设)
检验
(接受)
小概率事件 未发生
样本 (观察结果)
(拒绝) 小概率事件 发生
三、假设检验的基本形式
虚无假设HO如前面所举女青年初婚年龄=20。原假设
在不研 会究 被假中 否设是 定一稳 ,定 否般、则包受也到就括保失两护去的其部,研分究但意另:义一虚。方当面无经也假过并抽不设样表H调示O查永和,远研 究当假实际设数H据1。否定了原有假设H0时,就产生了需要接受其逻辑
研究假设H1:又称备择假设;是研究者 所需证实的假设。
精选课件
假设检验的基本形式
H0—虚无假设, H1—研究假设 两端检验:H0:μ=μ0,H1:μ≠μ0
一端检验:H0:μ≥μ0,H1:μ<μ0 H0:μ≤μ0,H1:μ>μ0
假设检验就是根据样本观察结果对原 假设(H0)进行检验,接受H0,就否定H1; 拒绝H0,就接受H1。
如X2检定法,也不要求是定距测量层次。
B.由于不理会总体的情况,非参数 检定法在推论时较为困难,准确性受影 响。
C.只要样本加大,可使检定力加强。
精选课件
六、假设检验的步骤
1
建立总体假设 H0,H1
2
抽样得到样 本观察值
3
选择统计量 确定H0为真 时的抽样分布
6
计算检验统 计量的数值
7
比较并作出检验判断
精选课件
二、假设检验的基本原理
第四章 假设检验(1)
§4.1
关于总体未知分布或对已知分布总体中未知 参数的假设称为统计假设,简称假设;
对样本进行考察,从而决定假设是否成立的 方法称为假设检验,简称检验;
例1:罐装可乐的标准容量是250毫升
生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢? 通常的办法是每隔一段时间进行抽样检查.
例2(医疗领域)为了检验某种新疗法是否比传统 疗法更有效,对40名患者进行实验。把病人分 成两组,每组20人,第一组采用新疗法,第二 组采用传统疗法。从治疗结果表中,我们能否 认为新疗法比传统疗法更有效?即第一组的康 复人数比第二组多的原因是因为新疗法效果更 好,还是由随机因素引起的?
疗法 新疗法 传统疗法 康复 12 9 未康复 8 11
假设检验中的两类错误 小概率事件不管多小都可能发生,再加上 样本的随机性,它们可能会影响检验结果。 实际情况
决定
拒绝H0 接受H0 以真为假(弃真) 以假为真(取伪)
H0为真 第一类错误 正确
H0不真 正确 第二类错误
P(拒绝H 0 | H 0为真) P(接受H 0 | H 0为假)
2 2 0 2 2 0
2.检验统计量
2
(n 1) S
2
2 0
~ (n 1)
2
2 3. P{12 / 2 (n 1) 2 / 2 ( n 1)} 1
得拒绝域是 (0,
2 1 / 2
(n 1)) ( / 2 (n 1), )
期望已知,关于方差的假设检验
双侧检验:
1.提出假设: H 0 : , H 1 :
2 2 0 2
应用统计学6-假设检验(1)
t 检验
(单边和双边)
χ2检验
(单边和双边)
名称 条件
H0
统计量及其分布
拒绝域 |u| >u1-α/2 u >u1-α u < - u1-α |t| >tα/2 t >tα t < -tα
2 χ 2 > χα / 2 ( n − 1)或
0 u 总体 µ ≤ µ0 2 检 方差σ 均 验 已知 µ ≥ µ 0 值 检 验 t 总体 µ = µ 0 µ ≤ µ0 2 检 方差σ 验 未知 µ ≥ µ 0
正确
α 错误和 β 错误的关系
当H0、H1给定,n固定时,无法同时使α和β变小 α和β的关系就像翘翘板,α小β就大, α大β就小
β α
使α、β 同时变小的办法就是增大样本容量。
“不能拒绝H0”
一般地说,哪一类错误所带来的后果越严重,危害越大, 在假设检验中就应当把哪一类错误作为Fra bibliotek要的控制目标。
通常β不易计算,所以通常我们 主要控制α,尽量减小β
µ ≥ µ0 µ < µ0
µ ≤ µ0 µ > µ0
双边检验
抽样分布
拒绝域 α/2
H0 :µ = µ0
H1 :µ ≠ µ0
置信水平 拒绝域 1-α α/2 接受域 H0值
临界值
临界值
左单边检验
抽样分布
拒绝域
H0 :µ ≥ µ0
H1 :µ < µ0
置信水平
α
1-α 接受域 H0值
临界值
右单边检验
由于α 事先确定,所以拒绝H0 是有说服力的, 而β通常未知,所以如果我们决定“接受H0 “,我们并不 确定这个决策的置信度,所以通常我们不采用“接受H0 “的说法,而是采用“不能拒绝H0 “的说法。
假设检验PPT课件
【学习目标】通过对本章的学习,掌握假设检验的概念和 类型、假设检验的两类错误和假设检验的一般步骤;重点掌握 单个总体均值的检验和比率的检验。
第一节 假设检验的基本问题 第二节 △ 假设检验的应用
假设检验
第一节 假设检验的基本问题
一、假设检验的概念 二、假设检验的两类错误 三、假设检验的类型 四、假设检验的类型一般步骤
假设检验
第一节 假设检验的基本问题
什么小概率?
1.在一次试验中,一个几乎不可能发生的事件发生的概率; 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假 设; 3.小概率由研究者事先确定。
假设检验
第一节 假设检验的基本问题
二、假设检验的两类错误(决策风险)
(一) 第一类错误 第一类错误,亦称拒真(弃真)错误。是指当原假设为 真时,但由于样本的随机性使样本统计量的具体值落入 了拒绝区域,这时所作的判断是拒绝原假设。 犯第一类错误的概率亦称拒真概率,它实质上就是前面
t
986 1000 24
2.333>
t n 1 2.1315
16
2
所以接受 H1,即这天包装机工作不正常。
假设检验
第二节 假设检验的应用
二、单个总体比率(成数)的假设检验
比率P是平均数的一种特殊形式,因而前面讲的平均 数检验理论都适用于总体比率P的假设检验,只是估计量 的形式略有不同。
【例4】我国出口的参茸药酒畅销于某国市场。据以往调查, 购买此种酒的顾客中40岁以上的男子占50%。经营该药酒 的进出口公司经理关心这个比率是否发生了变化,于是, 委托一个咨询机构进行调查,这个咨询机构从众多购买该 药酒的顾客中随机抽取了400名进行调查,结果有210名为 40岁以上的男子。试问在0.05的显著水平上,能否认为购 买此种药酒的顾客中40岁以上男子所占比率变化了?
(05)第5章 假设检验1
临界值: t0.05(35)=1.6896
拒绝H0
0.05
检验统计量:
t x 0 5275 5200 3.75
s / n 120 36
t0.05 (35) 1.6896
决策:拒绝H0 结论: 改良后的新品种产量有显著 提高
6 - 33 0 1.6896 z
6-7
统计学
STATISTICS
一个假设检验的例子
P112—【例3.33】
一个汽车电池制造商声称其最好的电池寿命的分布 为均值54个月,标准差为6个月。假设某一消费 组织决定购买50个这种电池作为样本检验电池的 寿命,以核实这一声明。
(1)假设这个制造商之所言是真实的,试描 述这50个电池样本的平均寿命的抽样分布。
STATISTICS
5.1 假设检验的基本原理
一、假设的陈述 二、显著性水平 三、统计量与拒绝域 四、利用P值进行决策
统计学
STATISTICS
5.1.1 假设的陈述
现实生活中,人们经常要对某个“假设”作出判断, 确定它是真的还是假的。在研究领域,研究者在 检验一种新的理论时,首先要提出一种自己认为 是正确的看法,即假设。
1 (1.53) 1 0.9370 0.0630
说明在显著性水平为0.05下不能判定汽车电池的 平均寿命不到54个月。但在显著性水平为0.1下可 以判定汽车电池的平均寿命不到54个月。
6 - 12
统计学
STATISTICS
原假设与备择假设
统计学
STATISTICS
原假设
(null hypothesis)
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
实验1 假设检验
项目八 假设检验、回归分析与方差分析实验1 假设检验实验目的 掌握用Mathematica 作单正态总体均值、方差的假设检验, 双正态总体的均值差、方差比的假设检验方法, 了解用Mathematica 作分布拟合函数检验的方法.基本命令1.调用假设检验软件包的命令<<Statistics\HypothesisTests.m输入并执行命令<<Statistics\HypothesisTests.m2.检验单正态总体均值的命令MeanTest命令的基本格式为MeanTest[样本观察值,0H 中均值0μ的值, TwoSided->False(或True), Known Variance->None (或方差的已知值20σ),SignificanceLevel->检验的显著性水平α,FullReport->True]该命令无论对总体的均值是已知还是未知的情形均适用.命令MeanTest 有几个重要的选项. 选项Twosided->False 缺省时作单边检验. 选项Known Variance->None 时为方差未知, 所作的检验为t 检验. 选项Known Variance->20σ时为方差已知(20σ是已知方差的值), 所作的检验为u 检验. 选项Known Variance->None 缺省时作方差未知的假设检验. 选项SignificanceLevel->0.05表示选定检验的水平为0.05. 选项FullReport->True 表示全面报告检验结果.3.检验双正态总体均值差的命令MeanDifferenceTest命令的基本格式为MeanDifferenceTest[样本1的观察值,样本2的观察值,0H 中的均值21μμ-,选项1,选项2,…]其中选项TwoSided->False(或True), SignificanceLevel->检验的显著性水平α,FullReport->True 的用法同命令MeanTest 中的用法. 选项EqualVariances->False(或True)表示两个正态总体的方差不相等(或相等).4.检验单正态总体方差的命令VarianceTest命令的基本格式为VarianceTest[样本观察值,0H 中的方差20σ的值,选项1,选项2,…]该命令的选项与命令MeanTest 中的选项相同.5.检验双正态总体方差比的命令VarianceRatioTest命令的基本格式为VarianceRatioTest[样本1的观察值,样本2的观察值,0H 中方差比2221σσ的值,选项1,选项2,…] 该命令的选项也与命令MeanTest 中的选项相同.注: 在使用上述几个假设检验命令的输出报告中会遇到像OneSidedPValue->0.000217593这样的项,它报告了单边检验的P 值为0.000217593. P 值的定义是: 在原假设成立的条件下, 检验统计量取其观察值及比观察值更极端的值(沿着对立假设方向)的概率. P 值也称作“观察”到的显著性水平. P 值越小, 反对原假设的证据越强. 通常若P 低于5%, 称此结果为统计显著; 若P 低于1%,称此结果为高度显著.6.当数据为概括数据时的假设检验命令当数据为概括数据时, 要根据假设检验的理论, 计算统计量的观察值, 再查表作出结论. 用以下命令可以代替查表与计算, 直接计算得到检验结果.(1)统计量服从正态分布时, 求正态分布P 值的命令NormalPValue. 其格式为NormalPValue[统计量观察值,显著性选项,单边或双边检验选项](2)统计量服从t 分布时, 求t 分布P 值的命令StudentTPValue. 其格式为StudentTPValue[统计量观察值,自由度,显著性选项,单边或双边检验选项](3)统计量服从2χ分布时, 求2χ分布P 值的命令ChiSquarePValue. 其格式为ChiSquarePValue[统计量观察值,自由度,显著性选项,单边或双边检验选项](4)统计量服从F 分布时, 求F 分布P 值的命令FratioPValue. 其格式为FratioPValue[统计量观察值,分子自由度,分母自由度,显著性选项,单边或双边检验选项](5)报告检验结果的命令ResultOfTest. 其格式为ResultOfTest[P 值,显著性选项,单边或双边检验选项,FullReport->True]注:上述命令中, 缺省默认的显著性水平都是0.05, 默认的检验都是单边检验.实验举例单正态总体均值的假设检验(方差已知情形)例 1.1 (教材 例 1.1) 某车间生产钢丝, 用X 表示钢丝的折断力, 由经验判断),(~2σμN X , 其中228,570==σμ, 今换了一批材料, 从性能上看, 估计折断力的方差2σ不会有什么变化(即仍有228=σ), 但不知折断力的均值μ和原先有无差别. 现抽得样本, 测得其折断力为578 572 570 568 572 570 570 572 596 584取,05.0=α试检验折断力均值有无变化?根据题意, 要对均值作双侧假设检验570:,570:10≠=μμH H输入<<Statistics\HypothesisTests.m 执行后, 再输入 data1={578,572,570,568,572,570,570,572,596,584};MeanTest[data1,570,SignificanceLevel->0.05,KnownVariance->64,TwoSided->True,FullReport->True](*检验均值, 显著性水平05.0=α, 方差083.02=σ已知*)则输出结果{FullReport->MeanTestStat Distribution 575.2 2.05548 NormalDistribution[]TwoSidedPValue->0.0398326,Reject null hypothesis at significance level ->0.05}即结果给出检验报告: 样本均值2.575=x , 所用的检验统计量为u 统计量(正态分布),检验统计量的观测值为 2.05548, 双侧检验的P 值为0.0398326, 在显著性水平05.0=α下, 拒绝原假设, 即认为折断力的均值发生了变化.例 1.2 (教材 例 1.2) 有一工厂生产一种灯管, 已知灯管的寿命X 服从正态分布)40000,(μN , 根据以往的生产经验, 知道灯管的平均寿命不会超过1500小时. 为了提高灯管的平均寿命, 工厂采用了新的工艺. 为了弄清楚新工艺是否真的能提高灯管的平均寿命,他们测试了采用新工艺生产的25只灯管的寿命. 其平均值是1575小时, 尽管样本的平均值大于1500小时, 试问: 可否由此判定这恰是新工艺的效应, 而非偶然的原因使得抽出的这25只灯管的平均寿命较长呢?根据题意, 需对均值的作单侧假设检验 1500:,1500:10>≤μμH H检验的统计量为 n X U /0σμ-=, 输入 p1=NormalPValue[(1575-1500)/200*Sqrt[25]]ResultOfTest[p1[[2]],SignificanceLevel ->0.05,FullReport ->True]执行后的输出结果为OneSidedPValue ->0.0303964{OneSidedPValue->0.0303964,Fail to reject null hypothesis at significance level ->0.05}即输出结果拒绝原假设单正态总体均值的假设检验(方差未知情形)例1.3 (教材 例1.3) 水泥厂用自动包装机包装水泥, 每袋额定重量是50kg, 某日开工后随机抽查了9袋, 称得重量如下:49.6 49.3 50.1 50.0 49.2 49.9 49.8 51.0 50.2设每袋重量服从正态分布, 问包装机工作是否正常(05.0=α)?根据题意, 要对均值作双侧假设检验:50:;50:10≠=μμH H输入 data2={49.6,49.3,50.1,50.0,49.2,49.9,49.8,51.0,50.2};MeanTest[data2,50.0,SignificanceLevel ->0.05,FullReport ->True](*单边检验且未知方差,故选项TwoSided,KnownVariance 均采用缺省值*)执行后的输出结果为{FullReport->Mean TestStat Distribution,49.9 -0.559503 StudentTDistribution[8]OneSidedPValue ->0.295567,Fail to reject null hypothesis at significance level ->0.05}即结果给出检验报告: 样本均值9.49=X , 所用的检验统计量为自由度8的t 分布(t 检验),检验统计量的观测值为-0.559503, 双侧检验的P 值为0.295567, 在显著性水平05.0=α下, 不拒绝原假设, 即认为包装机工作正常.例1.4 (教材 例1.4) 从一批零件中任取100件,测其直径,得平均直径为5.2,标准差为1.6.在显著性水平05.0=α下,判定这批零件的直径是否符合5的标准.根据题意, 要对均值作假设检验:.5:;5:10≠=μμH H 检验的统计量为n s T /0μ-=, 它服从自由度为1-n 的t 分布. 已知样本容量,100=n 样本均值2.5=X , 样本标准差6.1=s .输入StudentTPValue[(5.2-5)/1.6*Sqrt[100],100-1,TwoSided->True]则输出TwoSidedPValue->0.214246 即P 值等于0.214246, 大于0.05, 故不拒绝原假设, 认为这批零件的直径符合5的标准.单正态总体的方差的假设检验例1.5 (教材 例1.5) 某工厂生产金属丝, 产品指标为折断力. 折断力的方差被用作工厂生产精度的表征. 方差越小, 表明精度越高. 以往工厂一直把该方差保持在64(kg 2)与64以下. 最近从一批产品中抽取10根作折断力试验, 测得的结果(单位为千克) 如下:578 572 570 568 572 570 572 596 584 570 由上述样本数据算得74.75,2.5752==s x .为此, 厂方怀疑金属丝折断力的方差是否变大了. 如确实增大了, 表明生产精度不如以前, 就需对生产流程作一番检验, 以发现生产环节中存在的问题.根据题意, 要对方差作双边假设检验:64:;64:2120>≤σσH H 输入 data3={578,572,570,568,572,570,572,596,584,570};VarianceTest[data3,64,SignificanceLevel->0.05,FullReport->True](*方差检验,使用双边检验,05.0=α*)则输出{FullReport->Variance TestStat Distribution75.7333 10.65 ChiSquareDistribution[9]OneSidedPValue->0.300464,Fail to reject null hypothesis at significance level->0.05}即检验报告给出: 样本方差,7333.752=s 所用检验统计量为自由度4的2χ分布统计量(2χ 检验), 检验统计量的观测值为10.65, 双边检验的P 值为0.300464, 在显著性水平05.0=α 时, 接受原假设, 即认为样本方差的偏大系偶然因素, 生产流程正常, 故不需再作进一步的 检查.例1.6 (教材 例1.6) 某厂生产的某种型号的电池, 其寿命(以小时计) 长期以来服从方差50002=σ的正态分布, 现有一批这种电池, 从它的生产情况来看, 寿命的波动性有所改变. 现随机取26只电池, 测出其寿命的样本方差92002=s .问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著的变化(取02.0=α)?根据题意, 要对方差作双边假设检验: 5000:;5000:2120≠=σσH H 所用的检验统计量为,)1(2022σχS n -=它服从自由度为1-n 的2χ分布.已知样本容量,26=n 样本方差.92002=s 输入ChiSquarePValue[(26-1)*9200/5000, 26-1,TwoSided->True]则输出TwoSidedPValue->0.0128357.即P 值小于0.05, 故拒绝原假设. 认为这批电池寿命的波动性较以往有显著的变化.双正态总体均值差的检验(方差未知但相等)例1.7 (教材 例1.7) 某地某年高考后随机抽得15名男生、12名女生的物理考试成绩如下:男生: 49 48 47 53 51 43 39 57 56 46 42 44 55 44 40女生: 46 40 47 51 43 36 43 38 48 54 48 34从这27名学生的成绩能说明这个地区男女生的物理考试成绩不相上下吗?(显著性水平05.0=α).根据题意, 要对均值差作单边假设检验:211210:,:μμμμ≠=H H输入 data4={49.0,48,47,53,51,43,39,57,56,46,42,44,55,44,40};data5={46,40,47,51,43,36,43,38,48,54,48,34};MeanDifferenceTest[data4,data5,0,SignificanceLevel->0.05,TwoSided->True,FullReport->True,EqualVariances->True,FullReport->True](*指定显著性水平05.0=α,且方差相等*) 则输出{FullReport->MeanDiff TestStat Distribution3.6 1.56528 tudentTDistribution[25],OneSidedPValue->0.13009,Fail to reject null hypothesis at significance level->0.05} 即检验报告给出: 两个正态总体的均值差为3.6, 检验统计量为自由度25的t 分布(t 检验),检验统计量的观察值为1.56528, 单边检验的P 值为0.13009, 从而没有充分理由否认原假 设, 即认为这一地区男女生的物理考试成绩不相上下.双正态总体方差比的假设检验例1.8 (教材 例1.8) 为比较甲、乙两种安眠药的疗效, 将20名患者分成两组, 每组10人, 如服药后延长的睡眠时间分别服从正态分布, 其数据为(单位:小时):甲: 5.5 4.6 4.4 3.4 1.9 1.6 1.1 0.8 0.1 -0.1乙: 3.7 3.4 2.0 2.0 0.8 0.7 0 -0.1 -0.2 -1.6问在显著性水平05.0=α下两重要的疗效又无显著差别.根据题意, 先在21,μμ未知的条件下检验假设:2221122210:,:σσσσ≠=H H输入 list1={5.5,4.6,4.4,3.4,1.9,1.6,1.1,0.8,0.1,-0.1};list2={3.7,3.4,2.0,2.0,0.8,0.7,0,-0.1,-0.2,-1.6};VarianceRatioTest[list1,list2,1,SignificanceLevel->0.05,TwoSided->True,FullReport->True](*方差比检验,使用双边检验,05.0=α*) 则输出 {FullReport->Ratio TestStat Distribution1.41267 1.41267 FratioDistribution[9,9],TwoSidedPValue->0.615073,Fail to reject null hypothesis at significancelevel->0.05}即检验报告给出: 两个正态总体的样本方差之比2221s s 为1.41267, 检验统计量的分布为)9,9(F 分布(F 检验), 检验统计量的观察值为1.41267, 双侧检验的P 值为0.615073. 由检验报告知两总体方差相等的假设成立.其次, 要在方差相等的条件下作均值是否相等的假设检验:211210:,:μμμμ≠'='H H 输入MeanDifferenceTest[list1,list2,0,EqualVariances->True,SignificanceLevel->0.05,TwoSided->True,FullReport->True](*均值差是否为零的检验,已知方差相等,05.0=α,双边检验*)则输出{FullReport->MeanDiff TestStat Distribution1.26 1.52273 StudentTDistribution[18],TwoSidedPValue->0.1452,Fail to reject null hypothesis at significance level->0.05}根据输出的检验报告, 应接受原假设,:210μμ='H 因此, 在显著性水平05.0=α下可认为21μμ=.综合上述讨论结果, 可以认为两种安眠药疗效无显著差异.例1.9 (教材 例1.9) 甲、乙两厂生产同一种电阻, 现从甲乙两厂的产品中分别随机抽取12个和10个样品, 测得它们的电阻值后, 计算出样本方差分别为,40.121=s .38.422=s 假设电阻值服从正态分布, 在显著性水平10.0=ε下, 我们是否可以认为两厂生产的电阻值的方差相等.根据题意, 检验统计量为,2221S S F =它服从自由度(1,121--n n )的F 分布.已知样本容量10,1221==n n , 样本方差.38.4,40.12221==s s 该问题即检验假设: 2221122210:,:σσσσ≠=H H输入FRatioPValue[1.40/4.38,12-1,10-1,TwoSided->True,SignificanceLevel->0.1]则输出TwoSidedPValue->0.0785523,Reject null hypothesis at significance level->0.1}所以, 我们拒绝原假设, 即认为两厂生产的电阻阻值的方差不同分布拟合检验——2χ检验法例1.10 (教材 例1.10) 下面列出84个伊特拉斯坎男子头颅的最大宽度(单位:mm):141 148 132 138 154 142 150 146 155 158 150 140 147 148 144150 149 145 149 158 143 141 144 144 126 140 144 142 141 140145 135 147 146 141 136 140 146 142 137 148 154 137 139 143140 131 143 141 149 148 135 148 152 143 144 141 143 147 146150 132 142 142 143 153 149 146 149 138 142 149 142 137 134144 146 147 140 142 140 137 152 145试检验上述头颅的最大宽度数据是否来自正态总体(1.0=α)?输入数据data2={141,148,132,138,154,142,150,146,155,158,150,140, 147,148,144,150,149,145,149,158,143,141,144,144,126,140, 144,142,141,140,145,135,147,146,141,136,140,146,142,137, 148,154,137,139,143,140,131,143,141,149,148,135,148,152, 143,144,141,143,147,146,150,132,142,142,143,153,149,146, 149,138,142,149,142,137,134,144,146,147,140,142,140,137,152,145};输入Min[data2]|Max[data2] 则输出126|158 即头颅宽度数据的最小值为126, 最大值为158. 考虑区间[124.5,159.5], 它包括了所有的数据. 以5为间隔, 划分小区间. 计算落入每个小区间的频数, 输入pshu=BinCounts[data2,{124.5,159.5,5}] 则输出{1,4,10,33,24,9,3} 因为出现了两个区间内的频数小于5, 所以要合并小区间. 现在把频数为1, 4的两个区间合并, 再把频数为9, 3的两个区间合并. 这样只有5个小区间. 这些区间为(5.134,-∞),),,5.154(,],5.139,5.134(+∞为了计算分布函数在端点的值, 输入zu=Table[129.5+j*5,{j,1,4}] 则输出{134.5,139.5,144.5,149.5} 以这4个数为分点,把),(+∞-∞分成5个区间后,落入5个小区间的频数分别为5, 10, 33, 24, 12.它们除以数据的总个数就得到频率. 输入plv={5,10,33,24,12}/Length[data2]则输出⎭⎬⎫⎩⎨⎧71,72,2811,425,845下面计算在0H 成立条件下, 数据落入5个小区间的概率. 输入nor=NormalDistribution[Mean[data2],StandardDeviationMLE[data2]];(*Mean[data2]是总体均值的极大似然估计,StandardDeviationMLE[data2]是总体标准差的极大似然估计,NormalDistribution 是正态分布,因此nor 是由极大似然估计得到的正态分布*)Fhat=CDF[nor,zu] (*CDF 是分布函数的值*)则输出{0.0590736,0.235726,0.548693,0.832687}此即0H 成立条件下分布函数在分点的值. 再求相邻两个端点的分布函数值之差, 输入 Fhat2=Join[{0},Fhat,{1}];glv=Table[Fhat2[[j]]-Fhat2[[j-1]],{j,2,Length[Fhat2]}]则输出{0.0590736,0.176652,0.312967,0.283994,0.167313}输入计算检验统计量2χ值的命令chi=Apply[Plus,(plv-glv)^2/glv*Length[data2]]则输出3.59235再输入求2χ分布的P 值命令ChiSquarePValue[chi,2] (*5-2-1=2为2χ分布的自由度*)则输出OneSidedPValue->0.165932这个结果表明0H 成立条件下, 统计量2χ取3.59235及比它更大的概率为0.165932, 因此不拒绝0H , 即头颅的最大宽度数据服从正态分布.实验习题1.设某种电子元件的寿命X (单位:h)服从正态分布22,),,(σμσμN 均未知. 现测得16只元件的寿命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命225h?是否有理由认为这种元件寿命的方差≤852?2.某化肥厂采用自动流水生产线,装袋记录表明,实际包重)2,100(~2N X ,打包机必须定期进行检查,确定机器是否需要调整,以确保所打的包不至过轻或过重,现随机抽取9包, 测得数据(单位:kg)如下102 100 105 103 98 99 100 97 105若要求完好率为95%,问机器是否需要调整?3.某炼铁厂的铁水的含碳量X 在正常情况下服从正态分布.现对操作工艺进行了某些改进,从中抽取5炉铁水测得含碳量百分比的数据如下4.421 4.052 4.357 4.287 4.683据此是否可以认为新工艺炼出的铁水含碳量的方差仍为?)05.0(108.02=α4.机器包装食盐,假设每袋盐的净重服从正态分布,规定每袋标准重量为500g,标准差不能超过0.02.某天开工后,为检验机械工作是否正常,从装好的食盐中随机地抽取9袋,则其净重(单位:500g)为0.994 1.014 1.02 0.95 0.968 0.968 1.048 0.982 1.03 问这天包装机工作是否正常(05.0=α)?5.(1)某切割机在正常工作时,切割每段金属棒的平均长度为10.5cm.今从一批产品中随机地抽取15段,测得其长度(单位:cm)如下10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.210.9 10.6 10.8 10.5 10.7 10.2 10.7 设金属棒长度服从正态分布,且标准差没有变化,试问该机工作是否正常(05.0=α)?(2)上题中假定切割的长度服从正态分布,问该机切割的金属棒的平均长度有无显著变化(05.0=α)? (3)如果只假定切割的长度服从正态分布,问该机切割的金属棒长度的标准差有无显著变化(05.0=α)?6. 在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一平炉进行的, 每炼一炉钢时除操作方法外, 其他方法都尽可能做到相同.先用标准方法炼一炉, 然后用建议的新方法炼一炉, 以后交替进行, 各炼了10炉, 其得率分别为(1) 标准方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3(2) 新 方 法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1设这两个样本相互独立, 且分别来自正态总体),(21σμN 和),(22σμN ,21,μμ和2σ均未知.问建议的新操作方法能否提高得率(05.0=α).7.某自动机床加工同一种类型的零件.现从甲、乙两班加工的零件中各抽验了5各,测得它们的直径(单位:cm)分别为甲: 2.066 2.063 2.068 2.060 2.067乙: 2.058 2.057 2.063 2.059 2.060已知甲、乙二车床加工的零件其直径分别为),(~),,(~2221σμσμN Y N X ,试根据抽样结果来说明两车床加工的零件的平均直径有无显著性差异(05.0=α)?8.设某产品的使用寿命近似服从正态分布,要求平均使用寿命不低于1000h.现从一批产品中任取25只, 测得平均使用寿命为950h,样本方差为100, 在05.0=α下,检验这批产品是否合格.9. 两台机器生产某种部件的重量近似服从正态分布.分别抽取60与30个部件进行检测,样本方差分别为.66.9,46.152221==s s 试在05.0=α下检验假设 .:;:2221122210σσσσ>=H H 10.设某电子元件的可靠性指标服从正态分布,合格标准之一为标准差.05.00=σ现检测15次,测得指标的平均值95.0=x ,指标的标准差.03.0=s 试在1.0=α下检验假设.05.0:;05.0:221220≠=σσH H11.对两种香烟中尼古丁含量进行6次测试,得到样本均值与样本方差分别为 22.9,25.6,67.25,5.252221====s s y x 设尼古丁含量都近似服从正态分布,且方差相等.取显著性水平,05.0=α检验香烟中尼古丁含量的方差有无显著差异.。
假设检验(1)
当P时,结论为按所取的检验水准拒 绝H0,接受H1。这样判断的理由是: 在H0的条件下,出现等于及大于现有 检验统计量的概率P,是小概率事件, 这在一次抽样中是不大可能发生的, 即现有样本信息不支持H0,因而拒绝 它;反之,当P,即样本信息支持H0, 就没有理由拒绝它,只能接受H0。
-0.20
-0.15 -0.14
0.04
0.0225 0.0196
10
合计
4.49
4.01
0.48
0.58 (d)
0.2304
2.1182 (d2)
1. 建立假设:H0:d=0,
H 1 : d 0 , 0.05 。 d为治疗前后差值的总体均数。 2. 计算统计量t值
d0 d t Sd Sd
按0.05检验水准,接受H0,拒绝H1,
不能认为两法测定尿铅结果有差别。
1. 建立假设和确定检验水准
假设有两个,一是无效假设,符 号为H0,即样本均数所代表的总体均 数 与假设的总体均数 0 相等。与 0 的差异是抽样误差所致。二是备择假 设,符号为H1,即样本均数所代表的 总体均数 与 0 不相等,与 0 差异是 本质性差异。
假设检验有双侧检验和单侧检验之分,
由于样本均数有抽样误差,对一
个样本均数X与一个已知的或假设的
总体均数0作比较,它们之间差别可
能有两种原因造成:
① 由于抽样误差所致,山区男子 脉搏的总体均数与一般成年男 子的脉搏数总体均数相同,也 是72次/分,现在所得样本均数 74.2次/分,仅仅是由于抽样误 差造成的。
假设检验1
解: 要检验如下问题 H 0 : 12, H1 : 12 , 计算统计量的观测值 u 而u
1
n
x
12.5 12 100 5, 1
2
u0.95 1.645, u u0.95 , 所以拒绝原假设,即可以
认为产品的平均重量有显著变化.
我们由样本观测值计算发现
t 偏小,
那就有理由认为原假设
H 0 可能根本不成立,
于是拒绝域可以取作如下形式: .
第三章 假设检验(1)
§3.1 假设检验问题
实例
1.研究人员想知道一组学生的IQ平均分数与100的差异? 2.工人在技术培训前后某项技能的成绩是否提高了? 3.购买你的产品的顾客与不购买你的产品的顾客平均收入 是否相同? 4.实验前学习成绩和智商均相同的两组孩子, 分别进行不同 的教学方法, 进行一段时间后, 比较参与实验的两组学生的 平均成绩是否有差异, 从而可以对教学方法给出评价.
2
相应的拒绝域为
W1 { T t
1
2
(n 1)}
其中 t p ( n 1) 是自由度为 n 1 的 t 分布的 p -分位数点. 其它步骤类似. 称该检验为
t -检验.
而前述检验为 u -检验.
例1:某糖厂用自动打包机装糖.已知每袋糖的重量 (单位:千克)服从正态分布X ~ N , 2 .今随机抽查 9袋, 称出它们的重量并计算得到x 48.5, s* 2.5. 取 显著性水平 0.05, 在下列两种情形下分别检验 H 0 : 50 (1) 2 4
其中 0 为已知.
U
n ( X 0 )
U 满足如下要求:
假设检验
假设检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。
具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。
常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。
中文名假设检验外文名 hypothesis test提出者 K.Pearson 提出时间 20世纪初1、简介假设检验又称统计假设检验(注:显著性检验只是假设检验中最常用的一种方法),是一种基本的统计推断形式,也是数理统计学的一个重要的分支,用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
[1]2、基本思想假设检验的基本思想是小概率反证法思想。
小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。
反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设成立。
[2] 假设是否正确,要用从总体中抽出的样本进行检验,与此有关的理论和方法,构成假设检验的内容。
设A是关于总体分布的一项命题,所有使命题A成立的总体分布构成一个集合h0,称为原假设(常简称假设)。
使命题A不成立的所有总体分布构成另一个集合h1,称为备择假设。
如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数统计)。
如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设。
对一个假设h0进行检验,就是要制定一个规则,使得有了样本以后,根据这规则可以决定是接受它(承认命题A正确),还是拒绝它(否认命题A正确)。
假设检验1
假设检验一、假设检验的意义假设检验是抽样推断中的一项重要内容。
它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。
用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。
通过检验,对样本指标与假设的总体指标之间是否存在差别作出判断,是否接受原假设。
这里必须明确,进行检验的目的不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异。
从这个意义上,假设检验又称为显著性检验。
进行假设检验,先要对假设进行陈述。
通过下例加以说明。
例如,设某工厂制造某种产品的某种精度服从平均数为方差为的正态分布,据过去的数据,已知平均数为75,方差为100。
现在经过技术革新,改进了制造方法,出现了平均数大于75,方差没有变更,但仍存在平均数不超过75的可能性。
试陈述为统计假设。
根据上述情况,可有两种假设,一个是假想平均数不超过75,即假设另一个假想是平均数大于75,即假设如果我们把作为原假设,即被检验的假设,称作零假设,记作于是,假设相对于假设来说,是约定的、补充的假设,记作它和有两者选择其一的意思,即作为被检验的假设,则就是备择的,故称为备择假设或对立假设。
还须指出,哪个是零假设,哪个是备择假设,是无关紧要的。
我们关心的问题,是要探索哪一个假设被接受的问题。
被接受的假设是要作为推理的基础。
在实际问题中,一般要考虑事情发生的逻辑顺序和关心的事件,来设立零假设和备择假设。
在作出了统计假设之后,就要采用适当的方法来决定是否应该接受零假设。
由于运用统计方法所遇到的问题不同,因而解决问题的方法也不尽相同。
但其解决方法的基本思想却是一致的,即都是“概率反证法”思想,即:(1)为了检验一个零假设(即虚拟假设)是否成立,先假定它是成立的,然后看接受这个假设之后,是否会导致不合理结果。
第二章 假设检验理论1
最小错误错误概率准则
判决门限:
P( H 0 )(C10 C00 ) P( H1 )(C01 C11 )
P( H 0 ) P( H1 )
最小错误错误概率准则
P( x / H1 ) p ( H 0 ) p ( x / H 0 ) p ( H1 )
判决为H1成立
P( x / H1 ) p ( H 0 ) p ( x / H 0 ) p ( H1 )
第二章 假设检验理论
观测模型
H0 信源 H1 概率转移 机构
观测 空间R
H0 H1 判决 准则
观测模型
信源:信源输出通常称为假设H0 ,H1(
Hypotheses), H0 :Zero Hypotheses; 概率转移机构:在信源输出的其中某个 假设为真基础上,把噪声背景中的假设 以一定概率关系影射到观测空间中的过 程;(Probabilistic Transition Mechanism)
Η1
P(x/Hj)称为似然函数,它的含义表示为:观测样 本一定条件下,随假设(信源)而变化的函数。
P ( x / H1 ) p( x / H 0 )
称为似然比函数,Likelehood Ratio Function
P( x / H1 ) l ( x) p( x / H 0 )
P( H 0 )(C10 C00 ) P( H1 )(C01 C11 )
判决为H0成立
• Example : 如果系统满足
H0 :x=n H1 :x=A+n 其中n满足N(0,1),A是常数,等概率出现, 代价满足最小错误准则,求平均错误概率?
最大后验概率
• 在贝叶斯准则中,如果C00-C10 =C01-C11
假设检验分析法一
假设检验参数估计是统计推断的一个方面,统计推断的另一方面就是假设检验。
这2种推断方法都是研究总体参数的情况,但假设检验是研究如何运用样本得到的统计量来检验事先对总体参数所做的假设是否正确,是否具有某种性质或数量特征。
本章在讨论假设检验基本问题的基础上,着重研究总体平均数和2个总体平均数之差的假设检验、总体比率和2个总体比率之差的假设检验以及总体方差的假设检验等。
第一节假设检验的基本问题一、什么是假设检验一个说明统计假设检验基本推论过程的例子:一名被告正在受到法庭的审判。
根据英国的法律,先假定被告是无罪的,于是,证明他有罪的责任就是原告律师的事情了。
用假设检验的术语表示,那就是要建立一个假设,记为H0:被告是无罪的。
H0称为原假设或零假设。
另一个可供选择的假设记作H1:被告是有罪的。
H1称为备择或替代假设。
法庭陪审团要审查各种证据,以确定原告律师是否证实了这些证据与无罪这一基本假设不一致。
如果陪审员们认为证据与不一致,他们就拒绝该假设而接受其备择假设H1,即认为被告有罪。
用统计术语来说,原假设H0是接受检验的假设。
备择假设H1是当原假设被否定时另一种可成立的假设。
原假设和备择假设相互对立,在任何情况下只能有一个成立。
如果接受H0就必须拒绝H1;拒绝H0就必须接受H1。
例:某公司要检验一批新进口的薄钢板是否符合平均厚度为5毫米的规定,那么就是假设这批货(总体)的平均厚度(µ)是5毫米。
然后从这批货中按随机抽样的方法抽取样本并计算样本的平均厚度,以此来检验所做假设的正确性。
本例中需要被检验、被证实的原假设可记为H0: µ=5mm,(即原假设为总体平均厚度等于5mm)。
其备择假设就是H1: µ 5mm,(即这批货平均厚度不等于5毫米)。
总体平均数的假设有3种情况:(1)H0: µ = µ0;H1: µ≠ µ0。
(2)H0: µ≥ µ0;H1: µ < µ0。
假设检验第1讲
例 1: 某产品旳出厂检验要求: 次品率 p 不超出 4%才干出厂. 现从一万件产品中任意抽查12件 发觉3件次品, 问该批产品能否出厂?若抽查成 果发觉1件次品, 问能否出厂?
解: 先作一种假设。H0 : p 0.04
我们称H0是原假设或零假设.
再作一种备择假设
H1 : p 0.04
在H0成立时
要有效降低犯错误旳概率, 只好增长观察数据, 或在可能旳情况下提升数据旳质量,这相当于降 低数据旳样本方差.
例4 :第一类错误与第二类错误旳比较 一种有20数年教龄旳教师声称他上课历来不
“点名”. 怎样鉴定他讲旳话是真实旳?
确立原假设H0: 他没有点过名。 然后再调查H0是否为真. 当调查了他教过旳3个班, 都说他没有点过名, 这时假如认可H0, 犯错误旳概率还是较大旳. 当调查了他教过旳10个班, 都说他没有点过名, 这时认可H0 犯错误旳概率会明显降低。
于是, 我们判断正确旳概率是1-0.043=95.7%
假设检验中旳基本概念和检验思想 (1) 根据问题旳背景, 提出原假设
H0: p=0.35, 及其备择假设
H1: p>0.35.
(2) 在H0 成立旳假设下, 计算观察数据出现旳概 率P.
➢ 假如P很小(一般用0.05衡量), 就应该否定H0, 认可 H1;
如 = 0.05。拟定一种常数 c , 使得
X 68
P
3.6 6
c
则
c
z 2
z0.025
1.96
X 68 由 3.6 1.96
6
于是检验旳拒绝域为
X 69.18 或 X 66.824
W { X 69.18 or X 66.824} 现根据样本观察值,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 2 σ1 σ 2 n1 n2
,
若 Z S落在拒绝域中,则拒绝 H 0 , 否则接受 H 0 .
2 2 σ1 , σ 2 未知,但相等 (2) 总体方差
H 0 : μ1 μ2 =D0
H1 : μ1 μ2 D0 .
双边情形 单边类似
t
( X Y ) ( μ1 μ2 ) t ( n1 n2 2). ˆ ˆ ( n1 1) S12 ( n2 1) S22 1 1 n1 n2 2 n1 n2
假定 d i N ( μ, σ 2 ).
检验: H 0 : μ 0, H1 : μ 0.
H0 : μ 0
H1 : μ 0.
dμ t t ( n 1). Sd n
d di n
i 1 n
Sd
( d i d )2
i 1
n
n1
.
给定显著性水平 α , 拒绝域为( , t α 2 ( n 1)) 或 ( t α 2 ( n 1), ).
,
.
显著性水平
为犯第一类错误的概率.
三、大样本任意总体的假设检验 1、总体均值 μ 的假设检验
H 0 : μ μ0 H1 : μ μ0 .
双边情形 单边类似
Xμ Z N (0,1). σ n
ˆ σ 未知时,可用 S ( S ) 代替.
给定显著性水平 α ,
x μ0 Zs ,则落在拒绝域中,则拒绝 H 0 ,否则接受 H 0 . σ( s) n
3.06,3.08,4.94,4.06
假定新生婴儿体重服从正态分布,问可否认为12月
份比6月份新生婴儿体重要重?( α =0.05)
ˆ X 2.87, S12 0.655. ˆ 2 0.390. F 1.68. S 1 1 0.36. Y 3.70, S2 s W 6 10
两样本相互独立。
H 0 : p1 p2 =D0
Z
H1 : p1 p2 D0 .
双边情形 单边类似
ˆ ˆ ( P1 P2 ) ( p1 p2 ) p1 (1 p1 ) p2 (1 p2 ) n1 n2
给定显著性水平 α ,
拒绝域为 ( , Z α 2 ) 或 ( Z α 2 , ) .
1、总体均值差 μ1 μ2 的假设检验
ˆ 第一个总体: , μ1 , σ12 , n1 , X , S12 . X
2 ˆ2 第二个总体: , μ2 , σ 2 , n2 ,Y , S2 . Y
两样本相互独立。
H 0 : μ1 μ2 =D0
H1 : μ1 μ2 D0 .
Z
( X Y ) ( μ1 μ2 )
给定显著性水平 α , 拒绝域为( , tα 2 ( n1 n2 2)) 或 ( t α 2 ( n1 n2 2), ).
( x y ) D0 计算 t s ˆ ˆ ( n1 1) S12 ( n2 1) S22 1 1 n1 n2 2 n1 n2
Zs ˆ P p0 H H p0 (1 p0 ) ,则落在拒绝域中,则拒绝 0 ,否则接受 0 . n
例3 对某实验的温度进行测定,共100例,其 平均温度为1250 C , 25C 问能否认为该实验 S ( 的温度不超过1277 C ? α 0.05)
二、大样本任意二总体的假设检验
如果H0不成立,但统计量的实测值未落 入否定域,从而没有作出否定H0的结论,即 接受了错误的H0,那就犯了“以假为真”的 错误 .
请看下表
假设检验的两类错误
实际情况 决定 拒绝H0
接受H0
H0为真
第一类错误
正确
H0不真
正确
第二类错误
犯两类错误的概率:
P{拒绝H0|H0为真}= P{接受H0|H0不真}=
a ) D0 0, Z S
计算
b ) D0 0, Z S
ˆ ˆ ( P1 P2 ) 0 m m2 ˆ ,p 1 n1 n2 ˆ ˆ ˆ ˆ p(1 p ) p(1 p ) n1 n2
ˆ ˆ ( P1 P2 ) 0 . ˆ ˆ ˆ ˆ P1 (1 P1 ) P2 (1 P2 ) n1 n2
月份新生婴儿体重要重?( α =0.05)
X 2.87,Y 3.70.
例2 为比较不同季节新生婴儿的体重,从2008
年6月与12月出生的婴儿分别随即抽取6名和10名.
体重如下(kg):
6 月:1.52,2.96,2.56,2.96,3.26,3.96 12月:3.22,4.22,3.76,3.00,3.92,3.74
给定显著性水平 α , 拒绝域为 (0, F1 ( n1 1, n2 1)) 或 ( F ( n1 1, n2 1), ) .
α 2 α 2
计算
ˆ S12 FS 2 , ˆ S2
则若 FS 落在拒绝域中,则拒绝 H 0 ,否则接受 H 0 .
例1 为比较不同季节新生婴儿的体重,从2008
( x y ) D0
2 2 2 σ1 ( S12 ) σ 2 ( S2 ) n1 n2
则若 Z S 落在拒绝域中,则拒绝 H 0,否则接受 H 0 .
2、总体均值差 p1 p2 的假设检验
ˆ p 第一个总体: 1 , n1 , P1 .
ˆ p 第二个总体: 2 , n2 , P2 .
年6月与12月出生的婴儿分别随即抽取6名和10名.
体重如下(kg):
6 月:1.52,2.96,2.56,2.96,3.26,3.96
12月:3.22,4.22,3.76,3.00,3.92,3.74 3.06,3.08,4.94,4.06 假定6月份新生婴儿体重 X N ( μ1 ,0.54) ,12月份新 生婴儿体重 Y N ( μ2 ,0.325) .问可否认为12月份比6
则若 Z S 落在拒绝域中,则拒绝 H 0,否则接受 H 0 .
三、配对样本的假设检验
抽取一样本,容量为n,对样本中的每一个个体
进行两次观察,得到的样本称为配对样本.
1 1 1 X 1 , X 2 ,, X n 2 2 X 12 , X 2 ,, X n
d 则: i X i1 X i2分布相同,且相互独立,
2 2
H 0 : μ1 μ2 =D0
H1 : μ1 μ2 D0 .
2 2
Z
( X Y ) ( μ1 μ2 ) σ σ n1 n2
2 1
N (0,1).
双边情形 单边类似
给定显著性水平 α , 拒绝域为 ( , Z α 2 ) 或 ( Z α 2 , ) . 计算
则若 t S落在拒绝域中,则拒绝 H 0 ,否则接受 H 0 .
2、总体方差比 σ / σ 的假设检验
2 1 2 2
2 2 H 0 : σ1 σ2 2 2 H1 : σ1 σ2 .
ˆ S12 F 2 ˆ S2
2 σ1 F ( n1 1, n2 1). 2 σ2
双边情形 单边类似
拒绝域为 ( , Z α 2 ) 或 ( Z α 2 , ) .
2、总体成数 p 的假设检验
H 0 : p p0 H1 : p p0 .
双边情形 单边类似
Z
ˆ P p N (0,1). p(1 p ) n
给定显著性水平 α , 拒绝 ) .
二、小样本二正态总体假设检验 第一个总体: N ( μ1 , σ12 ). X
ˆ n1 , X , S12 . 总体X的样本:
2 第二个总体: N ( μ2 , σ2 ). Y
ˆ2 n2 ,Y , S2 . 总体Y的样本:
两样本相互独立。
1、总体均值差 μ1 μ2 的假设检验 (1) 总体方差 σ1 , σ 2 已知
2 2 σ1 σ 2 n1 n2
N (0,1).
双边情形 单边类似
2 ˆ2 ˆ 未知时,可相应地用 S12 ( S12 ), S2 ( S2 ) 代替. σ ,σ
2 1
2 2
给定显著性水平 α , 拒绝域为 ( , Z α 2 ) 或 ( Z α 2 , ) . 计算 Z S
d 0 ts ,则落在拒绝域中,则拒绝 H 0 ,否则接受 H 0 . sd n
四、假设检验的两类错误
假设检验会不会犯错误呢? 由于作出结论的依据是小概率原理
不是一定不发生
人们认为小概率事件在一次试验中是不会发生 .
如果H0成立,但统计量的实测值落入否定 域,从而作出否定H0的结论,那就犯了“以真 为假”的错误 .