统计学第6章假设检验分析
《医学统计学》第六章+参数估计与假设检验
2、该地所有人收缩压的均数可能在什么范围?
医学统计学(第7版)
三、总体均数的区间估计
(一)σ 已知
➢ 如果变量 X 服从均数为 μ、标准差为 的正态分布,则: z
服从标准正态分布。则:
P X 1.96
X 1.96
0.95
(二)σ 未知
1. t 分布
➢ 事实上,总体标准差 通常是未知的,这时我们可以用其估计量S代替 ,但
在这种情况下,( X ) / ( S /
n)
已不再服从标准正态分布,而是服从著名的 t 分布。
William Gosset
不同自由度的t分布图
医学统计学(第7版)
2. 可信区间的计算
S12 S22
n1 n2
2 ,v
医学统计学(第7版)
例题
➢ 例6-4 评价复方缬沙坦胶囊与缬沙坦胶囊对照治疗轻中度高血压的有效性,将102名患
者随机分为两组,其中试验组和对照组分别为54例和48例。经六周治疗后测量收缩压,
试验组平均下降15.77mmHg,标准差为13.17mmHg;对照组平均下降9.53mmHg,标准
样本率的标准差称为率的标准误(standard error of rate),可用来描述样
本率抽样误差的大小。率的标准误越小,则率的抽样误差越小,率的标
准误越大,则率的抽样误差越大。公式为:
p
(1 )
n
2. 率的标准误的估计
在一般情况下,总体率 π 往往是未知的,此时可用样本率 P 来估计总体
标准差与标准误的比较
标 准 差
标 准 误
计量经济学第6章假设检验
i1
n
或直接取自输出结果2.2.1中的方差分析部分“回归分析(行) F(列)”(399.09999)。(见表2.4.4)
有时S(回归系数的标准差,有时也记为 S e )也可不写;t统计 量右上角*的表示显著性水平的大小,**一般表示在显著性水平 1%下显著,*一般表示在显著性水平5%下显著,无*表示5%下 不显著。
b1
L xx L yy
n
( x x ) ( y y ) 其 中 x y
i 1
L
n
L xx
L
yy
n
i 1
( xi x )2
i 1
( yi y )2
为x与y的简单线性相关系数,简称相关系数。它表示x和y的线 性相 关关系的密切程度。其取值范围为|r| 1,即-1 r 1。 当r=-1时,表示x与y之间完全负相关; 当r=1时,表示x与y之间完全正相关; 当r=0时,表示x与y之间无线性相关关系,即说明x与y可 能无相关关系或x与y之间存在非线性相关关系。 5、四种检验的关系 前面介绍了t检验、拟合优度( )检验、 F检验和相关 R 2 系数(r)检验,对于一元线性回归方程来说,可以证 明,这四种检验:
第二步:计算F统计量 因为ESS=1602708.6 (计算过程见表2.4.3) 或直接取自输出结果 2.2.1中的方差分析部分“回归分析(行) SS(列)”(1602708.6)。
ˆ= RSS ( yi y )2 40158.071 (计算过程见计算表2.3.3) 或直接取
第六章假设检验基础PPT课件
❖假设检验的原理: 假设检验的基本思想是反证法和小
概率的思想
❖反证法思想:首先提出假设(由于未经检验是否成立,
所以称为无效假设),用适当的统计方法确定假设
成立的可能性大小,如果可能性小,则认为假设不
成立,拒绝它;如果可能性大,还不能认为它不成立
❖小概率思想:是指小概率事件在一次随机试验中认为
基本上不会发生
一、一组样本资料的t 检验(one sample/group t-test)
现有取自正态总体N(μ,σ2)的、容量为n 的一份 完全随机样本。 目的:推断该样本所代表的未知总体均数µ与已知总体 均数µ0是否相等已知总体均数µ0是指标准值,理论值 或经大量观察所得的稳定值。
n136135
3. 确定P值
指从H0规定的总体中随机抽得等于及 大于(或等于及小于)现有样本获得
的检验统计量值的概率。
4. P值的意义:如果总体状况和H0一致,统计量获 得现有数值以及更不利于H0的数值的可能性(概率) 有多大。
5.
t0 .2 (3 5 ) 50 .68 t 2 t0 .2 (3 5 ) 5得 P 0 .25
H0一般设为某两个或多个总体参数 相等,即认为他们之间的差别是由 于抽样误差引起的。H1的假设和H0 的假设相互对立,即认为他们之间 存在着本质的差异。H1的内容反映 出检验的单双侧。
单双侧的确定: 一是根据专业知识,已知东北某县囱
门月龄闭合值不会低于一般值; 二是研究者只关心东北某县值是否高
于一般人群值,应当用单侧检验。 一般认为双侧检验较为稳妥,故较为
目的要求选用不同的检验方法。
4、确定P值: P值是指由H0所规定的总体中做随机抽
样,获得等于及大于(或等于及小于)现 有统计量的概率。当求得检验统计量的值 后,一般可通过特制的统计用表直接查出P 值。
应用统计学6-假设检验(1)
t 检验
(单边和双边)
χ2检验
(单边和双边)
名称 条件
H0
统计量及其分布
拒绝域 |u| >u1-α/2 u >u1-α u < - u1-α |t| >tα/2 t >tα t < -tα
2 χ 2 > χα / 2 ( n − 1)或
0 u 总体 µ ≤ µ0 2 检 方差σ 均 验 已知 µ ≥ µ 0 值 检 验 t 总体 µ = µ 0 µ ≤ µ0 2 检 方差σ 验 未知 µ ≥ µ 0
正确
α 错误和 β 错误的关系
当H0、H1给定,n固定时,无法同时使α和β变小 α和β的关系就像翘翘板,α小β就大, α大β就小
β α
使α、β 同时变小的办法就是增大样本容量。
“不能拒绝H0”
一般地说,哪一类错误所带来的后果越严重,危害越大, 在假设检验中就应当把哪一类错误作为Fra bibliotek要的控制目标。
通常β不易计算,所以通常我们 主要控制α,尽量减小β
µ ≥ µ0 µ < µ0
µ ≤ µ0 µ > µ0
双边检验
抽样分布
拒绝域 α/2
H0 :µ = µ0
H1 :µ ≠ µ0
置信水平 拒绝域 1-α α/2 接受域 H0值
临界值
临界值
左单边检验
抽样分布
拒绝域
H0 :µ ≥ µ0
H1 :µ < µ0
置信水平
α
1-α 接受域 H0值
临界值
右单边检验
由于α 事先确定,所以拒绝H0 是有说服力的, 而β通常未知,所以如果我们决定“接受H0 “,我们并不 确定这个决策的置信度,所以通常我们不采用“接受H0 “的说法,而是采用“不能拒绝H0 “的说法。
统计学中的假设检验
统计学中的假设检验统计学是一门研究如何收集、整理、分析和解释数据的学科。
在统计学中,假设检验是一种常用的方法,用于验证对于某一总体的某一假设是否成立。
假设检验在科学研究、商业决策以及社会调查等领域都有广泛的应用。
本文将介绍假设检验的基本概念、步骤和常见的统计方法。
一、假设检验的基本概念假设检验是基于样本数据对总体参数进行推断的一种方法。
在进行假设检验时,我们需要提出一个原假设(H0)和一个备择假设(H1),然后根据样本数据来判断是否拒绝原假设。
原假设通常是我们希望证伪的假设,而备择假设则是我们希望支持的假设。
二、假设检验的步骤假设检验一般包括以下步骤:1. 提出假设:根据研究问题和背景,提出原假设和备择假设。
2. 选择显著性水平:显著性水平(α)是我们在进行假设检验时所允许的犯第一类错误的概率。
通常情况下,显著性水平取0.05或0.01。
3. 收集样本数据:根据研究设计和样本容量要求,收集样本数据。
4. 计算统计量:根据样本数据计算出相应的统计量,如均值、标准差、相关系数等。
5. 判断拒绝域:根据显著性水平和统计量的分布,确定拒绝域。
拒绝域是指当统计量的取值落在该区域内时,我们拒绝原假设。
6. 做出决策:根据样本数据计算出的统计量与拒绝域的关系,判断是否拒绝原假设。
7. 得出结论:根据决策结果,得出对原假设的结论。
三、常见的统计方法在假设检验中,常见的统计方法包括:1. 单样本t检验:用于检验一个样本的均值是否等于某个给定值。
2. 双样本t检验:用于检验两个样本的均值是否相等。
3. 方差分析:用于检验两个或多个样本的均值是否有显著差异。
4. 相关分析:用于检验两个变量之间是否存在线性相关关系。
5. 卡方检验:用于检验观察频数与期望频数之间的差异是否显著。
四、假设检验的局限性假设检验作为一种统计方法,也存在一定的局限性。
首先,假设检验只能提供关于原假设的拒绝与否的结论,并不能确定备择假设的真实性。
统计学第六章假设检验
10
即 z 拒绝域,没有落入接受域,所以没有足够理由接受原假设H0, 同
时,说明该类型电子元件的使用寿命确实有了显著的提高。
第六章 假设检验
1. 正态总体均值的假设检验
(2) 总体方差 2 未知的情形
双侧举例:【例 6-6】某厂用生产线上自动包装的产品重量服从正态
分布,每包标准重量为1000克。现随机抽查9包,测得样本平均重量为
100个该类型的元件,测得平均寿命为102(小时), 给定显著水平α=0.05,
问,该类型的电子元件的使用寿命是否有明显的提高?
解:该检验的假设为右单侧检验 H0: u≤100, H1: u>100
已知 z z0.05 1.645
zˆ x u0 n 100 (102 100 ) 2 1.645
986克,样本标准差是24克。问在α=0.05的显著水平下,能否认为生产线
工作正常? 解:该检验的假设为双侧检验 H0: u=0.5, H1: u≠0.5
已知 t /2 (n 1) t0.025 (9 1) 2.306, 而 tˆ x u 986 1000 1.75 可见 tˆ 1.75 2.306
设H0, 同时,说明该包装机生产正常。
其中 P( Z 1.8) 1 P( Z 1.8) 1 0.9281 0.0719 0.05。
第六章 假设检验
单侧举例:【例 6-4】某电子产品的平均寿命达到5000小时才算合格,
现从一批产品中随机抽出12件进行试验,产品的寿命分别为
5059, 3897, 3631, 5050, 7474, 5077, 4545, 6279, 3532, 2773, 7419, 5116
的显著性水平=0.05,试测算该日生产的螺丝钉的方差是否正常?
卫生统计学课件_第六章_假设检验
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。
第6章 假设检验
2
2
n2 7.5 2 / 120 6.3 2 / 153 0.8533
u
X1 X 2 s X1X 2
139.9 143.7 0.8533
4.4353 u 0.05 2.58
P<0.01,差别有统计学意义,可认为该市1993年12岁男童平均身高比1973年高。
假设检验应注意的问题
t 检 验
样本均数与总体均数的比较
目的:推断该样本是否来自某已知总体; 样本均数代表的总体均数与0是否相等。
总体均数0一般为理论值、标准值或经大量观察所得并为人们接
受的公认值、习惯值。
解决思路:
区间估计
判断样本信息估计的总体均数之可信区间是否覆盖已知的 总体均数0 ?若不覆盖,则可推断该样本并非来自已知均 数的总体。
样本信息不支持H0,便拒绝之并接受H1,否则不拒绝H0 。
假设检验的基本步骤
建立假设 确定检验水准 计算检验统计量 计算概率P 结论
当P≤ 时,拒绝H0,接受H1,差别有统计学意义。
当P> 时,不拒绝H0,差别尚无统计学意义。
不论,拒绝拒绝H0,还是不拒绝H0都可能范错误。
同?
μ0 =132(g/L)
n=25
? =
μ
X 150 ( g / L) S 16.5( g / L)
已知总体
未知总体
目的:推断病人的平均血红蛋白(未知总体均
数)与正常女性的平均血红蛋白(已知总体均
数0)间有无差别
μ =μ0 ?
X 0 150 132 18
手头样本对应的未知总体均数 μ等于已知总体均数μ0,
统计学中的假设检验错误类型分析
统计学中的假设检验错误类型分析假设检验是统计学的重要理论之一,用于判断样本数据对某个总体假设的支持度。
在假设检验过程中,我们会遇到两种类型的错误,即第一类错误和第二类错误。
本文将对这两种错误类型进行分析,并探讨如何降低错误率。
1. 第一类错误第一类错误也被称为显著性水平(Significance Level)或α错误。
它指的是在原假设为真的情况下,拒绝原假设的错误判断。
在假设检验中,我们通常会设定一个显著性水平来进行决策,常见的显著性水平有0.05和0.01。
当结果的p值小于设定的显著性水平时,我们将拒绝原假设。
然而,这种判断并不是绝对准确的,存在一定概率犯下错误。
第一类错误的概率通常用α表示。
当我们将显著性水平设定为0.05时,即α=0.05,意味着有5%的可能犯下第一类错误。
如果显著性水平设定得较低,例如α=0.01,那么犯第一类错误的概率将更小,但同时也会增加犯第二类错误的概率。
2. 第二类错误第二类错误是在原假设为假的情况下,接受原假设的错误判断。
与第一类错误相反,第二类错误常用β表示。
第二类错误的概率与样本大小、效应大小和显著性水平等因素有关。
当样本大小较小时,相同效应大小下犯第二类错误的概率较高;当效应大小较小时,相同样本大小下犯第二类错误的概率也较高;而当显著性水平设定较低时,犯第二类错误的概率也会增加。
3. 降低错误率的方法在实际应用中,我们希望尽可能降低第一类错误和第二类错误的概率,提高假设检验的准确性。
以下是一些常用的方法:3.1 增加样本容量通过增加样本容量,可以降低第一类错误和第二类错误的概率。
较大的样本容量能够提供更充分的信息,减小抽样误差,提高判断结果的准确性。
在样本容量不足时,可能会导致犯下更多的错误。
3.2 提高显著性水平设定较低的显著性水平可以降低第一类错误的概率。
但需要注意的是,过低的显著性水平会增加犯第二类错误的概率,因此需要权衡选择适当的显著性水平。
3.3 增大效应大小提高研究中的效应大小可以降低第二类错误的概率。
大学统计学 第6章 假设检验与方差分析
35%
16
30%
14
12
25%
10
20%
8
`
15%
6
10%
4
2
5%
0
0%
50-60
70-80
90-100
统计学导论
第六章 假设检验与方差分析
第一节 假设检验的基本原理 第二节 总体均值的假设检验 第三节 总体比例的假设检验 第四节 单因子方差分析 第五节 双因子方差分析 第六节 Excel在假设检验与方差分析
记为 H1:。150
整理课件
6-7
三、检验统计量
所谓检验统计量,就是根据所抽取的样本计 算的用于检验原假设是否成立的随机变量。
检验统计量中应当含有所要检验的总体参数, 以便在“总体参数等于某数值”的假定下研 究样本统计量的观测结果。
检验统计量还应该在“H0成立”的前提下有 已知的分布,从而便于计算出现某种特定的 观测结果的概率。
为 =x 149.8克,样本标准差s=0.872克。问该
生产线的装袋净重的期望值是否为150克(即 问生产线是否处于控制状态)?
整理课件
6-4
所谓假设检验,就是事先对总体的参数 或总体分布形式做出一个假设,然后利用抽 取的样本信息来判断这个假设(原假设)是 否合理,即判断总体的真实情况与原假设是 否存在显著的系统性差异,所以假设检验又 被称为显著性检验。
量所得结果落入接受域的概率。
问题,对于 和 大小的选择有
不同的考虑。例如,在例 6-1 中,如果检验者站在卖方 的立场上,他较为关心的是不要犯第一类错误,即不 要发生产品本来合格却被错误地拒收这样的事情,这
时, 要较小。反之,如果检验者站在买者的立场上,
(卫生统计学)第六章 假设检验基础
药前后患儿血清中免疫球蛋白IgG(mg/dl)含量
编号 1 2 3 4 5 6 7 8 9 10 11 12
用药前 1206.4 921.69 1294.08 945.36 721.36 692.32 980.01 691.01 910.39 568.56 1105.52 757.43
用药后 1678.44 1293.36 1711.66 1416.70 1204.55 1147.30 1379.59 1091.46 1360.34 1091.83 1728.03 1398.86
目的
H0
H1
双侧检验 是否μ1≠μ2
μ1=μ2
μ1≠μ2
单侧检验 是否μ1>μ2
μ1=μ2
μ1>μ2
或是否μ1<μ2
μ1=μ2
μ1<μ2
返回
选定检验方法和计算检验统计量
要根据研究设计的类型和统计推断的目的选用不同的检验方法。如 成组设计的两样本均数的比较用t检验(小样本)或Z检验(大样本), 两样本方差的比较用F检验。
(卫生统计学)第六章 假设检验基础
第一节、假设检验的概念与原理 一、假设检验的思维逻辑
1.小概率原理 小概率事件在一次随机试验中几乎是不可能发生
2.假设检验处理问题的特点 ⑴从全局的范围,即从总体上对问题作出判断 ⑵不可能对总体的每个个体均作观察
二、假设检验步骤
例6-1 已知北方农村儿童前囟门闭合月龄为14.1月。某研究者从东北某县抽取36名 儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月 龄的均数是否大于一般儿童?
四、方差齐性检验 homogeneity of variance test
统计学基础与实务-ppt-第6章假设检验
总体均值的检验
(大样本)
STAT
1. 假定条件
– 正态总体或非正态总体大样本(n30)
2. 使用z检验统计量 2 已知:z x0 ~N(0,1) n
2 未知:z x0 ~N(0,1)
sn
6-50
总体均值的检验(大样本)
(决策规则)
STAT
1. 在双侧检验中,如果|z| z/2 ,则拒绝原 假设H0;反之,则不能
STAT
1. 研究者想收集证据予以反对的假设 2. 又称“0假设” 3. 总是有符号 , 或 4. 表示为 H0
– H0 : = 某一数值
– 指定为符号 =, 或
– 例如, H0 : 10cm
6-12
备择假设
(alternative hypothesis)
STAT
1. 研究者想收集证据予以支持的假设 2. 也称“研究假设” 3. 总是有符号 , 或 4. 表示为 H1
– 总体参数包括总体均值、 比率、方差等
– 分析之前必须陈述
6-6
什么是假设检验?
(hypothesis test)
STAT
1. 先对总体的参数(或分布形式)提出某种假 设,然后利用样本信息判断假设是否成 立的过程
2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率
原理
6-7
假设检验中的小概率原理
z 检验
z x 0 sn
z 检验
z x 0 n
t 检验
t x 0 sn
6-47
STAT
总体均值的检验
(大样本)
6-48
总体均值的检验
(提出假设)
统计学第六章 假设检验课后答案
第六章假设检验一、单项选择题二、多项选择题三、判断题四、填空题1、原假设(零假设)备择假设(对立假设)2、双侧检验Z Z =xn︱Z︱<︱︱(或1-α)23、左单侧检验Z <-(或α)4、右单侧检验Z Z =xnZ >(或α)5、t t =︱t︱>︱︱(或α)sx2n6、弃真错误(或第一类错误)存伪错误(或第二类错误)7、越大越小8、临界值五、简答题(略)六、计算题1、已知:σx = 12 n = 400 x= 21 建立假设H0:X≤20H1:X>20右单侧检验,当α= 0.05时,Z0.05 = 1.645 构造统计量ZxZ =1.667>Z0.05 = 1.645,所以拒绝原假设,说明总体平均数会超过20。
2、已知:P0 = 2% n = 500 p = 建立假设H0:P ≥ 2%H1:P <2%左单侧检验,当α= 0.05时,Z0.05 = -1.645 构造统计量Z-1.597∣Z∣=1.597<∣Z0.05∣= 1.645,所以接受原假设,说明该产品不合格率没有明显降低。
3、已知:σx = 2.5 cm n = 100 X0 =12 cm x= 11.3 cm 建立假设H0:X≥12H1:X<12左单侧检验,当α= 0.01时,Z0.01 = -2.33 构造统计量Zx-2.8 2.5 ∣Z∣= 2.8>∣Z0.01∣= 2.33,所以拒绝原假设,说明所伐木头违反规定。
4、已知:P0 = 40% n = 60 p = 建立假设H0:P ≥ 40%H1:P <40% 21= 35% 60左单侧检验,当α= 0.05时,Z0.05 = -1.645 构造统计量Z-0.791∣Z∣= 0.791<∣Z0.05∣= 1.645,所以接受原假设,说明学生的近视率没有明显降低。
5、已知:X0 =5600 kg/cm2 σx = 280 kg/cm2 n = 100 x= 5570 kg/cm2 建立假设H0:X= 5600 H1:X≠5600双侧检验,当α= 0.05时,∣Z0.025∣= 1.96 构造统计量Z∣Z∣∣Z∣=1.07<∣Z0.025∣= 1.96,所以接受原假设,说明这批车轴符合要求。
贾俊平统计学第6章假设检验
正态分布
01
正态分布是一种常见的概率分布 ,其概率密度函数呈钟形曲线, 具有对称性、连续性和可加性等 性质。
02
正态分布广泛存在于自然界和人 类社会中,许多随机变量都服从 或近似服从正态分布。
t分布
t分布是正态分布在自由度不同时的 另一种表现形式,其形状与正态分布 相似,但尾部概率不同。
在假设检验中,t分布在样本量较小或 总体标准差未知时常常被用来代替正 态分布进行统计分析。
界值,判断是否拒绝原假设。
双侧Z检验
总结词
双侧Z检验是用于检验一个总体均数是否与已知值存在显著差异的统计方法。
详细描述
双侧Z检验的步骤与单侧Z检验类似,但需要计算双尾Z值,并根据临界值判断是否拒绝原假设。例如,要检验某 产品的质量是否合格,可以提出原假设为产品质量合格,备择假设为产品质量不合格,然后通过计算Z值和临界 值,判断是否拒绝原假设。
03
样本统计量与抽样分布
样本均值和样本方差
样本均值
表示样本数据的平均水平,计算公式为 $bar{x} = frac{1}{n}sum_{i=1}^{n} x_i$,其中 $n$ 为样本容量, $x_i$ 为第 $i$ 个样本数据。
样本方差
表示样本数据的离散程度,计算公式为 $S^2 = frac{1}{n-1}sum_{i=1}^{n} (x_i - bar{x})^2$,其中 $S^2$ 为样本方差,$bar{x}$ 为样本均值。
假设检验的逻辑
小概率事件原理
如果一个事件在多次试验中发生的概 率很小,那么在一次试验中该事件就 不太可能发生。
反证法
先假设原假设成立,然后根据样本数 据和统计原理,推导出与已知事实或 概率相矛盾的结论,从而拒绝原假设 。
应用统计学第六章参数假设检验
•临界值
•样本统计量
右侧检验示意图 (显著性水平与拒绝域 )
•抽样分布
•置信水平
•1 - a •接受域
•拒绝域
•a
•H0值
•样本统计量 •临界值
•观察到 的样本 统计量
•4 给出拒绝域
•在确定显著性水平后,可以确定检验的拒绝域W. 如在上面例1中, 取α=0.05, 要使对任意的θ≥110 有
•P155
•临界值
•H0值
•观察
到的样
本统计
•临界值
•样本统计量
双侧检验示意图 (显著性水平与拒绝域 )
•抽样分布
•拒绝域 •a/2
•1 - a •接受域
•置信水平 •拒绝域 • a/2
•临界值
•H0值
•临界值 •样本统计量
•观察 到的样 本统计
双侧检验示意图 (显著性水平与拒绝域 )
•抽样分布
•拒绝域 •a/2
•假设检验的思想:
•1、有一个明确的命题或假设 H;
•2、当 H 成立时,考虑某一变量 X 的性质,在女 士品茶问题中,考虑 X 为该女士说对的杯数,注意 此时 X 的分布已知;
•3、以 x 表示 X 的观测值,考虑 P(X=x)=px,px 越 小,试验结果越不利于 H;
•4、根据规定的小概率事件,做出最后的决策。
•若该女士只说对了 3 杯,又会得到怎样的结论?
•参数假设检验举例
例1:根据1989年的统计资料,某地女性新生儿的平 均体重为3190克。为判断该地1990年的女性新生儿 体重与1989年相比有无显著差异,从该地1990年的 女性新生儿中随机抽取30人,测得其平均体重为 3210克。从样本数据看,1990年女新生儿体重比 1989年略高,但这种差异可能是由于抽样的随机性 带来的,也许这两年新生儿的体重并没有显著差异 。究竟是否存在显著差异?可以先假设这两年新生 儿的体重没有显著差异,然后利用样本信息检验这 个假设能否成立。这是一个关于总体均值的假设检 验问题。
统计学原理-假设检验
两独立样本均值之差的抽样分布
(1)正态总体,总体方差已知
两个正态总体
和
中分别独立地抽取容
量为n1和n2的样本,x1、x2分别为其样本均值, 则x1-x2也服从正态分布,那么
第六章 假设检验
Excel操作
l运用函数NORMSDIST计算Z检验的P值 l运用函数TDIST计算t检验的P值
37*/6
第六章
第三节 两总体参数的假设检验 假设检验 学习要点
l 1. 两独立样本均值的抽样分布 l 2. 两独立总体均值之差的假设检验
38*/6
1. 两独立样本均值的抽样分布
第六章 假设检验
9*/6
2. 假设检验的步骤
第六章 假设检验
例6-3
分析:以前的产品废品率在1%以上,改进生产工艺可以使产 品废品率下降是需要支持的命题,故,
予以否定的命题 予以支持的命题
10*/6
2. 假设检验的步骤
第六章 假设检验
(2)检验统计量
检验统计量需要满足以下两个条件
l一是检验统计量中必须含有要检验的总体参数 l二是检验统计量的概率分布必须是明确可知的
31*/6
1. 总体均值的假设检验
检验规则:
条件 原假设与备择假设 检验统计量及其分布
第六章 假设检验
拒绝域
小样本 (n<30)σ2已
知
小样本 (n<30)σ2未
知
32*/6
1. 总体均值的假设检验
第六章 假设检验
例6-9 小样本,总体方差未知
设立原假设和备择假设分别为:H0:μ=5600; H1:μ≠5600 检验统计量为:
标准化检验统计量
11*/6
2. 假设检验的步骤
第六章 假设检验
所以有 C0 = 6 × 1.65 + 250 = 因此犯第二类错误的概率是
259.9
X − 270 C0 − 270 β = P{ X ≤ C0 } = P{ } ≤ 6 6 259.9 − 270 = P{z ≤ = −1.68} = φ (−1.68) 6 = 1 − φ (1.68) = 0.0465
y
0.0044
2.61
x
从(1)的计算结果可以看出,在超市提出的假设成立的 )的计算结果可以看出, 情况下,随机抽取的200件产品中,有6件是次品的概率 件产品中, 情况下,随机抽取的 件产品中 件是次品的概率 为0.0044,显然这是一个小概率事件,认为在一次抽查中 ,显然这是一个小概率事件, 不应该发生,现在它发生了, 不应该发生,现在它发生了,我们怀疑超市提出的假设不 应该成立。也就是拒绝这批产品进入超市。 应该成立。也就是拒绝这批产品进入超市。 在这个例子中,超市提出了假设, 在这个例子中,超市提出了假设,通过抽样获得样本数
这两类错误之间的关系是:在样本容量一定时,犯第一类 这两类错误之间的关系是:在样本容量一定时, 错误概率较大时,犯第二类错误地概率较小;反之, 错误概率较大时,犯第二类错误地概率较小;反之,犯第 一类错误概率较小时,犯第二类错误概率较大。 一类错误概率较小时,犯第二类错误概率较大。要想两类 错误的概率都减小,只有增加样本容量。 错误的概率都减小,只有增加样本容量。 5、显著性水平 、 显著性水平:是指人们犯第一类错误概率的最大允许值。 显著性水平:是指人们犯第一类错误概率的最大允许值。 注意:显著性水平是人们根据自己所研究的问题来确定, 注意:显著性水平是人们根据自己所研究的问题来确定, 在经济学和其他社会科学中,常用选择的显著性水平是5% 在经济学和其他社会科学中,常用选择的显著性水平是 或者10%,在卫生和医药统计中,常用选择的显著性水平 或者 ,在卫生和医药统计中, 是1%。在我们经济学中,除非特别声明,一般都以 。在我们经济学中,除非特别声明,一般都以5% 作 为显著性水平。 为显著性水平。 6、临界值和拒绝域 、 拒绝域: 所围城的区域。 拒绝域:拒绝域就是由显著性水平 α 所围城的区域。 临界值:由给定的显著性水平确定的拒绝域的边界值, 临界值:由给定的显著性水平确定的拒绝域的边界值,称 为临界值。 分位点所对应的值。 为临界值。实际上临界值就是 α 分位点所对应的值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H0: 1500
H1: 1500
单侧检验
(原假设与备择假设的确定)
一项研究表明,改进生产工艺后,会使
产品的废品率降低到2%以下。检验这一 结论是否成立 • 研究者总是想证明自己的研究结论(废品率
降低)是正确的
• 备择假设的方向为“<”(废品率降低) • 建立的原假设与备择假设应为
3. 检验统计量的基本形式为
Z=
X 0
n
Hale Waihona Puke 6.1 假设检验的基本问题
规定显著性水平
(significant level)
什么显著性水平?
1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率
• 被称为抽样分布的拒绝域
3. 表示为 (alpha)
6.1 假设检验的基本问题
6.1.1基本思想
假设检验的基本思路是首先对总体参数值提出 假设,然后再利用样本告知的信息去验证先前提 出的假设是否成立。如果样本数据不能充分证明 和支持假设,则在一定的概率条件下,应拒绝该 假设;相反,如果样本数据不能够充分证明和支 持假设是不成立的,则不能推翻假设成立的合理 性和真实性。假设检验推断过程所依据的基本信 念是小概率原理,即发生概率很小的随机事件, 在某一次特定的实验中几乎不可能发生。
•
H1: <某一数值,或 某一数值
•
例如, H1: < 3910(克),或 3910(克)
6.1 假设检验的基本问题
确定适当的检验统计量
什么检验统计量?
1.用于假设检验决策的统计量 2.选择统计量的方法与参数估计相同,需考
虑 • 是大样本还是小样本 • 总体方差已知还是未知
将研究者想收集证据证明其不正确的假设作为 原假设H0 先确立备择假设H1
单侧检验
(原假设与备择假设的确定)
一项研究表明,采用新技术生产后,将
会使产品的使用寿命明显延长到 1500 小 时以上。检验这一结论是否成立 • 研究者总是想证明自己的研究结论(寿命延
长)是正确的
• 备择假设的方向为“>”(寿命延长) • 建立的原假设与备择假设应为
设,然后利用样本信息来判断原假设是 否成立 2. 有参数假设检验和非参数假设检验 3. 采用逻辑上的反证法,依据统计上的小 概率原理
6.1 假设检验的基本问题
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ...
... 因此我们拒 绝假设 = 50
... 如果这是总 体的真实均值 20
6.1 假设检验的基本问题
6.1.3假设检验的步骤
提出假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策
6.1 假设检验的基本问题
1. 2.
3. 4.
提出原假设和备择假设 什么是原假设?(null hypothesis) 0 待检验的假设,又称“0假设” 为什么叫 假设? 研究者想收集证据予以反对的假设 总是有等号 =, 或 表示为 H0
H0: 2%
H1: < 2%
单侧检验
(原假设与备择假设的确定)
某灯泡制造商声称,该企业所生产的灯泡
的平均使用寿命在 1000 小时以上。如果 你准备进一批货,怎样进行检验
检验权在销售商一方 作为销售商,你总是想收集证据证明生产商 的说法(寿命在1000小时以上)是不是正确的 • 备择假设的方向为“ <”( 寿命不足 1000 小 时) 建立的原假设与备择假设应为 H0: 1000 H1: < 1000
6.1 假设检验的基本问题
错误和 错误的关系
和的关系就像 翘翘板,小就 大, 大就小
你不能同时减 少两类错误!
6.1 假设检验的基本问题
影响 错误的因素
1. 总体参数的真值 • 随着假设的总体参数的减少而增大
2. 显著性水平
一个总体
均值
比例
方差
Z 检验
(单尾和双尾)
t 检验
(单尾和双尾)
Z 检验
(单尾和双尾)
2检验
(单尾和双尾)
6.2 一个总体参数的检验
6.2.1总体平均数的检验
是
总体 是否已知 ?
否
小 样本容量 n
用样本标 准差S代替
大
z 检验
z 检验
t 检验
Z=
X 0
n
Z=
6.1 假设检验的基本问题
6.1.4假设检验中的两类错误
1. 第一类错误(弃真错误) • 原假设为真时拒绝原假设 • 会产生一系列后果 • 第一类错误的概率为 • 被称为显著性水平 2. 第二类错误(取伪错误) • 原假设为假时接受原假设 • 第二类错误的概率为 (Beta)
单侧检验
(显著性水平与拒绝域)
抽样分布
拒绝域
置信水平
1-
临界值
H0值
样本统计量
左侧检验
(显著性水平与拒绝域)
抽样分布
拒绝域
置信水平
1-
临界值
H0值
样本统计量
观察到的样本统计量
左侧检验
(显著性水平与拒绝域)
抽样分布
6.1 假设检验的基本问题
什么是假设?
对总体参数的的数值
我认为该地区新生婴儿 的平均体重为3190克!
所作的一种陈述
• 总体参数包括总体均值、
比例、方差等
• 分析之前必需陈述
6.1 假设检验的基本问题
什么是假设检验?
1. 事先对总体参数或分布形式作出某种假
6.2 一个总体参数的检验
6.2.1总体平均数的检验
3.大样本,则用 或s皆可
x 0 Z= ~ N (1,0) / n
6.2 一个总体参数的检验 6.2.2 总体比率的检验:适用的数据类型
数 据
品质数据
数值型数据
离散数据
连续数据
6.2 一个总体参数的检验
拒绝域
置信水平
1-
临界值
H0值
样本统计量
右侧检验
(显著性水平与拒绝域)
抽样分布
置信水平 拒绝域 1-
H0值
观察到的样本统计量
临界值
样本统计量
右侧检验
(显著性水平与拒绝域)
抽样分布
置信水平 拒绝域
1-
H0值
临界值
样本统计量
• 当 减少时增大 3. 总体标准差 • 当 增大时增大 4. 样本容量 n • 当 n 减少时增大
6.2 一个总体参数的检验
6.2.1总体平均数的检验
6.2.2 总体比率的检验
6.2.3 总体方差的检验
6.2 一个总体参数的检验
6.2.2 总体比率的检验 • 有两类结果 • 总体服从二项分布 • 可用正态分布来近似 2. 比例检验的 Z 统计量
Z = p P0 p (1 p ) n
~ N (0,1)
6.2 一个总体参数的检验
假设检验在统计方法中的地位
统计方法
描述统计
推断统计
参数估计
假设检验
6.1 6.2 6.3 6.4 6.5
6.2 一个总体参数的检验
6.1.1基本思想
6.1.2基本类型
6.1.3基本步骤
6.1.4 两类错误
第6章
假设检验
学习目标
知识目标
1.理解假设检验的基本思想和基本步骤 2.理解假设检验的两类错误及其关系 3.熟练掌握总体平均数、总体成数和总体方差的 各种假设检验方法 4.利用P值进行假设检验 能力目标 掌握假设检验的步骤,能对实际问题作假设 检验;能够利用P值,置信区间进行假设检验; 能够应用Excel进行假设检验。
拒绝域 /2
置信水平
拒绝域 1- /2
临界值
H0值
临界值
样本统计量
双侧检验
(显著性水平与拒绝域)
抽样分布
拒绝域 /2 1-
置信水平 拒绝域
/2
临界值
H0值
临界值
样本统计量
双侧检验
(显著性水平与拒绝域)
抽样分布
拒绝域 /2 1-
置信水平 拒绝域 /2
• • •
H0: = 某一数值 指定为 = 号,即 或 例如, H0: = 3190(克)
6.1 假设检验的基本问题
提出原假设和备择假设
什么是备择假设?(alternative
hypothesis)
1.
2. 3.
与原假设对立的假设,也称“研究假设”
研究者想收集证据支持原假设总是有: , < 或 表示为 H1
X 0 S n
t=
X 0 S n
6.2 一个总体参数的检验
6.2.1总体平均数的检验
1.总体为正态,且方差已知
x 0 Z= ~ N (1,0) / n
2.总体为正态(小样本),总体方差未知
x 0 t= ~ t (n 1) s/ n
= 50 H0
样本均值
6.1 假设检验的基本问题
假设检验的过程
提出假设 作出决策
拒绝假设! 别无选择.
总体
我认为人口的平 均年龄是50岁