假设检验_百度文库.
假设检验
Z <Zα/2
所以接受原假设,即该医院病 所以接受原假设 即该医院病 人候诊的时间无显著变化.。 人候诊的时间无显著变化 。
0.025
1- α
接受区域
0.025(α/2) ( )
-1.96
若
Z > Zα
2
则否定H 则否定 0
或总体分布未知、 或总体分布未知、大样本
0.025 0.025(2/α) ( )
检验统计量: 检验统计量
-1.96
1- α
x − µ0 t= ~ n − 1) ( s 1.96( Z ) ( n
2/α
t > t α (n − 1)
2
则否定H 则否定 0
t ≤ t α (n − 1)
2
则接受H 则接受 0
0.025 -1.96 1.96( Z 2/α ) ( 0.025(2/α) ( )
属于:总体正态,已知方差, 属于:总体正态,已知方差,双侧检验 ( H0: µ= µ0 )
(一)总体正态,已知方差,双侧检验 ( H0: µ= µ0 ) 总体正态,已知方差, 解:该批瓷砖进货的抗断强度X ~N( µ , 1.12 ) 该批瓷砖进货的抗断强度 ( S1 作假设 H0: µ= µ0 = 32.50 作假设:
x H 0 : µ = 300;H1 : µ ≠ 300 总体分布正态 但σ2未知, x =297, 总体分布正态,但 未知, n=10 =
x − µ0 t= ~ t(n − 1) s n 0.025 x − µ 0 297 − 3001- α t= = = −2.35 s 4.028 -1.96 1.96( Z ( n 10
概率论与数理统计-假设检验
14
若
取伪的概率较大.
15
/2
0.12 0.1
0.08 0.06 0.04 0.02
/2 H0 真
60 62.5 65 67.5 70 72.5 75
0.12 0.1
0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
16
现增大样本容量,取n = 64, = 66,则
41
两个正态总体
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
42
(1) 关于均值差 1 – 2 的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布拒绝域 Nhomakorabea1 – 2 = 1 – 2
1 – 2 1 – 2 <
1 – 2 1 – 2 > ( 12,22 已知)
43
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
拒绝域
1 – 2 1 – 2 <
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
其中
44
(2)
关于方差比
2 1
/
2 2
的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
假设检验
预备知识(4)假设检验如果我们想要知道某一总体的参数是否等于某个值、与另一总体的相应参数有什么关系……等问题,需要“验证”这一想法时,我们就要进行假设检验。
假设检验解决问题假设检验的两个基本原理21小概率事件不可能发生反证法假设检验的基本概念计算步骤零假设和备择假设检验统计量拒绝域两类错误与显著性水平假设检验的步骤根据实际问题提出一对互斥假设命题:零假设(又称原假设)和备择假设;构造某个适当的检验统计量,并确定其在零假设成立时的分布;根据观测的样本计算检验统计量的值;规定显著性水平α ;确定决策规则:根据确定检验统计量的临界值并进而给出拒绝域,或者计算p 值等;下结论:根据决策规则得出拒绝或不能拒绝零假设的结论。
注意“不能拒绝零假设”不同于“接受零假设”。
124356零假设和备择假设零假设和备择假设是互斥的,它们中仅有一个正确;等号必须出现在零假设中;最常用的有三种情况:双侧检验、左侧检验和右侧检验。
检验以“假定零假设为真”开始,如果得到矛盾说明备择假设正确。
双侧检验左侧检验右侧检验H 0H 10μμ=0μμ≥0μμ≤0μμ≠0μμ>0μμ<产品自动生产线工作是否正常?零假设:生产线正常工作vs 备择假设:生产线没有正常工作某种新生产方法是否会降低产品成本?零假设:新方法没有降低成本vs 备择假设:新方法可以降低成本……实际中的零假设和备择假设123假设检验的检验统计量常见的统计量有之前提到过的样本均值、样本方差等。
为了计算的方便,实际检验时,我们常常要构造新的检验统计量以便找到它服从的分布。
12假设检验的拒绝域与显著性水平指能够拒绝零假设的所有检验统计量集合。
拒绝域的边界值称为临界值。
检验统计量落在拒绝域中的概率称为显著性水平,记作α。
实际计算中,通常先给出一个显著性水平,再反过来得出拒绝域。
123假设检验中的两类错误第一类错误(弃真错误)原假设为真时拒绝原假设第一类错误的概率为α (Alpha) 12第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为β(Beta)两类错误与假设情形决策实际情况H0为真H0为假接受H正确第二类错误(β)拒绝H第一类错误(α)正确α错误和β错误的关系αβ你不能同时减少两类错误!α和β的关系就像翘翘板,α小β就大,α大β就小α/2拒绝域拒绝域Zp 值是什么?1/2 p-值p 值也称为观测到的显著性水平,是能拒绝零假设的H 0的α最小值比如对于双侧的拒绝域来说,有:决策规则:p 值< α时拒绝H 0。
第七章 假设检验
第七章假设检验第一节假设检验的基本知识一、假设陈述1、原假设/虚无假设:用H表示,常常是根据已有资料得出的,稳定、保守的经验性看法,没有充分根据是不会被推翻的。
2、备选假设/研究假设:与原假设对立的假设,用H1表示,经过抽样调查后,获得证据希望予以支持的假设。
二、假设检验的基本原理——小概率原理小概率原理:一次观察中小概率事件被认为不可能发生;如果一次观察出现了小概率事件,合理的想法应该是否定原有事件具有小概率的说法。
小概率原理在假设检验中的运用:抽取一个样本并计算出检验统计量,如果在原假设成立的条件下这个统计量几乎不可能发生,则拒绝原假设而接受备选假设。
反之,如果计算出的统计量发生的可能性不太小,则接受原假设。
即在原假设下,检验统计量是小概率事件则拒绝原假设。
例1:某市场有100位摊贩,根据以往统计,其中非本地居民占10%,现随机抽取10人调查,发现5个都不是本地人,则原有统计结果是否成立?解:H:100人中10个是非本地人。
计算在原假设成立的情况下,抽取5人都是非本地人的概率:P= C105 C905/C10010<10-4可见,出现5名非本地人的结果概率极其小,但一次实验就出现了,所以怀疑原假设的真实性,拒绝原假设。
三、拒绝域与显著性水平1、显著性水平α,在原假设成立条件下,统计检验中规定的小概率的数量界限,常用的有α=0.10,0.05,0.01。
2、接受域和拒绝域根据原假设画出统计量的分布,以Z分布为例。
如果把拒绝原假设的小概率α事件定在分布的右侧尾部,则右侧面积代表的概率即显著性水平,Zα是临界值。
如果检验统计量值Z>Zα,则应拒绝原假设;如Z<Zα,则接受原假设。
以Zα为临界值,左边为接受域,右边为拒绝域。
也可把α定在左边或两边。
α1、双边检验如果拒绝域放在抽样分布的两侧,每侧拒绝域的概率分别为α/2,假设抽样本分布以0为对称,则P(|Z|>Z α/2)= α;双边检验的假设如下:H 0: μ=μ0H 1: μ≠-Z α/2 Z α/2如果检验统计量|Z|>Z α/2,则拒绝原假设,否则接受。
第八章 假设检验
x z2
x z2 /
s n
上例,我们用求置信区间的方法,来判断 原假设是否合理。 大样本下满足中心极限定理,样本均值的 抽样分布服从正态分布,从而有置信区间:
x z2 s 24 =986 1.96 n 40
假设检验的步骤
1.确定原假设和备选假设 2.选择检验统计量 3.指定检验的显著性水平 4.建立拒绝原假设的规则 5.收集样本数据,计算检验统计量的值 6.将检验统计量的值域拒绝规则的临界值比较, 以决定是否拒绝原假设。或者,由检验统计量 的值计算p值,利用p值确定是否拒绝原假设。
x 2.92 3 z 2.67 / n 0.18 / 6
x z ~ N (0,1) / n
根据显著性水平α=0.01,对应的拒绝域面积为 0.01,临界值为-2.33 Z<-2.33,所以拒绝H0,即可认为没听咖啡的容量 不足3磅。 统计证据支持对HILLTOP咖啡重量不足采取投诉措 施。
(978.56,993.44)该区间不包含u0=1000, 因此我们拒绝原假设H0.检验表明,该包 装机未能正常工作。
总体均值的检验:小样本情形
小样本下,已知总体为正态分布,我们考 虑以下两种情况: 1.总体方差已知 2.总体方差未知 在总体方差已知的情况下,即使样本容量 较小,但样本平均数的抽样分布总是以平 均值 为均值,以 x 为标准差的正态分 布。因此其检验过程和检验统计量同大样 本情形。
拒绝域为α/2 拒绝域为α/2
z / 2
拒绝域
0
z / 2
假设检验
本的取值,按一定原则进行检验,然后作出接受或拒绝所作假设
的决定. 参数假设检验:对总体分布中参数做假设。 分类: 分布假设检验:对总体分布做假设。
假设检验的过程
提出假设
我认为人口的平 均年龄是50岁
作出决策 拒绝假设
别无选择!
总体
抽取随机样本
均值 x = 20
一、引例
X 68 可以确定一个常数c 使得 P c 3.6 / 6
取 0.05,则
c z z0.025 1.96
2
X 68 1.96 由 3 .6 6
X 69.18或 X 66.824
即区间( ,66.824 )与( 69.18 , + )为检验的拒绝域
2 设 X 1 , , X n是取自正态总体 N , 的一个样本, 其中 , 2 都是未知参数。
具体步骤:
(1)先考虑假设检验问题
H 0 : 0
H1 : 0
(2)选择检验统计量,在此处,由于, 2 未知,所以用总
1 n ( X i X ) 2 来代替,则采用 体方差 2 的无偏估计 S n 1 i 1
这是小概率事件 ,一般在一次试验中是不会发生的, 现一 次试验竟然发生, 故认为原假设不成立, 即该批产品次品 率 p 0.04 , 则该批产品不能出厂.
1 P (1) C12 p1 (1 p)11 0.306 0.3 12
这不是小概率事件,没理由拒绝原假设,而接受原假设, 即该批产品可以出厂. 注1 直接算 1 / 12 0.083 0.04
0.01 0.05,0.1 ,
假设检验
U | X 0 | ~ N (0,1)
/ n
3° 在假设 H0成立的条件下,由样本判断 y 小概率事件是否发生。 y pU ( x )
P{| U | u / 2 }
2
2
当 0很小时 ,
uα / 2
O uα / 2
x
{| U | u / 2 }是个小概率事件 (如上图) .
第一节
假设检验的 基本概念
一、假设检验的基本原理 二、假设检验的基本概念 三、两类错误
回
四、假设检验的一般步骤
停 下
实验设计 数理统计 统计推断
参数估计 假设检验 (回归分析)
统计推断: 研究如何加工、处理数据,从而 对所考察对象的性质做出尽可能精确和可靠的 推断.
很难发生. 但“很难发生”不等于“不发生”, 因而 假设检验所作出的结论有可能是错误的. 这种错误 有两类: (1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 错误, 这类错误是“以真为假”. 犯第Ⅰ类错误的概 率就是显著性水平 .
= P { 拒绝原假设H0 | H0为真 }
H0称为原假设或零假设, H1称为备择假设.
4. 拒绝域与临界点样本值x=(x1, x2, · · · , xn)所组成的集合. W1 = { x x 且使H0不成立}
W1 W1 : 拒绝原假设H0的检验统计量的取值范围.
W1 x x , U U
根据小概率原理, 如果H 0为真,则 | x 0 | 不应太大,则由一次试验得到
满足不等式
| u |
| x 0 |
/ n
第四章 4.2假设检验
根据z值 根据 值(或t值)进行左侧检验 值
拒绝域
统计量的观测 值等于-2.64 值等于 α
H0 H1 µ ≥ µ0 µ<µ0
1-α 接受域
-t α 0 −t0.10(39) = −1.30
Z, t
决策规则: 时拒绝零假设, 决策规则:t obs<-t α时拒绝零假设, 否则不能拒绝零假设
决策规则
(二)假设检验的分类
参数假设检验 若进行假设检验时总体的分布形式已知, 若进行假设检验时总体的分布形式已知,需 要对总体的未知参数进行假设检验, 要对总体的未知参数进行假设检验,称其为 参数假设检验 非参数假设检验 若对总体分布形式所知甚少, 若对总体分布形式所知甚少,需要对未知分 布函数的形式及其他特征进行假设检验, 布函数的形式及其他特征进行假设检验,通 常称之为非参数假设检验。 常称之为非参数假设检验。
一、
假设检验的基本问题
(一)什么是假设检验 (二)假设检验的分类 (三)假设检验的有关原理 (四)两类错误与显著性水平 (五)假设检验的步骤 假设检验的P值 (六)假设检验的 值
(一)什么是假设检验
从对总体参数所做的一个假设开始, 从对总体参数所做的一个假设开始,然 一个假设开始 后搜集样本数据,计算出样本统计量, 样本数据 后搜集样本数据,计算出样本统计量, 进而运用这些数据测定假设的总体参数 测定假设的 进而运用这些数据测定假设的总体参数 在多大程度上是可靠的,并做出承认还 在多大程度上是可靠的, 是拒绝该假设的判断 判断。 是拒绝该假设的判断。
例如, 有一个厂商声称, 他的产品的合 例如 , 有一个厂商声称 , 格品率很高,可以达到99 99% 格品率很高,可以达到99%,那么从一批 产品(譬如100 100件 中随机抽取一件, 产品(譬如100件)中随机抽取一件,这 一件恰恰相反好是次品的概率就非常小, 一件恰恰相反好是次品的概率就非常小 , 只有1 如果厂商的宣传是真的, 只有 1% 。 如果厂商的宣传是真的 , 随机 抽取一件是次品的情况就几乎是不可能 发生的。 但如果这种情况确实发生了, 发生的 。 但如果这种情况确实发生了 , 就有理由怀疑原来的假设, 就有理由怀疑原来的假设 , 即产品中只 的次品的假设是否成立, 有 1% 的次品的假设是否成立 , 这时就有 理由推翻原来的假设, 理由推翻原来的假设 , 可以做出厂商的 宣传是假的这样一个推断。 宣传是假的这样一个推断。
假设检验
产品检验: ■全数检验 ■抽样检验
能最真实、完整的反映所有产品的特性结果 GB/T2828.1-2003 存在抽样误差
总体与样本
判断
总体
随机抽取
样本
测量
数据
根据样本的信息推断总体
2. 假设检验的基本原理:小概率反证法 小概率原理:指小概率事件(通常概率 α≤0.05称为“小概率事件)在一次试 验中基本不会发生,反证法思想是先提 出某项假设(H0 ),用统计方法确定假 设的可能性(即检验假设是否正确): 可能性小,即假设不成立,应拒绝原假 设;如果可能性大,则接受假设,则假 设成立。
⑹根据显著性水平α 及统计量、样本自由 度查概率分布表。获取在此显著性水平α 下的置信区间,即临界值。 双侧检验:根据α/2或(1-α/2)确定临界值 单侧检验:根据α或(1 -α) 确定临界值
⑺做出判断:将计算出的统计量与查表得 出的临界值进行比较,作出拒绝或接受H0 的判断。
五、应用实例
1.单个正态总体的均值检验——t 检验
s12 0.0955 F 2 3.66 s2 0.0261 计算统计量:
n1=8,则样本的自由度 1 n1 1 7 n2=9,则样本的自由度 2 n2 1 8 α =0.05,查F检验临界值(F2)表,P(F >F2)= α 得到:F0.05(7、8)= 3.50 F在拒绝域内 结论:原假设H0不成立,即甲机床的精度比乙机床低。
因此,可用计算确定均值µ及1—α 置信区间的 方法来检验上述假设是否成立。 如果计算出来的置信区间包括µ 0 ,则接受H0 ; 如果计算出来的置信区间不包括µ 0 ,则拒绝H0
三、假设检验类型
• 参数假设:总体分布类型已知,对未知参数 的统计假设。检验参数假设问题称为参数假 设检验。当总体分布类型为正态分布时,则 为正态总体参数检验。 • 非参数假设:总体分布类型不明确,对参数 的各种统计假设。检验非参数假设问题称为 非参数假设检验,也称分布检验。参数假设 检验和非正态总体参数检验都比较复杂,在 QC小组活动中很少应用。
假设检验
第十章假设检验第一节假设检验的基本问题一、假设与假设检验1.假设检验的意义从样本的差异推论总体差异的过程,就是假设检验。
一个研究的概括程度越高,可推论的范围就越大。
2.虚无假设H0在推论研究假设之前所提出来的与研究假设相反的假设,这一假设是不存在的,故称之为虚无假设。
一般虚无假设都假设两个总体之间没有差异。
3.研究假设H1研究中所要证明的假设,称为科学假设、对立假设。
一般为假设两个总体参数之间有差异。
二、检验中的两类错误1、α错误:(1)概念:又称为显著性水平,I型错误,是指在否定虚无假设、接受对立假设时所犯的错误,即是将属于没有差异的总体推论为有差异的总体时,所犯的错误。
(2)α错误的确定原则:α错误的概率一般根据统计学原则,规定为5%-1%。
2.β错误:β错误是指在接受H0 为真时所犯的错误,在接受H0 为真,而拒绝H1时,势比有一部分属于H1总体的部分样本,被视为H0 的部分,而被否定在H1之外。
(3)α错误和β错误的关系:α错误和β错误是在两个前提下的概率。
两个总体的关系若是确定的,则α增大,β减小;α减小,β增大;二者相反。
三、单侧检验和双侧检验1、单测检验(1)概念:查统计表时,按分布的一侧计算显著性水平概率的检验,称作单侧检验。
(2)应用条件:凡是检验大于、小于、高于、低于、优于、劣于等有确定性大小关系的假设检验问题。
这类问题的确定是有一定的理论依据的。
假设检验写作H1:μ1<μ2 或μ1>μ2。
2.双侧检验(1)概念:查统计表时,按分布的两端计算显著性水平概率的检验,称作双侧检验。
(2)应用条件:凡是理论上不能确定两个总体一个一定比另一个大或小的假设检验。
一般写作H1:μ1≠μ2。
第二节平均数差异显著性检验一、平均数显著性检验(一)概念:是指研究样本的总体与已知总体μ0差异是否显著的假设检验。
(二)原理:总体分布正态分布或接近正态分布的样本平均数的分布为正态分布或t分布,按分布率进行推论。
假设检验
第一节 假设检验的基本原理 第二节 单个正态总体的假设检验 第三节 两个正态总体的假设检验
第一节:假设检验的基本原理
一、基本概念 假设检验是统计推断的另一种重要形式,
其任务是通过样本对未知的总体分布特征作 出合理的推测。
先对总体分布中的某些参数或对总体分布类 型做某种假设,然后根据样本值做出接受还 是拒绝所做假设的结论。
例如 若H0 : m = m0, 则H1 有以下三种情况: (1) H0 : m = m0, H1: m m0 (2) H0 : m = m0, H1 : m > m0 (3) H0 : m = m 0, H1 : m < m0
其中(1)称为双边检验.
其中(2), (3)称为单边检验.
第二步:选取一个合适的检验统计量,并根据原假设 H0和备择假设 H1 确定H0的拒绝域.
0.05 6
因为4.9>1.96 ,即观测值落在拒绝域内
所以拒绝原假设。
二 当2未知时, 均值m的检验(t检验)
1 (双边检验) H0: m = m0 H1: m m0
此时2未知, 不能用
U
X
m0
n
用
T
X
m0
S
n
当H0成立时,
T
X m0
S
~ t(n 1)
n
因此, 对给定的, 查t分布表, 使
X
m0
~ N(0, 1)
n
当H0 成立时, u的值不应太大.
而当H1 成立时, u的值往往偏大.
因此, P{uu}=
于是得到H0的拒绝域为 (u, )
类似地, 若检验的假设是
假设检验
四 假设检验一 基本内容1.假设检验对总体分布或分布中的某些参数作出假设,然后利用样本的观测值所提供的信息,检验这种假设是否成立,这一统计推断过程,称为假设检验。
(1) 待检验假设或零假设记为0H ,正在被检验的与0H 相对立的假设1H 称为备选假设或对立假设。
(2) 假设检验的依据——小概率原理:小概率事件在一次试验中实际上不会发生。
(3) 假设检验的思路是概率性质的反证法。
即首先假设成立,然后根据一次抽样所得的样本值得信息,若导致小概率事件发生,则拒绝原假设,否则接受原假设。
(4) 假设检验可能犯的两类错误:① 第一类错误(弃真错误):即假设0H 为真而被拒绝,记为α,即00{|}P H H α=拒绝为真。
② 第二类错误(存伪错误):假设0H 不真而被接受,记为β,即00{|}P H H β=接受不真。
③ 当样本容量n 一定时,,αβ不可能同时减少,在实际工作中总是控制α适当的小。
2.假设检验的程序对任何实际问题进行假设检验,其程序一般为五步,即: ⑴ 根据题意提出零假设0H (或相应备选假设1H )。
⑵构造样本统计量并确定其分布;⑶给定显著性水平α,查表确定临界值,从而得出接受域和拒绝域; ⑷由样本观测值计算出统计量的值;⑸作出判断:若统计量的值落入拒绝域则拒绝0H ,若统计量的值落入接受域则接受0H 。
3.假设检验的主要方法Z 检验法、t 检验法、2λ检验法、F 检验法。
4.关于一个正态总体的假设检验⑴2200(,),H X N μδδμμ 已知,检验假设:=Z 检验法:①001000H H μμμμμμμμ≠><:= (:或或)②统计量0(0,1)()Z N H -=成立时。
③给出1122{}P Z ZZαααα--<=,,查正表定④ 由样本值12n x x x (,,,) 计算Z 的值 ⑤ 判断:若1122Z ZZαα--∈∞∈∞0(-,-)或Z (-,+),则拒绝H(这是对双侧检验提出的Z 检验法步骤,若是单侧可仿比) (2)2200(,),H X N μδδμμ 未知,检验假设:=t 检验法:①001000H H μμμμμμμμ≠><:= (:或或)②0(1)()t t n H -=- 成立时。
假设检验
2
2 0
2 0
H0:
,H1:
.
其中
为已知常数.检验统计量
T
1
2 0
n
(Xi )2
i 1
~ 2 (n) .
对于给定的显著性水平 ,拒绝域为
t 12 / 2 (n) 或
t
2
/
2
(n)
.
上述检验的统计量服从 2 分布,称此种检
验为 2 检验,类似地可以进行单边检验(见表
一、方差已知时,两个正态总体均值差的假设检验—u 检验
设
2 1
,
2 2
为已知,要检验的假设为
也可以写成
H0:1 2 ,H1:1 2 ,
H0:1 2 0 ,H1:1 2 0 .
检验统计量为
u X Y ~ N (0, 1) .
2 1
2 2
mn
对于给定的显著性水平 , 查表得 u / 2, 使得
t 12 / 2 (n 1) 或 t 2 / 2 (n 1) .
这里
2 1
/
2
(n
1)
2 0.95
(4)
0.711
,
2 /2
(n
1)
2 0.05
(4)
9.488
,
x =1.414,s 2 =0.00778,
t
(5
1) 0.00778 0.0482
例2 某车间加工一种零件,要求长度为150mm, 今从一批加工后的这种零件中抽取 9 个,测得长度如 下:
假设检验
σ 22
n2
例:已知同年龄组男生50米跑成绩服从正态分 布。根据以往的资料得知A、B两校男生50 米跑成绩的标准差分别为0.4秒和0.2秒。今 从两校中分别抽测了25名和28名男生,其 50米跑平均成绩分别为8.1秒和7.9秒。问两 校男生50米跑水平是否相同?
练习: 练习 已知甲地某 年龄组男生身 高的 标准差为
西班牙队的比赛中发动93次进攻,成功率为53.8﹪。
是否可以认为该场比赛的进攻成功率高于以往?
练习:某排球队根据近期大量资料统计出比赛扣 球成功率为30%。该队今年参加排球联赛 6场,共扣球326次,成功112次,问今年 扣球成功率是否比以前有提高?
二、两样本率的差异显著性检验(π1=π2) 两样本率的差异显著性检验(
一、样本率与总体率差异显著性检验( P =π) 样本率与总体率差异显著性检验( ) 已知总体率为πo ,样本率为 P。要检验样本率P 所 属总体率π与已知总体率πo是否相同,当 n>30,且 n P>5,统计量为u =p −π π o (1 − π o ) n
例:中国男篮进攻成功率为46.3﹪,第12届世锦赛与
未知, (三)两总体为正态分布,σ1 、σ2 未知,且为小样本的假设检验 两总体为正态分布
当两总体服从正态分布, σ1 、σ2未知,但σ12 = σ22 (方差齐性,即方差间差异不具显著性),n1、 n2均小于 30,则统计量为
t= x1 − x2 (n1 − 1) S1 + (n2 − 1) S 2 1 1 ( + ) n1 + n2 − 2 n1 n2
例: 已知某县14岁女生50米跑成绩服从正态分布, 且 µ o = 8 .8 s。现从某中学随机抽取29名同龄女生 测验50米跑,其成绩 , = 8.5s x
第六章 假设检验
所以有 C0 = 6 × 1.65 + 250 = 因此犯第二类错误的概率是
259.9
X − 270 C0 − 270 β = P{ X ≤ C0 } = P{ } ≤ 6 6 259.9 − 270 = P{z ≤ = −1.68} = φ (−1.68) 6 = 1 − φ (1.68) = 0.0465
y
0.0044
2.61
x
从(1)的计算结果可以看出,在超市提出的假设成立的 )的计算结果可以看出, 情况下,随机抽取的200件产品中,有6件是次品的概率 件产品中, 情况下,随机抽取的 件产品中 件是次品的概率 为0.0044,显然这是一个小概率事件,认为在一次抽查中 ,显然这是一个小概率事件, 不应该发生,现在它发生了, 不应该发生,现在它发生了,我们怀疑超市提出的假设不 应该成立。也就是拒绝这批产品进入超市。 应该成立。也就是拒绝这批产品进入超市。 在这个例子中,超市提出了假设, 在这个例子中,超市提出了假设,通过抽样获得样本数
这两类错误之间的关系是:在样本容量一定时,犯第一类 这两类错误之间的关系是:在样本容量一定时, 错误概率较大时,犯第二类错误地概率较小;反之, 错误概率较大时,犯第二类错误地概率较小;反之,犯第 一类错误概率较小时,犯第二类错误概率较大。 一类错误概率较小时,犯第二类错误概率较大。要想两类 错误的概率都减小,只有增加样本容量。 错误的概率都减小,只有增加样本容量。 5、显著性水平 、 显著性水平:是指人们犯第一类错误概率的最大允许值。 显著性水平:是指人们犯第一类错误概率的最大允许值。 注意:显著性水平是人们根据自己所研究的问题来确定, 注意:显著性水平是人们根据自己所研究的问题来确定, 在经济学和其他社会科学中,常用选择的显著性水平是5% 在经济学和其他社会科学中,常用选择的显著性水平是 或者10%,在卫生和医药统计中,常用选择的显著性水平 或者 ,在卫生和医药统计中, 是1%。在我们经济学中,除非特别声明,一般都以 。在我们经济学中,除非特别声明,一般都以5% 作 为显著性水平。 为显著性水平。 6、临界值和拒绝域 、 拒绝域: 所围城的区域。 拒绝域:拒绝域就是由显著性水平 α 所围城的区域。 临界值:由给定的显著性水平确定的拒绝域的边界值, 临界值:由给定的显著性水平确定的拒绝域的边界值,称 为临界值。 分位点所对应的值。 为临界值。实际上临界值就是 α 分位点所对应的值。
假设检验
一.基本概念:(1)对总体参数的数值所作的陈述,称为统计假设。
(2)对总体参数的数值提出某种假设,然后利用样本所提供的信息检验假设是否成立的过程,称为假设检验。
(3)通常将研究者想收集证据予以支持的假设称为备(选)择假设,记作Hα或H1。
(4)通常将研究者想收集证据予以反对的假设称为原假设,或零假设,用H0表示。
(5)能够作出拒绝原假设这一结论的所有可能样本取值范围,称为拒绝域。
(6)根据样本数据计算出来的,并据以对原假设和备择假设作出决策的某种统计量,称为检验统计量。
(7)当原假设为真时拒绝原假设,称所犯错误为第一类错误,犯第一类错误的概率通常记为α。
(8)当原假设为假时没有拒绝原假设,称为所犯错误为第二类错误,犯第二类错误的概率通常记为β。
(9)假设检验中犯第一类错误的概率,称为显著性水平,通常用α表示。
二.确定检验类型:观察备择假设的符号:如果是“<”就是左侧检验(原假设的拒绝域在左边);如果是“>”就是右侧检验(原假设的拒绝域在右边);如果是“≠”就是双侧检验(原假设的拒绝域在两侧)。
三.常见数值:1. α=0.1(置信水平是90%)(1)左侧检验:Z=-1.28(2)右侧检验:Z=1.28(3)双侧检验(区间估计):Z=+1.645 Z=-1.6452. α=0.05(置信水平是95%)(1)左侧检验:Z=-1.645(2)右侧检验:Z=1.645(3)双侧检验(区间估计):Z=+1.96 Z=-1.963. α=0.01(置信水平是99%)(1)左侧检验:Z=-2.33(2)右侧检验:Z=2.33(3)双侧检验(区间估计):Z=+2.58 Z=-2.58四.计算时采用的分布:(1)均值检验:阅读题目,看看是大样本还是小样本(30)。
如果是大样本,就用标准正态分布分位数表;如果是小样本,再看总体方差是否已知,如果知道,仍然用标准正态分布分位数表;如果是小样本,而且总体方差还不知道,就用t分布临界值表。
第五章-假设检验
H0: 1500 H1: 1500
1-29
第二十九页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,改进生产工艺后,会使 产品的废品率降低到2%以下。检验这 一结论是否成立
研究者总是想证明自己的研究结论(废品率 降低)是正确的
H0: 355 H1: 355
1-28
第二十八页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,采用新技术生产后,将 会使产品的使用寿命明显延长到1500小 时以上。检验这一结论是否成立
研究者总是想证明自己的研究结论(寿命延 长)是正确的
备择假设的方向为“>”(寿命延长)
假设其中真有99个白球,摸 出红球的概率只有 1/100 ,
这是小概率事件。
➢小概率事件在一次试验中竟然发生了,不能不 使人怀疑所作假设的正确性,因此可以认为这 个盒子应该不是装有99个白球的那个盒子。
这个例子中所使用的推理方法,称为“带概率性
质的反证法”,或“概率反证法”。
2022/8/9
1-11
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-26
第二十六页,编辑于星期五:十八点 三十四分。
双侧检验 (显著性水平与拒绝域)
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-27
第二十七页,编辑于星期五:十八点 三十四分。
单侧检验
第五章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 非参数检验
第8章 假设检验
关于建立假设的几点认识:
❖ 1.原假设和备择假设是一个完备事件组,且相互对 立,即必有一个成立,而且只有一个成立。
❖ 2.在假设检验中,通常将符号≤ ≥ =放在原假设上。 ❖ 3. 不同的研究者出于不同的研究目的或角度,可能
根据计算的检验统计 量与临界值进行比较, 得出拒绝或不拒绝原 假设的结论
检验统计量与拒绝域
拒绝原假设的检验统计量的所有可能取 值的集合,称为拒绝域。
若 绝对值Z临界值,拒绝原假设
拒绝域的大小与我们事先选定的显著性 水平有关。
根据选定的显著性水平确定的拒绝域的 边界值,称为临界值。
选定的显著性水平后,查阅书后的附表 就可以得到具体的临界值,将检验统计 量与之比较,就可以作出拒绝或接受原 假设的决策。
H0 H1
研究的问题 双侧检验 左侧检验 右侧检验
= 0
8.1.4 用P 值进行假设检验
❖ P 值是一个概率值(194页) 左侧检验时,P值为曲线左边小于等于检
验统计量部分的面积
右侧检验时,P值为曲线右边大于等于检
验统计量部分的面积
双侧检验时P值为曲线两边大于等于或小于 等于检验统计量部分的面积检验统计量部
什么是原假设?
1. 待检验的假设,又称“0假设”
为什么叫0 假设?
2. 研究者想收集证据予以反对的假设
3. 总是有等号 , 或
4. 表示为 H0 例如, H0: 3190(克)
什么是备择假设?
1. 与原假设对立的假设,也称“研究假设”
2. 研究者想收集证据予以支持的假设,总 是有不等号: , 或