《应用统计学》第8章:两个总体的假设检验
概率论与数理统计第8章(公共数学版)
P (弃真)
P(拒 绝H0
|
H
为
0
真)
P(
A
|
H
为
0
真)
小概率事件发生的概率就是犯弃真错误的概率
越大,犯第一类错误的概率越大, 即越显著. 故在检验中,也称为显著性水平
20
2.第二类错误:纳伪错误
如
果
原
假
设H
是
0
不
正
确
的, 但
却
错
误
地
接
受
了Hቤተ መጻሕፍቲ ባይዱ
0
此时我们便犯了“纳伪”错误,也称为第二类错误
统计量观测值 u 57.9 53.6 2.27 6 10
该批产品次品率 p 0.04 , 则该批产品不能出厂.
11
若从一万件产品中任意抽查12件发现1件次品
p 0.04 代入
取 0.01,则 P12(1) C112 p1(1 p)11 0.306 0.01
这不是小概率事件,没理由拒绝原假设,从而接受 原假设, 即该批产品可以出厂.
13
例2 某厂生产的螺钉,按标准强度为68/mm2, 而实际
称其中的一个为原假设,也称零假设或基本假设 记 为H0 称另一个为备择假设,也称备选假设或对立假设 记为H1 一般将含有等号的假设称为原假设
7
二、假设检验的基本原理
假设检验的理论依据是“小概率原理” 小概率原理:如果一个事件发生的概率很小,那么在一 次实验中,这个事件几乎不会发生. 如: 事件“掷100枚均匀硬币全出现正面”
(三)对给定(或选定)的显著性水平 ,由统计
量的分布查表确定出临界值,进而得到H0的拒绝域 和接受域.
贾俊平《统计学》章节题库(假设检验)详解【圣才出品】
3 / 58
圣才电子书 十万种考研考证电子书、题库视频学习平台
【解析】通常把观察现象原来固有的性质戒没有充分证据丌能轻易否定的命题设为原假 设;通常把该观察现象新的性质戒丌能轻易肯定的结论设为备择假设。题中,实际统计的日 销售量为 99.32 吨,即无法轻易肯定广告可使每天的销售量达到 100 吨,则原假设和备择
8.超人电池制造商宣称他所制造的电池可使用超过 330 小时,为检验这一说法是否属 实,研究人员从中抽叏了 12 个电池迚行测试,建立的原假设和备择假设为 H0:μ≤330, H1:μ>330。检验结果是没有拒绝原假设,这表明( )。[浙江工商大学 2011 研;安 徽财经大学 2012 研]
A.有充分证据证明电池的使用导命小亍 330 小时 B.电池的使用导命小亍等亍 330 小时 C.没有充分证据表明电池的使用导命超过 330 小时
假设应该为: H0 : μ 100 , H1 : μ 100
7.在假设检验中,两个总体 X~N(μ1,σ12),Y~N(μ2,σ22),其中 μ1,μ2 未知, 检验 σ21 是否等亍 σ22 应用( )。[浙江工商大学 2011 研]
A.μ 检验法 B.t 检验法 C.F 检验法 D.χ2 检验法 【答案】C 【解析】在两个正态总体条件下,样本方差除以总体方差乊比服从 F 分布,所以检验两 个总体方差是否相等,应用 F 检验法。
A.B 公叵交货日期比 A 公叵短 B.B 公叵交货日期比 A 公叵长 C.B 公叵交货日期丌比 A 公叵短 D.B 公叵交货日期丌比 A 公叵长 【答案】C 【解析】通常把研究者要证明的结论作为备择假设。由亍海山集团倾向亍向 B 公叵订 货,故备择假设应为 B 公叵交货日期比 A 公叵短;而原假设不备择假设互斥,故原假设为 B 公叵交货日期丌比 A 公叵短。
第8章假设检验测试答案
第八章假设检验1。
A 2。
A 3。
B 4。
D 5。
C 6. A1。
某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1.40。
某天测得25根纤维的纤度的均值,检验与原来设计的标准均值相比是否有所变化,要求的显著性水平为,则下列正确的假设形式是().A. :μ=1.40,:μ≠1。
40 B. : μ≤1.40,:μ>1.40 C. :μ<1。
40,:μ≥1。
40 D. :μ≥1。
40,:μ<1.40 2。
某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为()。
A。
:π≤0。
2,:π>0。
2 B。
:π=0。
2,:π≠0.2 C. :π≥0.3,:π<0。
3 D. :π≥0.3,:π<0。
33.一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。
随机抽取40位参加该项计划的样本,结果显示:样本的体重平均减少7磅,标准差为3.2磅,则其原假设和备择假设是()。
A。
:μ≤8,: μ>8B. :μ≥8,:μ<8C. :μ≤7,:μ>7D。
:μ≥7,:μ<74。
在假设检验中,不拒绝原假设意味着( )。
A。
原假设肯定是正确的B。
原假设肯定是错误的C。
没有证据证明原假设是正确的D。
没有证据证明原假设是错误的5。
在假设检验中,原假设和备择假设()。
A. 都有可能成立B. 都有可能不成立C. 只有一个成立而且必有一个成立D. 原假设一定成立,备择假设不一定成立6.在假设检验中,第一类错误是指( )。
A。
当原假设正确时拒绝原假设B. 当原假设错误时拒绝原假设C. 当备择假设正确时拒绝备择假设D。
当备择假设不正确时未拒绝备择假设7. B 8. C 9. B 10。
A 11。
D 12。
C7.在假设检验中,第二类错误是指()。
A。
当原假设正确时拒绝原假设B. 当原假设错误时未拒绝原假设C。
当备择假设正确时未拒绝备择假设D. 当备择假设不正确时拒绝备择假设8。
统计学假设检验
双侧检验的P 值
a/ 2 拒绝
1/2 P 值
a/ 2 拒绝
1/2 P 值
临界值
计算出的样本统计量
Hபைடு நூலகம்值
临界值
Z
计算出的样本统计量
左侧检验的P 值
抽样分布
拒绝域
a
P值
临界值 计算出的样本统计量
1-a H0值
置信水平 样本统计量
右侧检验的P 值
抽样分布
置信水平
拒绝域
1-a H0值
a
P值
临界值 计算出的样本统计量
现从该机器装完的产品中随机 -1.3 0.7 1 -0.5 0
抽取25瓶,分别进行测定(用 -0.6 0.7 -1.5 -0.2 -1.9
样本减1000cm3),得到如下 -0.5 1 -0.2 -0.6 1.1
结果。检验该机器的性能是否
达到设计要求 (a=0.05)
绿色 绿色 健康饮品
健康饮品
双侧检验
0.076mm。试问新机床加工零件的椭圆度的均 值与以前有无显著差异?(a=0.05)
解: H0: μ= 0.081mm 没有明显差异 H1: μ 0.081mm 有显著差异
已知μ0 = 0.081mm,σ=0.025mm,x 0.076mm
n = 200,因为是大样本,故选择Z统计量
α=0.05,z0.025=1.96
μ0 = 5cm,σ未知,n=10,是小样本, 因此,应选择t统计量。此题为双侧检验,
α=0.05,t0.025(9)=2.262
检验统计量:
t x 0 5.3 5 3.16 2.262
s n 0.3 10
统计决策: 因为 t ta /2 ,样本统计量落入拒绝域,
贾俊平版统计学课件 第8章
▽与原假设对立的假设称备择假设,记为 H1 ,用 、 或 表示。 对于新生儿体重的例子,可以表示为
H 0 : 3190
H1 : 3190
(2)确定检验统计量及其分布
▽用于检验假设的统计量称为检验统计量
▽根据 H 0 及相应条件选择适当的统计量,并确定统计量
的分布 对于新生儿体重的例子,可利用 x 0 构造检验统计量. 若新生儿体重为正态分布 N ( , 2 ) ,且 已知,则在 H 0 为真 时,用 z 作为检验统计量,并且
H 0 : 3190 H1 : 3190
并已知 x 3210, 80, n 100 ,则
z0 x 0
n
3210 3190 80 100
2.5
于是
p 2Pz z0 2 0.00621 0.01242
双侧检验的P值
/ 2
/ 2 拒绝
▽犯第二类错误的概率为 。
表8-1 假设检验中各种可能结果的概率
实际情况
H 0 为真 H 0 不真
决策
接受 H 0
1
拒绝 H 0
1
假设检验中的两类错误(决策结果)
H0: 无罪
假设检验就好像一场审判过程 统计检验过程
陪审团审判
实际情况 裁决 无罪 无罪 有罪 正确 错误 有罪 错误 正确 接受H0 拒绝H0 决策
若p-值 /2, 不能拒绝 H0 若p-值 < /2, 拒绝 H0
8.1.6 假设检验的形式
研究的问题 假设
双侧检验
H0 H1
左侧检验
右侧检验
= 0 ≠0
第八章 假设检验 (《统计学》PPT课件)
第二节 一个正态总体的假设检验
一、正态总体
设总体X ~ N(m, 2),抽取容量为n的样本 x1, x2, xn
样本均值 X 与方差S2 计算公式分别为:
2
1 n 1
n i1
(xi
X)
我们将利用上述信息,来检验关于未知参数均值 和方差的假设。
总体参数
均值
方差
总体方差已知
z 检验
(单尾和双尾)
总体方差已知
t 检验
(单尾和双尾)
2 检验
(单尾和双尾)
第二节 一个正态总体的假设检验
二、均值m的假设检验
1.H0:m=m0
2.选择检验统计量:
2已知: Z X m0 ~ N(0,1)
/ n
2未知:
小样本: t X m0 ~ t(n 1)
这个值不像我 们应该得到的 样本均值 ...
...因此我们拒绝 原假设μ=50
... 如果这是总 体的假设均值
60
μ=80
H0
样本均值
第一节 假设检验概述
三、假设检验的程序
一个完整的假设检验过程,通常包括以下几个步骤:
首先,设立原假设H0与备选假设H1; 第二步,构造检验统计量,并根据样本观察数据
小样本:当 t t
2
,则拒绝原假设,反之则接受H0;
5.得出结论。
二、均值m的假设检验
6.例题分析
[例8.3] 某广告公司在广播电台做流行歌曲磁带广告 ,它的插播广告是针对平均年龄为21岁的年轻人的,标 准差为16。这家广告公司经理想了解其节目是否为目标 听众所接受。假定听众的年龄服从正态分布,现随机抽 取400多位听众进行调查,得出的样本结果为x 25 岁S2,18 。以0.05的显著水平判断广告公司的广告策划是否符合 实际?
概率论与数理统计(假设检验的思想方法和基本概念)
= {| z | z0.025}={| z |1.96}
由样本数据计算得到
x 0 z / n
(497 506 518 524 488 517 510 515 516) / 9 500 2.02 15 / 9
因此,假设检验问题可能会犯如下两类错误:
第一类错误(“弃真”):实际情况是H0成立,而检验 的结果表明H0不成立,拒绝了H0. 第二类错误(“存伪”):实际情况是H0不成立,H1成 立,而检验的结果表明H0成立,接受了H0.
下面我们来研究一下犯这两类错误的概率.
8.1.2 假设检验的两类错误
犯第一类错误的概率:
X
H1: < 0
~ N (0,1)
/ n 对于给定的小概率 , 由图8-3知
X P z , / n X X 0 , 当原假设成立时,由于 / n / n X 0 所以 P z , / n X 0 即 z 是小概率事件. / n
8.1.1 假设检验的思想方法
根据上例可以看到假设检验的思想方法是:
(1) 提出假设; (2) 在假设成立的条件下构造一个小概率事件; (3) 由样本数据判断小概率事件是否发生了,如果小 概率事件发生了,根据“小概率原理”,作出否定原 假设的推断.
8.1.1 假设检验的思想方法
再考察下面的例子. 【例8.2】一台包装机包装洗衣粉,额定标准重量为500g, 根据以往经验,包装机的实际装袋重量服从正态N(,2), 其中 = 15g通常不会变化
x 0
这违背了小概率原理, 原因是原假设出了问 题
/ n
概率与数理统计第8章--假设检验与方差分析
第8章假设检验与方差分析【引例】重庆啤酒股份有限公司(以下简称重庆啤酒)于1990年代初斥巨资开始乙肝新药的研发,其股票被视作“生物医药”概念股受到市场热捧。
尤其是2010~2011年的两年间,在上证指数大跌1/3的背景下,重庆啤酒股价却从23元左右飙升最高至元,但公司所研制新药的主要疗效指标的初步统计结果于2011年12月8日披露后,股价连续跌停,12月22日以元报收后停牌。
2012年1月10日重庆啤酒公告详细披露了有关研究结论,复牌后股价又遭遇连续数日下跌,1月19日跌至元。
此公告明确告知:“主要疗效指标方面,意向性治疗人群的安慰剂组与 600μg组,及安慰剂组与εPA-44 900μg组之间,HBeAg/抗HBe 血清转换在统计意义上均无差异”。
通俗地说,用药与不用药(安慰剂组)以及用药多与少(900μg组与600μg 组),都没有明显差异,这意味着该公司研制的乙肝新疫苗无效。
有关数据如表所示:表乙肝新疫苗的应答率注:εP A-44为治疗用(合成肽)乙型肝炎疫苗简称。
上表数据显示,两个用药组的应答率都高于安慰剂组的应答率,但为什么说“在统计意义上均无差异”为什么说这个结论表示乙肝新疫苗无效什么叫“在统计意义上无差异”如何根据样本数据作出统计意义上有无差异的判断解答这些问题就需要本章所要介绍的假设检验。
现实中,人们经常需要利用样本信息来判断有关总体特征的某个命题是真还是伪,或对某个(些)因素的影响效应是否显著作出推断,所以假设检验和方差分析有着广泛的应用。
例如,在生物医学领域,判断某种新药是否比旧药更有效;在工业生产中,根据某批零件抽样检查的信息来判断整批零件的质量是否符合规格要求;在流通领域,鉴别产品颜色是否对销售量有显著影响等等。
这些分析研究都离不开假设检验或方差分析。
假设检验与方差分析的具体方法很多,研究目的和背景条件不同,就需采用不同的方法。
本教材介绍假设检验与方差分析的基本原理和一些基本方法。
统计学第8章假设检验
市场调查中常用的假设检验方法包括T检验、Z检验和卡方 检验等。选择合适的检验方法需要考虑数据的类型、分布 和调查目的。例如,对于连续变量,T检验更为适用;对于 分类变量,卡方检验更为合适。
医学研究中假设检验的应用
临床试验
在医学研究中,假设检验被广泛应用于临床试验。研究 人员通过设立对照组和实验组,对不同组别的患者进行 不同的治疗,然后收集数据并使用假设检验来分析不同 治疗方法的疗效。
03 假设检验的统计方法
z检验
总结词
z检验是一种常用的参数检验方法,用于检验总体均值的假设。
详细描述
z检验基于正态分布理论,通过计算z分数对总体均值进行检验。它适用于大样本 数据,要求数据服从正态分布。z检验的优点是简单易懂,计算方便,但前提假 设较为严格。
t检验
总结词
t检验是一种常用的参数检验方法,用于检验两组数据之间的差异。
卡方检验
总结词
卡方检验是一种非参数检验方法,用于 比较实际观测频数与期望频数之间的差 异。
VS
详细描述
卡方检验通过计算卡方统计量来比较实际 观测频数与期望频数之间的差异程度。它 适用于分类数据的比较,可以检验不同分 类之间的关联性。卡方检验的优点是不需 要严格的假设前提,但结果解释需谨慎。
04 假设检验的解读与报告
详细描述
t检验分为独立样本t检验和配对样本t检验,分别用于比较两组独立数据和同一组数据在不同条件下的 差异。t检验的前提假设是小样本数据近似服从正态分布。t检验的优点是简单易行,但前提假设需满 足。
方差分析
总结词
方差分析是一种统计方法,用于比较两个或多个总体的差异。
详细描述
方差分析通过分析不同组数据的方差来比较各组之间的差异。它适用于多组数据的比较,可以检验不同因素对总 体均值的影响。方差分析的前提假设是各组数据服从正态分布,且方差齐性。
管理定量分析课程第8章:假设检验
判决
无罪 有罪
陪审团审判
真实的情况
无罪
有罪
判决正确
判决错误
判决错误
判决正确
结论
未拒绝原假设 拒绝原假设
假设检验 总体参数的实际情况
原假设为真 备择假设为真 结论正确 第二类错误 第一类错误 结论正确
11
假设检验中犯Ⅰ型错误的概率,称为显著性水平(level of significance),即指当零假设实际上是正确时,检验统计量落
7
又如:教育部要检验2012年录取的大学新生平均身高是否 达到了170cm标准,这样需要提出原假设(H0):2012
年大学新生(总体)的平均身高(µ )是170cm。为了检
验这个假设是否正确,需要根据随机取样的原则,从2012 年的大学新生总体中选取样本并计算样本的平均高度,以 此来检验原假设的正确性。
8
假设检验一般分为参数假设检验和非参数假设检验两种类型。参 数假设检验对变量的要求较为严格,适合于等距变量和比率变量 ,非参数假设检验对变量的要求较为自由,既适合于等距变量和 比率变量,也适用于类别变量和顺序变量。
变量测量层次
分类(nominal)变 量
数学性(interval)变量
4
一、假设与假设检验
假设是科学研究中广泛应用的方法,它是根据已知理 论与事实对研究对象所作的假定性说明。统计学中的 假设一般专指用统计学术语对总体参数所做的假定性 说明。在进行任何一项研究时,都需要根据已有的理 论和经验事先对研究结果作出一种预想的假设。这种 假设叫科学假设,在统计学上称为研究假设。对这种 研究假设进行证实或证伪的过程叫假设检验。
非参数检验是一种与总体分布状况无关的检验方法,它不 依赖于总体分布的形式。
第8章假设检验
24
6.假设检验的统计结论是根据原假设进行阐述的,
要么拒绝原假设,要么不拒绝原假设 • 当我们不能拒绝原假设时,我们不能说“接受 原假设”,因为我们没有证明原假设是真(如 果用“接受”则意味证明了原假设是正确的), 只不过我们没有足够的证据拒绝原假设,因此 不能拒绝原假设。当我们拒绝原假设时,得出 结论是清楚的。
拒绝原假设
小概率原理:小概率事件在一次试验中几乎不会发生 小概率的标准:与一个显著性水平a 有关, 0<a <1
13
四、假设检验的过程
提出假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策
14
五、 原假设和备则假设
15
五、 原假设和备择假设
(一)原假设(null hypothesis)
我认为这种新药比原有 的药物更有效!
总体参数包括总体均 值、比例、方差等 分析之前必需陈述
如 产品合格率在80%以 上等。
9
二、什么是假设检验?
1.
2.
3.
一个假设的提出总是以一定的理由为基础,但 这些理由是不是完全充分的,要进行检验,即 进行判断。如在某种新药的研发中,研究者要 判断新药是否比原有药物更有效;海关人员对 进口货物进行检验,判断该批货物的属性是否 与申报的相一致。 假设检验就是先对总体的参数提出某种假设(原 假设和备择假设),然后利用样本信息判断假设 是否成立的过程 逻辑上运用反证法,统计上依据小概率原理
绝的却是一个真实的假设,采取的是错误行为。
31
二、显著性水平a
(significant level)
1.
2.
3.
4.
第8章 假设检验
例 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的 和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的 频数将以比例9:3:3:1发生。在检验这个理论时,孟德 尔分别得到频数315、101、108、32、这些数据提供充分 证据拒绝该理论吗?
P PH0 | Z || z0 | 2PH0 Z | z0 | 2(1 (| z0 |))
(即z0代替了拒绝域式中的z 2 )
判断:当P小于显著水平时,拒绝原假设,
否则,接受: 0, H1 : 0 , 其中0是已知的常数
以X 作为的参考, 若H0为真,X比0大些,但
这个批次清漆的干燥时间构成的总体方差可设 2 0.36 而其均值是要求我们检验的!
经计算,现抽取的9个数据的平均值x 6.4小时,
现在的问题是,我们能否认为 "6.4 6.0 0" ?
即,接受以下哪个假设?
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
4
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
16
*另外方法:若给定显著性水平, 当原假设成立时
( 0),总体X ~ N (0, 2 ),因此,X ~ N (0, 2 n )
P0 ( X 0
k)
P 0
(
X
0
n
k
设
)
n
k
n z /2
k z/2 n
1
一般,H
的拒绝域写为:
第8章假设检验
是正确的,也可以是不正确的
定义8.1.1:所谓假设检验,是先对总体的分布函数 形式或分布的某些参数作出某些可能的假设,然后 根据所得的样本数据,对假设的正确性作出判断
假
§8.1 基本概念
设
检
例8.1.1:检验一批产品的废品率是否超过0.03, 验
把“ p 0.03 ”作为一个假设,从这批产品中抽取
若干个样品,记其中所含废品数为 X
➢ 当 X 较小时,认为假设正确,或“接受”假设
➢ 当 X 较大时,则认为假设是不正确,“拒绝”
或“否定”假设
假
§8.1 基本概念
设
检
例8.1.2:判断一个硬币是否均匀,即投掷时出现 验
正面的概率是否为
1
2,
把“ p
1 2
”作为一个假设,
将硬币投掷100次,以 X 记正面出现的次数
原假设,而将新方法优于原方法取为对立假设
假
§8.1 基本概念
设
检
➢ 或者说对立假设可能是我们真正感兴趣的,接受 验
对立假设可能意味着得到某种有特别意义的结论,
或意味着采取某种重要决断
➢ 因此对统计假设作判断前,在处理原假设时总是 偏于保守,在没有充分证据时,不应轻易拒绝原假 设,或者说在没有充分的证据时不能轻易接受对立 假设
➢
例8.1.2的统计假设为:H0
:
p
1 2
H1
:
p
1 2
假
§8.1 基本概念
设
检
注:当根据抽样结果接受或拒绝一个假设时,只 验
是表明我们的一种判断;由于样本的随机性,这
样作出的判断就有可能犯错误
➢ 例如:一批产品的废品率只有0.01,因为0.01<
第8章 假设检验
关于建立假设的几点认识:
❖ 1.原假设和备择假设是一个完备事件组,且相互对 立,即必有一个成立,而且只有一个成立。
❖ 2.在假设检验中,通常将符号≤ ≥ =放在原假设上。 ❖ 3. 不同的研究者出于不同的研究目的或角度,可能
根据计算的检验统计 量与临界值进行比较, 得出拒绝或不拒绝原 假设的结论
检验统计量与拒绝域
拒绝原假设的检验统计量的所有可能取 值的集合,称为拒绝域。
若 绝对值Z临界值,拒绝原假设
拒绝域的大小与我们事先选定的显著性 水平有关。
根据选定的显著性水平确定的拒绝域的 边界值,称为临界值。
选定的显著性水平后,查阅书后的附表 就可以得到具体的临界值,将检验统计 量与之比较,就可以作出拒绝或接受原 假设的决策。
H0 H1
研究的问题 双侧检验 左侧检验 右侧检验
= 0
8.1.4 用P 值进行假设检验
❖ P 值是一个概率值(194页) 左侧检验时,P值为曲线左边小于等于检
验统计量部分的面积
右侧检验时,P值为曲线右边大于等于检
验统计量部分的面积
双侧检验时P值为曲线两边大于等于或小于 等于检验统计量部分的面积检验统计量部
什么是原假设?
1. 待检验的假设,又称“0假设”
为什么叫0 假设?
2. 研究者想收集证据予以反对的假设
3. 总是有等号 , 或
4. 表示为 H0 例如, H0: 3190(克)
什么是备择假设?
1. 与原假设对立的假设,也称“研究假设”
2. 研究者想收集证据予以支持的假设,总 是有不等号: , 或
应用统计学概念整理
应用统计学概念整理第一章:导论1.只能归类于某一类别的非数字型数据称为分类数据2.只能归于某一有序类别的非数字型数据称为顺序数据3.按数字尺度测量的观测值称为数值型数据4.包含所研究的全部个体的集合称为总体5.从总体中抽取的一部分的元素的集合称为样本6.用来描述总体特征的的概括性数字度量称为参数7.用来描述样本特征的概括性数字度量称为统计量8.说明事物类别的一个名称称为分类变量9.说明事物有序类别的一个名称称为顺序变量10.说明事物数字特征的一个名称称为数值型变量11.只能取可数值的变量称为离散型变量12.可以在一个或多个区间中取任何值的变量称为连续型变量第二章:数据收集1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法,称为抽样调查.2.为特定目的而专门组织的全面调查称为普查3.按照国家有关法律规定,自上而下地统一布置,自下而上地逐级提供基本数据的调查方式称为统计报表第三章:数据的图表展示1.落在某一特定类别或组中的数据个数,称为频数2.把各个类别及其落在其中的相应频数全部列出,并用表格形式表示出来,称为频数分布3.一个样本或总体中各个部分的数据与全部数据之比,称为比例4.将比例乘以100得到的数值,称为百分比或百分数,用%表示5.样本或总体中各不同类别数值之间的比值,称为比率6.分类数据的图示:条形图,pareto图,对比条形图,饼图7.将各有序类别或组的频数逐级累加起来得到的频数称为累计频数8.将各有序类别或组的百分比逐级累加起来称为累计频率9.顺序数据的图示:累计频数分布图,环形图10.根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组11.分组后的数据称为分组数据12.把变量值作为一组称为单变量值分组13.将全部变量值一次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组14.在组距分组中,一个组的最小值称为下限,最大值称为上限15.一个组的上限与下限的差称为组距16.各组组距相等的组距分组称为等距分组17.各组组距不相等的组距分组称为不等距分组18.每一组的下限和上限之间的重点值称为组中值19. 用矩形的宽度和高度即面积来表示频数分布的图形称为直方图20. 由茎和叶两部分组成的,反应原始数据分布的图形称为茎叶图21. 由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反应原始数据分布的图形,称为箱线图第四章:数据的概括性度量1.一组数据向其中心值靠拢的倾向和程度称为集中趋势 2.测度集中趋势就是寻找数据水平的代表值或中心值 3.不同类型的数据用不同的集中趋势测度值 4.低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据 5.层次由低到高:分类—顺序-数值型 6.一组数据中出现频数最多的变量值,称为众数 7.一组数据排序后处于中间位置上的变量值称为中位数 8.一组数据排序后处于中间位置上的变量值,称为中位数 9.一组数据排序后处于25%和75%位置上的值称为四分位数 10.一组数据相加后除以数据的个数而得到的结果,称为平均数 11.N 个变量值乘积的n 次平方根,称为几何平均数 12.数据分布的另一个重要特征 13.离中趋势反映各变量值远离其中心值的程度(离散程度) 14.从另一个侧面说明了集中趋势测度值的代表程度 15.不同类型的数据有不同的离散程度测度值 16.非众数组的频数占总频数的比率,称为异众比率 17.上四分位数与下四分位数之差,称为四分位差,也称为内距或四分间距 18.一组数据的最大值与最小值只差称为极差,用R 表示 19.各变量值与其平均数离差绝对值的平均数,称为平均差,叶也称为平均绝对离差 20.各变量值与其平均数离差平方的平均数称为方差 21.方差的平方根称为标准差 22. 变量值与其平均数的离差除以标准差后的值,称为标准分数,也成为标准化值或z 分数 数据类型品质数据汇总表条形图饼图环形图数值型数据原始数据茎叶图箱线图分组数据直方图折线图时序数据线图多元数据散点图气泡图雷达图23.对于任意分布形态的数据,根据切比雪夫不等式,至少有1-1/k2的数据落在平均数加减k个标准差之内。
两个总体的假设检验
案例1——哪种安眠药旳疗效好?
为分析甲、乙两种安眠药旳效果,某医院将20个失 眠病人提成两组,每组10人,两组病人分别服用甲、 乙两种安眠药作对比试验。试验成果如下:
两种安眠药延长睡眠时间对比试验(小时)
病人
安眠药
1 2 3 4 5 6 7 8 9 10
甲
1.9 0.8 1.1 0.1 –0.1 4.4 5.5 1.6 4.6 3.4
∵本例中“P(F<=f)单尾”旳值为 0.1503, 故其双边检验所到达旳明显性水平为
2×0.1503 = 0.3006 > 0.20
故在在水平 = 0.20下,12 与 22 间无明显差别。
23
§8.5 大样本两个总体百分比旳检验
设 P1, P2 分别是两个独立总体旳总体百分比,
原假设为
H0: P1 = P2
两种安眠药延长睡眠时间对比试验(小时)
病人 安眠药
1
2
34
5678
9 10
甲
1.9 0.8 1.1 0.1 –0.1 4.4 5.5 1.6 4.6 3.4
乙
0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0
(1)两种安眠药旳疗效有无明显差别?
(2)假如将试验措施改为对同一组10个病人,每人分别 服用甲、乙两种安眠药作对比试验,试验成果仍如 上表,此时两种安眠药旳疗效间有无差别?
~ t ( n1+n2-2 )
其中:
S
2 w
(n1
1)S12 (n2 1)S22 n1 n2 2
,
称为合并方差。
完全类似地,能够得到如下检验措施:
统计量
备择假设
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2. σ12≠σ22 且未知
此时,可用 Excel 的【工具】→“数据分析”→ “ t 检验:双样本异方差假设” 检验 σ12≠σ22且都未知时两个正态总体的均值。
12
【案例1】哪种安眠药的疗效好? 案例 】哪种安眠药的疗效好?
为分析甲、乙两种安眠药的效果,某医院将20个失 眠病人分成两组,每组10人,两组病人分别服用甲、 乙两种安眠药作对比试验。试验结果如下: 两种安眠药延长睡眠时间对比试验(小时)
3
案例1——哪种安眠药的疗效好? 哪种安眠药的疗效好? 案例 哪种安眠药的疗效好
为分析甲、乙两种安眠药的效果,某医院将20个失 眠病人分成两组,每组10人,两组病人分别服用甲、 乙两种安眠药作对比试验。试验结果如下: 两种安眠药延长睡眠时间对比试验(小时)
病人 安眠药
1 1.9
2 0.8
3 1.1
7
解:12 = σ22 = σ2 未知, n1= 5,n2= 6, H0:1= 2 σ
⑴双边检验问题 H1:1≠2。由所给数据,可求得 x1 = 1556, x2 = 1733 , S12=269.62, S22=471.92
2 (n1 1) S 1 + (n2 1) S 2 4 × 269.6 2 + 5 × 471.9 2 2 = 395 Sw = = n1 + n2 2 9
第8章 两个总体的假设检验 章
本章教学目标
掌握运用 Excel 的“数据分析”及其统计函数 功能求解两个总体的假设检验问题。
1
本章主要内容: 本章主要内容:
§8.1 §8.2 §8.3 §8.4 §8.5 §8.6 案例介绍 两个独立正态总体均值的检验 成对样本试验的均值检验 两个正态总体方差的检验(F检验) 两个总体比例的检验 两个总体的假设检验小结
17
F 分布密度函数的图形
f (x) n1=20, n2=100 n1=20, n2=25 n1=20, n2=10 x
0
18
F 分布的右侧 α 分位点 Fα ( n1, n2 ) 右
F 分布的右侧 α 分位点为满足 P{ F > Fα ( n1, n2 ) } = α 的数值 Fα (n1, n2)。
病人 安眠药 甲 乙 1 2 3 4 5 6 7 8 9 10 1.9 0.8 1.1 0.1 –0.1 4.4 5.5 1.6 4.6 3.4 0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0
(1)两种安眠药的疗效有无显著差异? (2)如果将试验方法改为对同一组10个病人,每人分别 服用甲、乙两种安眠药作对比试验,试验结果仍如 上表,此时两种安眠药的疗效间有无差异?
16
§8.4 两个正态总体方差的检验
1. F 分布 则随机变量 Y~χ 2(n2), 且 X 和 Y 相互独立, 设 X~χ 2(n1),
X/n1 F= Y/n2
服从自由度为( n1, n2 )的 F 分布,记为 F ~ F ( n 1, n 2 ) n1 为第一(分子的)自由度, n2 为第而,若 “P(T<=t)单尾”或“P(T<=t)双尾”>0.05,则结果为不显著; “P(T<=t)单尾”或“P(T<=t)双尾”<0.05,则一般显著; “P(T<=t)单尾”或“P(T<=t)双尾”<0.01,则高度显著; “P(T<=t)单尾”或“P(T<=t)双尾”<0.001,则极高度显著。 本例中:∵ “P(T<=t)单尾”= 0.2387 >0.05; “P(T<=t)双尾”= 0.4773 >0.05, 故无论单边还是双边检验结果都不显著。 11
22
用 Excel 求解
可用 Excel 的【工具】→“数据分析”→ “F检验: 双样本方差” 检验两个正态总体是否是同方差的。 在 Excel 的输出结果中 “P(F<=f)单尾”与“P(T<=t)单尾”的含义是相同 的,即 p 值。 ∵本例中“P(F<=f)单尾”的值为 0.1503, 故其双边检验所达到的显著性水平为 2×0.1503 = 0.3006 > 0.20 故在在水平 α = 0.20下,σ12 与 σ22 间无显著差异。
9 × 2.002 2 + 9 ×1.789 2 = 1.8985 Sw = 18 12.33 0.75 | t |= = 1.8609 < t0.025 (18) = 2.1009 1.8985 1 / 10 + 1 / 10
故不能拒绝H0,两种安眠药的疗效间无显著差异。 用Excel 求解本案例
可用 Excel 的统计函数 FINV 返回 Fα(n1,n2)。 语法规则如下: 格式:FINV(α , n1, n2 ) 功能: 返回 Fα ( n1, n2 )的值。
20
2. 两总体方差的检验 ( F 检验 )
原假设为 H0:σ12=σ22。 当 H0为真时, 统计量
S12 F = 2 ~ F ( n1-1, n2-1 ) S2
4
§8.2 两个独立正态总体均值的检验
设总体 X1~ N ( 1, σ12), X2~N ( 2, σ22), 且 X1和 X2 相互独立。 X 1 , X 2 和 S12, S22 分别是 它们的样本的均值和样本方差, 样本容量分别为 n 1和 n 2。 原假设为 H0:1 = 2
5
1. σ12 = σ22 = σ 2,但 σ 2 未知 ( t 检验 )
14
成对样本试验— §8.3 成对样本试验 案例 1 (2)解答 解答
由于此时 X1, X2 为同一组病人分别服用两种安眠 成对样本试验。 成对样本试验 药的疗效, 因此 X1, X2 不独立,属于成对样本试验 对于这类“成对样本试验 成对样本试验”的均值检验,应当化 成对样本试验 为单个正态总体的均值检验。方法如下: 设 X=X1-X2 (服用甲、乙两种安眠药延长睡眠时 间之差), 则 X~N ( , σ 2 )。 H0: = 0, H1:≠0 由表中所给数据,可求得 x = 1.58, S =1.23,n =10
2
§8.1 案例介绍
【案例1】新工艺是否有效? 案例 】新工艺是否有效?
某厂生产的一种钢丝的平均抗拉强度为 10560 (kg/cm2)。 现采用新工艺生产了一种新钢丝,随机抽取 10 根, 测得抗拉强度为: 10512, 10623, 10668, 10554, 10776 10707, 10557, 10581, 10666, 10670 求得新钢丝的平均抗拉强度为 10631.4(kg/cm2)。 是否就可以作出新钢丝的平均抗拉强度高于原钢丝, 即新工艺有效的结论?
13
案例 1 解答
(1)设服用甲、乙两种安眠药的延长睡眠时间分别为 X1, X2, X1~N( 1, σ 2),X2~N( 2, σ 2), n1 = n2 =10。 由试验方法知 X1, X2 独立。 H0:1=2,H1:1≠2 由表中所给数据,可求得:
x1 = 2.33, S12=2.0022, x2 = 0.75, S22=1.7892
f (t) “P(T<=t)单尾”的值(概率) 0 t (统计量)
由图可知:P(T<=t)双尾 = 2×P(T<=t)单尾
10
“P(T<=t)单尾”与“P(T<=t)双尾”的使用
“P(T<=t)单尾” 由图可知: t > tα 等价于 “P(T<=t)单尾”< α t > tα/2 等价于 “P(T<=t)双尾”< α
9
用 Excel 检验两总体均值
可用 Excel 的【工具】→“数据分析”→“ t检验:双 样本等方差假设”,检验 σ12=σ22=σ 2,但σ 2未知时 两个总体的均值。 在Excel 的输出结果中: 临界显著性水平; 临界显著性水平 “P(T<=t)单尾”—单边检验达到的临界显著性水平 临界显著性水平。 临界显著性水平 “P(T<=t)双尾” —双边检验达到的临界显著性水平 “P(T<=t)单尾”和“P(T<=t)双尾”统称为“ p 值 ”。
| x1 x2 | | 1556 1733 | | t |= = = 0.74 S w 1 / n1 + 1 / n2 395 1 / 5 + 1 / 6
∵ | t | = 0.74 < tα/2 (n1+n2-2) = t0.025(9) = 2.2622 故两种轿车的平均首次故障里程间无显著差异, 即两种轿车的该项质量指标是处于同一水平的。
完全类似地,可以得到如下检验方法:
统计量 备择假设 拒绝域
F > Fα / 2 (n1 1, n2 1)
S F= S
2 1 2 2
σ ≠σ
2 1
2 2
或 F < F1α / 2 (n1 1, n2 1) F > Fα (n1 1, n2 1) F < F1α (n1 1, n2 1)
备择假设
Sw
1 ≠ 2 1 > 2 1 < 2
拒绝域 | t |< tα / 2 (n1 + n2 2)
t > tα (n1 + n2 2) t < tα (n1 + n2 2)
6
【案例2】轿车质量差异的检验 案例 】
测得甲, 乙两种品牌轿车的首次故障里程数数据如下: 甲品牌 X1:1200, 1400, 1580, 1700, 1900 乙品牌 X2:1100, 1300, 1800, 1800, 2000, 2400 设 X1和 X2 的方差相同。问在水平 α = 0.05 下, (1)两种轿车的平均首次故障里程数之间有无显著差异? (2)乙品牌轿车的平均首次故障里程是否比甲品牌有显 著提高?