人大《统计学》第七章假设检验

合集下载

《统计学》-第7章-习题答案

《统计学》-第7章-习题答案

第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。

2.答:相关和回归都是研究现象及变量之间相互关系的方法。

相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。

3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。

复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。

偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。

4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。

根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。

总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。

两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。

第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。

教育统计学第七章 假设检验

教育统计学第七章  假设检验

例1 某地区的教育卫生部门多年积累的资料表 明,15岁儿童的平均身高为165 cm,标准差为10 cm, 今随机抽取120名15岁儿童测得平均身高为168 cm。 试问该地区全体15岁儿童的平均身高是否发生了变 化?
假设检验原理示意图
二、假设检验中的两类错误
统计学中将H0真实而拒绝H0时所犯的错误称做 Ⅰ型错误(弃真错误),由于这类错误的概率为 故称为 型错误 统计学中将H0假而接受H0时所犯的错误称做 Ⅱ开型错误(取伪错误),这类错误的概率以 表示,因而又叫做 型错误。
z 2.58
例2 某市小学五年级语文统考历年来平均分为85,标 准差为10,从今年小学五年级语文统考成绩中随机抽取80 个考分,算得平均分为87,请在=0.05水平上检验一下今 年该市小学五年级语文统考成绩是否高于往年。
Z 与临界值比较
P值范围
检验结果 保留H0,拒绝H1
显著性 不显著 显著 (*) 极其显 著 (**)
检验统计量:
t
X
X

X
X
n 1
(1)小样本的情况
例3 某市初三英语毕业考试平均为65分,现 从该市某校抽取20份初三英语毕业考试试卷,算 得平均分69.8,标准差为9.234。问该校初三英 语平均分数与全区是否一样?
t检验决断规则
t
与临界值的比较
P值范围 P>0.05 0.01< P≤0.05 P≤0.01
第七章 显著性检验
在处理调查或实验数据时,经常要讨论统计 值之间差异的问题。对于这些差异的讨论一般分 为两种情况: • (1) 样本统计量与相应总体参数的差异; • (2) 两个样本统计量之间的差异。
假设检验:从样本统计值推论总体参数

教育统计学第七章假设检验

教育统计学第七章假设检验

THANKS
感谢观看
和假设。
合理选择样本
选择具有代表性的样本是假设 检验的重要前提,样本的选择 应基于研究目的和研究对象的 特征。
正确理解数据
对收集到的数据进行正确理解 和分析,确保数据的准确性和 可靠性。
正确解读结果
对假设检验的结果进行正确解 读,避免误导或过度解读。
假设检验的局限性
样本代表性
由于样本是从总体中随机抽取的,因此可能存在样本代表性不足的问 题,导致假设检验的结果存在误差。
用于比较实际观测频数与期望 频数之间的差异。
回归分析
用于研究变量之间的关系,并 检验回归方程是否显著。
03
参数假设检验
单个总体参数的假设检验
定义
对单个总体参数的假设检验是检 验一个总体参数是否等于某个特
定值。
步骤
1. 提出假设;2. 确定检验统计量; 3. 确定临界值;4. 做出推断结论。
示例
检验某班级学生的平均成绩是否为 80分。
提高假设检验准确性的方法
增加样本量
增加样本量可以提高假设检验的准确性,降 低误差率。
考虑使用交叉验证
交叉验证可以减少模型过拟合和欠拟合问题, 提高假设检验的准确性。
选择适当的统计方法
根据研究目的和数据特征选择适当的统计方 法,可以更准确地检验假设。
注意控制实验误差
在实验过程中,应采取措施控制实验误差, 确保数据的准确性和可Байду номын сангаас性。
两个样本非参数检验
1 2 3
曼-惠特尼U检验
用于比较两个独立样本的平均值是否存在显著差 异。
威尔科克森符号秩检验
适用于比较两个独立样本的平均值是否存在显著 差异,特别是当其中一个样本的观测值不能进行 四则运算时。

《概率论与数理统计》第七章_假设检验

《概率论与数理统计》第七章_假设检验

第七章 假设检验学习目标知识目标:理解假设检验的基本概念小概率原理;掌握假设检验的方法和步骤。

能力目标:能够作正态总体均值、比例的假设检验和两个正态总体的均值、比例之差的假设检验。

参数估计和假设检验是统计推断的两种形式,它们都是利用样本对总体进行某种推断,然而推断的角度不同。

参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。

而在假设检验中,则是预先对总体参数的取值提出一个假设,然后利用样本数据检验这个假设是否成立,如果成立,我们就接受这个假设,如果不成立就拒绝原假设。

当然由于样本的随机性,这种推断只能具有一定的可靠性。

本章介绍假设检验的基本概念,以及假设检验的一般步骤,然后重点介绍常用的参数检验方法。

由于篇幅的限制,非参数假设检验在这里就不作介绍了。

第一节 假设检验的一般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误一、假设检验的基本概念(一)原假设和备择假设为了对假设检验的基本概念有一个直观的认识,不妨先看下面的例子。

例7.1 某厂生产一种日光灯管,其寿命X 服从正态分布)200 ,(2μN ,从过去的生产经验看,灯管的平均寿命为1550=μ小时,。

现在采用新工艺后,在所生产的新灯管中抽取25只,测其平均寿命为1650小时。

问采用新工艺后,灯管的寿命是否有显著提高?这是一个均值的检验问题。

灯管的寿命有没有显著变化呢?这有两种可能:一种是没有什么变化。

即新工艺对均值没有影响,采用新工艺后,X 仍然服从)200 ,1550(2N 。

另一种情况可能是,新工艺的确使均值发生了显著性变化。

这样,1650=X 和15500=μ之间的差异就只能认为是采用新工艺的关系。

究竟是哪种情况与实际情况相符合,这需要作检验。

假如给定显著性水平05.0=α。

在上面的例子中,我们可以把涉及到的两种情况用统计假设的形式表示出来。

第一个统计假设1550=μ表示采用新工艺后灯管的平均寿命没有显著性提高。

第7章统计假设检验

第7章统计假设检验


根据备择假设,建立相应的H0的拒绝域
(五)做出推断及生物学解释。 P≥0.05 不认为是小概率事件,接受H0 P<0.01或P<0.05为小概率事件,则 否定H0:μ =μ
0
;接受HA
根据结果对原问题做出明确、合理的解释。
小结:显著性检验中应注意的问题
① 试验之前进行严格合理的试验设计或抽样设计; ② 根据不同的试验设计方法,选择不同的显著性检验 方法;
(三)选择合适的统计量,并研究试验所得统 计量的抽样分布。
根据不同的目的采用不同的检验方法:对平
均数做检验, u 检验( 2 已知)或 t 检验( 2未 知),单个样本方差检验用 2 检验,两个样 本方差用F检验.
u, t, 2,F
称为检验统计量.
(四)建立H0的拒绝域,查表确定临界值。
【例1】 某实验要求实验动物平均体重μ=10.00g, 现有 实验动物10只,平均体重 =10.23g, 已知总体 x 标准差σ=0.4g,问这些动物在该实验中能否使 用?
【解析】


已知动物体重服从正态分布,而且标准差已知,可用 u检验。 设抽取该10只动物的总体体重平均数为μ,实验要求的 实验动物体重平均数为μ0
HA: μ>μ0
HA: μ<μ0
三、显著水平与两类错误
(一)小概率原理
在显著性检验中,否定或接受无效假设的依据是 “小概率事件实际不可能性原理”。 小概率事件在一次试验中,几乎是不会发生的。 若根据一定的假设条件计算出来该事件发生的概率 很小,而在一次试验中竟然发生了,则可以认为假 设的条件不正确,因此,否定假设。
五、显著性检验的基本步骤
(一)首先对试验样本所在的总体作假设。

第七章假设检验与t检验(终板)

第七章假设检验与t检验(终板)
1、假设检验中α值是检验水准,是拒绝 或不拒绝H0的概率标准。α的大小是人为 选定的,一般取0.05。
2、P值是指从H0所规定的总体中作随机 抽样,获得等于及大于 (或等于及小于)现有 样本统计量的概率。通过 P值与α 值的比 较来确定拒绝或不拒绝H0。
四、假设检验的应用注意事项
(1)研究设计要科学严密 (2)考虑假设检验方法的前提条件 (3)正确理解P值的含义 (4)假设检验的结论不能绝对化 (5)统计学意义与实际意义相互结合
的疗效时,如能根据专业知识认为新药 疗效不会比旧药差,只关心新药是否比 旧药好(疗效至少相同,绝对排除出现 相反的可能性),可用单侧检验。
双侧检验:在比较甲乙两种药物的疗效时, 事先不能确定哪种药的疗效较好,只关心两药 的疗效有无差别,要用双侧检验。双侧检验若 有差别,单侧检验肯定有差别;反之,单侧检 验若有差别,双侧检验不一定有差别。 单侧检验更容易得到有统计学意义的结论。
140 150 138 120 140 145 135 115 135 130 120 133 147 125 114 165 —
差值d (4)
27 25 12 -10 -10 0 0 10 7 -5 20 3 37 10 -6 10
d 130
d2 (5)
725 625 144 100 100 0 0 100 49 25 400 9 1369 100 36 100
2、选定检验方法和计算检验统计量
根据研究设计方案、资料类型、样本含量 大小及分析目的选用适当的检验方法,并根据 样本资料计算相应的检验统计量;不同的检验 方法要用不同的公式计算现有样本的检验统计 量(t ,u,F值)。检验统计量是在H0成立的前 提下计算出来。
3、确定P值,作出统计推断 P值是指由所规定的总体作随机抽样, 获得

医学统计学第七、八章 假设检验的基本概念和t检验

医学统计学第七、八章  假设检验的基本概念和t检验

S x 1 − x 2 为两样本均数差值的标准误
Sx −x
1
2
⎛1 1⎞ ⎟ = S ⎜ + ⎜n n ⎟ 2 ⎠ ⎝ 1
2 c
在两总体方差相等的条件下,可将两方差合并, 求合并方差(pooled variance) S c2
2 ⎡ ( Σ x1 ) ⎤ 2 ⎢ Σ x1 − ⎥ + n1 ⎦ ⎣ = n1 − 1 + 2 ⎡ ( Σx2 ) ⎤ 2 ⎢Σ x2 − ⎥ n2 ⎦ ⎣ n2 − 1
t 检验的应用条件:
① 单样本t检验中,σ 未知且n 较小,样本取自 正态总体; ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 方差不齐可用t’检验; ③ 两大样本均数比较时,可用Z检验。
1、样本均数与总体均数比较的 t 检验
• 使用范围:用于样本均数与已知总体均数(一 般为理论值、标准值或经过大量观察所得的稳 定值等)的比较。 • 分析目的:推断样本所代表的未知总体均数 μ 与已知总体均数 μ0有无差别。 • 若 n 较大,则 tα .ν ≈ tα .∞ , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 Z )得P值。
回到例子:
2.计算统计量
已知μ0= 3min,n=50, X=4min
4−3 t= = 4 .7140 1 .5 / 50
υ = 50 − 1 = 49
3、确定 P 值,作出统计推断 根据算出的检验统计量如 t、z 值,查 相应的界值表,即可得到概率 P。 P值是在H0成立前提下,抽得比现有样 本统计量更极端的统计量值的概率。 P值越小只能说明:作出拒绝H0 ,接受 H1的统计学证据越充分。
X −μ X −μ 用公式:t = 或z = σX SX

统计学第七章假设检验

统计学第七章假设检验
有证据表明新机床加工的零件
-1.96 0 1.96
的椭圆度与以前有显著差异 Z
统计学第七章假设检验
总体方差已知时的均值检验 (单尾 Z 检验)
统计学第七章假设检验
均值的单尾 Z 检验
(2 已知)
1. 假定条件
– 总体服从正态分布 – 若不服从正态分布,可以用正态分布来
近似 (n30)
2. 备择假设有<或>符号 3. 使用z-统计量
– 被称为抽样分布的拒绝域
3. 表示为 (alpha)
– 常用的 值有0.01, 0.05, 0.10
4. 由研究者事先确定
统计学第七章假设检验
作出统计决策
1. 计算检验的统计量
2. 根据给定的显著性水平,查表得出相应 的临界值Z或Z/2
3. 将检验统计量的值与 水平的临界值进
行比较 4. 得出接受或拒绝原假设的结论
统计学第七章假设检验
双侧检验与单侧检验 (假设的形式)
假设
H0 H1Leabharlann 研究的问题 双侧检验 左侧检验 右侧检验
= 0
0
0
≠0
< 0
> 0
统计学第七章假设检验
双侧检验
(原假设与备择假设的确定)
1. 双侧检验属于决策中的假设检验。也就是说,
不论是拒绝H0还是接受H0,我们都必需采取 相应的行动措施 2. 例如,某种零件的尺寸,要求其平均长度为 10厘米,大于或小于10厘米均属于不合格 3. 建立的原假设与备择假设应为
样本统计量
第二节 一个正态总体的参数检验
一. 总体方差已知时的均值检验 二. 总体方差未知时的均值检验 三. 总体比例的假设检验
统计学第七章假设检验

应用统计学第7章 假设检验

应用统计学第7章 假设检验


μp
(1 )
σp
n
7.3 几种常见的假设检验
• p的抽样分布接近于 正态分布,所以检
验统计量是ZSTAT 值:
p的假设检验
Z STAT

nπ 5和 n(1-π) 5
π(1 π)
n
nπ < 5或 n(1-π) < 5
本章不讨论
7.3 几种常见的假设检验
关于总体比例,可建立如下假设:
提出原假设和备择假设 选择显著性水平 确定检验统计量 建立决策准则 做出决策
7.2 假设检验的五个步骤
7.2.1提出原假设和备择假设 原假设,H0
检验的声称或断言
例:在美国每个家庭平均有3台电视机
(H0 : μ 3)
是总体参数,不是样本统计量
H0 : μ 3
H0 : X 3
7.2 假设检验的五个步骤
的假设检验
σK已n知own (Z 检验)
检验统计量是:
σ Un未kn知own (t 检验)
7.3 几种常见的假设检验
根据抽样分布原理,当总体服从正态分布N(μ,2)时,那
么从中抽取(重复抽样)容量为n 的样本,其样本均值
服从正态分布
N , 2 / n ,而统计量
Z
x
服从标
准正态分布。
n
对于双侧检验,对给定的显著性水平α,当
解:由题意知,这是左单侧检验问题,可建立如下假设:
H0 : 0.9
H1 : 0.9
样本比例
p 82 0.82 ,检验统计量的值为:
100
Z
p
= 0.82 0.9 2.67
(1 )
0.9 0.1
n
100

统计学课件第七章-假设检验

统计学课件第七章-假设检验

《统计学》第七章 假设检验
假设检验的基本思想:运 用具有概率性质的反证法。
总体 (某种假设)
抽样 检验
(接受)
小概率事件 未发生
样本 (观察结果)
(拒绝) 小概率事件 发生
《统计学》第七章 假设检验
§7.1 假设检验概述
STAT
★ 一、假设检验的基本思想 ★ 二、原假设和备择假设
三、两类错误
四、假设检验的基本程序
H 0: 0 H 1:0
【例】某型号汽车每升汽油平均行
驶里程为10公里。生产厂家研制了
一种新型汽化器以求提高燃料效率。
目前正在进行行驶实H验0:,以≤求1通0 过 实效验 率证。明新型汽化器H可1:以提>高燃10料
《统计学》第七章 假设检验
拒绝域和接受域(右侧检验)
假设的总体 抽样分布
接受域
拒绝域
当实际分布 的均值为未知时, 无法计算出犯第 二类错误的概率。 因此,我们通常 只控制犯第一类 错误的概率。
《统计学》第七章

假设检验
假设的总体 抽样分布
- Z b b b a 以左侧检验为例
两类错误总结
《统计学》第七章 假设检验
结论
接受 H0 拒绝 H0
总体实际情况
H0 为真
结论正确
H1 为真
拒绝域
《统计学》第七章 假设检验
㈣建立拒绝原假设的规则(方法二)
p-值
拒绝区域 (概率)
对于单侧检验,p-值 大于或 等于 值,则 接受原假设
接受区域
z z
p-值为从检验统计量到分布拒绝域一侧的面 积。p-值较小说明样本结果的似然程度差, 即根据样本结果不能得出原假设为真的结论

心理统计学 第七章假设检验

心理统计学 第七章假设检验
α和β 的关系就像翘翘板, 的关系就像翘翘板, 就大, α小β 就大, α大β 就小
β
α
四、单侧与双侧检验
• 1.双侧检验:只强调差异 1.双侧检验: 双侧检验 而不强调方向性的检验。 而不强调方向性的检验。
H 0 : µ = µ0
• 2.单侧检验:既强调差异 2.单侧检验: 单侧检验 又强调方向性的检验。 又强调方向性的检验。
• (二)两类错误的关系
• • • • • 1. α+β不等于1 不等于1 是在两个不同前提下的概率。 α和β是在两个不同前提下的概率。 2. α和β不可能同时增大或减小 增大样本容量n 可同时减小两类错误。 增大样本容量n,可同时减小两类错误。 3.统计检验力 统计检验力1 3.统计检验力1-β。
解: 提出假设:用μ1表示受过早期教育的儿童的平均智商。单侧检验,提出假设: ⑴提出假设 Ho: H1: Ho:μ1≤μo=100 H1:μ1>μo=100 选择并计算统计量: ⑵选择并计算统计量:由于总体方差已知,样本平均数服从正态分布。
⑶查表确定临界值:Z0.05=1.645 查表确定临界值: 统计决断: p<0.05。 ⑷统计决断:Z=1.84> Z0.05=1.645 ,p<0.05。 p<0.05 落在拒绝区域,所以拒绝零假设,接受备择假设。 即应该认为受过良好早期教育的儿童智力高于一般水平。 即应该认为受过良好早期教育的儿童智力高于一般水平。
Ⅰ型错误:也称α型错误或弃真错误,即H0为真拒绝H0(拒 为真拒绝H 型错误:也称α型错误或弃真错误, 绝了一个本应接受的假设); 绝了一个本应接受的假设); 型错误:也称β型错误或取伪错误, 为假接受H Ⅱ型错误:也称β型错误或取伪错误,即H0为假接受H0(接 受了一个本应拒绝的假设)。 受了一个本应拒绝的假设)。 负责任的态度是无论做出什么决策, 负责任的态度是无论做出什么决策, 都应该给出该决策可能犯错误的概率。 都应该给出该决策可能犯错误的概率。

统计学第七章假设检验和非参数统计

统计学第七章假设检验和非参数统计

4、计算T值:根据裁判的观察确定球的 反弹角度为X
5、统计判断:当一名球员使用上肢之外 的身体部分触球时,球的反弹角度为X的概率 为0.03。由于0.03<0.05,拒绝原假设,即认 为球员A存在上肢触球。
在本例中,有3%的可能性发生弃真错误, 即球员A没有上肢触球,但裁判作出了错误判 断。
显著性水平α在这里决定了某一个结论能 否被接受。
例题:
对24名儿童依次进行一项测试活动,获得 下列分数序列:
31,23,36,43,41,44,12,26,43, 75,2,3,15,13,78,24,13,27,86,61, 13,7,6,8
转化成上下游程,为:-,+,+,-, +,-,+,+,+,-,+,+,-,+, -,-,+,+,-,-,-,-,+
二、确定适当的检验统计量T
检验统计量T是用于检验原假设是否成立 的标准,在原假设成立的前提下,统计量T满 足某种特征。
四、计算检验统计量T的值
根据检验中获得的数据,计算统计量T的 值。
五、作出统计决策
根据T的取值特征,计算取该值的概率, 如果此概率小于a,则拒绝原假设。
第一节 检验原理
一、提出原假设(Null Hypothesis)和 备择假设(Alternative Hypothesis)
建立原假设H0:P+=P-
计算两种符号的数量S+和S-,利用二 项分布计算S+或S-出现的概率是否处于接受 域。
在n>20的情况下,二项分布可以用正态 分布进行近似:
符号检验中仍然没有利用总体的分布特 征。
四、游程检验
游程检验又称连贯检验或串检验,用于考 察一个序列中两种符号的出现次序是否随机。
本例,如果α变为0.15,这时当一名球员 使用上肢之外的身体部分触球时,球的反弹 角度为X的概率为0.10,就可以拒绝原假设, 即认为球员A存在上肢触球。但如果α为0.05, 在反弹角度为X的概率为0.10时,就要接受原 假设。

《概率统计教学资料》第7章假设检验

《概率统计教学资料》第7章假设检验
置信区间可以给出更全面的信息,因为它同时给出了估计值的可能范围和置信水平。但是,置信区间 的计算比假设检验更为复杂,且在某些情况下可能无法给出明确的结论。
THANKS
感谢观看
《概率统计教学资料》 第7章 假设检验
目录
• 假设检验的基本概念 • 参数假设检验 • 非参数假设检验 • 假设检验的注意事项
01
假设检验的基本概念
定义与原理
定义
假设检验是一种统计推断方法, 通过样本数据对总体参数作出假 设,然后利用适当的统计量进行 检验,以决定假设是否成立。
原理
假设检验基于概率原则,通过比 较样本数据与理论分布或预期结 果,对假设作出接受或拒绝的决 策。
的统计量。
双参数假设检验
双参数假设检验是在单参数假设检验的基础上发展而来的,它主要针对 两个参数进行检验,判断这两个参数是否符合预期或是否具有显著性差 异。
常见的双参数假设检验方法包括配对样本T检验、相关性检验、回归分析 等,这些方法在处理具有两个变量的问题时非常有用。
双参数假设检验的步骤与单参数假设检验类似,也需要提出假设、构造 检验统计量、确定临界值、做出推断结论等步骤,但在实际应用中需要 注意处理两个参数之间的关系。
02
参数假设检验
单参数假设检验
单参数假设检验是假设检验中最基础和 最常用的类型,它主要针对单一参数进 行检验,判断该参数是否符合预期或是
否具有显著性差异。
常见的单参数假设检验方法包括t检验、 Z检验、卡方检验等,这些方法在统计 学教材和实际应用中均有广泛应用。
单参数假设检验的步骤包括提出假设、 构造检验统计量、确定临界值、做出推 断结论等步骤,其中构造检验统计量是 关键步骤,需要根据具体问题选择合适

统计学第四版第7章假设检验(简)总结

统计学第四版第7章假设检验(简)总结
02
~ 2 n 1
2 n 1 s 当H 为真时,统计量 2
2 n 1 s 20 10.0042 2 统计量的值 31.92
2
0.0025
2 0.10, 查 2分布表得 02.05 ( 19) 30.14, 0 19 10.12 .95

假设检验分为两类:参数检验、非参数检验/自
由分布检验
2
例1

消费者协会接到消费者投诉,指控品牌纸包装饮
料存在容量不足,有欺骗消费者之嫌。包装上标 明的容量为250毫升。消费者协会从市场上随机抽 取50盒该品牌纸包装饮品,测试发现平均含量为 248毫升,小于250毫升。这是生产中正常的波动, 还是厂商的有意行为?消费者协会能否根据该样 本数据,判定饮料厂商欺骗了消费者呢?

提出原假设和备择假设→根据抽样分布,计算样本统 计量→选择显著性水平α ,查表确定临界值→判断并 得出结论。
8
第一步:确定原假设与备择假设
: =255;



≠250
原假设H0:通常是研究者 想收集证据予以反对的假 设,也称为零假设
备择假设H1:通常是研究 者想收集证据予以支持的 假设,也称为研究假设。
3
例2

一种罐装饮料采用自动生产线生产,每罐
的容量是255ml,标准差为5ml。为检验每罐
容量是否符合要求,质检人员在某天生产
的饮料中随意抽取了40罐进行检验,测得每
罐平均容量为255.8ml。检验该天生产的饮
料容量是否符合标准要求。
4
例3

根据过去大量资料,某厂生产的产品的使
用寿命服从正态分布N(1020,1002)。现

第七章假设检验

第七章假设检验

第三节
u检验
u检验(u test ),亦称z检验(z test) 大样本均数(率)与总体均数(率)比较的u检 验、 两个大样本均数(率)比较的u检验 一、大样本均数比较的u检验 二、大样本率的u检验
一、大样本均数比较的u检验
假定样本数据服从正态分布 ,当总体标准差 未知时,可用样本标准差作为估计值 这里的总体均数一般是指已知的理论值、标准 值或经过大量观察所得到的稳定值,记作µ 0 (或记为 )
两个样本率p1、p2的差值服从正态分布
u p1 p2
1 2
p p
2 2 p p p p 1 (1 1 ) / n1 2 (1 2 ) / n2
1 2 1 2
样本率p介于0.1~0.9之间,每组例数大于60 例
n1 p1 n2 p2 ˆ0 n1 n2
两样本均数比较的u检验
该检验方法适用于完全随机设计中两组 计量资料差别的比较 两样本均数差值服从正态分布
u Leabharlann 1 X 2X1X2
X
1X2
2 2 2 2 X / n 1 1 2 / n2 X2 1

当总体标准差未知,两组例数均超过30
ˆX
1X2
亦称样本率与总体率的比较的u检验,这里的 总体率一般是指已知的理论值、标准值或经大 量观察所获得的稳定值。
例7–3 全国调查的调查结果,学龄前儿童营 养性贫血患病率为23.5%。某医院为了解当
地学龄前儿童能够营养性贫血患病情况,对
当地1396例学龄前儿童进行了抽样调查,查
出营养性贫血患儿363例,患病率为26.0%。
ˆp p
1
2
1 1 ˆ0 (1 ˆ0 )( ) n1 n2

统计学 第7章 假设检验

统计学 第7章 假设检验

2013年8月4日/下午6时50分
《统计学教程》
第6章 抽样分布与参数估计 3.抽样分布
6.1 抽样分布
抽样分布(Sampling Distribution)是指从同分布总体中,独立抽 取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分 布的概率分布,抽样分布是抽样理论的研究对象。 抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
ˆ lim P 1
n


(6.25)
则称为的满足一致性准则的估计量,一般称之为一致估计量。 一致估计量随着样本容量的增大,其数值越来越接近被估计的总体参 数。
2013年8月4日/下午6时50分
《统计学教程》
第6章 抽样分布与参数估计
6.2 参数估计的一般问题
2.无偏性 无偏性(Unbiasedness)是指估计量的数学期望等于未知的总体参数 真值。即
(6.2)
称序列 X1,X 2, ,X n, 依概率收敛于总体均值。即当n充分大时,车 比雪夫不等式几乎都是成立的;当n趋于无穷大时,n个随机变量的均值 趋于总体均值。
2013年8月4日/下午6时50分
《统计学教程》
第6章 抽样分布与参数估计
6.1 抽样分布
2.中心极限定理 在客观现实中,有许多随机变量是由大量的相互独立的随机因素的综 合影响而形成的,任何一个因素在总的影响中的作用都是微小的,这种 随机变量往往近似地服从正态分布。 中心极限定理(Central Limit Theorem)反映了随机变量近似地服 从正态分布的特征。中心极限定理是大样本推断的理论基础。 独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机 变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差, 则 n

统计学--假设检验

统计学--假设检验
2. 所表达的含义是总体参数发生了变化或变量之间有某种关系 3. 备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收
集证据拒绝原假设,以支持备择假设 4. 总是有符号 , 或
– H1 : 某一数值 – H1 : 某一数值 – H1 : <某一数值
提出假设
(例题分析)
160 166 326
总的看, 白人有19/160=12% 的被告被判处死刑, 与 之对应, 黑人只有17/166=10% 的被告被判死刑, 白人死 刑率要高一些. 但如果考虑受害者的种族, 结论就相反 了. 当受害者是白人时, 有11/63=17.5% 的黑人被告被判 死刑, 而只有 19/151=12.6% 的白人被告被判死刑. 当受 害者是黑人时, 白人被告没一个人( 0%)被判死刑, 而黑 人被告确有 6/103=5.8% 的被判死刑.
抽样分布
Region of Rejection
拒绝H0

置信水平
1-
Region of Nonrejection
第7章 假设检验
统计名言
……正如一个法庭宣告某一判决 为“无罪(not guilty)”而不为“清白 (innocent)”,统计检验的结论也应 为“不拒绝”而不为“接受”。
——Jan Kmenta
案例
• 辛普森杀妻案
• 辛普森案 (英语:O. J. Simpson murder case,又称加利福尼亚人民诉 辛普森案,英语:People v.Simpson)是美国加利福尼亚州最高法院对 前美式橄榄球明星、演员O•J•辛普森进行的刑事诉讼,在该案中,辛普 森被指控于1994年犯下两宗谋杀罪,受害人为其前妻妮克尔•布朗•辛普 森及其好友罗纳德•高曼。该案被称为是美国历史上最受公众关注的刑事 审判案件。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

服从标准正态分布,即:
x 0 z= ~ N ( 0,1) σ n
§2.1 总体均值的检验
根据检验统计量计算公式计算检验统计量样本值 z,当显著 水平为α 时,查 Z 分布表:
在双侧检验中,如果 z≥ Z1α,则拒绝原假设 H0 ;反之,则不能拒绝 2 原假设。 在左侧检验中,如果 z < Z1α,则拒绝原假设;反之,则不能拒绝原 假设。 在右侧检验中,如果 z > Z1α ,则拒绝原假设;反之,则不能拒绝原 假设。
§2.1 总体均值的检验
【例7.1】某车间用一台包装机包装成品食盐,已知袋装食 盐的净重服从正态分布,且当机器正常时,其均值为0.5公 斤,标准差为0.005公斤。某日开工后要检验包装机是否正 常运作,随机抽取了40袋,称得净重如下(单位:公斤):
α 请检验机器是否处于正常运作状态?( = 0.05)
z= x 0 n
σ
=
1507.625 1500 = 3.05 > 1.645 10 16
因此,拒绝原假设H0,即认为该种新技术显著提高灯泡的使 用寿命。
§2.1 总体均值的检验
§2.1.2.小样本情况下
σ 1.正态总体, 已知 正态总体, x 0 采用统计量 z = 对样本均值进行检验 σ n
§1.1 假设检验的统计思想 假设检验的统计思想
统计思想: 统计思想:
小概率原理 反证法思想
主要表现: 主要表现:
1、主要理论依据是“小概率事件在现实中是不可能发生的” 这一概率思想。 2、采用的逻辑推理方法是反证法。
§1.2 基本概念及检验步骤
1.原假设与备择假设
原假设: 原假设:待检验的假设,也称为零假设。 备择假设: 备择假设:原假设的对立面,否定原假设后可供选择的假设。 例:某种饮料包装上注明“净含量500ml”,是否可信?
§1.2 基本概念及检验步骤
4.接受域与拒绝域
接受域:使原假设不能被拒绝的统计量所在区域。 拒绝域:使原假设能够被拒绝的统计量所在区域。也称否定域。
这两个区域是互补的关系,即检验统计量的实际值必落入且只能 落入其中一个区域,它们之间的分界线即临界值 临界值。 临界值
H 对于不同形式的假设, 0 的接受域和拒绝域不同。
2
2.正态总体, 2 未知 正态总体, σ
检验统计量 t =
x 0 服从自由度为( n 1)的 t 分布,由于σ 2未知,一般 σ n 用样本标准差 s 来代替总体标准差 σ ,即:
x 0 t= ~ t ( n 1) s n
§2.1 总体均值的检验
对于给定的显著性水平 α ,查 t 分布表: 在双侧检验中,当 t > tα /2 ( n 1) 时,拒绝原假设;反之,则不能拒绝
x 0 。 s n
由题中样本数据及已知条件得到: x = 1507.625 , 0 = 1500 , = 10.404 , = 0.05 , tα (15 ) = 1.753 s α 检验统计量 x 0 1507.625 1500 = = 2.932 > 1.753 t= s n 10.404 16 拒绝原假设 H 0 ,即认为该种新技术显著提高灯泡的使用寿命。
§2.2 总体比例的假设检验
检验未知的总体比例π 等于某一假设值 P0 设
H0 :π = P; H1 : π ≠ P0 0
H (或 H1 : π ≥ P0 ; 1 : π < P0 )
检验统计量 z = σ
用样本比例 p 来代替π ,因此检验统计量调整为:
z= p P0 p (1 p ) n
p P0 逼近正态分布,因未知σ n
解:首先设立原假设与备择假设: H 0 : = 0 = 0.5 ; H1 : ≠ 0 由题中样本数据及已知条件得到: s x = 0.4983 , 0 = 0.5 , ≈ 0.00655 , = 0.05 ,tα 2 ( 9 ) = 2.26 α
t = x 0 s n
=
0.4983 0.5 0.00655 10
§2.1 总体均值的检验
解:首先设立原假设与备择假设: H 0 : = 0 = 0.5 ; H 1 : ≠ 0 已知该总体服从正态分布及总体的标准差,故本题可以采用 Z 检验。 由题中样本数据及已知条件得到: x = 0.4989 , 0 = 0.5 , σ = 0.005 , n = 40 , α = 0.05 , Z1α 2 = 1.96 本题属于双侧检验,根据正态分布,有:
总体服从二项分布,样本量 n足够大且满足
p 的抽样分布可用正态分布近似。 p 的数学期望为 E(p) =π , p 的方差为 Var ( p ) = π (1 π ) , n
np > 5 时,比例 n (1 p ) > 5
样本比例经标准化后的随机变量则服从标准正态分布,即
z= p π ~ N (0,1) π (1 π ) n
左侧检验
右侧检验
如果需要判断参数是否偏大(偏小)的情况,则采取左侧 需要判断参数是否偏大(偏小) 需要判断参数是否偏大 (右侧)检验。
§1.2 基本概念及检验步骤
5.假设检验的具体步骤
(1)建立假设。 (2)确定检验统计量,并确定该统计量的分布情况, 然后依据样本信息计算该检验统计量的实际值。 (3)设定检验的显著性水平,并确定临界值。 (4)将检验统计量的实际值与临界值进行比较,做出 是否拒绝原假设的决策。
分类: 分类:
参数假设检验,简称参数检验; 非参数检验或者自由分布检验。
第七章
假设检验
§1
假设检验基本问题
§2 一个总体参数的检验 §3 二个总体参数的检验
§1 假设检验基本问题
§1.1 假设检验的统计思想 §1.2 基本概念及检验步骤 §1.3 关于 p 值 §1.4 两类错误 §1.5 假设的建立问题
§2 一个总体参数的检验
§2.1 总体均值的检验 §2.2 总体比例的假设检验 §2.3 正态总体的方差检验
§2.1 总体均值的检验
§2.1.1.大样本情况下 样本均值 x 的抽样分布均为正态分布,其数学期望为总体 均值 ,方差为 σ 2 n ,其中σ 2 为总体方差。 检验统计量
z= x 0 σ n
§1.5 假设的建立问题
实践中一般采取“原假设处于被保护地位 原假设处于被保护地位”的原则, 原假设处于被保护地位 即将没有充分理由便不能拒绝的命题作为原假设,其对 立面作为备择假设。
一般将已有的、固有的、经验的命题作为原假设,将想 要证明成立的命题作为备择假设,这样做可以有效减小 犯第一类错误的概率。
H1 : ≠ 500ml 该假设可以表达为: H 0 : = 500ml 其中,字母 H表示假设,下标0表示原假设,下标1表示备择假 设。
§1.2 基本概念及检验步骤
零假设与备择假设并不一定完全对称。 假设的形式: 假设的形式: 双侧检验:H 0 : = 0 H1 : ≠ 0 单侧检验 左侧检验: H 0 : = 0 H1 : < 0 (或者 H 0 : ≥0 ;H 1 : < 0 ) 右侧检验:H 0 : = 0 H1 : > 0 (或者 H 0 : ≤0 ; H1 : > 0 )
n = 200 ,p =
z =
157 α = 0.785 , = 0.05 , Z1α 2 = 1.96 200
§1.4 两类错误
进行假设检验时会犯两种错误:
①零假设正确却被拒绝,称之为“第I类错误”; ②零假设不正确却没有被拒绝,称之为“第II类错误”。
§1.4 两类错误
犯第I类错误的概率记为 α ,即前面提到的显著性水平。 犯第II类错误的概率记为 β 。 在一定样本容量下,减少 α 会引起 β 增大,减少 β 会引起 α 的增大。 假设检验中人们普遍执行同一准则: 首先控制弃真错误( 错误)。 首先控制弃真错误(α 错误)。
≈ 0.821 < tα 2 ( 9 ) = 2.26
因此,不能拒绝原假设H 0 ,即不能认为包装机器运作不正常。
§2.1 总体均值的检验
【例7.4】(续例7.2)若没有灯泡寿命标准差的经验数据, 试检验判断该种新技术是否显著提高灯泡的使用寿命。 ( α = 0.05 )
解:首先确定原假设与备择假设不变,但检验统计量换为 t =
原假设。 在左侧检验中,当 t < tα ( n 1) 时,拒绝原假设;反之,则不能拒绝 原假设。 在右侧检验中,当 t > tα ( n 1) 时,拒绝原假设;反之,则不能拒绝 原假设。
§2.1 总体均值的检验
【例7.3】(续例7.1)若其它条件不变,但抽查样本量减 为10,且事先并不知道机器正常时的标准差信息。试检验机 器是否处于正常运作状态?(α = 0.05 )
§2.1 总体均值的检验
§2.1.3.选择统计量的总结 . . .
如何选择检验统计量
大样本(
σ
σ
σ
σ
§2.1 总体均值的检验
§2.1.4.计算机实现结果
例:SPSS
SPSS软件中对原始数据(样本数据)是否服从正态分布、方 差是否已知并没有太多的条件限制,对于均值检验采用的统 计量均为t统计量。
§2.2 总体比例的假设检验
§1.2 基本概念及检验步骤
双侧检验的接受域为检验统计量分布曲线上两临界值之 双侧检验 间的区域,而拒绝域分别位于两端;
如果是只需判断有无显著差异 只需判断有无显著差异的情况,则采用双侧检验。 只需判断有无显著差异
§1.2 基本概念及检验步骤
左侧检验的拒绝域位于接受域的左侧; 左侧检验 右侧检验的拒绝域位于接受域的右侧。 右侧检验
§1.2 基Leabharlann 概念及检验步骤2.检验统计量
检验使用的统计量称为检验统计量 检验统计量的构造形式为:
检验统计量=
相关文档
最新文档