2019-2020年人教统编4-3非参数假设检验幻灯片
合集下载
非参数假设检验.pptx
取 1。.据9 此,我们可以用参数 的泊1松.9分布来
计算每分钟内通过收费站的汽车为0辆、1辆、2辆、3 辆、4辆或更多的概率。
第12页/共43页
e 各概率乘以观测总数n=100,便得到理论频数 ,具体结果见下表: i ei
计算 2统计量的值:
2 (14.96 10)2 (28.42 26)2 (27.0 35)2
H0 :汽车通过收费站的辆数服从泊松分布; H1 :不服从泊松分布。
观测值分为5组,且有 u0 10,u1 26,u2 35,u4 5
第11页/共43页
回忆泊松分布
P{X x} e x , x 0,1, 2,
x!
其中 为泊松分布的期望值,是未知的,需要用样
本观测值来估计。由于100分钟内观测到190辆汽车, 所以平均每分钟观测到190/100=1.9辆汽车,故
第9页/共43页
计算 2统计量的值:
2 6 (ui ei )2
i1
ei
(27 25)2 (18 25)2 (15 25)2 (24 25)2
25
25
25
25
(36 25)2 (30 25)2 12
25
25
在本例的情况下, 统2 计量的自由度为m-1=6-1=5。
第8页/共43页
解:本例中的观测值以月为组,共分为m=6组,
每 月的销售台数即为观测的频v数i ,观测的总次
数为n=150。现欲检验是否服从(离散的)均匀 分布,即每月的销售量是否为
ei
nPi
150 6
25(台),
Pi
1 6
,i
1,
,6
为此,设
H0 :洗衣机销售量服从均匀分布;
H1 :并不服从均匀分布;
计算每分钟内通过收费站的汽车为0辆、1辆、2辆、3 辆、4辆或更多的概率。
第12页/共43页
e 各概率乘以观测总数n=100,便得到理论频数 ,具体结果见下表: i ei
计算 2统计量的值:
2 (14.96 10)2 (28.42 26)2 (27.0 35)2
H0 :汽车通过收费站的辆数服从泊松分布; H1 :不服从泊松分布。
观测值分为5组,且有 u0 10,u1 26,u2 35,u4 5
第11页/共43页
回忆泊松分布
P{X x} e x , x 0,1, 2,
x!
其中 为泊松分布的期望值,是未知的,需要用样
本观测值来估计。由于100分钟内观测到190辆汽车, 所以平均每分钟观测到190/100=1.9辆汽车,故
第9页/共43页
计算 2统计量的值:
2 6 (ui ei )2
i1
ei
(27 25)2 (18 25)2 (15 25)2 (24 25)2
25
25
25
25
(36 25)2 (30 25)2 12
25
25
在本例的情况下, 统2 计量的自由度为m-1=6-1=5。
第8页/共43页
解:本例中的观测值以月为组,共分为m=6组,
每 月的销售台数即为观测的频v数i ,观测的总次
数为n=150。现欲检验是否服从(离散的)均匀 分布,即每月的销售量是否为
ei
nPi
150 6
25(台),
Pi
1 6
,i
1,
,6
为此,设
H0 :洗衣机销售量服从均匀分布;
H1 :并不服从均匀分布;
《非参数检验方法》课件
用于比较两个独立样本的中位数是否相等。
用于比较三个或多个独立样本的中位数是 否相等。
3 Wilcoxon符号秩检验
4 Friedmann检验
用于比较两个相关样本的中位数是否相等。
用于比较三个或多个相关样本的中位数是 否相康型”饮料,是否对销售额产生显著影响?
使用 Mann-Whitney U检验来比较推出“健康型”饮料前后的销售额差异。
案例2:针对不同年龄段顾客的购物偏好是否存在差异?
使用 Kruskal-Wallis H检验来分析不同年龄段顾客的购物偏好是否有显著差异。
总结
非参数检验方法的应用场景和局限性。非参数检验方法的总体流程。非参数 检验方法的意义及应用前景。
《非参数检验方法》PPT 课件
非参数检验方法PPT课件
简介
什么是非参数检验方法?为什么需要非参数检验方法?非参数检验方法的优 势和劣势。
基本原理
什么是假设检验?什么是零假设和备择假设?非参数检验方法与参数检验方 法的区别。
常见的非参数检验方法
1 Mann-Whitney U检验
2 Kruskal-Wallis H检验
非参数检验综合概述PPT(30张)
•
9、别再去抱怨身边人善变,多懂一些道理,明白一些事理,毕竟每个人都是越活越现实。
•
10、山有封顶,还有彼岸,慢慢长途,终有回转,余味苦涩,终有回甘。
•
11、人生就像是一个马尔可夫链,你的未来取决于你当下正在做的事,而无关于过去做完的事。
•
12、女人,要么有美貌,要么有智慧,如果两者你都不占绝对优势,那你就选择善良。
多个独立样本的非参数检验
例3 14名新生儿出生体重按其母亲的吸烟习惯分组(A组: 每日吸烟多于20支;B组:每日吸烟少于20支;C组:过去 吸烟而现已戒烟;D组:从不吸烟),具体如下。试问四个 吸烟组出生体重分布是否相同?数据见npc.sav:
A组: 2.7 2.4 2.2 3.4 B组: 2.9 3.2 3.2 C组: 3.3 3.6 3.4 3.4 D组: 3.5 3.6 3.7
两独立样本的非参数检验 (2) 检验统计量
分析结果
给 出 Mann-Whitney U 、 Wilcoxon W 统 计 量 和 Z 值 , 近 似 值 概 率 (Asymp.Sig)和精确概率值(Exact.sig)均小于0.05,结论一致,表明 猫、兔在缺氧条件下的生存时间的差异具有统计学意义,由平均秩次猫 (15.7)、兔(7.96)来看,可以认为缺氧条件下猫的生存时间长于兔。
•
3、命运给你一个比别人低的起点是想告诉你,让你用你的一生去奋斗出一个绝地反击的故事,所以有什么理由不努力!
•
4、心中没有过分的贪求,自然苦就少。口里不说多余的话,自然祸就少。腹内的食物能减少,自然病就少。思绪中没有过分欲,自然忧就少。大悲是无泪的,同样大悟无言。缘来尽量要惜,缘尽就放。人生本来就空,对人家笑笑,对自己笑笑,笑着看天下,看日出日落,花谢花开,岂不自在,哪里来的尘埃!
非参数假设检验方法课件
特点
非参数假设检验具有灵活性、稳 健性和适用范围广等优点,能够 处理更广泛的数据类型和分布情 况,不受特定参数假设的限制。
与参数检验的区别与联系
区别
参数检验基于对总体分布的参数假设 ,如正态分布等,而非参数检验则不 依赖于这些假设。
联系
非参数检验和参数检验都是为了对总 体进行推断,只是所依据的假设不同 。在实际应用中,可以根据具体情况 选择合适的检验方法。
大,可能会导致误判。
与参数检验的优缺点比较
适用范围
参数检验方法通常需要假定数据分布的形式,适用范围相对较窄 ;而非参数检验方法无需假定分布形式,适用范围更广。
解释性
参数检验方法通常可以提供具体的参数估计和效应量估计,解释性 较强;而非参数检验方法的解释性相对较差。
计算复杂性
参数检验方法的计算过程通常较为复杂,需要使用复杂的数学公式 和推导;而非参数检验方法的计算过程相对简单。
详细描述
符号检验通过计算两组数据中正例和负例的差异数,并利用二项分布的概率公 式来计算差异显著的p值。该方法适用于小样本数据,并且对数据的分布没有严 格要求。
威尔科克森符号秩检验
总结词
威尔科克森符号秩检验是用于比较两个独立样本的差异是否显著的统计方法。
详细描述
该方法通过比较两个样本的秩和,利用威尔科克森符号秩公式计算差异显著的p 值。该方法适用于处理数据量较小的情况,并且对数据的分布没有严格要求。
05
非参数假设检验的未来 发展与展望
现有研究的不足与局限性
方法适用范围有限
01
目前非参数假设检验方法主要适用于特定类型的数据和问题,
对于复杂数据或特定领域的适用性有待提高。
理论基础尚不完备
02
非参数假设检验具有灵活性、稳 健性和适用范围广等优点,能够 处理更广泛的数据类型和分布情 况,不受特定参数假设的限制。
与参数检验的区别与联系
区别
参数检验基于对总体分布的参数假设 ,如正态分布等,而非参数检验则不 依赖于这些假设。
联系
非参数检验和参数检验都是为了对总 体进行推断,只是所依据的假设不同 。在实际应用中,可以根据具体情况 选择合适的检验方法。
大,可能会导致误判。
与参数检验的优缺点比较
适用范围
参数检验方法通常需要假定数据分布的形式,适用范围相对较窄 ;而非参数检验方法无需假定分布形式,适用范围更广。
解释性
参数检验方法通常可以提供具体的参数估计和效应量估计,解释性 较强;而非参数检验方法的解释性相对较差。
计算复杂性
参数检验方法的计算过程通常较为复杂,需要使用复杂的数学公式 和推导;而非参数检验方法的计算过程相对简单。
详细描述
符号检验通过计算两组数据中正例和负例的差异数,并利用二项分布的概率公 式来计算差异显著的p值。该方法适用于小样本数据,并且对数据的分布没有严 格要求。
威尔科克森符号秩检验
总结词
威尔科克森符号秩检验是用于比较两个独立样本的差异是否显著的统计方法。
详细描述
该方法通过比较两个样本的秩和,利用威尔科克森符号秩公式计算差异显著的p 值。该方法适用于处理数据量较小的情况,并且对数据的分布没有严格要求。
05
非参数假设检验的未来 发展与展望
现有研究的不足与局限性
方法适用范围有限
01
目前非参数假设检验方法主要适用于特定类型的数据和问题,
对于复杂数据或特定领域的适用性有待提高。
理论基础尚不完备
02
假设检验 参数和非参数31页PPT
1、战争满足了,或曾经满足过人的 好斗的 本能, 但它同 时还满 足了人 对掠夺 ,破坏 以及残 酷的纪 律和专 制力的 欲望。 ——查·埃利奥 特 12、不应把纪律仅仅看成教育的手段 。纪律 是教育 过程的 结果, 首先是 学生集 体表现 在一切 生活领 域—— 生产、 日常生 活、学 校、文 化等领 域中努 力的结 果。— —马卡 连柯(名 言网)
13、遵守纪律的风气的培养,只有领 导者本 身在这 方面以 身作则 才能收 到成效 。—— 马卡连 柯 14、劳动者的组织性、纪律性、坚毅 精神以 及同全 世界劳 动者的 团结一 致,是 取得最 后胜利 的保证 。—— 列宁 摘自名言网
15、机会是不守纪律的。——雨果
31、只有永远躺在泥坑里的人,才不会再掉进坑里。——黑格尔 32、希望的灯一旦熄灭,生活刹那间变成了一片黑暗。——普列姆昌德 33、希望是人生的乳母。——科策布 34、形成天才的决定因素应该是勤奋。——郭沫若 35、学到很多东西的诀窍,就是一下子不要学很多。——洛克
13、遵守纪律的风气的培养,只有领 导者本 身在这 方面以 身作则 才能收 到成效 。—— 马卡连 柯 14、劳动者的组织性、纪律性、坚毅 精神以 及同全 世界劳 动者的 团结一 致,是 取得最 后胜利 的保证 。—— 列宁 摘自名言网
15、机会是不守纪律的。——雨果
31、只有永远躺在泥坑里的人,才不会再掉进坑里。——黑格尔 32、希望的灯一旦熄灭,生活刹那间变成了一片黑暗。——普列姆昌德 33、希望是人生的乳母。——科策布 34、形成天才的决定因素应该是勤奋。——郭沫若 35、学到很多东西的诀窍,就是一下子不要学很多。——洛克
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
未落入拒绝域,即认为是均匀的。
例2.试检验每年爆发战争次数分布是否服从泊松分布. 解: 这是一个分布的拟合优度检验,提出假设:H0: X ~P(λ)
由观察值,得参数λ的最大似然估计为
ˆ x 0.69
按参数为 0.69 的泊松分布,计算事件X=i 的概率 pi ,
pi 的估计是 pˆ i e0.69 0.69i i !
(k
r
1)}
(估计r 个参数)
如果根据所给的样本值 x1, x2, .., xn 算得统计量χ2 的实 测值落入拒绝域,则拒绝原假设;否则就认为差异不显
著而接受原假设.
注:皮尔逊定理是在 n 无限增大时推导出来的, 因而使用时要注意 n 要足够大以及 npi 不太小这两个 条件. 根据计算实践,要求 n 不小于 50 以及 npi 不小 于 5. 否则应适当合并相邻区间,使 npi 满足此要求 .
2 1
(k
1)
2 0.95
(5)
11.0705
由样本,得检验统计量的值:(其中分子中的10是60*1/6)
2 k (ni npi )2 (7 10)2 (8 10)2 .... (13 10)2 2.8 11.0705
i 1
npi
10
10
10
一、χ2拟合优度检验
χ2 检验法是在总体X 的分布未知时,根据来自总体的样
本,检验关于总体分布的假设的一种检验方法. 基本思想: 提出原假设:
H0:总体 X 的分布函数为 F(x)
然后根据样本的经验分布和所假设的理论分布 之间的吻合程度来决定是否接受原假设.这种检验通 常称作拟合优度检验,它是一种非参数检验.
i 1
npi
在理论分布 已知的条件下,
第三节 非参数假设检验
一、总体分布函数的假设检验 二、独立性假设检验 三、两总体分布比较的假设检验
问题的背景:
前面已经研究了假设检验的基本思想,并讨论了 当总体分布已知时,关于其中未知参数的假设检验问 题.
然而可能遇到这样的情形,总体服从何种理论分 布并不知道,要求我们直接对总体分布提出一个假 设.
又α = 0.05,自由度为 2,查χ2分布表得:
2 1
(k
1
1)
2 0.95
(2)
5.9915
由样本,得检验统计量的值:
2 4 (ni npi )2 2.673 5.9915 未落入拒绝域, i1 npi 故认为每年发生战争次数 X 服从参数为 0.69 的泊松分布.
实测频数
ni npi
理论频数
它标志着经验分布与理论分布之间的差异的大小.
4.皮尔逊引进如下统计量表示经验分布与理论分布之
间的差异:
其分布是什么?
2 k (ni npi )2
i 1
npi
在理论分布 已知的条件下,
npi 是常量
Pearson证明了如下定理:
若原假设中的理论分布 F(x) 已经完全给定,那 么当 n 充分大时,统计量
~ 2 k (ni npˆi )2
2 (k r 1)
i1 npˆi
根据以上定理,对给定的显著性水平α ,
查χ2 分布表可得临界值χ21-α
,使得
P( 2
2 1
)
分别得拒绝域:
W
{ 2
2 1
(k
1)}
(不需估计参数)
W
{ 2论分布,可以算出总体 X 的值落入每
个 Ai 的概率 pi ,于是 npi 就是落入 Ai 的样本值的理论 频数.
实测频数
ni npi
理论频数
它标志着经验分布与理论分布之间的差异的大小.
4.皮尔逊引进如下统计量表示经验分布与理论分布之
间的差异:
其分布是什么?
2 k (ni npi )2
基本原理和步骤如下:(总体分布取值有限)
1. 将总体 X 的取值为 a1, a2, …, ak .
2. 把取值为 ai 的样本值的个数记作 ni ,称为实测 频数. 所有实测频数之和 n1+ n2+ …+nk 等于样本容 量 n.
H0:P(X=ai) =pi , i=1,2,…, k.
3.根据所假设的理论分布,可以算出 npi 就是落入 X 取 值为 ai 的样本值的理论频数.
i = 0, 1, 2, 3, 4
将有关计算结果列表如下:
pˆ i
npˆ i
(ni n pi )2 n pi
注:将n pˆi<5 的组予以合
并,即将发
生3次及以上
次数的组归
并为一组.
≥3
13.91
检验的拒绝域为:
W
{ 2
2 1
(k
1 1)}
因假设的理论分布中有一个未知参数,即r = 1,又 k =4, 故自由 度为 4-1-1=2.
例1. 掷一颗骰子 60 次,结果如下:试在α= 0.05 水平 下检验其是否均匀?
解: 这是一个分布的拟合优度检验,记出现点数 i 的概
率为 pi , 提出假设:
H0
:
p1
p2
...
p6
1 6
检验的拒绝域为:
W
{ 2
2 1
(k
1)}
现在α = 0.05,k = 6,查表得
基本原理和步骤如下:(连续型随机变量总体)
1. 将总体 X 的取值范围分成 k 个互不重迭的小区 间(或小组), 记作 A1, A2, …, Ak .
2. 把落入第 i 个小区间 Ai 的样本值的个数记作 ni ,称为实测频数. 所有实测频数之和 n1+ n2+ …+nk 等于样本容量 n.
H0:P(Ai) =pi , i=1,2,….k.
~ 2 k (ni npi )2
2(k 1)
i1 npi
注: 若在 H0下分布类型已知,但其参数未知,这时需要 先用极大似然估计法估计参数,然后作检验.
Fisher证明了如下定理:
若原假设中的理论分布 F(x) 中有 r 个未知参数 需用相应的最大似然估计来代替,那么当 n 充分大 时,统计量
例如,从 1500 到 1931 年的 432 年间,每年爆发战 争的次数可以看作一个随机变量,椐统计,这 432 年间 共爆发了 299 次战争,具体数据如下:
战争次数 X
0 1 2 3 4
发生X 次战争的年 数
223
142 48 15 4
Poisson分布?
对总体分布进行检验的问题称为分布的拟合检验.