第7讲 独立样本(两样本)非参数检验2:KS检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二班累 计频率
?
4
5 6 7 11 9 1 1
谁做统计量比较合适呢?
1 - 10
作者:刘永亮,河北大学经济学院
非参数 统计
统计量
•
•
累计频率差的绝对值的最大值,即两样 本KS统计量。 发明者是:科尔莫哥洛夫和斯米尔诺夫
1 - 11
作者:刘永亮,河北大学经济学院
非参数 统计
两样本KS检验的步骤
• • •
样本容量不相 等时, 注意1: 小的为m 注意2: p是接受 域的概率(1-α)
1 - 13
作者:刘永亮,河北大学经济学院
非参数 统计
1 - 14
作者:刘永亮,河北大学经济学院
非参数 统计
1 - 15
资料来源:《非参数统计方法(1995)》P236-237
作者:刘永亮,河北大学经济学院
非参数 统计
统计量 D=0.71,大于临界值0.5,落在拒绝域 拒绝零假设,两班员工被投诉分布不同,即两班员工服务 质量存在显著差异。
1 - 18
作者:刘永亮,河北大学经济学院
非参数 统计 ☆
K-S双样本检验的SPSS实现
可以用SPSS直接打开Excel文件,操作 :文件—打开—数据,
软件实现过程(数据见“投诉.xls”和信息台.sav)
U秩和检验临界值表
•
来源:吴喜之《非参数统计》表5
1-3
作者:刘永亮,河北大学经济学院
非参数 统计
1-4
作者:刘永亮,河北大学经济学院
非参数 统计
1-5
作者:刘永亮,河北大学经济学院
非参数 统计
1-6
作者:刘永亮,河北大学经济学院
非参数 统计 打开“信息台.xls”,计算U统计量 U1=Wx-n*(n+1)/2=80.5-66=14.5 U2=Wy- m*(m+1)/2=129.5-45=84.5 U=14.5(取小的) 查表得临界值:n=11,m=9,α=0.05, 临界值为28, U<28,拒绝原假设,认为差异显著。
• • •
第一步,提出假设。H0:两组分布相同。 H1:两组分布不同。 脑筋急转弯:若H0:两组均值相同; H1: 两组均值不同。可否?有何区别? 第二步,计算统计量D,累计频率的最 大差值(绝对值)。 第三步,查表;最后,下结论。 关键点:右边检验
作者:刘永亮,河北大学经济学院
1 - 12
非参数D的分布表:小样本查表,大样本用近似公式 统计
第一班被投诉次数 2 0 7 1 1 0 1 2 1 2 4
第二班被投诉次数
3 5 4 2 3 7 4 4 6
请问两班的服务水平是否相同?用Mann Whitney U检 验 附Mann-Whitney临界值表和Excel数据文件:信息台.xls )。
1-2
作者:刘永亮,河北大学经济学院
非参数 Mann-Whitney 统计
它除以2,得 单边检验的P 值。
1 - 23
作者:刘永亮,河北大学经济学院
非参数 统计 两样本KS检验的R软件操作
x=c(2,0,7,1,1,0,1,2,1,2,4) y=c(3,5,4,2,3,7,4,4,6) ks.test(x,y) 结果:
1 - 24
作者:刘永亮,河北大学经济学院
非参数 统计
1 - 19
要选择Excel类型
作者:刘永亮,河北大学经济学院
非参数 统计 (1)SPSS数据文件,如图所示。
1 - 20
作者:刘永亮,河北大学经济学院
非参数 (2统计 )分析→非参数检验→旧对话框--两个独立样本
1 - 21
作者:刘永亮,河北大学经济学院
非参数 ☆ ຫໍສະໝຸດ Baidu计
K-S双样本检验的软件实现
上面有无不妥?
• • •
•
本是右边检验。应该 ks.test(x,y,alternative="g") #注:12统计李佳发现,此处不能用简 写alt 或双边的P值除以2.
1 - 25
作者:刘永亮,河北大学经济学院
非参数 统计
作业
提示:这是连续型变量,需要分组
1 - 26
作者:刘永亮,河北大学经济学院
非参数 统计
承上,温故
1、上次课讲了什么统计方法? Wilcoxon检验和? Mann-Whitney U检验 2、它们有什么用? 检验两个总体的均值是否相等。 3、怎么做?
1-1
作者:刘永亮,河北大学经济学院
非参数 统计 实战检验
例题:某信息咨询台有两班次员工,第一班11人, 第二班9人,某月被投诉情况如下表:
1-7
作者:刘永亮,河北大学经济学院
非参数 统计
启下,知新
第7 讲
两样本KS检验
1-8
作者:刘永亮,河北大学经济学院
非参数 统计
看例题,思考
•
创新思考
1-9
作者:刘永亮,河北大学经济学院
非参数 统计
求两组的累计频率
投诉次数 0 1 2 3
第一班频数
第二班频 数
第一班累计频数
第二班累计频数
第一班累 计频率
(3)设置对话框
1 - 22
作者:刘永亮,河北大学经济学院
非参数 统计 ☆
K-S双样本检验的软件实现
(4)结果解读
Frequencies 投 诉 次数 分 类 变量 1 2 Total N 11 9 20
Test Statisticsa Most Extreme Differences Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Grouping Variable: 分 类 变量 Absolute Positive Negative 投 诉 次数 .707 .707 .000 1.573 .014
容量相等时D的分布表:
1 - 16
作者:刘永亮,河北大学经济学院
非参数 统计
1 - 17
作者:刘永亮,河北大学经济学院
非参数 统计 K-S双样本检验的例题结果 ☆
样本容量 n 11 , m 9 和显著性水平 0.05 ,查不等容量 K-S 双样本检验临界值表,得 否定域为:
D D 0.5