非参数统计Kolmogorov-Smirnov检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非参数统计期末大作业
一、Wilcoxon 符号秩检验
某个公司为了争夺竞争对手的市场,决定多公司重新定位进行宣传。在广告创意 中,预计广告投放后会产生效果。一组不看广告组和一组看广告,抽取 16 位被 调查者,让起给产品打分。现有数据如下 不看广告 看广告 62 87 83 92 96 90 99 86 71 94 60 95 97 82 100 91
两种通信套餐的用户年龄
套餐 1 18 18 25 22 24 套餐 2 22 48 51 34 42
23 26
26 44 31 38
分析两种套餐的目标市场年龄的分布是否存在显著性差异。 1、手算 建立假设: H0:两种套餐的目标市场年龄分布不存在显著差异 H1:两种套餐的目标市场年龄分布存在显著差异 检验统计量 D 的计算表 年龄 18 18 22 23 24 25 26 31 34 38 42 44 48 51 f1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 f2 0 0 1 0 0 0 1 1 1 1 1 1 1 1 1 2 3 4 5 6 7 7 7 7 7 7 7 7 f1 0 0 1 1 1 1 2 3 4 5 6 7 8 9 f2 S1(x) 1/7 2/7 3/7 4/7 5/7 6/7 1 1 1 1 1 1 1 1 S2(x) 0 0 1/9 1/9 1/9 1/9 2/9 3/9 4/9 5/9 6/9 7/9 8/9 1 S1(x)- S2(x) 1/7 2/7 20/63 29/63 38/63 47/63 7/9 6/9 5/9 4/9 3/9 2/9 1/9 0
输出结果如下(输出3);
Frequencies 运营商 年龄 1 2 Total N 7 9 16
Test Statistics
a
年龄 Most Extreme Differences Absolute Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) Exact Sig. (2-tailed) Point Probability a. Grouping Variable: 运营商 .778 .000 -.778 1.543 .017 .008 .006
由上表:精确计算的双尾 P 值为 0.008,与手算结果一致,表明两种套餐的 目标市场年龄分布存在显著差异。
二、Wald-Wolfowitz
游程检验
有低蛋白和高蛋白两种料喂养大白鼠, 以比较它们对大白鼠体重的增加是否 有显著不同的影响,为此对m=10,n=10只大白鼠分别喂养低蛋白和高蛋白两种饲 料,得增重量X,Y(单位:g)的表如下:
饲料 低蛋白 X 高蛋白 Y 64 42 71 52 72 61 75 65 82 69 增重量 83 75 84 78 90 78 91 78 96 81
在非参数检验中选择两个独立样本检验:
对话框: 运营商 1 和 2 分类的变量输入到 Grouping Variable,在 Define Groups 输入 1 和 2。 在 Test Type 选中 Kolmogorov-Smirnov。 在ቤተ መጻሕፍቲ ባይዱExact时打开的对话框中可以选择精确方法(Exact) 。
给定显著性水平 =0.05,试用游程检验法检验两种饲料的影响有无显著差异。 1、手算 建立假设: H0:两种饲料对大白鼠无显著差异 H1:两种饲料对大白鼠有显著差异 将X,Y的数据按从小到大混合排列,得X,Y的混合样本序列: Y Y Y X Y Y X X X Y Y Y Y Y X X X X X X 故得游程总数U=6, m=10,n=10,查表得,U=6的概率为0.019,由于是双 侧检验,对于显著性水平α=0.05,对应的P值为2× 0.019 = 0.038 < ������. ������5,因 此拒绝原假设,即表明两种饲料对大白鼠有显著差异。 2、Spss 在spss中输入数据(数据2)
在非参数检验中选择两个独立样本检验
对话框: 在Define Groups输入1和2。 在Test Type选中Wald-Wolfowitz runs。
输出结果如下(输出2):
Frequencies 分组 增重量 1 2 Total N 10 10 20
Test Statistics
b,c
Exact Sig. Number of Runs 增重量 Minimum Possible Maximum Possible a. There are 2 inter-group ties involving 4 cases. b. Wald-Wolfowitz Test c. Grouping Variable: 分组 6 8
分析广告效应是否显著。 1、手算 建立假设: H0:广告效应不显著 H1:广告效应显著 不看广告组记为 x,看广告组记为 y。 检验统计量计算表
X 62 83 96 99 71 60 97 100 Y 87 92 90 86 94 95 82 91 D=x-y -25 -9 6 13 -23 -35 15 9 |D| 25 9 6 13 23 35 15 9 |D|的秩 7 2.5 1 4 6 8 5 2.5 D 的符号 + + + +
由表可知: T+=1+4+5+2.5=12.5 T-=7+2.5+6+8=23.5 根据n=8, T+和T-中较大者T-=23.5, 查表得, T+的右尾概率为0.230到0.273, 在显著性水平α = 0.05下,P值显然较大,故没有理由拒绝原假设,表明广告效 应不显著。
2、Spss 在spss中输入八组数据(数据1):
a
.441
由上表,Z为负,说明是以负秩为基础计算的结果,其相应的双侧渐进显著 性结果为0.441,明显大于0.05,因此在α = 0.05的显著性水平下,没有理由拒 绝原假设,即表明广告效应不显著,与手算的结论一致。 3、R语言(R语言1) 输入语句: x=c(62,83,96,99,71,60,97,100) y=c(87,92,90,86,94,95,82,91) wilcox.test(x,y,exact=F,cor=F) 输出结果: Wilcoxon rank sum test data: x and y W = 33, p-value = 0.9164 alternative hypothesis: true location shift is not equal to 0 由输出结果可知,P=0.9164,远大于 =0.05,因此没有理由拒绝原假设, 即广告效应并不显著,与以上结果一致。
4
b
5.88
23.50
0
c
8
由上表,负秩为4,正秩也为4,同分的情况为0,总共8。负秩和为12.5,正 秩和为23.5,与手算结果一致
Test Statistics
b
看广告 - 不看广 告 Z Asymp. Sig. (2-tailed) a. Based on negative ranks. b. Wilcoxon Signed Ranks Test -.771
7
由上表, 找出检验统计量 D=max S1 x S 2 x =7/9, m=7, n=9, mnD=7 × 9 × 9 = 49,查表得,相应的 P 值为 0.008,在 5%的显著性水平上,P 值足够小,因 此拒绝原假设,表明两种套餐的目标市场年龄分布存在显著差异。
2、spss 输入数据(数据 3)
选择非参数检验中的两个相关样本检验
对话框中选择Wilcoxon,输出如下结果(输出1):
Ranks N 看广告 - 不看广告 Negative Ranks 4
a
Mean Rank 3.12
Sum of Ranks 12.50
Positive Ranks Ties Total a. 看广告 < 不看广告 b. 看广告 > 不看广告 c. 看广告 = 不看广告
a
Z -2.068 -1.149
(1-tailed) .019 .128
a
由上表,P值与手算结果一致,因此也拒绝原假设,即表明两种饲料对大白 鼠有显著差异。
三、Kolmogorov-Smirnov 检验
为了研究两家电信运营商套餐在目标市场的年龄维度上的分布是否相同, 该电信 运营公司开展了一个社会调查活动。 数据如下:
一、Wilcoxon 符号秩检验
某个公司为了争夺竞争对手的市场,决定多公司重新定位进行宣传。在广告创意 中,预计广告投放后会产生效果。一组不看广告组和一组看广告,抽取 16 位被 调查者,让起给产品打分。现有数据如下 不看广告 看广告 62 87 83 92 96 90 99 86 71 94 60 95 97 82 100 91
两种通信套餐的用户年龄
套餐 1 18 18 25 22 24 套餐 2 22 48 51 34 42
23 26
26 44 31 38
分析两种套餐的目标市场年龄的分布是否存在显著性差异。 1、手算 建立假设: H0:两种套餐的目标市场年龄分布不存在显著差异 H1:两种套餐的目标市场年龄分布存在显著差异 检验统计量 D 的计算表 年龄 18 18 22 23 24 25 26 31 34 38 42 44 48 51 f1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 f2 0 0 1 0 0 0 1 1 1 1 1 1 1 1 1 2 3 4 5 6 7 7 7 7 7 7 7 7 f1 0 0 1 1 1 1 2 3 4 5 6 7 8 9 f2 S1(x) 1/7 2/7 3/7 4/7 5/7 6/7 1 1 1 1 1 1 1 1 S2(x) 0 0 1/9 1/9 1/9 1/9 2/9 3/9 4/9 5/9 6/9 7/9 8/9 1 S1(x)- S2(x) 1/7 2/7 20/63 29/63 38/63 47/63 7/9 6/9 5/9 4/9 3/9 2/9 1/9 0
输出结果如下(输出3);
Frequencies 运营商 年龄 1 2 Total N 7 9 16
Test Statistics
a
年龄 Most Extreme Differences Absolute Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) Exact Sig. (2-tailed) Point Probability a. Grouping Variable: 运营商 .778 .000 -.778 1.543 .017 .008 .006
由上表:精确计算的双尾 P 值为 0.008,与手算结果一致,表明两种套餐的 目标市场年龄分布存在显著差异。
二、Wald-Wolfowitz
游程检验
有低蛋白和高蛋白两种料喂养大白鼠, 以比较它们对大白鼠体重的增加是否 有显著不同的影响,为此对m=10,n=10只大白鼠分别喂养低蛋白和高蛋白两种饲 料,得增重量X,Y(单位:g)的表如下:
饲料 低蛋白 X 高蛋白 Y 64 42 71 52 72 61 75 65 82 69 增重量 83 75 84 78 90 78 91 78 96 81
在非参数检验中选择两个独立样本检验:
对话框: 运营商 1 和 2 分类的变量输入到 Grouping Variable,在 Define Groups 输入 1 和 2。 在 Test Type 选中 Kolmogorov-Smirnov。 在ቤተ መጻሕፍቲ ባይዱExact时打开的对话框中可以选择精确方法(Exact) 。
给定显著性水平 =0.05,试用游程检验法检验两种饲料的影响有无显著差异。 1、手算 建立假设: H0:两种饲料对大白鼠无显著差异 H1:两种饲料对大白鼠有显著差异 将X,Y的数据按从小到大混合排列,得X,Y的混合样本序列: Y Y Y X Y Y X X X Y Y Y Y Y X X X X X X 故得游程总数U=6, m=10,n=10,查表得,U=6的概率为0.019,由于是双 侧检验,对于显著性水平α=0.05,对应的P值为2× 0.019 = 0.038 < ������. ������5,因 此拒绝原假设,即表明两种饲料对大白鼠有显著差异。 2、Spss 在spss中输入数据(数据2)
在非参数检验中选择两个独立样本检验
对话框: 在Define Groups输入1和2。 在Test Type选中Wald-Wolfowitz runs。
输出结果如下(输出2):
Frequencies 分组 增重量 1 2 Total N 10 10 20
Test Statistics
b,c
Exact Sig. Number of Runs 增重量 Minimum Possible Maximum Possible a. There are 2 inter-group ties involving 4 cases. b. Wald-Wolfowitz Test c. Grouping Variable: 分组 6 8
分析广告效应是否显著。 1、手算 建立假设: H0:广告效应不显著 H1:广告效应显著 不看广告组记为 x,看广告组记为 y。 检验统计量计算表
X 62 83 96 99 71 60 97 100 Y 87 92 90 86 94 95 82 91 D=x-y -25 -9 6 13 -23 -35 15 9 |D| 25 9 6 13 23 35 15 9 |D|的秩 7 2.5 1 4 6 8 5 2.5 D 的符号 + + + +
由表可知: T+=1+4+5+2.5=12.5 T-=7+2.5+6+8=23.5 根据n=8, T+和T-中较大者T-=23.5, 查表得, T+的右尾概率为0.230到0.273, 在显著性水平α = 0.05下,P值显然较大,故没有理由拒绝原假设,表明广告效 应不显著。
2、Spss 在spss中输入八组数据(数据1):
a
.441
由上表,Z为负,说明是以负秩为基础计算的结果,其相应的双侧渐进显著 性结果为0.441,明显大于0.05,因此在α = 0.05的显著性水平下,没有理由拒 绝原假设,即表明广告效应不显著,与手算的结论一致。 3、R语言(R语言1) 输入语句: x=c(62,83,96,99,71,60,97,100) y=c(87,92,90,86,94,95,82,91) wilcox.test(x,y,exact=F,cor=F) 输出结果: Wilcoxon rank sum test data: x and y W = 33, p-value = 0.9164 alternative hypothesis: true location shift is not equal to 0 由输出结果可知,P=0.9164,远大于 =0.05,因此没有理由拒绝原假设, 即广告效应并不显著,与以上结果一致。
4
b
5.88
23.50
0
c
8
由上表,负秩为4,正秩也为4,同分的情况为0,总共8。负秩和为12.5,正 秩和为23.5,与手算结果一致
Test Statistics
b
看广告 - 不看广 告 Z Asymp. Sig. (2-tailed) a. Based on negative ranks. b. Wilcoxon Signed Ranks Test -.771
7
由上表, 找出检验统计量 D=max S1 x S 2 x =7/9, m=7, n=9, mnD=7 × 9 × 9 = 49,查表得,相应的 P 值为 0.008,在 5%的显著性水平上,P 值足够小,因 此拒绝原假设,表明两种套餐的目标市场年龄分布存在显著差异。
2、spss 输入数据(数据 3)
选择非参数检验中的两个相关样本检验
对话框中选择Wilcoxon,输出如下结果(输出1):
Ranks N 看广告 - 不看广告 Negative Ranks 4
a
Mean Rank 3.12
Sum of Ranks 12.50
Positive Ranks Ties Total a. 看广告 < 不看广告 b. 看广告 > 不看广告 c. 看广告 = 不看广告
a
Z -2.068 -1.149
(1-tailed) .019 .128
a
由上表,P值与手算结果一致,因此也拒绝原假设,即表明两种饲料对大白 鼠有显著差异。
三、Kolmogorov-Smirnov 检验
为了研究两家电信运营商套餐在目标市场的年龄维度上的分布是否相同, 该电信 运营公司开展了一个社会调查活动。 数据如下: