两配对样本符号秩检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Wilcoxon符号秩检验
14 - 26 2018-9-30
统计学
STATISTICS (第五版)
Wilcoxon符号秩检验
计算各样本观察值与假定的中位数的差值, 并取绝对值 将差值的绝对值排序,并找出它们的秩 计算检验统计量和P值,并作出决策
14 - 25 2018-9-30
统计学
STATISTICS (第五版)
Wilcoxon符号秩检验
(SPSS Wilcoxon test)
第 1 步:选择【分析】【非参数检验 -2 个相关样 本】主对话框 第2步:将两个变量同时选入【检验对】,(“零件 长度”和“假设中位数”) 第3步:在【检验类型】下选择【Wilcoxon】, 点击【精确】并选择【精确】,返回主 对话框,点击【确定】
14 - 6 2018-9-30
第 14 章 非参数检验
14.1 单样本的检验
14.1.1 总体分布类型的检验 14.1.2 中位数的符号检验 14.1.3 Wilcoxon符号秩检验
14.1 单样本的检验 14.1.1 总体分布类型的检验
统计学
STATISTICS (第五版)
总体分布类型的检验
建国门—王府井 燕莎 西单—金融街 中关村 亚奥
华 夏 时 报 》 自 国贸—京广 990 称是中国第一 份 商 圈 社 区 报 , 20 精准覆盖北京 44 636 座 写 字 楼 265 ( 公寓 )70000 实 125 名精英读者的 78 精神咖啡 30 2005 年 8 月 29 8 日的华夏时报 10 公布了该报最 134 新的发行量数 20 据,并声明是 18 “最新发行数 10 据诚信公告”
15
59 10 50
291 126 250
218 42 89
10 196 8
67 60 52
39
22 53 47 144 151 181 78 11 23 93
118
103 20 77 217 151 90 3 139 18 30
289
40 171 35 171 109 51 64 13 62 92
(二项分布检验)
二项分布检验(binomial test)是通过考察二分类变量的每个类 别中观察值的频数与特定二项分布下的期望频数之间是否存 在显著差异,来判断抽取样本所依赖的总体是否服从特定概 率为P的二项分布 二项分布检验的原假设是:抽取样本所依赖的总体与特定的 二项分布无显著差异 根据二项分布知识,一个服从二项分布的随机变量,在n次试 验中,出现“成功”的次数的概率为
(使用SPSS中的【Nonparametric Tests-2 Related Samples】选项也可以作 上述检验)
14 - 21 2018-9-30
14.1 单样本的检验 14.1.3 Wilcoxon符号秩检验
统计学
STATISTICS (第五版)
秩的概念
(rank)
秩就是一组数据按照从小到大的顺序排列之后, 每一个观测值所在的位置 用一般符号R来表示,假定一组数据 X1 , X 2 , , X n, 按照从小到大的顺序排列, X i 在所有观测值中排 第 Ri 位,那么 X i的秩即为 Ri Ri 也是一个统计量,它测度的是数据观测值的相 对大小,大多数非参数检验方法正是利用秩的这 一性质来排除总体分布未知的障碍的。当然,也 有一些非参数方法并不涉及秩的性质
(二项分布检验)
【例14-1】根据以往的生产数据,某种产品的合 格率为 90% 。现从中随机抽取 25 个进行检测 ,合格品为 20个。检验该批产品的合格率是 否为90%?(产品合格率X~B(n,0.9))
SPSS的数据格式 合格品 1 0 频数 20 5
表中的“1”表示合格品;“0”表示不合格品
14 - 10 2018-9-30
14 - 24 2018-9-30
统计学
STATISTICS (第五版)
Wilcoxon符号秩检验
(Wilcoxon signed ranks test)
检验总体参数(如中位数)是否等于某个假定的 值。它是对符号检验的一种改进,弥补了符 号检验的不足,要比单纯的符号检验更准确 一些(对应的参数检验—单样本均值检验) 检验步骤
P( X x) C nx p x q n x
若“成功”的次数的概率小于给定的显著性水平,则拒绝原 假设,表明抽取样本所依赖的总体与特定概率为 p的二项分布 有显著差异(样本数据不是来自某个特定概率为p的二项分布)
2018-9-30
14 - 9
统计学
STATISTICS (第五版)
总体分布类型的检验
统 计 学 数据分析
(方法与案例)
作者 贾俊平
统计学
STATISTICS (第五版)
统计名言
对正确问题的近似答案,胜过对 错的问题的精确答案。
——John W.Tukey
14 - 2 2018-9-30
第 14 章 非参数检验
14.1 单样本的检验 14.2 两个及两个以上样本的检验 14.3 秩相关及பைடு நூலகம்检验
检验该供货商生产的配件长度是否服从正态分 布?(=0.05)
14 - 14
2018-9-30
统计学
STATISTICS (第五版)
总体分布类型的检验
(SPSS K-S检验)
第 1 步:选择【分析】【非参数检验】【1- 样 本 K-S】进入主对话框 第2步:将待检验的变量选入【检验变量列表】(本 例为“配件长度”) 第3步:点击【精确】,并在对话框中选择 【精确】,点击【确定】
2018-9-30
统计学
STATISTICS (第五版)
中位数的符号检验
(sign test)
【例14-3】某企业生产一种零件,规定其长度的中位 数为15厘米,现从某天生产的一批零件中随机抽 取16只,测得其长度(单位:cm)如下
15.1 14.5 14.8 14.6 15.2 14.8 14.8 14.6
二项分布检验
14 - 11 2018-9-30
统计学
STATISTICS (第五版)
总体分布类型的检验
(SPSS binomial test)
二项分布检验
【例14.1】输出结果
表中的合格品的观察比例为0.8,检验比例为0.9。精确单尾概 率为 0.098 ,它表示如果该批产品的合格率为 0.9 ,那么 25 个 产品中合格品数量小于等于 20 个的概率为 0.098 。 P>0.05, 不 拒绝原假设,没有证据表明该批产品的合格率不是0.9
2018-9-30
14 - 12
统计学
STATISTICS (第五版)
总体分布类型的检验
(K-S检验)
单样本的 K-S 检验 (Kolmogorov-Smirnov 检验 ) 是用来 检验抽取样本所依赖的总体是否服从某一理论分布 其方法是将某一变量的累积分布函数与特定的分布函 数进行比较。设总体的累积分布函数为F(x),已知的 理论分布函数为 F0(x) ,则检验的原假设和备择假设 为 H0: F(x)=F0(x) ; H1: F(x)≠F0(x) 原假设所表达的是:抽取样本所依赖的总体与指定的 理论分布无显著差异 SPSS 提供的理论分布有正态分布、 Poisson 分布、 均匀分布、指数分布等
14.8 15.1 15.3 14.7 15.0 15.2 15.1 14.7 检验该企业生产零件的中位数与15cm是否有显著 差异?(=0.05)
14 - 19
2018-9-30
统计学
STATISTICS (第五版)
中位数的符号检验
(SPSS sign test)
第 1 步:选择【分析】【非参数检验 - 二项式】选项 进入主对话框 第2步:将待检验的变量选入【检验变量列表】(本例 为“零件长度”) 第3步:点击【定义二分法】,中在【割点】框中输入 总体中位数的假设值15, 在【检验比例】框内输入二项分布的参 数0.5,点击【确定】
14 - 23 2018-9-30
统计学
STATISTICS (第五版)
结的处理
(ties)
很多情况下,数据中会出现相同的观测值,那么 对它们进行排序后,这些相同观测值的排名显然 是并列的,也就是说它们的秩是相等的,这种情 况被称为数据中的“结” 对于结的处理,通常是以它们排序后所处位置的 平均值作为它们共同的秩 当一个数据中结比较多时,某些非参数检验中原 假设下检验统计量的分布就会受到影响,从而需 要对统计量进行修正 ( 一般情况下,软件会自动 作出修正)
符号检验
14 - 20 2018-9-30
统计学
STATISTICS (第五版)
中位数的符号检验
(SPSS sign test)
符号检验
【例14-3】输出结果
零件长度小于等于中位数的有10个,大于中位数的只有6个。 而参数为 (16,0.5) 的二项分布变量大于等于 15 的概率为 0.227 。精确双尾概率为 P=0.454>0.05 ,不拒绝原假设。没有证据 表明该企业生产零件的实际中位数与15cm有显著差异
统计学
STATISTICS (第五版)
学习目标
非参数检验及其用途 单样本的非参数检验方法 两个及以上样本的非参数检验方法 秩相关及其检验方法 用SPSS进行非参数检验 非参数检验与参数检验的比较
14 - 4 2018-9-30
统计学
STATISTICS (第五版)
不同商圈的报纸发行量是否有差异?
14.1 单样本的检验 14.1.2 中位数的符号检验
统计学
STATISTICS (第五版)
中位数的符号检验
(sign test)
14 - 18
检验总体中位数是否等于某个假定的值 设一个随机样本有n个数据,总体中位数的实际值为M, 假设的总体中位数值为 M0。当样本中的数据大于假设的 中位数时,用“+”号表示,小于假设的中位数时,用“-” 表示;对于恰好等于假设的中位数的数据予以剔出 若关心实际的M与假设的M0是否有差别,应建立假设 H0: M=M0 ; H1: M≠M0 计算检验统计量 S+ 和S-。S+表示每个样本数据与 M0与差 值符号为正的个数; S- 表示每个样本数据与 M0 差值符号 为负的个数 计算P值并作出决策。若P<,拒绝原假设
K—S检验
14 - 15 2018-9-30
统计学
STATISTICS (第五版)
总体分布类型的检验
(SPSS K-S检验)
K—S检验
【例14-2】输出结果
精确双尾概率为0.602>0.05,不拒绝原假设。没有证据 表明该供货商提供的汽车配件长度不服从正态分布
14 - 16 2018-9-30
统计学
STATISTICS (第五版)
总体分布类型的检验
(SPSS binomial test)
第 1 步:指定“频数”变量:点击【数据】【加权个 案】,将“频数”选入【频率变量】 【确定】 第 2 步:选择【分析】【非参数检验】选项进入主对话 框 第3步:将待检验的变量选入【检验变量列表】 第4步:在【检验比例】中输入检验的概率 (本例为0.9),点击【确定】
18
182 92 57 160 144 150 39 30 12 53
11
54 43 48 168 18 51 548 26 16 40
14 - 5
2018-9-30
统计学
STATISTICS (第五版)
不同商圈的报纸发行量是否有差异?
要检验不同商圈的发行量是否有显著差异,可以 采用方差分析方法。但该方法假定每个商圈在不 同发行点的发行量应服从正态分布,且方差相等 实际上,这些假定很难得到满足。比如,对上述 数据所做的正态分布检验表明,亚奥商圈的发行 量就不满足正态分布(P=0.018<0.05) 非参数方法就不需要这些假定,照样可以得到比 较满意的检验结果。比如,对上述数据所做的 Kruskal-Wallis 检 验 得 到 的 (P=0.355>0.05) , 没 有证据表明不同商圈的报纸发行量之间存在显著 差异
2018-9-30
14 - 13
统计学
STATISTICS (第五版)
总体分布类型的检验
(K-S检验)
【例 14-2】沿用第 6 章的例 6-7 。对某汽车配件提 供商提供的 10 个样本进行检测,得到其长度 数据如下(单位:cm)
12.2 12.4 10.8 11.3 12.0 12.2 11.8 12.0 11.9 12.3
14 - 26 2018-9-30
统计学
STATISTICS (第五版)
Wilcoxon符号秩检验
计算各样本观察值与假定的中位数的差值, 并取绝对值 将差值的绝对值排序,并找出它们的秩 计算检验统计量和P值,并作出决策
14 - 25 2018-9-30
统计学
STATISTICS (第五版)
Wilcoxon符号秩检验
(SPSS Wilcoxon test)
第 1 步:选择【分析】【非参数检验 -2 个相关样 本】主对话框 第2步:将两个变量同时选入【检验对】,(“零件 长度”和“假设中位数”) 第3步:在【检验类型】下选择【Wilcoxon】, 点击【精确】并选择【精确】,返回主 对话框,点击【确定】
14 - 6 2018-9-30
第 14 章 非参数检验
14.1 单样本的检验
14.1.1 总体分布类型的检验 14.1.2 中位数的符号检验 14.1.3 Wilcoxon符号秩检验
14.1 单样本的检验 14.1.1 总体分布类型的检验
统计学
STATISTICS (第五版)
总体分布类型的检验
建国门—王府井 燕莎 西单—金融街 中关村 亚奥
华 夏 时 报 》 自 国贸—京广 990 称是中国第一 份 商 圈 社 区 报 , 20 精准覆盖北京 44 636 座 写 字 楼 265 ( 公寓 )70000 实 125 名精英读者的 78 精神咖啡 30 2005 年 8 月 29 8 日的华夏时报 10 公布了该报最 134 新的发行量数 20 据,并声明是 18 “最新发行数 10 据诚信公告”
15
59 10 50
291 126 250
218 42 89
10 196 8
67 60 52
39
22 53 47 144 151 181 78 11 23 93
118
103 20 77 217 151 90 3 139 18 30
289
40 171 35 171 109 51 64 13 62 92
(二项分布检验)
二项分布检验(binomial test)是通过考察二分类变量的每个类 别中观察值的频数与特定二项分布下的期望频数之间是否存 在显著差异,来判断抽取样本所依赖的总体是否服从特定概 率为P的二项分布 二项分布检验的原假设是:抽取样本所依赖的总体与特定的 二项分布无显著差异 根据二项分布知识,一个服从二项分布的随机变量,在n次试 验中,出现“成功”的次数的概率为
(使用SPSS中的【Nonparametric Tests-2 Related Samples】选项也可以作 上述检验)
14 - 21 2018-9-30
14.1 单样本的检验 14.1.3 Wilcoxon符号秩检验
统计学
STATISTICS (第五版)
秩的概念
(rank)
秩就是一组数据按照从小到大的顺序排列之后, 每一个观测值所在的位置 用一般符号R来表示,假定一组数据 X1 , X 2 , , X n, 按照从小到大的顺序排列, X i 在所有观测值中排 第 Ri 位,那么 X i的秩即为 Ri Ri 也是一个统计量,它测度的是数据观测值的相 对大小,大多数非参数检验方法正是利用秩的这 一性质来排除总体分布未知的障碍的。当然,也 有一些非参数方法并不涉及秩的性质
(二项分布检验)
【例14-1】根据以往的生产数据,某种产品的合 格率为 90% 。现从中随机抽取 25 个进行检测 ,合格品为 20个。检验该批产品的合格率是 否为90%?(产品合格率X~B(n,0.9))
SPSS的数据格式 合格品 1 0 频数 20 5
表中的“1”表示合格品;“0”表示不合格品
14 - 10 2018-9-30
14 - 24 2018-9-30
统计学
STATISTICS (第五版)
Wilcoxon符号秩检验
(Wilcoxon signed ranks test)
检验总体参数(如中位数)是否等于某个假定的 值。它是对符号检验的一种改进,弥补了符 号检验的不足,要比单纯的符号检验更准确 一些(对应的参数检验—单样本均值检验) 检验步骤
P( X x) C nx p x q n x
若“成功”的次数的概率小于给定的显著性水平,则拒绝原 假设,表明抽取样本所依赖的总体与特定概率为 p的二项分布 有显著差异(样本数据不是来自某个特定概率为p的二项分布)
2018-9-30
14 - 9
统计学
STATISTICS (第五版)
总体分布类型的检验
统 计 学 数据分析
(方法与案例)
作者 贾俊平
统计学
STATISTICS (第五版)
统计名言
对正确问题的近似答案,胜过对 错的问题的精确答案。
——John W.Tukey
14 - 2 2018-9-30
第 14 章 非参数检验
14.1 单样本的检验 14.2 两个及两个以上样本的检验 14.3 秩相关及பைடு நூலகம்检验
检验该供货商生产的配件长度是否服从正态分 布?(=0.05)
14 - 14
2018-9-30
统计学
STATISTICS (第五版)
总体分布类型的检验
(SPSS K-S检验)
第 1 步:选择【分析】【非参数检验】【1- 样 本 K-S】进入主对话框 第2步:将待检验的变量选入【检验变量列表】(本 例为“配件长度”) 第3步:点击【精确】,并在对话框中选择 【精确】,点击【确定】
2018-9-30
统计学
STATISTICS (第五版)
中位数的符号检验
(sign test)
【例14-3】某企业生产一种零件,规定其长度的中位 数为15厘米,现从某天生产的一批零件中随机抽 取16只,测得其长度(单位:cm)如下
15.1 14.5 14.8 14.6 15.2 14.8 14.8 14.6
二项分布检验
14 - 11 2018-9-30
统计学
STATISTICS (第五版)
总体分布类型的检验
(SPSS binomial test)
二项分布检验
【例14.1】输出结果
表中的合格品的观察比例为0.8,检验比例为0.9。精确单尾概 率为 0.098 ,它表示如果该批产品的合格率为 0.9 ,那么 25 个 产品中合格品数量小于等于 20 个的概率为 0.098 。 P>0.05, 不 拒绝原假设,没有证据表明该批产品的合格率不是0.9
2018-9-30
14 - 12
统计学
STATISTICS (第五版)
总体分布类型的检验
(K-S检验)
单样本的 K-S 检验 (Kolmogorov-Smirnov 检验 ) 是用来 检验抽取样本所依赖的总体是否服从某一理论分布 其方法是将某一变量的累积分布函数与特定的分布函 数进行比较。设总体的累积分布函数为F(x),已知的 理论分布函数为 F0(x) ,则检验的原假设和备择假设 为 H0: F(x)=F0(x) ; H1: F(x)≠F0(x) 原假设所表达的是:抽取样本所依赖的总体与指定的 理论分布无显著差异 SPSS 提供的理论分布有正态分布、 Poisson 分布、 均匀分布、指数分布等
14.8 15.1 15.3 14.7 15.0 15.2 15.1 14.7 检验该企业生产零件的中位数与15cm是否有显著 差异?(=0.05)
14 - 19
2018-9-30
统计学
STATISTICS (第五版)
中位数的符号检验
(SPSS sign test)
第 1 步:选择【分析】【非参数检验 - 二项式】选项 进入主对话框 第2步:将待检验的变量选入【检验变量列表】(本例 为“零件长度”) 第3步:点击【定义二分法】,中在【割点】框中输入 总体中位数的假设值15, 在【检验比例】框内输入二项分布的参 数0.5,点击【确定】
14 - 23 2018-9-30
统计学
STATISTICS (第五版)
结的处理
(ties)
很多情况下,数据中会出现相同的观测值,那么 对它们进行排序后,这些相同观测值的排名显然 是并列的,也就是说它们的秩是相等的,这种情 况被称为数据中的“结” 对于结的处理,通常是以它们排序后所处位置的 平均值作为它们共同的秩 当一个数据中结比较多时,某些非参数检验中原 假设下检验统计量的分布就会受到影响,从而需 要对统计量进行修正 ( 一般情况下,软件会自动 作出修正)
符号检验
14 - 20 2018-9-30
统计学
STATISTICS (第五版)
中位数的符号检验
(SPSS sign test)
符号检验
【例14-3】输出结果
零件长度小于等于中位数的有10个,大于中位数的只有6个。 而参数为 (16,0.5) 的二项分布变量大于等于 15 的概率为 0.227 。精确双尾概率为 P=0.454>0.05 ,不拒绝原假设。没有证据 表明该企业生产零件的实际中位数与15cm有显著差异
统计学
STATISTICS (第五版)
学习目标
非参数检验及其用途 单样本的非参数检验方法 两个及以上样本的非参数检验方法 秩相关及其检验方法 用SPSS进行非参数检验 非参数检验与参数检验的比较
14 - 4 2018-9-30
统计学
STATISTICS (第五版)
不同商圈的报纸发行量是否有差异?
14.1 单样本的检验 14.1.2 中位数的符号检验
统计学
STATISTICS (第五版)
中位数的符号检验
(sign test)
14 - 18
检验总体中位数是否等于某个假定的值 设一个随机样本有n个数据,总体中位数的实际值为M, 假设的总体中位数值为 M0。当样本中的数据大于假设的 中位数时,用“+”号表示,小于假设的中位数时,用“-” 表示;对于恰好等于假设的中位数的数据予以剔出 若关心实际的M与假设的M0是否有差别,应建立假设 H0: M=M0 ; H1: M≠M0 计算检验统计量 S+ 和S-。S+表示每个样本数据与 M0与差 值符号为正的个数; S- 表示每个样本数据与 M0 差值符号 为负的个数 计算P值并作出决策。若P<,拒绝原假设
K—S检验
14 - 15 2018-9-30
统计学
STATISTICS (第五版)
总体分布类型的检验
(SPSS K-S检验)
K—S检验
【例14-2】输出结果
精确双尾概率为0.602>0.05,不拒绝原假设。没有证据 表明该供货商提供的汽车配件长度不服从正态分布
14 - 16 2018-9-30
统计学
STATISTICS (第五版)
总体分布类型的检验
(SPSS binomial test)
第 1 步:指定“频数”变量:点击【数据】【加权个 案】,将“频数”选入【频率变量】 【确定】 第 2 步:选择【分析】【非参数检验】选项进入主对话 框 第3步:将待检验的变量选入【检验变量列表】 第4步:在【检验比例】中输入检验的概率 (本例为0.9),点击【确定】
18
182 92 57 160 144 150 39 30 12 53
11
54 43 48 168 18 51 548 26 16 40
14 - 5
2018-9-30
统计学
STATISTICS (第五版)
不同商圈的报纸发行量是否有差异?
要检验不同商圈的发行量是否有显著差异,可以 采用方差分析方法。但该方法假定每个商圈在不 同发行点的发行量应服从正态分布,且方差相等 实际上,这些假定很难得到满足。比如,对上述 数据所做的正态分布检验表明,亚奥商圈的发行 量就不满足正态分布(P=0.018<0.05) 非参数方法就不需要这些假定,照样可以得到比 较满意的检验结果。比如,对上述数据所做的 Kruskal-Wallis 检 验 得 到 的 (P=0.355>0.05) , 没 有证据表明不同商圈的报纸发行量之间存在显著 差异
2018-9-30
14 - 13
统计学
STATISTICS (第五版)
总体分布类型的检验
(K-S检验)
【例 14-2】沿用第 6 章的例 6-7 。对某汽车配件提 供商提供的 10 个样本进行检测,得到其长度 数据如下(单位:cm)
12.2 12.4 10.8 11.3 12.0 12.2 11.8 12.0 11.9 12.3