第七章-非参数检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

两配对样本的非参数检验
诚信求是,笃学致公
1. 非参数检验基本思想
参数检验
当总体分布已知(如正态分布)时,根据样本数据对总体分布的统计参数 (均值、方差等)进行推断。 分布形式(或分布函数)是给定的,但是其中的某些参数是未知的。
非参数检验:
(1)在总体分布未知或知道甚少的情况下,利用样本数据对总体分布 形态等进行推断的方法。
单样本 t 检验利用来自某总体的样本数据,推断该总体的均值与指定 的检验值之间是否存在显著性差异,它是对总体均值的假设检验。
ຫໍສະໝຸດ Baidu
(3) 两独立样本 T 检验
两独立样本T检验的目的是利用来自某两个总体的独立样本,推断两 个总体的均值是否存在显著差异。
(4) 两配对样本 T 检验
配对样本T检验用于检验两个相关样本是否来自相同均值的正态 总体,即推断两个总体的均值是否存在显著差异。
诚信求是,笃学致公
2. 单样本的非参数检验
(3)单样本 K-S检验
例【7-3】利用“鸡增重重量”数据分析鸡增重重量总体是否服从正态 分布。 分析:可以通过单样本K-S检验实现。
操作步骤 • • • 选择【分析】->【非参数检验】->【旧对话框】->【1样本K-S】; 将“鸡增重重量”放入【检验变量列表】; 在“检验分布”中,选择【常规】,点击【确定】,得到结果。
日期 1.00 2.00 3.00 4.00 5.00 人数 101.00 58.00 46.00 47.00 43.00
诚信求是,笃学致公
2. 单样本的非参数检验
操作步骤
• 选择【分析】->【非参数检验】->【旧对话框】->【卡方】; • 将“就诊日期”放入【检验变量列表】; • 在【值】栏目中依次添加 2.8,1,1,1,1,点击【确定】,得到
D max(S ( xi ) F ( xi ) 由于实际累计概率为离 散值,可对D修正为: 修正D : D max(max( S ( xi ) F ( xi ) , max(S ( xi 1 ) F ( xi ) )
诚信求是,笃学致公
2. 单样本的非参数检验
(3)单样本 K-S检验
诚信求是,笃学致公
2. 单样本的非参数检验
(1)卡方检验----实例
例【7-1】医学研究表明心脏病人猝死人数与日期的关系为:一周内,星 期一猝死者较多,其他日子基本相当,各天的比例近似为: 2.8:1:1:1:1 根据“心脏病猝死”数据,推断总体分布是否与理论分布相吻合。 分析: 利用总体分布卡方检验实现。
原假设成立时:
①小样本下:D~kolmogorov分布
②大样本下: n D 近似服从K(x)分布 ③SPSS仅给出大样本下的 n D 和对应的p值 决策 ①D统计量的p值<显著性水平,拒绝原假设,样本来自的总体与指定 分布有显著差异
②D统计量的p值>显著性水平,不拒绝原假设,样本来自的总体与指
定分布无显著差异
(2)推断过程中不涉及有关总体分布的参数。
诚信求是,笃学致公
1. 非参数检验基本思想
SPSS中非参数检验方法主要涉及: 单样本非参数检验 两独立样本非参数检验 两配对样本非参数检验 多独立样本非参数检验
多配对样本非参数检验
诚信求是,笃学致公
2. 单样本的非参数检验
目的:样本来自总体的分布是否与某个已知的分布相吻合?
23
A
24
B
25
B
26
A
27
B
28
B
29
A
30
A
31
A
面 B
A
B
B
A
B
B
A
B
A
B
B
A
B
A
诚信求是,笃学致公
3. 两独立样本的非参数检验
1)独立样本:在一个总体中随机抽样对在另一个总体中随机抽样没有 影响的情况下所获得的样本。
2)推断样本来自的两个总体的分布等是否存在显著差异。
3)方法:曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验 等。
诚信求是,笃学致公
2. 单样本的非参数检验
(3)单样本 K-S检验
利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的 检验方法,适用于探索连续型随机变量的分布。 (3)步骤 ①计算各样本观测值在理论分布中出现的理论累计概率值F(x) ②计算各样本观测值的实际累计概率值S(x) ③计算理论累计概率值与实际累计概率值的差D(x) ④计算差值序列中最大绝对差值D
诚信求是,笃学致公
2. 单样本的非参数检验
(2)二项式检验 在现实生活中有很多数据的取值是二值的;
• • •
人群可以分为男性和女性;
产品可以分为合格和不合格;
学生可以分为三好学生和非三好学生。
通常将这样的二值分别用1和0表示。如果进行n次相同的实验, 则出现两类(1或0)的次数可以用离散型随机变量来描述。如果 随机变量值为1代表成功,其概率设为p,则随机变量值为0的概
操作步骤 • • • 选择【分析】->【非参数检验】->【旧对话框】->【二项式】; 将“是否合格”放入【检验变量列表】; 在【值】栏目中添加0.9,点击【确定】,得到结果。
诚信求是,笃学致公
2. 单样本的非参数检验
(2)二项式检验----实例
二项式检验结果表明,合格的显著性概率为0.55, 大于显著性 水平0.05,应接受原假设,即“该批产品的一级品率为90%”。
诚信求是,笃学致公
2. 单样本的非参数检验
(4)变量值随机性检验
游程检验结果表明,合格的显著性概率为0.712, 大于显著性水 平0.05,应接受原假设,即“耐压设备的工作正常”。
诚信求是,笃学致公
2. 单样本的非参数检验
练习题
【1】掷一颗六面体300次,用数字型数据1、2、3、4、5、6分别代表 六面的六个点,试问这颗六面体是否均匀。
1 43 2 49 3 56 4 45 5 66 6 41
【2】掷一枚硬币31次,出现正面和反面在上的结果见下表,试问这枚
硬币是否均匀。请使用 二项检验和随机检验分别测试结果。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
面 A 次
17
B
18
A
19
B
20
B
21
A
22
A
诚信求是,笃学致公
3. 两独立样本的非参数检验
(1)曼-惠特尼U检验
非参数检验中秩是最常使用的概念。什么是一个数据的秩呢?一般来说,秩就 是该数据按照升幂排列之后,每个观测值的位置。例如我们有下面数据. Xi Ri 15 7 9 5 18 9 3 1 17 8 8 4 5 2 13 6 7 3 19 10
诚信求是,笃学致公
SPSS 软件应用实验
诚信求是,笃学致公
推荐参考书

SPSS统计分析方法及应用(第4版)
薛薇著,电子工业出版社。

SPSS22.0统计分析应用教程,冯岩 松著,清华大学出版社。

SPSS统计分析基础教程(第二版),
张文彤、邝春伟 著,高等教育出版
社。

SPSS统计分析方法及应用实验教程, 徐秋艳著,中国水利水电出版社。
结果。
诚信求是,笃学致公
2. 单样本的非参数检验
结果分析
表示了各检验变量的个案数,即分组描述 情况。期望数表明各天死亡的期望频数, 残差为观察值与期望值之间的差。
卡方检验结果表明概率p为 0.065, 大于 显著性水平0.05,接受零假设,即 心脏病 猝死人数与日期的关系基本满足 2.8:1:1:1:1。
诚信求是,笃学致公
2. 单样本的非参数检验
(4)变量值随机性检验
【7-4】利用“电缆数据”推断耐压设备的工作是否正常。 分析: ①若耐压数据的变动是随机的-则设备工作正常 ②若耐压数据的变动不是随机的-则设备工作存在不正常 ③可以通过变量值随机性检验实现。 操作步骤 • • • 选择【分析】->【非参数检验】->【旧对话框】->【游程】; 将“xh”放入【检验变量列表】; 在“分割点”中,选择【定制】,输入1,点击【确定】,得到结果。
基本思想 (1)通过对样本变量值的分析,实现对总体的变量值出现是否随机进 行检验。 (2)原假设:总体变量值出现是随机的。 ①检验依据:游程-样本序列中连续出现相同的变量值的次数。
②游程数太大或太小都表明变量值存在不随机的现象。
诚信求是,笃学致公
2. 单样本的非参数检验
(4)变量值随机性检验
游程检验方法是检验一个取两个值的变量的这两个值的出现是否是随机的。 假定下面是由0和1组成的一个这种变量的样本: 0000111111001011100000000
率q便等于1-p,则成功次数变量X的分布为二项分布。
诚信求是,笃学致公
2. 单样本的非参数检验
(2)二项式检验

基本思想 (1)通过样本数据检验样本来自的总体是否服从指定概率p的二项分布。 (2)小样本-精确检验:计算n次试验中某类出现的次数小于等于x次的概率:
i i n i P{ X x} Cn pq i 0 x
诚信求是,笃学致公
课程内容
1 • 了解SPSS非参数检验思想 2 • 掌握SPSS单样本非参数检验 3 • 掌握SPSS两独立样本非参数检验 4 • 掌握SPSS两配对样本非参数检验
5
www.islide.cc
3
诚信求是,笃学致公
上期回顾…
诚信求是,笃学致公
上期回顾… (2) 单样本 T 检验
大样本-近似检验
x 0.5 np Z np(1 p) 2 2 x 时加0.5 x 时减0.5 n n
诚信求是,笃学致公
2. 单样本的非参数检验
(2)二项式检验----实例
例【7-2】利用“产品合格率”数据,推断该批产品的一级品率是否为 90%。 分析:产品合格与否属于二值变量,可以通过二项分布检验实现。
其中相同的0(或相同的1)在一起称为一个游程(单独的0或1也算)。
这个数据中有4个0组成的游程和3个1组成的游程。一共是R=7个游程。其 中0的个数为m=15,而1的个数为n=10。
成功使出 : 1
不灵,这就非常尴尬了: 0
诚信求是,笃学致公
2. 单样本的非参数检验
(4)变量值随机性检验
检验统计量
质地均匀的骰子,六个面朝上的概率分别为1/6.
诚信求是,笃学致公
2. 单样本的非参数检验
(1)卡方检验
卡方统计量
0 e 2 ( f f 2 2 i i ) ~ (k 1) 0 fi i 1 k
k 子集个数, f i 0 观察频数,f i e 期望频数,
2值越大 观测频数分布与期望频 数分布差距越大 2值越小 观测频数分布与期望频 数分布差距越小 2对应的p值 , 拒绝原假设,样本来自 的总体分布与理论分布 存在显著差异 2对应的p值 , 不拒绝原假设,样本来 自的总体分布与理论分 布无显著差异
Ps : 【相等】 表示均匀分布; 【常规】表示正态分布。
诚信求是,笃学致公
2. 单样本的非参数检验
(3)单样本 K-S检验
K-S检验结果表明,合格的显著性概率为0.61, 大于显著性水 平0.05,应接受原假设,即“鸡增重重量总体服从正态分布”。
诚信求是,笃学致公
2. 单样本的非参数检验
(4)变量值随机性检验
Z
r r
r
r:游程数
2n1n2 r n1 n2
r2
2n1n2 (2n1n2 n1 n2 ) (n1 n2 ) 2 (n1 n2 1)
n1 出现1的个数,n2 出现0的个数
决策: Z统计量的p值<显著性水平,拒绝原假设,变量值的出现不是随机的。 Z统计量的p值>显著性水平,不拒绝原假设,变量值的出现是随机的。
—绘制样本数据的直方图、pp图、QQ图判断—粗略
—通过非参数检验—精确
单样本非参数检验
(1)对单个总体的分布形态等进行推断 (2)方法:卡方检验、二项分布检验、K-S检验、变量值随机性检验等。
诚信求是,笃学致公
2. 单样本的非参数检验
(1)卡方检验
基本思想 根据样本数据推断总体分布与期望分布是否存在显著差异,是一种吻 合性检验。通常适合对有多个分类值(子集)的分类型变量总体分布的 分析。 原假设:样本来自的总体分布与期望分布无显著差异。 变量值落入第i个子集中的理论概率为 pi ,相应的期望频率为 npi
诚信求是,笃学致公
上期回顾…
(5) 单因素方差分析 研究一个控制变量的不同水平是否对观测变量产生了 显著影响。
例如
[1] 不同施肥量对农作物产量的影响; [2] 90年代不同地区新生儿男女比例; [3] 不同学历的工资水平比较;
诚信求是,笃学致公
SPSS非参数检验
非参数检验基本思想
单样本的非参数检验 两独立样本的非参数检验
相关文档
最新文档