单样本随机性检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS中实现过程
研究问题 某村发生一种地方病,其住户沿一条河排 列,调查时对发病的住户标记为“1”,对 非发病的住户标记为“0”,共35户,其取 值如表10-3所示。
表10-3
住 1 2 3 4 户
35名住户发病情况
发病情况 1 0 1 1 住 13 14 15 16 户 发病情况 1 1 1 1 住 户 25 26 27 28 发病情况 1 1 0 1
注:一个可以两分的总体,如按性别区分的人 群,按产品是否为次品区分的总体等,随机从 中抽取一个样本,样本也可以分为两类:类型 I 和类型 II 。若凡属类型 I 的,用0表示;凡 属类型 II的,用1表示。所以样本出现是否随 机的问题,就转化为一个二元0-1序列出现的 顺序是否随机的问题。
对于连续型数据,我们也关心数据是否 随机出现,这时可将连续的数据二元化,将 连续数据的随机性问题转化成为二元数据的 离散化问题。
游程检验的基本思想:
固定样本量下,通过游程多少来判断。
具体而言:在固定样本量下,若游程个数过少, 则说明0和1比较集中,序列存在成群的倾向; 若游程个数过多,则说明0和1交替频繁,周期 特征明显,序列具有混合倾向。
假设检验
Mood在1940年提出如下假设检验问题,设 X1, „ , Xn是一列由0或1构成的序列,
设置数据二 分法的分割 点。小于此 分割点的样 本数据为一 类,大于等 于此分割点 为另一类。 可设置中位 数、众数、 均值为分割 点值,也可 自定义分割 点数值。
在检测变量 栏(Test Variable List)中添 加要检测的 变量
Exact、 Options选 项实现的 功能与前 面两节完 全一样
2 mn Z
此临界值有表可查。
在SPSS单样本变量值的随机性检验中, SPSS将利用游程构造Z统计量,并依据正态 分布表给出对应的相伴概率值。如果相伴概 率小于或等于用户的显著性水平α,则应拒 绝零假设H0,认为样本值的出现不是随机的; 如果相伴概率值大于显著性水平,则不能拒 绝零假设H0,认为变量值的出现是随机的。
解决思路: 如果两组成绩没有显著性差别,那么这两组 学生的合在一起按成绩排序以后,学生的组 别成随机排列。 于是问题转化为:按成绩排序后,对组别做 随机性检验。如果接受组别的随机性假设, 也就等于认为两组学生的体育成绩无显著差 异。
SPSS 16实用教程 第10章 非参数检验
10.3 SPSS单样本变量值随机性检验
统计学上的定义和计算公式
定义:单样本变量值的随机性检验是对某变 量的取值出现是否随机进行检验,也称为 游程检验(Run过程)。
游程检验亦称连贯检验或串检验,是一种随 机性检验方法,应用范围很广。 例如:奖劵的购买是否随机,期货价格的变 换是否随机,一个机械流程中产品误差的出 现是否存在规律等等。若事件的发生并非随 机,而是有规律可循,则可作出相应的对策。
试检查这台机器装多装少是否随机?
假设检验问题 H0: 机器装多装少是随机的; H1:机器装多装少不是随机的
这里采用中位数法,计算样本中位数为503, 令,则相应的Y样本为: 1,1,0,0,0,0,0,0,1,1,1, 1,1,0,0,0,1,1,1,1,1 则0的个数m=9,1的个数n=12,R=5。
图10-10 “Runs Test”对话框
图10-11 “Runs Test:Options”对话框
10.3.3 结果和讨论
0.181>0.05,在 0.05水平下接受原 假设,可认为病 患沿河成随机分 布,无聚集性。
作业!(请用SPSS实现书上研究问题并解决例题1~4)
例题1 假定我们掷23次硬币,得到结果如下:
基本概念
游程:在一个二元0-1序列里,一个由0或1连续构 成的串。 游程长度:一个游程里数据的个数。 一个序列里游程个数用R表示。 例如下面的一个0-1序列: 1100001110110000111100 共22个数,0的个数为11,1的个数为11,共8 个游程,4个0游程,4个1游程。
设某样本n=12人的标志表现为男、女,有以下三种排列。 (i) 男\男,女\女\女,男,女\女,男\男\男\男 (ii) 男\男\男\男\男\男\男,女\女\女\女\女 (iii)男,女,男,女,男,女,男,女,男,女,男\男 连续出现男或女的区段称为游程。 每个游程包含的个数为游程长度。以r表示序列中游程 的个数: (i)r=5, (ii)r=2, (iii)r=11 可以看出,(i)是随机性序列;(ii)(iii)是非 随机性序列,所以,可以用游程的个数来检验样本的随机 性,或总体的分布特征。
R的条件分布(课后思考)
H0成立的条件下,Xi~ b(N,p),则在有m个0和n 个1的条件下 , R的条件分布为
m 1 n 1 2 k 1 k 1 , P ( R 2k ) N n
m 1 n 1 m 1 n 1 k 1 k k k 1 . P( R 2k 1) N n
5
6 7 8
1
1 0 0
17
18 19 20
0
0 1 1
29
30 31 32
0
0 1 0
9
10 11 12
0
0 1 1
21
22 23 24
0
0 1 1
33
34 35
0
0 0

实现步骤
找到Analyze / Nonparametric Tests / Runs 选项
图10-9 在菜单中选择“Runs”命令
例4
为了考察学生的体育达标成绩,从两组学生中分别 选取了15和14名学生进行测试,测试成绩如下: 甲组:67 67 70 70 73 74 78 81 83 84 84 87 87 97 97 乙组:63 66 71 74 74 75 76 77 77 78 79 82 86 87 运用游程检验的方法检验这两组学生的体育成绩测 试是否有显著差别?
当样本量很大时,检验统计量
R E( R) Z Var ( R)
近似服从标准正态分布
于是有给定水平α后,可以用近似公式得 到拒绝域的上下临界值分别为为:
2m n r 1 1 mn
2m n r2 1 1 mn
2 mn Z
检验p值。
考虑双边假设检验,给定水平α,设r是由 样本算出来的检验统计量的值,则 p值=2 min { P(R≥r), P(R≤ r) }。
R分布的进一Biblioteka Baidu讨论
在零假设下,可以证明:
2mn E ( R) 1, mn
2mn(2mn m n) var(R) , 2 (m n) (m n 1)
H0:样本出现顺序随机 H1:样本出现顺序不随机
若关心序列是否具有某种倾向,则可建立单 侧假设检验,H0不变,H1为序列具有混合倾向 或H1为序列具有成群倾向。
检验统计量R及其分布
取一个序列里的游程总数作为检验统计 量,记为R。 设样本总数为N,其中0的个数为m个,1的 个数为n个,即m+n=N。在H0成立的条件下, 出现多少0和1,出现多少游程都与概率p有关, 但在已知m和n时,R的条件分布就与p无关了。
00000001111110000111100 问这个试验是不是随机的?
此例中,总试验次数为N=23,0出现次数为 m=13,1出现的次数为n=10。如果称连在一 起的0或1为游程,则上面这组数中有3个 0游 程,2个1游程,共5个游程。 经计算,p值约为0.002,所以在水平α>0.002 时,拒绝原假设,即认为该数列不是随机的。
对于α=0.05,查表得到对应的R为6,而 5<6,拒绝原假设,认为这台机器装多装少 并非随机(运用精确检验)。
例3
有一批容器,其重量有些差异。连续抽查了15 个容器,其重量分别为: 3.6 3.9 4.1 3.6 3.8 3.7 3.4 4.0 3.8 4.1 3.9 4.0 3.8 4.2 4.1 问在0.05显著性水平下能否认为其重量的变 动是随机的?
例题2
某品牌消毒液质检部要求每瓶消毒液的平均容 积为500ml,现从流水线上的某台装瓶机上随 机抽取20瓶,测得其容量如下所示。 509,505,502,501,493,498,497,502, 504,506,505,504,508,498,495,496, 507,506,507,508,505
相关文档
最新文档