关于随机性的游程检验课件

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如果 0/1 序列中0和1出现的顺序规律性不强,随机性强,则 0和1出现不会太集中,也不会太分散。换句话说,可以通过0 和1出现的集中程度度量序列随机性的大小。
若序列随机,则游程的个数不能太多,也不能太少。游程 长度也不应太长或太短。相应地,就会出现游程个数检验和 游程长度检验。
在固定序列长度 m和n时,可以通过游程的个数 R 过多或 过少来定义假设检验的拒绝域。
P(R

2k)

2

m k
1 1


n k

1 1

N

n

P(R

2k
1)

m 1 n 1

k
1


k



m 1 n
k


k
1

1

N

n

建 立 了 抽 样 分 布 , 根 据 分 布 公 式 就 可 以 得 到 在 H ( 0即 随 机 性 ) 成 立 时 , P (Rr)或 P (Rr)的 值 , 计 算 拒 绝 域 进 行 检 验 。
在数据出现顺序是否随机的检验中,一个典型的序列就是 二元0/1序列出现顺序的随机性问题
在一个二元序列中,0和1交替出现,一个由0或1连续构成 的串称为一个游程(run),一个游程中数据的个数称为游程的长 度。
一个序列里游程个数用R表示, R表示0和1交替轮换的频 繁程度。容易看出, R是序列中0和1交替轮换的总次数加1.
那么 R 服从什么分布呢?
R 的分布
X 1 ,X 2, ,X n是 一 列 由 0 或 1 构 成 的 序 列 , 假 设 检 验 问 题 H 0:数 据 出 现 顺 序 随 机 H 1:数 据 出 现 顺 序 不 随 机
在 零 假 设 H 0成 立 的 情 况 下 , X i~ b1 ,p , p是 1 出 现 的 概 率 。
— — W ald-W olfow itz检 验
1 .在 m 和 n不 大 时 , 可 以 用 计 算 器 或 查 表 来 进 行 计 算
通 常 的 表 是 给 出 水 平 0 .0 2 5 ,0 .0 5及 m 和 n时 , 拒 绝 域 的 临 界 值 c 1和 c 2 , 满 足 P (R c 1)及 P (R c2).
p 由 n确 定 , 游 程 个 数 R 的 分 布 与 p 有 关 N
然 而 , 在 已 知 m 和 n 时 , 游 程 个 数 R 的 条 件 分 布 就 与 p 无 关 了
假 定 有 m 个 0 和 n 个 1 , m n N , 出 现 任 何 一 种 不 同 结 构 序 列 的 可 能 性 是 1 N n 1 m N
2.当样本很大时,当数据序列的量很大时,即n, 在零假设下,根据精确分布的性质可以得到 E(R) 2 mn 1 mn 2mn(2mnmn)
Var(R) mn2 (mn1)
于是
ZRE(R) Var(R)
R2 mn 1
mn
N(0,1)
2mn(2mnmn)
二、随机游程的检验
Mood (1940) 提出关于这一问题的检验 假设检验:
随机抽取一个样本,其观察值按某种顺序排列,如果 研究所关心的问题是:被有序排列的两种类型符号是否随 机排列,则可以建立双侧备择.
H 0 : 数 据 出 现 顺 序 随 机 H 1 : 数 据 出 现 顺 序 不 随 机
假如我们掷一个硬币,这是一个伯努利试验,将正面向上 记做1,将反面向上记做0,例如我们得到一列这样的结果:
00000001111110000111100
如果称连在一起的0或1为游程,则上面这组数中有3个0游 程,2个1游程,一共是5个游程 (R=5)
这里0的总个数为 m=13,1的总个数为 n=10. 记总的试验 次数为 N,有 N=m+n
关于随机 性的游程
百度文库检验
一、游程
一个两分的总体,如按性别区分的人群,按产品是否有毛 病区分的总体等等,随机从中拍取一个样本,样本也可以分为 两类:类型1和类型2. 凡属类型1的记做0,类型2的记做1 当样本按某种顺序排列(如按抽取时间先后排列)时,一个 或者一个以上相同符号连续出现的段,就被称作游程,也就是 说,游程是在一个两种类型的符号的有序排列中,相同符号连 续出现的段。
如 果 游 程 个 数 为 奇 数 R2k+ 1, 这 意 味 着 有 k1个 1游 程 和 k个 0游 程 ; 或 有 k1个 0游 程 和 k个 1游 程 。
如 果 游 程 数 为 偶 数 R2k, 这 意 味 着 0和 1各 有 k个 游 程 , 于 是 得 到 R的 条 件 分 布 为
二、检验统计量
检验统计量为: R 游程个数
例如,对于序列 1100001110110000111100, R=8,游程长度分别为 2,4,3,1,2,4,4,2
极端情况: 000001111111 R = 2 0101010101010 R = 2min(m,n)+1
所以,2 ≤ R ≤ 2min(m,n)+1 极端情况都说明数据不具有随机性。
如果关心的是序列是否具有某种倾向,则应建立单侧备择
H 0 : 序 列 是 随 机 的 H 1 : 序 列 具 有 混 合 的 倾 向 H 0 : 序 列 是 随 机 的 H 1 : 序 列 具 有 成 群 的 倾 向
注:
1. 为了对假设作出判定,被收集的样本数据仅需定类尺度 测量,但要求进行有意义的排序,按一定次序排列的样本观 察值能够被变换为两种类型的符号(比如 二元0/1序列)
2. 在H0为真的情况下,两种类型符号出现的可能性相等, 其在序列中是交互的。相对于一定的 m和n,序列游程的总 数应在一个范围内。 若游程的总数过少,表明某一游程的长度过长,意味着 许多0 或许多1 连在一起,序列存在成群的倾向; 若游程总数过多,表明游程长度很短,意味着 0 和1交 替出现得太频繁,序列具有混合的倾向。 因此,无论游程的总数 R 过多或过少,都表明序列不是 随机的。
相关文档
最新文档