非参数统计复习过程
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
O22 O32
O23 … O2c O33 … O3c
..
.
.
..
..
.
.
..
..
.
.
..
r Or1
Or2
Or3 … Orc
O1· O2 · O3 · .
.
.
Or ·
合计O ·j O.1 O.2 O.3 … O.c n
O ∑O O ∑O 记:
c
i•
ij
r
•j
ij
j
i
显然 n ∑Oi• ∑O• j
游程
每个连续出现某一类 样本观察值的区段
ຫໍສະໝຸດ Baidu
游程 长度
每个区段包含的相同 样本观察值的个数
游程的个数 r可用来检验样本的随机性
游程检验方法步骤
将样本观察值顺序排列,找出中位数或平均数 以中位数或平均数为界分样本观察值为两个部分
以两部分交错形成的游程个数为检验的统计量
2×2的列联表资料,χ2值简算公式
x
y
1
1
a
2
c
合计 a+c
2 合计
b
a+b
d
c+d
b+d n
x2
n(ad b)c2
(ac)b (d)a (b)c (d)
第三节 成对比较检验
一、符号检验 用两组样本数据之差的正、负符号判断两个总
体特征是否存在差异的检验方法,亦称正负号检验。
特点: 来自两个总体的两个样本 可以相关,也可以独立
检验统计量
皮尔森拟合优度χ2 统计量:
∑ k
χ2=
(fi-fe)i2
f i=1 ei
~χ2(k-1)
其中: k—样本分类(组)数
皮尔森定理:如果原假设H0成立,则在样本容量 n→∞时,χ2 的分布趋向于k-1的卡方分布。
检验步骤
(1)对总体分布建立假设 H0:总体服从某种理论分布 H1:总体不服从该理论分布
非参数统计
非参数统计的特点
不要求对总体分布 作任何限制性假定
可用于定名测定和 定序测定的变量
不以估计总体参数 为目的
方法直观,易于理 解,运算比较简单;
若总体分布能确定时,较参数方法效率差
第二节 χ2检验
一、拟合优度检验
利用样本信息对总体是否与某种假设的理论分布符 合的检验。
检验的基本思想 假设总体 X 服从某一分布, 将样本分成 K 类(组),观察样本数据在类(组) 出现的频数 f1,f2,…,fk 。在原假设 H0下,得到 每一类(组)的预期频数: fe1,fe2,…,fek 。若 H0为真, fi 与 fei 的差异应该不显著。
c
X X y O P P(X ,
) i•
P i
i
j
j1
n
i•
r
y X y O P P( P j
i1
, y ) •j
i
j
n
•j
若X、Y相互独立,应有:PX i yj P i• P •j O n i• O n •j
检验X和Y的独立性,等于检验:
H 0 : P X i y j P i • P • j
(4)确定带正负号的差值的个数为样本 容量n
(5)建立假设: H0:T+=T- H1: T+≠T-
(6)确定检验统计量T:T= min ( T+,T-) (5)设定α,当T<Tα, 拒绝H0 。
第四节 曼—惠特尼U检验 与威尔科克森检验的思想方法基本相同。特点:
两个样本 相互独立
两个样本合 在一起排序
数据不一 定成对
检验步骤: (1)从总体A、B中分别独立抽取样本nA和nB, 将(nA+nB)个观察值从小到大排序并赋予等级 号
(2〕分别计算两个样本各自的等级和TA和TB
(3)建立假设
H0:两总体某特征无显著差异 H1:两总体某特征显著差异
(4)计算检验统计量U [ U = min (UA、UB)]
0.5 0.5
n
(4)确定拒绝域, 比较并作出判断
二、威尔科克森带符号的等级检验 运用两组数据差异的正、负号,并结合考虑差异
大小判断两总体是否存在差异的检验方法。
检验步骤
(1)确定配对样本数据并 计算带正负号的差异数值
(2)将差值取绝对数后排序并赋顺序 等级。相邻等值取位序平均数为等级
(3)根据原正负号赋予各等级正负号,并计 算正负等级和T+和T-
对分布、方差均不 作任何假定
不计具体数值,只考虑 差数的正负方向
损失了具体数值差 别的信息
检验步骤
(1)确定配对样本,识别差 异,统计正负差异个数
(2)建立假设: H0:两组数据无差异 等价于 H0: P (+) =0.5
H1: P (+) ≠0. 5
(3)计算检验统计量 大样本时:
ˆ Z P 0.5
检验步骤
(1)建立假设 H0:两组变量独立 H1:两组变量不独立
(2)将样本资料编成 r×c列联表,并列出 实际频数Oij
(3)计算理论频数
Eij
Oi•O• j n
(4)计算检验统计量
r
2
c (O ijE i)j2
i 1 j 1
E ij
2
~ (r 1 )c( 1 )
(5)给定的α,若χ2> χα2,拒绝原假设
①nA、nB<10时, UA= nAnB+ nA(nA +1)/2-TA
UB= nAnB+ nB(nB +1)/2-TB
②nA、nB>10时
Z U(nAnB/2) nAnB(nAnB1)/12
(5)设定显著性水平α,查U值表, 对于nA、nB<10,当U≤Uα,拒绝H0,
第五节 游程检验
根据样本标志表现排列所形成的游程的多少进行 判断的检验方法。亦称连贯检验
注意
H0 总体为完全给定的概率分布形式时, χ2 统 计量的自由度为k-1
H0 总体服从某种形式的概率分布时,χ2 统计 量的自由度为k-r-1 ,
r等于需要估计的参数的个数。
(2)抽样并对样本资料编成频数分布(fi) (3)以“原假设H0为真”导出一组期望频数(fei) (4)计算检验统计量χ2=∑(fi-fei)2/fei (5)给定的α查χ2表,比较χ2值与χ2临界值 (6)作出检验判断
拟合优度检验需要注意 (1)各组理论频数fei不得小于5; (2)样本单位数 n >50; (3)若某一类(组)理论频数 < 5,应与邻类 (组)合并,且k应为实际类(组)数 (4)注意 r 的取值
三、独立性检验 利用样本信息对两组数据是否彼此关联的检验。 特点在于其理论频数由样本实际频数计算得出
设有一组观察值(X1,Y1)、(X2、Y2)…(Xn、Yn) X有1,2…r种状态, Y有1,2…c种状态,
将其编成r×c列联表(联合频数分布表), 用Oij表示X、Y同时发生的频数:
列联表形式(r×c)
y x
1
2
Y 3 …c
合计O i·
1 O11
O12
O13 … O1c
2 O21 X 3 O31