【资料】非参数统计第二章-单样本检验汇编

合集下载

非参数检验课件

非参数检验课件

13.71
5
19.61
24.37
4.76
6
14.50
92.75
78.25
7
49.63
121.57
71.94
8
44.56
89.76
45.20
编秩次,求秩和 去掉d=0的对子,总的对子数也要相应减去; 用绝对值︱d︳编秩次,如果出现绝对值相等时(ties) ,则将它们的平均秩次值作为他们的秩次;
第二节 单样本资料的符号秩和检验
• 目的:推断样本中位数与已知总体中位数 (常为标准值或大量观察的稳定值)有无 差别,常用于不满足单样本t检验应用条 件的资料;其检验假设是M=M0.
• 例10-2 已知某地正常人尿氟含量的中位 数为2.15mmol/L.今在该地某厂随机抽取 12名工人,测得尿氟含量,结果见表2。 问该工厂的尿氟含量是否高于当地正常人 ?
参数检验方法
• t检验 两独立样本t检验要求:正态、方差相等、个体独立 配对t检验要求:差值正态、个体独立
• 方差分析 完全随机设计方差分析要求:正态、方差相等、个体独 立
参数检验方法
• 两组性别结构是否相同?
• 两组某种不良反应的发生率是否相同?
• 多组发生率是否相同? • 多组构成是否相同?
定性无序分 类资料
未解决的问题
• 疗效用痊愈、显效、有效、无效四级分类法进行 评价时,两组或多组如何比较?
• 对两组患者空腹胰岛素水平进行比较时,有的病 例测量结果为Ins<2.0 或Ins>300,如何处理?
未解决的问题
• 对应于多分类变量(有序) • 非正态分布 • 不完整数据:如,Ins<2.0 或Ins>300 • 正态分布但方差不相等时

单样本游程检验

单样本游程检验

单样本游程检验车间生产的20个轴承外座圈为下列数据15.0415.3614.5714.5315.5714.6915.3714.6614.5215.4115.3414.2815.0114.7614.3815.8713.6614.9715.2914.95利用游程检验这20个轴承的外座圈周长大于中位数14.96和小于中位数14.96的情况的出现是不是随机的。

数据《非参数统计》xx之手算:建立假设组:H0:外座圈周长大于中位数14.96和小于中位数14.96情况的出现是随机的。

H1:外座圈周长大于中位数14.96和小于中位数14.96情况的出现不是随机的。

x D=x-14.9615.040.0815.360.414.57-0.3914.53-0.4315.570.6114.69-0.2715.370.4114.66-0.314.52-0.4415.410.45符号++--+-+--+x D=x-14.9615.340.3814.28-0.6815.010.0514.76-0.214.38-0.5815.870.9113.66-1.314.970.0115.290.3314.95-0.01符号+-+--+-++-U=14,m=10,n=10查表得,P=0.242>=0.05,因此不能拒绝原假设,即认为外座圈周长大于中位数14.96和小于中位数14.96情况的出现是随机的。

SPSS:操作:Analyze——Nonparametric Tests——RunsRuns TestTest ValueCases < Test ValueCases >= Test ValueTotal CasesNumber of RunsZAsymp. Sig. (2-tailed)Exact Sig. (2-tailed)a轴承外座圈周长14.96101020141.149.251.255Point Probabilitya. Median .076由输出结果可知,精确双尾检验概率P=0.255>=0.05,因此不能拒绝原假设,即认为外座圈周长大于中位数14.96和小于中位数14.96情况的出现是随机的。

非参数统计1

非参数统计1
(1)设置零假设和备选假设; (2)构造检验统计量T(X1,X2,…Xn); (3)数值实现t= T(x1,x2,…xn); (4)计算零假设下,r.v.T落入某区间的精确概率
或近似概率
P值
零假设下,P(T>t)的值称为p值。
若p值很小,说明观测值的实现在零假设下为小概率 事件,故拒绝零假设。犯第一类错误的概率为p。
比如: (1)研究保险公司的索赔请求数时,可能假定索赔请求
数来自泊松分布P(a);
(2)研究化肥对农作物产量的影响效果时,平均意义 之下,每测量单元(可能是)产量服从正态分布
N(a,b).
一个典型的参数检验过程
1. 总体参数
Example: Population Mean
2. 假定数据的形态为
Whole Numbers or Fractions
Pitman于1948年回答了非参数统计方法相对于 参数方法来说的相对效率方面的问题;
非参数统计的历史(续)
60年代中后期,Cox和Ferguson最早将非参数方法 应用于生存分析。
70年代到80年代,非参数统计借助计算机技术和 大量计算获得更稳健的估计和预测,以P.J.Huber 以及 F.Hampel为代表的统计学家从计算技术的实 现角度,为衡量估计量的稳定性提出了新准则。
这里,j为求均值前删掉的最小或最大观测值的数目。
顺序统计量的分布:
设总体的分布函数F(x),则第r个顺序统计量的分布 函数为:
Fr (x)
P(X (r)
x)
P(至少
r个X
小于或等于
i
x)
n
P( X1, X 2 ,L , X n中恰好有j个小于x)
jr
n
C

单样本非参数检验1卡方检验【24页】

单样本非参数检验1卡方检验【24页】

(1)建立零假设和备择假设
H0 :总体分布函数为 F(x); H1 :总体分布函数不为 F(x)。
分布函数和密度函数的区别知道吧?
(2)构造和计算统计量
◆把实轴 (,分) 成 k 个不相交的区间 (,a 1 ](a ,1 ,a 2 ],,.(.a k . 1 ,, )
◆设样本观察值 x1,x2,...x,n落入每个区间的实际频数为 f i 则实际频率为 f i
因此,医学家的研究结论是正确的哦。
3.3 卡方检验的SPSS软件实现
(1)输入例子中的数据,如图所示。
切记要加权!
卡检验的SPSS操作
勾选“值”
输入2.8, 点“添加”
改成1,点“添加”, 依次进行
1个2.8,6个1,最后点 OK!
得到卡方检验结果,分两部分
死亡日期
O bserv ed N Expected N Residual
1.00
55
53.5
1.5
2.00
23
19.1
3.9
3.00
18
19.1
-1.1
4.00
11
19.1
-8.1
5.00
26
19.1
6.9
6.00
20
19.1
.9
7.00
15
19.1
-4.1
Total
168
注意:学习了卡方检验的方法和过程后,你会解读软件给 出的分析结果吗?
答案
• P值=0.256,大于显著性水平0.05,接受原 假设,认为原分布成立,即原来医生的结 论是正确的。
中,拒绝零假设,即总体不服从指定分布 F(X )
即 2 的概率P值??显著性水平

非参数统计-02

非参数统计-02

psignrank(11,10)= 0.05273438
Wilcoxon符号秩检验(Wilcoxon signed-rank)
• 统计量 在零假设 下的分布 在 n=3 时, 的秩只有1,2,3, 但符号却 有 8 种可能, 每种可能的概率都是1/8. 的最小值 为 0, 最大值 为
Density of Wilconxon
--64是否能认为是大于中位数的检验 本例中, 由于 -- 在R中, pbinom(28,71,0.5)= 0.048为p值.
n=28 n=36
density of Bin(71,0.5)
0.08
0.00
0.02
0.04
对于水平0.05, 拒绝零假设.
0.0640
50
60
70
基于符号检验的 中位数和分位点的置信区间
广义符号检验特点 • 零分布不需要对称的假定. • 检验某假定的比例值. • 用二项分布.
2.2 Wilcoxon 符号秩检验 • 对单样本, 零分布假定是连续的、对称的. • 检验 • 用符号秩检验(Wilcoxon signed-rank)
• 设有随机抽取的 n 个样本 , 检验中位数 Wilcoxon 符号检验步骤: 1. 计算 的值, 并给出这些值的秩 2. 计算 ,即 的 的秩之和 或 ,即 的 的秩之和 其中 3. 利用统计量 或 所服从的分布进行 检验(查表或用R中psignrank(w,n)得 P-值)
置信区间为
其中 由 决定. • 在欧洲酒精人均消费的例中, n(n+1)/2=55
中位数10.390是参数 的Hodges-Lehmann估计

的95%置信区间为: 其中, 即:
qsignrank(0.025,10)=9 psignrank(9,10)=0.03222656 psignrank(8,10)=0.02441406

《单样本非参数检验》PPT课件演示教学

《单样本非参数检验》PPT课件演示教学

4663
1
0.0000305
0.9999390
[4940,8679]
3739
2
0.0004883
0.9990234
[5789,8546]
2757
3
0.0036926
0.9926147
[6161,7987]
1826
4
0.0175781
0.9648438
[6344,7897]
648
5
0.0592346
0.8815308
二、检验的步骤
(1) 计算︱Xi-M0︳,它们代表这些样本点到M0的距离;
(2) 把上面的n个绝对值排序,并找出它们的秩;如果 有相同的样本点,每个点取平均秩(如1,4,4,5的秩 为1,2.5,2.5,4);
(3) 计算正等级的总和W+与负等级的总和W-
(4) 选择检验统计量。对双边检验,在零假设下, W+ 与 W-应大小差不多.因而,当其中之一非常小时,应怀 疑零假设;在此,取检验统计量W=min(W+ ,W-)。类 似地,对左侧检验,取W=W+ 。对右侧检验,取W=W- 。
(5) 根据得到的W值,查Wilcoxon符号秩检验的分布表以 得到在零假设下P—值.如果n很大要用正态近似,得 到一个与W有关的正态随机变量Z的值,再查表得P— 值。。
(6) 如P值较小(比如小于或等于给定的显著性水平0.05)则 可以拒绝零假设。
注意:Wilcoxon符号秩检验利用符号检验没有用数据 大小的信息,但Wilcoxon符号秩检验假设分布是对称 的,如果对称性不成立,则还是符号检验好。
特别,当样本容量很大时,可利用正态近似,利用线性 符号秩的概念有

非参数统计第二章 单样本检验

非参数统计第二章 单样本检验

第二节 Wilcoxon符号秩检验
基本概念及性质 对称分布的中心一定是中位数,在非对称分布情况下,中
位数不唯一,研究对称中心比中位数更有意义。 例:下面的数据中,O是对称中心吗?
0
检验步骤
Ex.某公司为减少加工费用,决定若铸件重量的中位数超过 25公斤,就转包加工;若不超过25公斤则不转包。现从这 批铸件中随机抽取8件,每件的重量分别为:24.3,25.8, 25.4,24.8,25.2,25.1,25.0,25.5。使用这些数据,能 否作出这批铸件是否转包的决定。
在0.05的水平下,拒绝前面的两个假设.
中位数的置信区间
根据顺序统计量构造置信区间:
P(X(i) M X( j) ) 1 P(M X(i) ) P(M X( j) )
n ki
Ckn
1 n 2
n
Ckn
kj
1 n 2
1 i j n
由于得到的区域是以中位数对称的,
P
定义, s
n
I(xi M0 )
n
, s I(xi M0 ) ,则 s s
n , K min{s ,s}
i1
i1
在零假设情况下 K ~ B(n,0.5),在显著性水平为 的拒绝域为
Pbinom (K k | n, p 0.5)
其中k是满足上式最大的k值。
结果讨论
结果讨论
H0:M=84,H1:M≠84
按照传统的参数方法,假设房屋价格服从正态分布N(84, σ2),
则检验统计量为
,t其值X为1.384,结论呢? s/ n
第一节 符号检验和置信区间
假设总体 F(x) ,Me是总体的中位数,对于假设检验问题:
H0 : Me M0 H1 : Me M0

第3讲单样本非参数检验2二项分布检验

第3讲单样本非参数检验2二项分布检验

VAR00001
Group 1 Group 2 Total
a. Based on Z Approximation.
二项分布检验的R操作
binom.test(x,N,P)
4.4作业
• 1、用卡方检验住前面例题。 • 2、根据以往经验,新生儿染色体异常率一 般为1%,现某医院观察了当地共400名新 生儿,只发现一例染色体异常,数据见 binominal.sav.问可否推断该地区新生儿染 色体异常率低于一般水平? • 3、某保险公司主管部门经理估计投保人中 35岁以上者占65%, 随机抽取38人,结果 35岁以上者有24人(样本成数为0.63), 设,问主管经理的估计是否可靠?
Z Z z 1 2
4.1 二项分布检验的思想和方法 二项分布检验的过程:
(4)计算统计量和做出统计决策 ★当 n 20 ,计算统计量 Z 在拒绝域
Z Z z 1 2
k 0.5 np np(1 p)
解答过程: (1)建立零假设和备选假设
H 0 :业绩好的新员工服从P值为0.6的二项分布
H 1 :业绩好的新员工不服从P值为0.6的二项分布
解答过程: (2)构造和计算统计量
k =28,p=0.6,n=32,k=28>(n/2)=16,计算统计量
Z k 0.5 np np(1 p) 28 0.5 32 0.6 32 0.6 (1 0.6) 2.995
Z
n 2
k 0.5 np np(1 p)
k
时取加号,否则取减号(正态性近似的连续型修正,提高近似程度)。
二项分布与正态分布之间的关系
(3)设定显著水平和确定否定域 ★当 n 20 ,零假设成立时,统计量 Z

第5讲单样本非参数检验4游程检验

第5讲单样本非参数检验4游程检验

令α =0.05,问上面样本数据是否随机?
计算提示
• 大样本,所以游程统计量近似服从标准正 态分布。 • m=10,n=40,R=13 γ =m/n=0.25,代入公式可求出游程统计量的 值(-1.81),再查标准正态分布表,得临界 值为正负1.96。 因此,落入接受域,数据是随机的
R操作
library(tseries) x=c(1,1,1,0,1,1,1,1,1,1,1,0,1,1,0,0,1,1,1,1,1, 1,0,1,1,1,1,0,1,1,1,1,1,0,0,0,0,1,1,1,1,1,1,1,1 ,1,1,1,1,1) x1=factor(x) runs.test(x1)
前面分析表明:游程个数过大或过小都是不 随机的,而游程个数居中则是随机的。因此, 可构造统计量R,表示游程的个数。再确定该 统计量的分布,则可查表确定拒绝域和接受域, 从而进行假设检验。
游程检验分布表如下: 分别记两组的样本容量分别为n1和n2,哪个为 n1都可以。
游程检验分布表
游程个数R
游程检验分布表
案例3
解决思路
解:中位数为204.6,将小于204.6的设为0,大于204.6的设为1,可得 二分变量。
大家来完成。
Байду номын сангаас
答案
SPSS操作: 用前面数据操作。
P值=0.022,小于0.05,拒绝原 假设,认为数据不具有随机性
手工计算,结果又如何?大家完 成
library(tseries) x=c(156.0,255.5,132.0,246.7,867.9,86.4,610 .4,125.7,150.4,117.6,201.9,207.2,189.8,585. 8,153.1,565.4,511.0,567.0,222.3,141.5) m=mean(x) x1=x-304.68 x2=(x1>0) x3=factor(x2) runs.test(x3)

非参数统计单样本检验

非参数统计单样本检验
问:经费有无上升趋势?
首先用全部19个数据检验: n=19,c=10,S_=5,S+=4
再用1970年至1984年旳15个数据检验: n=15,c=8,S_=7,S+=0
第五节 游程检验
游程旳概念:
随机游程问题:
一种二元0/1序列当中,一段全由0或者全由1 构成旳串成为一种游程,游程中数据旳个数称 为游程长度,序列中游程旳个数记为R,反应0 和1轮换交替旳频繁程度。在序列长度N固定 旳时候,假如游程过少过者过多,都阐明序列 旳随机性不好。当游程过多或者过少时,就会 怀疑序列旳随机性。
P(R 2k 1) k 1
k
k
N
k 1
()
n
n 1 m 1
2( )( )
P(R 2k)
k 1 k 1 N
()
n
建立了抽样分布之后,在零假设成立时,能够计算P(R c1)或者P(R c2 ) 旳值,进行检验。
随机游程问题:
R=8,m=10, n=11 查表可知,α=0.05下临界值为c1=6,c2=17 因为6<R=8<17,故以为这些数据符合随机性假设
检验原理和计算措施
设是由0或者1构成旳序列 X1,X2,…,Xn ,假设检验问题:
H0 : 数据出现顺序随机 H1 : 数据出现不随机
R为游程个数,假设有 m个0,n 个1,m n N ,这时R取任何一种值
旳概率都是1
/
N ()
n
,R旳条件分布
n 1 m 1 n 1 m 1
( )( ) ( )( )
ab
180
200
220
240
260
1970
1975
1980

第二章非参数统计的分析

第二章非参数统计的分析
zB0.5n(n足够大) 0.25n
2021/2/22
第二章非参数统计的分析
13
第二节 Cox-Stuart趋势检验
人们经常要看某项发展的趋势.但是从图表上很难看出是 递增,递减,还是大致持平.
【例5】我国自1985年到1996年出口和进口的差额(balance) 为(以亿美元为单位)
—149.0 119.7 37.7 43.5 122.2 54.0
49.9,48.2,47.6,46,45.8,45.2,41.9,38.8,37.7,37.
5,36.5, 36.4,32.7,32.7,32.2,29.1,27.8,27.8
2021/2/22
第二章非参数统计的分析
6
Histogram of x
10
8
6
Frequency
4
2
0
20
40
60
80
100
2021/2/22
第二章非参数统计的分析
8
符号检验的思路,记
成功:X-0大于零,即大于中位数M,记为“+”; 失败:X-0小于零,即小于中位数M,记为“-”。 令 S+=得正符号的数目
S-=得负符号得数目 可以知道S+或S— 均服从二项分布B(65,0.5)。则可以 用来作检验的统计量。其假设为:
H 0 : 0 :H 1 : 0 H 0 : 0
2021/2/22
第二章非参数统计的分析
9
关于非参数检验统计量需要说明的问题
在非参数检验中,可以得到两个相互等价的统计量, 比如在符号检验中,得负号与得正好的个数,就是一对 等价的统计量,因为S++S-=N。那么我们在检验时应该 用那个呢?约定选择统计量

非参数统计教学大纲

非参数统计教学大纲

遵义师范学院课程教学大纲非参数统计教学大纲(试行)课程编号:280020 适用专业:统计学学时数:64 学分数: 4执笔人:黄建文审核人:系别:数学教研室:统计学教研室编印日期:二〇一五年七月课程名称:非参数统计课程编码:学分:4总学时:64课堂教学学时:64实践学时:适用专业:统计学先修课程:高等数学、线性代数、概率论、数理统计一、课程的性质与目标:(一)该课程的性质本课程属专业方向选修课程。

非参数统计形成于二十世纪四十年代,是与参数统计相比较而存在的统计学一个年轻、活跃而前沿的分支,含有丰富的统计思想并在实践中有着广泛的应用。

非参数统计方法不依赖于总体分布及其参数,适用于多种类型的数据,进行统计推断时仅需要一些非常一般性的假设,因而具有良好的稳健型,在总体分布未知的情况下往往比参数统计方法有效。

(二)该课程的教学目标本课程的教学目的是使学生了解非参数统计在推断统计体系中日益重要的作用,理解非参数统计方法和参数统计方法的区别。

要求学生掌握本课程的基本知识、基本概念、基本原理和基本方法,能应用非参数统计方法解决一些简单的实际问题;注重学生统计思维能力和实践能力的培养,进一步培养学生重视原始资料的完整性与准确性、对数据处理持严肃认真态度的专业素质。

二、教学进程安排课外学习时数原则上按课堂教学时数1:1安排。

三、教学内容与要求第一章引言【教学目标】通过本章学习,使学生清楚非参数统计的研究对象,了解非参数统计的历史,明白非参数统计方法和参数统计方法的区别,认识学习非参数统计方法的必要性,了解非参数统计的一些基本概念与基本工具;通过对初等推断统计的简单回顾,要求学生提炼并把握推断统计思想的实质,为后续章节学习非参数统计的分析技巧和主要思想打下基础。

【教学内容和要求】主要教学内容:非参数统计研究内容;非参数统计小史;初等推断统计回顾;非参数统计基本概念。

教学重点与难点:教学重点是通过与参数统计异同的比较,介绍非参数统计的研究内容与研究方法;教学难点是对检验的相对效率、秩检验统计量、U统计量等非参数统计基本概念的理解。

非参数统计课程《非参数统计》课程教学大纲模板3.1教学大纲

非参数统计课程《非参数统计》课程教学大纲模板3.1教学大纲

非参数统计》课程教学大纲课程编号:06542 制定单位:统计学院制定人(执笔人):潘文荣审核人:徐海云制定(或修订)时间:2014年2月28日江西财经大学教务处《非参数统计》课程教学大纲、课程总述、教学时数分配三、单元教学目的、教学重难点和内容设置第一章绪论教学目的】理解非参数统计学习目的和内容。

重点难点】学习非参数统计学的应用意义,明确非参数统计的优缺点。

教学内容】第一节测量的层次第二节假设测验的回顾第三节非参数统计方法第二章单个样本的非参数检验【教学目的】了解符号检验、Wilcoxon 检验、正态计分检验、Cox-Start 趋势检验、游程经验的原理和计算方法,并进行上机操作。

【重点难点】符号检验、游程检验、Wilcoxon 检验的原理和计算方法。

【教学内容】第一节符号检验第二节Wilcoxon 检验第三节正态计分检验第四节Cox-Start 趋势检验第五节游程经验第三章两个相关样本的非参数检验【教学目的】了解符号检验、Wilcoxon 检验在两个相关中的检验,并进行上机操作。

【重点难点】在上一章学习的知识进一步应用到相关处理的比较上。

【教学内容】第一节符号检验第二节Wilcoxon 符号秩检验第四章两个独立样本的非参数检验【教学目的】了解Brown-mood 中位数检验的原理及计算方法,并进行上机操作。

【重点难点】秩和检验的原理和方法【教学内容】第一节Brown-mood 中位数检验第二节秩和检验第五章多个相关样本的非参数检验【教学目的】了解Cochran检验、Friedman检验的原理及计算方法,并进行上机操作。

【重点难点】Fiedman 检验的原理和方法【教学内容】第一节Cochran 检验第二节Friedman 检验第六章多个独立样本的非参数检验【教学目的】了解Kruskal-Wallis 检验、正态计分检验的原理及计算方法,并进行上机操作。

【重点难点】独立样本比较的非参数统计方法。

非参数检验资料.

非参数检验资料.

(二)频数表资料(或等级资料) 的两样本比较
[例3]:20名正常人和32名铅 作业工人尿棕色素定性 检查结果见下表3,问 铅作业工人尿棕色素是 否高于正常人?
表3 正常人和铅作业工人尿棕色
素定性检查结果
尿棕 N1 人数 N2
色素 正常人
铅作业工人
-
18
8
+
2
10
++
0
7
+++ 0
3
++++ 0
4
非参数检验
秩和检验
上海第二医科大学 公共卫生学院 蔡泳
非参数统计的概念 non-parametric statistics
不知道所研究样本来自总体的分 布型或已知总体分布与检验所要 求的条件不符,此时可用非参数 统计进行假设检验
适用资料: 1.总体分布为偏态或分布形式未知 2.等级资料 3.个别数据偏大或数据的某一端无
表1 甲乙两方法分别测定某车间空 气中CS2的含量比较
采样 甲法 乙法 差值 秩次

(1)
+-
(2) (3) (4) (5) (6)
1
50.7 60.0 -9.3
9
2
3.3 3.3 0 -
-
3
28.8 30.0 -1.2
4
4 46.2 43.2
5
1.2 2.2
6 25.5 27.5
7
2.9 4.9
秩和检验
• 配对资料的符号秩和检验 • 两样本的秩和检验 • 等级(有序分类)资料的秩和检验 • 多组资料的秩和检验
一、配对资料的符号秩和检验 (wilcoxon signed rank test, 又称差数秩和检验)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
根据5年前的数据,对0.05,0.5和0.95分位数,至少检验一个 假定。
H0:M0.5=7.5,H1:M0.5<7.5
H0:M0.05=6,H1:M0.05<6
H0:M0.95=9,H1:M0.95<9
字符型数据的符号检验
例. 为了解顾客对咖啡、茶的喜好情况,在某商店随机抽取15 名顾客进行调查,结果有12名顾客更喜欢茶,2名顾客更喜欢 咖啡,1名对两者同样喜好。问顾客对咖啡和茶的喜好是否有 差异?若有,是否更喜欢茶?
i1
在零假设情况下 K~B(n,0.5),在显著性水平为 的拒绝域为
P b in o m (K k |n ,p 0 .5 )
其中k是满足上式最大的k值。
结果讨论
结果讨论
大样本结论
当n较大时 K ~ N( n , n )
24 ZKn2N(0,1),n
n4
双边: H 0:M e M 0 H ,1:pM -e值 M 0 左侧: H 0:M e M 0 H ,1:pM -e 值 M 0 右侧: H 0:M e M 0 H 1 ,:M pe- 值M 0
i1
i1
K s
在零假设情况下 K~B(n,p) ,在显著性水平为 的拒绝域为
P binom (K k|n,p)
其中k是满足上式最大的k值。
例. 5年前成年人在每日24小时中的睡眠量中位数是7.5小时, 每日睡眠量为6小时或少于6小时的占调查总数的5%,9小时 和9小时以上的也占5%。现对8个普通成年人的抽样调查结果 为:7.2,8.3,5.6,7.4,7.8,5.2,9.1,5.8.问现在成年人 的睡眠量是否少于5年前
或者负号太多的时候,认为数据存在趋势。在零假设情况
下 Di服从二项分布。从而转化为符号检验问题
K m in (S ,S )~b (n ',0 .5 )
例 某地区32年来的降雨量如下表 问 (1):该地区前10年来降雨量是否有变化? (2):该地区32年来降雨量是否有变化?
年份 1971 1972 1973 1974 1975 1976 1977 1978 降雨量 206 223 235 264 229 217 188 204 年份 1979 1980 1981 1982 1983 1984 1985 1986 降雨量 182 230 223 227 242 238 207 208 年份 1987 1988 1989 1990 1991 1992 1993 1994 降雨量 216 233 233 274 234 227 221 214 年份 1995 1996 1997 1998 1999 2000 2001 2002 降雨量 226 228 235 237 243 240 231 210
第四节 Cox-Stuart趋势检验
检验原理:
数据序列: X1,X2,,…双,Xn边假设检验问题:
H 0 : 数 据 序 列 无 趋 势 H 1 :;1/)2/,2,n为 n为 偶奇 数数
取数对(x i , x,ic ) Di x,i 为xi正c 的S数 目, 为负的数S 目 , 当正号
非参数统计第二章-单样本检验
第一节 符号检验和置信区间
假设总体 F ( x ) ,Me是总体的中位数,对于假设检验问题:
H 0:M eM 0 H 1:M eM 0
M 0 是待检验的中位数取值
定义,
s
n
I(xi M0)
,
n
s I(xi M0) ,则 s s n, Kmin{s,s}
i1
采用Neyman原则选择最优置信区间,首先找出置信度大于
1 的所有区间 [X(i),X(j)],ij,然后再从中选择区间
长度最小的一个。对于大样本,可以用近似正态分布求 置信区间。
构造置信度为90%的置信区间: [9.8,10.0]
第二节 Wilcoxon符号秩检验
基本概念及性质 对称分布的中心一定是中位数,在非对称分布情况下,中
2PN(0,1)(Zz) PN(0,1)(Zz) PN(0,1)(Zz)
检验步骤
Ex. 某国12位总统的寿命(岁)分别为46,57,58,60,60, 63,64,67,72,78,88,90.问该国总统寿命的中位数是 否不小于71.5岁?
根据题目,要检验的是 H0:M0.5≥71.5,H1:M0.5<71.5
位数不唯一,研究对称中心比中位数更有意义。 例:下面的数据中,O是对称中心吗?
0
检验步骤
Ex.某公司为减少加工费用,决定若铸件重量的中位数超过 25公斤,就转包加工;若不超过25公斤则不转包。现从这 批铸件中随机抽取8件,每件的重量分别为:24.3,25.8, 25.4,24.8,25.2,25.1,25.0,25.5。使用这些数据,能 否作出这批铸件是否转包的决定。
在0.05的水平下,拒绝前面的两个假设.
中位数的置信区间
根据顺序统计量构造置信区间:
P(X(i)M X(j))1P(M X(i))P(M X(j))
kn iCk n1 2nkn jCk n1 2n 1ijn
由于得到的区域是以中位数对称的,
PX (k 1 ) M X (n k ) 1 2 P (K k ) k i 0 1 C n k 1 2 n 1
此处的目的只是为了比较两者中哪个更受欢迎,并无定量的数 值,因而可采用符号检验,只要把更喜欢茶视为“成功+”, 反之视为“失败-”。故可建立如下假设:
H0:P+=P-,H1:P+≠P_
H0:P+=P-,H1:P+>P_
在第一个检验中,仅判定对二者喜好程度有无差异。由调查结 果,n=14,s+=12,s-=2. P(S_≤2|n=14,p=0.5)=0.0065,双侧检 验概率为0.013.
显然,当S_太小时拒绝原假设。经计算,K=min(S_,S+)=4
P(K≤4)=? 0.1938
广义符号检验
假设总体 F ( x ) ,Mp是总体的p分位数,对于假设检验问题:
H 0:M pM 0 H 1:M pM 0
M 0 是待检验的分位数取值
定义,
s
n
I(xi M0)
,
n
s I(xi M0) ,则 s s n,
相关文档
最新文档