非参数统计第二章 单样本检验PPT课件

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P(K≤4)=? 0.1938
广义符号检验
假设总体 F ( x ) ,Mp是总体的p分位数,对于假设检验问题:
H 0:M pM 0 H 1:M pM 0
M 0 是待检验的分位数取值
定义,
s
n
I(xi M0)
,
n
s I(xi M0) ,则 s s n,
i1
i1
K s
在零假设情况下 K~B(n,p) ,在显著性水平为 的拒绝域为
H0:M=84,H1:M≠84
按照传统的参数方法,假设房屋价格服从正态分布N(84, σ2),
则检验统计量为
,t其 值X为1.384,结论呢? s/ n
第一节 符号检验和置信区间
假设总体 F ( x ) ,Me是总体的中位数,对于假设检验问题:
H 0:M eM 0 H 1:M eM 0
M 0 是待检验的中位数取值
采用Neyman原则选择最优置信区间,首先找出置信度大于
1 的所有区间 [X(i),X(j)],ij,然后再从中选择区间
长度最小的一个。对于大样本,可以用近似正态分布求 置信区间。
构造置信度为90%的置信区间: [9.8,10.0]
第二节 Wilcoxon符号秩检验
基本概念及性质 对称分布的中心一定是中位数,在非对称分布情况下,中
24 ZKn2N(0,1),n
n4
双边: H 0:M e M 0 H ,1:pM -e值 M 0 左侧: H 0:M e M 0 H ,1:pM -e 值 M 0 右侧: H 0:M e M 0 H 1 ,:M pe- 值M 0
2PN(0,1)(Zz) PN(0,1) (Z z) PN(0,1)(Zz)
此处的目的只是为了比较两者中哪个更受欢迎,并无定量的数 值,因而可采用符号检验,只要把更喜欢茶视为“成功+”, 反之视为“失败-”。故可建立如下假设:
H0:P+=P-,H1:P+≠P_
H0:P+=P-,H1:P+>P_
在第一个检验中,仅判定对二者喜好程度有无差异。由调查结 果,n=14,s+=12,s-=2. P(S_≤2|n=14,p=0.5)=0.0065,双侧检 验概率为0.013.
第四节 Cox-Stuart趋势检验
检验原理:
数据序列: X1,X2,,…双,Xn边假设检验问题:
H 0 : 数 据 序 列 无 趋 势 H 1 : 有 增 长 或 减 少 趋 势
令:
c(nn+1/)2/,2,n为 n为 偶奇 数数
取数对(x i , x,ic ) Di x,i 为xi正c 的S数 目, 为负的数S 目 , 当正号
检验步骤
Ex. 某国12位总统的寿命(岁)分别为46,57,58,60,60, 63,64,67,72,78,88,90.问该国总统寿命的中位数是 否不小于71.5岁?
根据题目,要检验的是 H0:M0.5≥71.5,H1:M0.5<71.5
显然,当S_太小时拒绝原假设。经计算,K=min(S_,S+)=4
P binom (K k|n,p)
其中k是满足上式最大的k值。
例. 5年前成年人在每日24小时中的睡眠量中位数是7.5小时, 每日睡眠量为6小时或少于6小时的占调查总数的5%,9小时 和9小时以上的也占5%。现对8个普通成年人的抽样调查结果 为:7.2,8.3,5.6,7.4,7.8,5.2,9.1,5.8.问现在成年人 的睡眠量是否少于5年前
位数不唯一,研究对称中心比中位数更有意义。 例:下面的数据中,O是对称中心吗?
0
检验步骤
Ex.某公司为减少加工费用,决定若铸件重量的中位数超过 25公斤,就转包加工;若不超过25公斤则不转包。现从这 批铸件中随机抽取8件,每件的重量分别为:24.3,25.8, 25.4,24.8,25.2,25.1,25.0,25.5。使用这些数据,能 否作出这批铸件是否转包的决定。
根据5年前的数据,对0.05,0.5和0.95分位数,至少检验一个 假定。
H0:M0.5=7.5,H1:M0.5<7.5
H0:M0.05=6,H1:M0.05<6
H0:M0.95=9,H1:M0.95<9
字符型数据的符号检验
例. 为了解顾客对咖啡、茶的喜好情况,在某商店随机抽取15 名顾客进行调查,结果有12名顾客更喜欢茶,2名顾客更喜欢 咖啡,1名对两者同样喜好。问顾客对咖啡和茶的喜好是否有 差异?若有,是否更喜欢茶?
或者负号太多的时候,认为数据存在趋势。在零假设情况
下 Di服从二项分布。从而转化为符号检验问题
K m in (S ,S )~b (n ',0 .5 )
例 某地区32年来的降雨量如下表 问 (1):该地区前10年来降雨量是否有变化? (2):该地区32年来降雨量是否有变化?
年份 1971 1972 1973 1974 1975 1976 1977 1978 降雨量 206 223 235 264 229 217 188 204 年份 1979 1980 1981 1982 1983 1984 1985 1986 降雨量 182 230 223 227 242 238 207 208 年份 1987 1988 1989 1990 1991 1992 1993 1994 降雨量 216 233 233 274 234 227 221 214 年份 1995 1996 1997 1998 1999 2000 2001 2002 降雨量 226 228 235 237 243 240 231 210
在0.05的水平下,拒绝前面的两个假设.
中位数的置信区间
根据顺序统计量构造置信区间:
P(X(i)MX(j))1P(MX(i))P(MX(j))
kn iCk n1 2nkn jCk n1 2n 1ijn
由于得到的区域是以中位数对称的,
PX (k 1 ) M X (n k ) 1 2 P (K k ) k i 0 1 C n k 1 2 n 1
定义,
s
n
I(xi M0)
,
n
s I(xi M0) ,则 s s n, Kmin{s,s}
i1
i1
在零假设情况下 K~B(n,0.5),在显著性水平为 的拒绝域为
P b in 百度文库 m (K k |n ,p 0 .5 )
其中k是满足上式最大的k值。
结果讨论
结果讨论
大样本结论
当n较大时 K ~ N( n , n )
第二章 单样本检验
t X
s/ n
假设某地的10栋房屋出售价格(由低到高排列)为56,69, 85,87,90,94,96,113,118,179(单位:万元), 问该地区的平均房屋价格是否和人们相信的84万元的水平大 体一致。
我们用M表示价格分布的中心(这里考虑中位数),如假设该 分布对称,则M也是均值。我们要检验
相关文档
最新文档