非参数统计第二章 单样本检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
根据5年前的数据,对0.05,0.5和0.95分位数,至少检验一个 假定。 H0:M0.5=7.5,H1:M0.5<7.5 H0:M0.05=6,H1:M0.05<6 H0:M0.95=9,H1:M0.95<9
字符型数据的符号检验
例. 为了解顾客对咖啡、茶的喜好情况,在某商店随机抽取15 名顾客进行调查,结果有12名顾客更喜欢茶,2名顾客更喜欢 咖啡,1名对两者同样喜好。问顾客对咖啡和茶的喜好是否有 差异?若有,是否更喜欢茶?
此处的目的只是为了比较两者中哪个更受欢迎,并无定量的数 值,因而可采用符号检验,只要把更喜欢茶视为“成功+”, 反之视为“失败-”。故可建立如下假设: H0:P+=P-,H1:P+≠P_ H0:P+=P-,H1:P+>P_
在第一个检验中,仅判定对二者喜好程度有无差异。由调查结 果,n=14,s+=12,s-=2. P(S_≤2|n=14,p=0.5)=0.0065,双侧检 验概率为0.013.
构造置信度为90%的置信区间: [9.8,10.0]
第二节 Wilcoxon符号秩检验
基本概念及性质 对称分布的中心一定是中位数,在非对称分布情况下,中 位数不唯一,研究对称中心比中位数更有意义。 例:下面的数据中,O是对称中心吗?
0
检验步骤
Ex. 某公司为减少加工费用,决定若铸件重量的中位数超过 25公斤,就转包加工;若不超过 25公斤则不转包。现从这 批铸件中随机抽取8件,每件的重量分别为:24.3,25.8, 25.4,24.8,25.2,25.1,25.0,25.5。使用这些数据,能 否作出这批铸件是否转包的决定。
2PN(0,1) (Z z) PN(0,1) (Z z) PN(0,1) (Z z)
检验步骤
Ex. 某国12位总统的寿命(岁)分别为46,57,58,60,60, 63,64,67,72,78,88,90.问该国总统寿命的中位数是 否不小于71.5岁?
根据题目,要检验的是 H0:M0.5≥71.5,H1:M0.5<71.5 显然,当S_太小时拒绝原假设。经计算,K=min(S_,S+)=4 P(K≤4)=? 0.1938
n
n
定义, s I(x i M0 ) , s I(x i M0 ) ,则 s s n , K min{s ,s}
i 1
i 1
在零假设情况下 K ~ B(n,0.5) ,在显著性水平为 的拒绝域为
Pbinom (K k | n, p 0.5)
在0.05的水平下,拒绝前面的两个假设.
中位数的置信区间
根据顺序统计量构造置信区间:
P(X(i) M X( j) ) 1 P(M X(i) ) P(M X( j) ) n n n n k1 k1 Cn Cn 1 i j n 2 k j 2 k i
其中k是满足上式最大的k值。
结果讨论
结果讨论
大样本结论
当n较大时
n n K ~ N( , ) 2 4
Z
Kn 2 N(0,1), n n4
双边: H0 : Me M0 H , p-值 1 : Me M0
左侧: H0 : Me M0 H , p-值 1 : Me M0 右侧: H0 : Me M0 H1, p值 :M e M0
按照传统的参数方法,假设房屋价格服从正态分布N(84, σ 2), X 则检验统计量为 ,t其值为 1.384, 结论呢? s / n
第一节 符号检验和置信区间
假设总体 F(x) ,Me是总体的中位数,对于假设检验问题:
H0 : Me M0 H1 : Me M0
M 0 是待检验的中位数取值
广义符号检验
假设总体 F(x) ,Mp是总体的p分位数,对于假设检验问题:
H0 : Mp M0 H1 : Mp M0
M 0 是待检验的分位数取值
定义, s I(x i M0 ) , s I(x i M0 ) ,则 s s n ,
n
n
i 1
i 1
K s
在零假设情况下 K ~ B(n,p) ,在显著性水平为 的拒绝域为
Pbinom (K k | n, p)
其中k是满足上式最大的k值。
பைடு நூலகம்
例. 5年前成年人在每日24小时中的睡眠量中位数是7.5小时, 每日睡眠量为 6 小时或少于 6 小时的占调查总数的 5% , 9 小时 和9小时以上的也占5%。现对8个普通成年人的抽样调查结果 为:7.2,8.3,5.6,7.4,7.8,5.2,9.1,5.8.问现在成年人 的睡眠量是否少于5年前
第四节 Cox-Stuart趋势检验
检验原理:
数据序列: X1,X2,…,X ,双边假设检验问题: n
令:
H0 : 数据序列无趋势 H1 : 有增长或减少趋势
n / 2, n为偶数 c (n+1)/2, n为奇数
由于得到的区域是以中位数对称的,
P X ( k 1)
k 1 M X ( nk ) 1 2P( K k ) Cn 2 i 0 k 1 n 1
采用Neyman原则选择最优置信区间,首先找出置信度大于 1 的所有区间 [X(i) , X( j) ],i j ,然后再从中选择区间 长度最小的一个。对于大样本,可以用近似正态分布求 置信区间。
X t s/ n
假设某地的10栋房屋出售价格(由低到高排列)为56,69, 85, 87, 90,94, 96,113 ,118, 179 (单位:万元), 问该地区的平均房屋价格是否和人们相信的 84 万元的水平大 体一致。 我们用M表示价格分布的中心(这里考虑中位数),如假设该 分布对称,则M也是均值。我们要检验 H0:M=84,H1:M≠84
字符型数据的符号检验
例. 为了解顾客对咖啡、茶的喜好情况,在某商店随机抽取15 名顾客进行调查,结果有12名顾客更喜欢茶,2名顾客更喜欢 咖啡,1名对两者同样喜好。问顾客对咖啡和茶的喜好是否有 差异?若有,是否更喜欢茶?
此处的目的只是为了比较两者中哪个更受欢迎,并无定量的数 值,因而可采用符号检验,只要把更喜欢茶视为“成功+”, 反之视为“失败-”。故可建立如下假设: H0:P+=P-,H1:P+≠P_ H0:P+=P-,H1:P+>P_
在第一个检验中,仅判定对二者喜好程度有无差异。由调查结 果,n=14,s+=12,s-=2. P(S_≤2|n=14,p=0.5)=0.0065,双侧检 验概率为0.013.
构造置信度为90%的置信区间: [9.8,10.0]
第二节 Wilcoxon符号秩检验
基本概念及性质 对称分布的中心一定是中位数,在非对称分布情况下,中 位数不唯一,研究对称中心比中位数更有意义。 例:下面的数据中,O是对称中心吗?
0
检验步骤
Ex. 某公司为减少加工费用,决定若铸件重量的中位数超过 25公斤,就转包加工;若不超过 25公斤则不转包。现从这 批铸件中随机抽取8件,每件的重量分别为:24.3,25.8, 25.4,24.8,25.2,25.1,25.0,25.5。使用这些数据,能 否作出这批铸件是否转包的决定。
2PN(0,1) (Z z) PN(0,1) (Z z) PN(0,1) (Z z)
检验步骤
Ex. 某国12位总统的寿命(岁)分别为46,57,58,60,60, 63,64,67,72,78,88,90.问该国总统寿命的中位数是 否不小于71.5岁?
根据题目,要检验的是 H0:M0.5≥71.5,H1:M0.5<71.5 显然,当S_太小时拒绝原假设。经计算,K=min(S_,S+)=4 P(K≤4)=? 0.1938
n
n
定义, s I(x i M0 ) , s I(x i M0 ) ,则 s s n , K min{s ,s}
i 1
i 1
在零假设情况下 K ~ B(n,0.5) ,在显著性水平为 的拒绝域为
Pbinom (K k | n, p 0.5)
在0.05的水平下,拒绝前面的两个假设.
中位数的置信区间
根据顺序统计量构造置信区间:
P(X(i) M X( j) ) 1 P(M X(i) ) P(M X( j) ) n n n n k1 k1 Cn Cn 1 i j n 2 k j 2 k i
其中k是满足上式最大的k值。
结果讨论
结果讨论
大样本结论
当n较大时
n n K ~ N( , ) 2 4
Z
Kn 2 N(0,1), n n4
双边: H0 : Me M0 H , p-值 1 : Me M0
左侧: H0 : Me M0 H , p-值 1 : Me M0 右侧: H0 : Me M0 H1, p值 :M e M0
按照传统的参数方法,假设房屋价格服从正态分布N(84, σ 2), X 则检验统计量为 ,t其值为 1.384, 结论呢? s / n
第一节 符号检验和置信区间
假设总体 F(x) ,Me是总体的中位数,对于假设检验问题:
H0 : Me M0 H1 : Me M0
M 0 是待检验的中位数取值
广义符号检验
假设总体 F(x) ,Mp是总体的p分位数,对于假设检验问题:
H0 : Mp M0 H1 : Mp M0
M 0 是待检验的分位数取值
定义, s I(x i M0 ) , s I(x i M0 ) ,则 s s n ,
n
n
i 1
i 1
K s
在零假设情况下 K ~ B(n,p) ,在显著性水平为 的拒绝域为
Pbinom (K k | n, p)
其中k是满足上式最大的k值。
பைடு நூலகம்
例. 5年前成年人在每日24小时中的睡眠量中位数是7.5小时, 每日睡眠量为 6 小时或少于 6 小时的占调查总数的 5% , 9 小时 和9小时以上的也占5%。现对8个普通成年人的抽样调查结果 为:7.2,8.3,5.6,7.4,7.8,5.2,9.1,5.8.问现在成年人 的睡眠量是否少于5年前
第四节 Cox-Stuart趋势检验
检验原理:
数据序列: X1,X2,…,X ,双边假设检验问题: n
令:
H0 : 数据序列无趋势 H1 : 有增长或减少趋势
n / 2, n为偶数 c (n+1)/2, n为奇数
由于得到的区域是以中位数对称的,
P X ( k 1)
k 1 M X ( nk ) 1 2P( K k ) Cn 2 i 0 k 1 n 1
采用Neyman原则选择最优置信区间,首先找出置信度大于 1 的所有区间 [X(i) , X( j) ],i j ,然后再从中选择区间 长度最小的一个。对于大样本,可以用近似正态分布求 置信区间。
X t s/ n
假设某地的10栋房屋出售价格(由低到高排列)为56,69, 85, 87, 90,94, 96,113 ,118, 179 (单位:万元), 问该地区的平均房屋价格是否和人们相信的 84 万元的水平大 体一致。 我们用M表示价格分布的中心(这里考虑中位数),如假设该 分布对称,则M也是均值。我们要检验 H0:M=84,H1:M≠84