非参数统计 符号检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例3.1 假设某地16座预出售的楼盘均价,单位(百元/平方米)如下: 36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 35
该地平均楼盘价格是否与媒体公布的3700元/平方米的说法相符? 解一: 用t检验法
H0 : 37 H1 : 37 其中为总体的均值
喜欢B品牌的客户人数:18人
不能区分的人数:
5人
解:假设检验问题: H0 : P(A) P(B) H1 : P(A) P(B) 由给定的数据知: S 22, S 18, S S 40
运用大样本的性质,
Z
K
n' n'
2C 4
22 40 2
40 4
1 2
记为“0”,记P+ 为“+”比例, P- 为“-”比例, 那么假设检验问题:
H0:P+=P- H1:P+=P可以用符号检验。
例3.4 如右表是某种商 品在12家超市促销活动 前后的销售额对比表, 用符号检验分析促销活 动的效果如何?
连 促销前 促销后
锁 销售额 销售额 符号
店
1 42 40
0.791
Z0.05
1.96
结论:不能拒绝原假设。
-Z0.05=-1.96 ,Z0.05=1.96,
Z=0.791不在拒绝域。
符号检验在配对样本比较中的应用
配对样本(x1,y1), (x2,y2) ,… (xn,yn)
将 xi yi 记为“+”,xi yi 记为“-”x,i yi
S+=2, S-=13, Pbinom(15, 0.75){min{S+,S-}<2}=0 因此,拒绝H0。
R编程计算:
>binom.test(sum(x>40),length(x)-1,0.75)
Exact binomial test
data: sum(x > 40) out of length(x)-1 number of successes = 2, n = 15, p-value = 9.23e-07 alternative hypothesis: p is not equal to 0.75 95 percent confidence interval:
单边符号检验问题
H0 : Me M0 H1 : Me M0 Pbinom (S k | n', p 0.5)
H0 : Me M0 H1 : Me M0 Pbinom (S k | n' , p 0.5)
k是满足式子的最大值
大样本结论
当n较大时
+
2 57 60
-
3 38 38
0
4 49 47
+
5 63 65
-
6 36 39
-
7 48 49
-
8 58 50
+
9 47 47
0
10 51 52
-
11 83 72
+
12 27 33
-
结论:不能拒绝原假设。
-Z0.05=-1.96 ,Z0.05=1.96,
Z=-0.9487不在拒绝域。
根据同样原理,可以将中位数符号检验推广为任意 分位点的符号检验。
结论:符号检验在总体分布未知的情况下优于t 检验!
>binom.test (sum(build.price>37),length(build.price),0.5)
Exact binomial test
data: sum(build.price>37) and length(build.price) number of successes =3,number of trials=16,p-value=0.02127 alternatice hypothesis :true probability of success is not equal to 0.5 95 percent confidence interval: 0.04047373 0.45645655 sample estimates: probability of success 0.1875
非参数统计
第三章
单一样本的推断问题
单一样本位置的点估计、置信区间估计和假设检验是参数统 计推断的基本内容,其中t统计量和t检验作为正态分布总体期 望均值的推断工具是我们熟知的。
如果数据不服从正态分布,或有明显的偏态表现,应用t统计 量和t检验推断,就未必能发挥较好的效果。
主要内容
单样本推断问题
中心位置推断
H0 : Me M0 H1 : Me M0
M0 是待检验的中位数取值
定义: S n I(xi M0 )
n
S I(xi M0 ) ,则 s s n' K min{s,s}
i1
i1
在零假设情况下 K ~ b(n',0.5) ,在显著性水平为 的拒绝域为
,p-值 2PN(0,1) (Z z) ,p-值 PN(0,1) (Z z) ,p-值 PN(0,1) (Z z)
例3.2 设某化妆品厂商有A和B两个品牌,为了解顾客对A品
牌和B品牌在使用上的差异,将A品牌和B品牌同时交给45个
顾客使用,一个月后得到如下数据:
喜欢A品牌的客户人数:22人
0.01657591 0.40460270 sample estimates: probability of success
0.1333333
例3.1. 假设某地16座预出售的楼盘均价,单位(百元/平方米) 36,32,31,25,28,36,40,32,41,26,35,35,32,87,33,35 H0 : 37 H1 : 37 H0 : M0.75 40 H1 : M0.75 40
36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 35 - -- - -- 0- +- -- -+- -
2Pbinom (K k | n', p 0.5)
其中k是满足上式最大的k值。
解二: 用符号检验法
k 3,
2P{K
k
|
n
16, p
0.5}
2
k i0
16
i
1 2
16
0.0213
在显著性水平0.05下,拒绝H0。 符号检验与t检验得到了相反的结论,到底选择哪 一种结果呢?
总结
T检验推断过程 假定分布结构 确定假设 检验统计量在零假设下的抽样分布 由抽样分布计算拒绝域或计算p值与显著性比较 做出决策
如果数据分布呈现明显的非正态性,t检验可能会由于运 用错误的假设,导致不成功的推断。
数据描述
符号检验推断过程
假设总体 F(x) ,Me 是总体的中位数,对于假设检验问题:
分布检验
符号检验
符号秩检验
符 游 Cox 号 程 -Staut 检 检 趋势 验 验 检验
分 位 数 检 验
Wilcoxon 符号 秩检验
2 拟 合
Kolmogorov -Smirnov
正态性检验
Liliefor 正态性
பைடு நூலகம்
优
检验
度
检
验
第一节 符号检验和分位数推断
基本概念
符号检验是非参数统计中最古老的检验方法之一,最早可 追溯到1701年一项有关伦敦出生的男婴性别比例是否超过 1/2的研究。 这种检验被称为符号检验的理由是:它所关心的信息只与 两类观测值有关,用符号“+”“-”区分,符号检验就是 通过符号的个数来进行统计推断。
one-sample t-Test data: build.price-37 t= -0.1412,df=15,p-value=0.8896 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval -8.045853 7.045853 sample estimates: mean of x -0.5
用T统计量 T X 37 S/ n
结论: 不能拒绝H0。
R的t检验程序和输出结果
>build.price<一c(36 ,32, 31, 25, 28, 36, 40, 32, 41, 26, 35, 35, 32, 87, 33, 35)
>mean(build.price) [1] 36.5 >var(build.price) [1] 200.5333 >length(build.price) [1]16 >t.test(build.price-37)
S
~
n' N(
,
n'
)
:
24
Z S n' 2 N(0,1), n n' 4
Z S n' 2 C N(0,1), n不够大时 n' 4
当n不够大的时候可用修正公式进行调整。
双边: H0 : Me M0 H1 : Me M0 左侧: H0 : Me M0 H1 : Me M0 右侧:H0 : Me M0 H1 : Me M0