[转载]K-S检验(Kolmogorov–Smirnovkurtosis-skewness)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[转载]K-S检验(Kolmogorov–Smirnovkurtosis-skewness)本⽂与普通的讲述 K-S 检验的⽂章略有不同,分为两部分:
(1). 针对⼤部分分布的 Kolmogorov–Smirnov 检验(真正的K-S检验)
(2). 仅适⽤于⾼斯分布的基于分布曲线形状的 kurtosis-skewness 检验准则(冒牌的K-S检验)
⼀、单样本 Kolmogorov–Smirnov 检验(转载)
1. 定义:
它是检验单⼀样本是不是服从某⼀预先假设的特定分布的⽅法。
2. 检验⽅法:
它的检验⽅法是以样本数据的累计频数分布与特定理论分布⽐较,若两者间的差距很⼩,则推论该样本取⾃某特定分布族。
假设检验问题:
H0:样本所来⾃的总体分布服从某特定分布
H1:样本所来⾃的总体分布不服从某特定分布
令F0(x)表⽰预先假设的理论分布,Fn(x)表⽰随机样本的累计概率(频率)函数,设 D=max|F0(x) - Fn(x)|
结论:当D > D(n, a), 则拒绝H0, 反之则接受H0假设。
其中D(n,a) 是显著⽔平为a且样本容量为n时的拒绝临界值(查表可得)
3. 举例:
例:35位健康男性在未进⾷前的⾎糖浓度如表所⽰,试测验这组数据是否来⾃均值µ=80,标准差σ=6的正态分布 87 77 92 68 80 78 84 77 81 80 80 77 92 86 76 80 81 75 77 72 81 90 84 86 80 68 77 87 76 77 78 92 75 80 78 (n=35)
解:(a). 假设H0:健康男性在未进⾷前的⾎糖浓度服从正态分布;H1:健康男性在未进⾷前的⾎糖浓度不服从正态分布
(b). 求D值:
(c). 查表给出结论:
假设a=0.55, ⼜n=35,查表的D(35,0.55) = 0.23 > D = 0.1754, 所以不能拒绝H0
4. 适⽤范围
单样本 K-S 检验可以将⼀个变量的实际频数分布与⾼斯分布(Gaussian)、均匀分布(Uniform)、泊松分布(Poisson)、指数分布(Exponential)等进⾏⽐较
⼆、kurtosis-skewness For Gaussian Distribution
1. 定义:
Kurtosis(峰度): 是对Sample构成的分布的峰值是否突兀或是平坦的描述
Skewness(偏度):是对Sample构成的分布的对称性状况的描述
2. Kurtosis:
(a). Kurtosis是对于分布的标准四阶中⼼距(standardized 4th central moment)
正态分布的Kurtosis为K=3,为了描述的⽅便,使⽤exceess_K = K-3 来标准化表⽰。
如果exceess_K >0, 表⽰波形更平坦(flatness); 如果exceess_K<0, 则表⽰波形更突兀消瘦(peakedness).
(b). 如何根据Sample计算Kurtosis
3. Skewness:
(a). Skewness 是对于分布的标准三阶中⼼距(standardized 3rd central moment)
正态分布的Skewness=0。
如果Skewness>0代表波形有右侧长尾,如果Skewness<0代表波形有左侧长尾。
(b). 如何根据Sample计算Skewness
4. 检验准则:
假设Sample Size = N
(a). Skewness
符合正态分布的Skewness范围 [-2*Sqrt(6/N), +2*Sqrt(6/N)] (b). Kurtosis
符合正态分布的Kurtosis范围 [-2*Sqrt(24/N), +2*Sqrt(24/N)]
三、Reference
3. 查表做出判断。