K-S分布检验和拟合优度χ2检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 K—S单样本分布检验 单样本分布检验
一、适用范围 Kolmogorov-Smirnov检验常译为柯尔莫哥洛夫 斯 检验常译为柯尔莫哥洛夫-斯 检验常译为柯尔莫哥洛夫 米尔诺夫检验,简写为K-S检验,亦称 检验法,也 检验, 检验法, 米尔诺夫检验,简写为 检验 亦称D检验法 是一种拟合优度检验法。 是一种拟合优度检验法。K-S单样本检验主要用来检 单样本检验主要用来检 验一组样本数据的实际分布是否与某一指定的理论 分布相符合。 分布相符合。 二、基本原理和方法 1、基本原理: 、基本原理: 这种检验主要是将理论分布下的累计频数分布与观 察到的累计频数分布相比较, 察到的累计频数分布相比较,找出它们间最大的差 异点,并参照抽样分布, 异点,并参照抽样分布,定出这样大的差异是否处 于偶然。 于偶然。
www.ctbu.edu.cn
三、检验步骤
4、显著性检验: 、显著性检验: 小样本情况下, ⑴小样本情况下,及n1= n2=n,n≤30,用附 , , 表12。对于单尾检验和双尾检验,该表列出 。对于单尾检验和双尾检验, 了不同显著性水平下的临界值。 了不同显著性水平下的临界值。 大样本情况下, 不一定等于n ⑵大样本情况下,n1不一定等于 2,但都小 的双尾检验, 于40的双尾检验,可用附表 续表中的公式 的双尾检验 可用附表12续表中的公式 算出D的临界值 的临界值。 算出 的临界值。 都较大,但又是单尾检验时, ⑶当 n1和n2都较大,但又是单尾检验时,用 算式 n1 n 2 2 2 χn = 4D ∼ χ (22 )
(1 0 0 0 , 0 .0 5 )
1000
因为D1ooo<0.043,故认为样本数据所提供的信息 因为D , 无法拒绝H 即接受H 认为可做正态分布的拟合。 无法拒绝 0,即接受 0,认为可做正态分布的拟合。 K-S检验法是一种精确分布的方法 检验法是一种精确分布的方法, K-S检验法是一种精确分布的方法,不受观察次 数多少的限制。 数多少的限制。这个方法可应用于分组或不分组的 情形。检验量D 情形。检验量 n也可用于检验随机样本是否抽自某 特定的总体的问题。 特定的总体的问题。
www.ctbu.edu.cn
第二节
K-S双样本分布检验 双样本分布检验
一、适用范围 K-S双样本检验主要用来检验两个独立样本是否来自 双样本检验主要用来检验两个独立样本是否来自 同一总体(或两样本的总体分布是否相同)。 )。其单 同一总体(或两样本的总体分布是否相同)。其单 尾检验主要用来检验某一样本的总体值是否随机地 大于(或小于)另一样本的总体值。 大于(或小于)另一样本的总体值。 二、理论依据和方法 1、理论依据: 、理论依据: 单样本检验相似, 与K-S单样本检验相似,K-S双样本检验是通过两个 单样本检验相似 双样本检验是通过两个 样本的累计频数分布是否相当接近来判断H 样本的累计频数分布是否相当接近来判断 o是否为 真。如果两个样本间的累计概率分布的离差很大, 如果两个样本间的累计概率分布的离差很大, 同的总体,就应拒绝H 这就意味着两样本来自不同的总体,就应拒绝 o。
www.ctbu.edu.cn
四、实例
例8.1:正态拟合。 :正态拟合。 某织布厂工人执行的生产定额( 某织布厂工人执行的生产定额(织机每小时生产织 物的米物)情况如表8-1, 物的米物)情况如表 ,试检验这些样本数据能 否作正态拟合? 否作正态拟合? 表8-1 工人执行生产定额情况分组表
按定额执行情况分组 3.75~ 3.75~4.25 4.25~ 4.25~4.75 4.75~ 4.75~5.25 5.25~ 5.25~5.75 5.75~ 5.75~6.25 工人数 20 372 498 103 7 1000
www.ctbu.edu.cn
2、方法 、
用 Fn(x)表示样本量为 的随机样本观察值的 表示样本量为n的随机样本观察值的 表示样本量为 累计分布函数, 是等于或小于x 累计分布函数,且Fn(x) =i/n(i是等于或小于 ( 是等于或小于 的所有观察结果的数目, , , , )。 的所有观察结果的数目,i=1,2,…,n)。 F(x)表示理论分布的累计概率分布函数。K-S 表示理论分布的累计概率分布函数。 表示理论分布的累计概率分布函数 单样本检验通过样本的累计分布函数F 单样本检验通过样本的累计分布函数 n(x)和理 和理 论分布函数F(x)的比较来做拟合优度检验。检 论分布函数 的比较来做拟合优度检验。 的比较来做拟合优度检验 验统计量是F(x)与Fn(x)间的最大偏差 n: 间的最大偏差D 验统计量是 与 间的最大偏差
D = max[ S 1 ( x ) − S 2 ( x )]
K-S双样本的双尾检验统计量为: 双样本的双尾检验统计量为: 双样本的双尾检验统计量为
D = max
www.ctbu.edu.cn
S1(x) − S 2 (x)
三、检验步骤
1、双尾检验假设:H0:S1(x)=S2(x) 、双尾检验假设: H1:S1(x)≠S2(x) 单尾检验假设: 单尾检验假设: H0:S1(x)=S2(x)或H0:S1(x)=S2(x) 或 H1:S1(x)>S2(x) H1:S1(x)<S2(x) 2、把两组样本分别排成累计频数分布(对两 、把两组样本分别排成累计频数分布( 个分布用相同的间隔或分类, 个分布用相同的间隔或分类,并利用尽可能多 的间隔。 的间隔。 3、计算检验统计量 值,如是单尾检验,应 、计算检验统计量D值 如是单尾检验, 的方向计算D值 按H1的方向计算 值。
www.ctbu.edu.cn
表8-2
表8-2
标 准 化 X的组限 甲
不足4.25 不足
正态拟合计算表
累 计 概 累计 率 ( 理 工人 论概率) 数 (2) (3) ) ) 0.045 20 0.390 0.873 0.995 1.000 —— 392 890 993 1000 实际累 计频率 (4) ) 0.020 0.392 0.890 0.993 1.000 —— (2)-(4) 的绝 对 值 (5) ) 0.025 0.002 0.017 0.002 0.000 ——
www.ctbu.edu.cn
——
-
例8.1 根据表8-2中第 列数据, 中第(5)列数据 根据表 中第 列数据,取最大绝对差数 D1ooo =0.025作为检验统计量。若取a=0.05, 作为检验统计量。若取 , 作为检验统计量 检验表K-S) n=1000,从临界值表中查(检验表 , 检验表 1 .3 6 得: D 。 = 0 .0 4 3 =
矿
乙
矿
Байду номын сангаас
3.8 2.1 3.2 7.2 2.3 3.5 3.0 4.6 3.1 3.2
检验, 解:这是一个双样本的K-S检验,根据题意, 这是一个双样本的 检验 根据题意, 建立双侧检验假设组: 建立双侧检验假设组:H 0: F甲 ( x ) = F乙 ( x ) H 1: F甲 ( x ) ≠ F乙 ( x )
www.ctbu.edu.cn
例8.1 正态拟合 解:首先,由于做正态拟合的均值、标准差 首先,由于做正态拟合的均值、 未知,因此,先计算样本均值和标准差, 未知,因此,先计算样本均值和标准差,再 做正态拟合。通过对样本资料的计算得: 做正态拟合。通过对样本资料的计算得: ⌢ x=4.85;s=0.352,分别作为 和δ的估计值, 分别作为Û和 δ 的估计值, ; 分别作为 建立假设: 建立假设: H0:样本数据服从均值为 样本数据服从均值为4.85,标准差为 , 0.352的正态分布 的正态分布 H1:样本数据不服从均值为 样本数据不服从均值为4.85,标准差为 , 0.352的正态分布 的正态分布 计算资料列如表8-2: 计算资料列如表 :
n1 + n 2
www.ctbu.edu.cn
四、实例
例8.2(小样本)检验两矿的金属含量率是否 (小样本) 相同。在甲、乙两矿坑中各抽取10个矿石样 相同。在甲、乙两矿坑中各抽取 个矿石样 矿石中含有某种金属含量率( ) 本,矿石中含有某种金属含量率(%)的资料 如表8-3所示 所示: 如表 所示: 甲 3.1 1.2 2.9 3.0 0.6 2.8 1.6 1.7 3.2 1.7 表7-3
www.ctbu.edu.cn
四、实例
2、确定检验统计量: D = max 、确定检验统计量: 本例 D=5/10 3、检验与判断。由于 1=n2=10,属小样本,查附表 、检验与判断。由于n ,属小样本, 12得临界值D0.05=7/10,因为 得临界值D 得临界值 ,因为D=5/10<7/10,所以接 , 假设,认为两矿的金属含量率相同。 受Ho假设,认为两矿的金属含量率相同。 当样本容量较大时,一般当n 当样本容量较大时,一般当 1+ n2>35时,可用附 时 续表中的公式计算临界值, 表12续表中的公式计算临界值,只有当样本容量相 续表中的公式计算临界值 n1n 2 当大时, 当大时,检验统计量 2 4D n1 + n 2 才渐进服从自由度为2的 分布, 才渐进服从自由度为 的X2分布,此时可用X2分布 表查得临界值。 表查得临界值。
www.ctbu.edu.cn
2、方法 、
如果令S 如果令 1(x)表示第一个样本观察值 ) 的累计概率分布函数, 的累计概率分布函数,S2(x)表示另 ) 一个样本观察值的累计概率分布函数, 一个样本观察值的累计概率分布函数, 那么K-S双样本的单尾检验统计量为: 双样本的单尾检验统计量为: 那么 双样本的单尾检验统计量为
www.ctbu.edu.cn
四、实例
1、列等距分组表,计算各组次数f甲、f乙 ,累计次 、列等距分组表,计算各组次数 F 及其差额。 数F甲、F乙,累计频率 F甲 、 乙 及其差额。计算 n乙 结果列如表8-4所示 所示。 结果列如表 所示。 n 甲
金属含 量率 (%) 0.0~0.9 1.0~1.9 2.0~2.9 3.0~3.9 4.0~4.9 5.0`5.9 6.0~6.9 7.0~7.9 次数 f甲 1 4 2 3 0 0 0 0 累计频率 F甲 f乙 F甲/10 F乙/10 /10- F 表7-4 例7.2的计算表 的计算表 乙/10 0 1 0 1/10 0 1/10 0 5 0 5/10 0 5/10 2 7 2 7/10 2/10 5/10 6 10 8 10/10 8/10 2/10 1 10 9 10/10 9/10 1/10 0 10 9 10/10 9/10 1/10 0 10 9 10/10 9/10 1/10 1 10 10 10/10 10/10 0 累计次数 F甲 F乙
D n = max F ( x) − Fn ( x)
{
}
3.用样本容量 和显著水平 在附表 中查出 用样本容量n和显著水平 在附表11中查出 用样本容量 和显著水平a在附表 临界值D 临界值 na; 4.通过 n与Dna的比较做出判断,若Dn<Dna, 通过D 的比较做出判断, 通过 则认为拟合是满意的。 则认为拟合是满意的。
δ
⌢
标准正 态概率 (1) ) 0.045 0.345 0.483 0.122 0.005 1.000
乙
-∞~-1.70 ~
4.25-4.75 -1.70~-0.28 ~ 4.75-5.25 5.25-5.75 5.75-6.25 -0.28~1.14 ~ 1.14~2.56 ~ 2.56-+∞
合计
第八章 分布检验和拟合优度 2检验 分布检验和拟合优度χ
www.ctbu.edu.cn
第八章 分布检验和拟合优度χ2检验
1
Kolmogorov-Smirnov 单样本检验及一些正态性检验
2
Kolmogorov-Smirnov 两样本分布检验
3
Pearson χ2 拟合优度检验 5
www.ctbu.edu.cn
D n = max F ( x) − Fn ( x)
{
}
若对每一个x值来说, 都十分接近, 若对每一个 值来说,Fn(x)与F(x)都十分接近,则表 值来说 与 都十分接近 明实际样本的分布函数与理论分布函数的拟合程度很 高。
www.ctbu.edu.cn
三、检验步骤
1.建立假设组: 建立假设组: 建立假设组 H0:Fn(x)=F(x) H1:Fn(x)≠F(x) 2.计算样本累计频率与理论分布累计概率的 计算样本累计频率与理论分布累计概率的 绝对差,令最大的绝对差为D 绝对差,令最大的绝对差为 n;