卡方检验和非参数检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(- , 70 (70, 90 (90, 110 (110, 130 (130, 150 (150, 170 (170, +) 合计
8
取显著性水平 = 0.25 (由于原假设H0 是我们希望得到的结果,为使检验结论更 具说服力,控制的重点应是与原假设H0不 真而接受H0的概率,故 应取的稍大些)。 本例中k = 7,r = 2,k –r -1 = 4。
7
区
间
fi 11 10 18 21 19 10 11 100
nPi 10.56 12.10 17.47 19.74 17.47 12.10 10.56 100
( f i nPi ) 2 nPi
0.0183 0.3645 0.0161 0.0804 0.1340 0.3645 0.0183 0.9961
2
2
2
2
2 §.1总体分布的 检验
检验的基本原理 (1) 设 x1,x2,,xn 为总体 X 的一组样本观察值, F(x) 为某一已知分布的分布函数, 1, 2,, r是的r个待定参数,分别是r个参数的点估计, 以分别代替1, 2,….,r ,作原假设 H0:总体X的分布函数为F(x) (2) 将F(x)的定义域划分为k个互不相交的区 间 (ai , ai+1,i =1,2,…, k;记fi为样本 观 察 值 x1, x2,…, xn 落 在 第 个 区 间 (ai ,ai+1 内的频数,并记 Pi=P{ai <X≤ ai+1}= F(ai+1)-F(ai )
6
解:由表中数据,用Excel可求得 x =120.95, S2=40.582 ,故可作原假设 H0:X~ N (120,402) 将实轴划分为如下7个互不相交的区间。用Excel 的FREQUENCY函数计算数据落在各区间内的频 数,用NORMDIST函数求出各理论频数nPi , 统计量的计算如表所示。
2 ( f nP ) i 2 i nPi i 1 k
4
(3) 可以证明,当 n充分大时(n ≥ 50),若 H0为真,则统计量
( fi nPi ) 2 nPi i 1
2 k
近似服从 (k -r -1) 分布。其中 r 为分布 F(x) 中待定参数的个数 于是在给定显著性水平下,若
3
fi n
为 以 F(x) 为 分 布 函 数 的 随 机 变 量 在 区 间 (ai ,ai+1 上取值的概率,i =1,2,…, k。 则当H0为真时,由贝努里定理,当n充分大时, n 次独立重复试验结果的实际频率 与其概率 Pi之间的差异并不显著,于是显然可以用统计 量来刻画它们间总的差异的大小。其中 nPi 为 理论频数。当 H0 为真时,下式的值就应当较 小
卡方检验和非参数检验
在总体分布形式已知条件下未知参数检 验问题。但实际问题中总体的分布形式 往往是未知的,虽然根据中心极限定理 可以有相当的把握认为大多数经济变量 服从或近似服从正态分布,但有时为了 使所做的统计推断更具说服力,就需要 对总体的分布形式进行检验。
1
本章主要内容:
2
(1)总体分布的卡方( )检验; (2)两个比例差异的卡方()检验(独立样本); (3)两个以上比例差异的卡方()检验(独立样本); (4)独立性的卡方()检验; (5)两个比例差异的McNEMAR检验(相关样本); (6)两个独立总体的非参数检验(Wilcoxon秩和检验); (7)单因素方差分析的非参数检验(Kruskal-Wallis秩 检验)
(k r 1)
2 2
就拒绝H0,说明总体X的真实分布函数与F(x) 间存在显著差异;否则接受 H0 ,即可以认为 两者在水平下并无显著差异。
5
某厂有一台经常需要维修的设备,该设备中有一个易 损坏的重负荷轴承,设备故障的主要原因是轴承损坏。为 了制定该设备的维修计划和维修预算,需要了解该轴承的 寿命分布。表10.1给出了100个轴承寿命的观察数据,问: 该轴承寿命是否服从正态分布?
2 2
行变量 组一 类 1(正向) 类 2(反向) 总计 组二
列变量 总计
x1 n1 x1 n1
x2 n2 x2 n2
X , ( x1 x2 )
n X n, ( n1 n2 )
10
为了检验组一样本有关类1的比例是否等于第二组样本 有关类1的比例,即假设检验为: 原假设为两比例之间无显著差异: H0 : p1 p2 备择假设为两比例之间有差异: H1 : p1 p2 使用卡方( )检验的基本思路为: (1).确定统计量为
107 103 89 99 167 192 123 72 94 59 155 141 69 121 136 149 136 120 190 118 105 118 97 104 173 128 8 130 139 212 148 168 135 63 136 111 190 103 140 117 49 123 92 12 179 127 181 144 151 52 143 105 31 57 129 91 121 89 145 128 120 80 68 120 88 103 158 113 142 168 115 107 88 139 75 145 83 60 118 174 142 172 95 107 144 113 223 76 185 155 87 122 146 156 105 114 93 176 140 116
0.9961
2Leabharlann Baidu
2 0.25
(4) 5.385
故在水平 = 0.25下接受原假设H0,即 可认为该轴承的使用寿命服从N (120, 402)分布。
9
§.2 比例差异的
2
检验(独立样本)
§10.2.1 两个比例差异的检验 前面,我们研究了两个比例的Z检验。这部分从不同角 度检验数据。假设检验过程使用近似卡方()分布的 检验数据。 如果想要比较两个独立样本组的分类变量,可以做两 维的列联表,显示每组的第1类(正向类,如“成功”, “是”等)和第2类(反向类,如“失败”,“否”等) 出现的频数,如表所示