单样本非参数检验1卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
2
2 0.05
(6)
12.59
中,接受零假设
零假设:每天心脏病猝死人数分布同预期分布相同
因此,医学家的研究结论是正确的哦。
第14页/共23页
3.3 卡方检验的SPSS软件实现
(1)输入例子中的数据,如图所示。
第15页/共23页
切记要加权!
第16页/共23页
卡检验的SPSS操作
第17页/共23页
(, a1 ], (a1, a2 ], ,..., (ak1, )
◆设样本观察值 x1, x2 ,..., xn落入每个区间的实际频数为 f i
则实际频率为 fi
n
◆当零假设成立时,样本值落在每个区间的概率 pi 可以由 分布函数 F(x精) 确计算,则每个区间的理论频数为 npi
◆当假设成立时,理论频数 npi与实际频数 f i应该相差很小
现在利用这批数据,推断心脏病人猝死人数与 日期的关系是否成立?
第9页/共23页
3.2 卡方检验的例题 解:该问题可以转化为检验心脏病猝死人数在一 周时间内的分布是否同预期分布相同,可以使用 卡方检验进行处理,过程如下: (1)建立零假设和备择假设
零假设:每天心脏病猝死人数分布同预期分布相同 备择假设:每天心脏病猝死人数分布同预期分布不同
游程检验
二项分布检验
科尔戈洛夫-斯米尔诺夫单样 本检验
第2页/共23页
主讲方法:
◆卡方检验 ◆二项分布检验 ◆科尔莫戈罗夫-斯米尔诺夫(KolmogorovSmirnov) 检验 ◆游程检验
第3页/共23页
3.1 卡方检验的求解思想和方法
思想: 卡方检验是在给定样本 X1, X 2 ,观..., 察X n 值
第23页/共23页
x1, x2 ,..., xn 的情况下,检验总体是否服从有关分布 F(X ) 的一种非参数统计方法。
第4页/共23页
(1)建立零假设和备择假设
H0 :总体分布函数为 F(x); H1 :总体分布函数不为 F(x)。
分布函数和密度函数的区别知道吧?
第5页/共23页
(2)构造和计算统计量
◆把实轴 (,分) 成 k 个不相交的区间
7.752
2
第11页/共23页
小答案
• 2.8/8.8=0.3181 • 168*0.3181=53.4408
第12页/共23页
3.2 卡方检验的例题
(3)设定显著性水平和确定否定域
给定显著性水平0.05,在原假设成立时,统计量 2
服从自由度为7-1=6的卡方分布,否定域为:
勾选“值”
第18页/共23页
输入2.8, 点“添加”
第19页/共23页
改成1,点“添加”, 依次进行
第20页/共23页
1个2.8,6个1,最后点 OK!
第21页/共23页
得到卡方检验结果,分两部分
1.00 2.00 3.00 4.00 5.00 6.00 7.00 Total
死 亡日 期
Obser ved N 55 23 18 11 26 20 15 168
传统的非参数统计
• 单样本非参数检验
• 两样本(独立和相关)非参数检 验
• 多样本(独立和相关)非参数检
验
第1页/共23页
单样本检验及方法
什么叫单样本检验呢?
在进行统计分析过程中,往往需要根据一 组样本的信息来对某个总体分布或抽样过程是 否随机进行判断,利用一个样本对总体进行推 断的非参数检验。
卡方检验
第10页/共23页
3.2 卡方检验的例题
(2)构造和计算统计量
日期
周一 周二 周三 周四 周五 周六 周日 合计
怎么计算得到的 呢?
实际频数 期 望 频 差
fi
率 npi
f i - npi
55
53.5
1.5
23
19.1
3.9
18
ຫໍສະໝຸດ Baidu
19.1
-1.1
11
19.1
-8.1
26
19.1
6.9
20
19.1
0.9
0.14
0.12
0.10
0.08
0.06
0.04
0.02
第7页/共23页0.00 0
2
4
6
8 10 12 14 16 18 20 22 24
(4)做出统计决策
如果
2
统计量的值落在否定域
2
2
2 1
(k 1)
中,拒绝零假设,即总体不服从指定分布 F(X )
即 2 的概率P值??显著性水平
第8页/共23页
3.2 卡方检验的例题
例:医学家研究心脏病人猝死人数与日期的关系 时发现,一周之中星期一心脏病人猝死者较多, 其他日子基本相同。每天的比例近似为2.8:1: 1:1:1:1:1.
现在收集到168个观察数据,其中星期一至星 期日的死亡人数分别为:55,23,18,11,26, 20,15。
15
19.1
-4.1
168
168
值 ( f i - npi )2 ( fi npi )2
npi
npi
2.25
0.04205607
15.21
0.79633508
1.21
0.06335079
65.61
3.43507853
47.61
2.49267016
0.81
0.04240838
16.81
0.88010471
Expected N 53.5 19.1 19.1 19.1 19.1 19.1 19.1
Residual 1.5 3.9 -1.1 -8.1 6.9 .9 -4.1
注意:学习了卡方检验的方法和过程后,你会解读软件给 出的分析结果吗?
第22页/共23页
答案
• P值=0.256,大于显著性水平0.05,接受原 假设,认为原分布成立,即原来医生的结 论是正确的。
◆构造统计量 2 k ( fi npi )2
i 1
npi
第6页/共23页
(3)设定显著性水平和确定否定域
◆给定显著性水平 。
◆在零假设成立时, 2 统计量服从自由度为 k 1
的卡方分布。
◆否定域为
2 2
2 1
(k 1)
y=chi2(x,5)
0.16
2
2
2 0.95
(6)
12.59
第13页/共23页
3.2 卡方检验的例题
(4)做出统计决策
y=chi2(x,5)
0.16
0.14
0.12
0.10
0.08
0.06
0.04
0.02
0.00
0
2
4
6
8 10 12 14 16 18 20 22 24
统计量
2
=7.752,没有落在否定域