单样本非参数检验1:卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.2 卡方检验的例题
解:该问题可以转化为检验心脏病猝死人数在一 周时间内的分布是否同预期分布相同,可以使用 卡方检验进行处理,过程如下: (1)建立零假设和备择假设
零假设:每天心脏病猝死人数分布同预期分布相同 备择假设:每天心脏病猝死人数分布同预期分布不同
3.2 卡方检验的例题
(2)构造和计算统计量
的一种非参数统计方法。
(1)建立零假设和备择假设
H 0 :总体分布函数为 F(x) ;
H 1 :总体分布函数不为 F(x) 。
分布函数和密度函数的区别知道吧?
(2)构造和计算统计量
◆把实轴 (, ) 分成 k 个不相交的区间
(, a1 ], (a1 , a 2 ], ,..., (a k 1 , )
怎么计算得到的 呢?
日期 实际频数 期 望 频 差
fi
值
2 ( f i - npi )
率 npi 53.5 19.1 19.1 19.1 19.1 19.1 19.1 168
f i - npi
周一 周二 周三 周四 周五 周六 周日 合计
55 23 18 11 26 20 15 168
1.5 3.9 -1.1 -8.1 6.9 0.9 -4.1
3.2 卡方检验的例题
(3)设定显著性水平和确定否定域
给定显著性水平0.05,在原假设成立时,统计量 服从自由度为7-1=6的卡方分布,否定域为:
2 2 2 0.95 (6) 12.59
2
y=chi2(x,5)
0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00
注意:学习了卡方检验的方法和过程后,你会解读软件给 出的分析结果吗?
答案
• P值=0.256,大于显著性水平0.05,接受原 假设,认为原分布成立,即原来医生的结 论是正确的。
第3讲 单样本非参数统计—卡方检验
传统的非参数统计
• 单样本非参数检验 • 两样本(独立和相关)非参数检
验 • 多样本(独立和相关)非参数检
验
单样本检验及方法
什么叫单样本检验呢?
在进行统计分析过程中,往往需要根据一 组样本的信息来对某个总体分布或抽样过程是 否随机进行判断,利用一个样本对总体进行推 断的非参数检验。
y=chi2(x,5)
0
2
4
6
8
10
12
14
16
18
20
22
24
(4)做出统计决策
2 统计量的值落在否定域 2 2 12 如果
(k 1)
中,拒绝零假设,即总体不服从指定分布 F (X )
2 的概率P值??显著性水平 即
3.2 卡方检验的例题
例:医学家研究心脏病人猝死人数与日期的关系 时发现,一周之中星期一心脏病人猝死者较多, 其他日子基本相同。每天的比例近似为2.8:1: 1:1:1:1:1. 现在收集到168个观察数据,其中星期一至 星期日的死亡人数分别为:55,23,18,11,26, 20,15。 现在利用这批数据,推断心脏病人猝死人数 与日期的关系是否成立?
3.2 卡方检验的例题
(4)做出统计决策
0
2
4
6
8
10
12
14
16
18
20
22
24
统计量 2 =7.752,没有落在否定域 2 2 中,接受零假设
2 0.05 (6) 12.59
零假设:每天心脏病猝死人数分布同预期分布相同
因此,医学家的研究结论是正确的哦。
3.3 卡方检验的SPSS软件实现
◆设样本观察值 x1 , x 2 ,..., x n 落入每个区间的实际频数为 f i 则实际频率为 f i
n
◆当零假设成立时,样本值落在每个区间的概率 p i 可以 由分布函数 F(x) 精确计算,则每个区间的理论频数为 npi ◆当假设成立时,理论频数
npi
与实际频数 f i 应该相差很小
◆构造统计量
卡方检验 二项分布检验 游程检验
科尔戈洛夫-斯米尔诺夫单样 本检验
主讲方法:
◆卡方检验 ◆二项分布检验 ◆科尔莫戈罗夫-斯米尔诺夫(KolmogorovSmirnov) 检验 ◆游程检验
3.1 卡方检验的求解思想和方法
思想: 卡方检验是在给定样本
X 1 , X 2 ,..., X n
观察值
x1 , x 2 ,..., x n 的情况下,检验总来自百度文库是否服从有关分布 F (X )
npi 2.25 15.21 1.21 65.61 47.61 0.81 16.81
( f i npi ) 2 npi
0.04205607 0.79633508 0.06335079 3.43507853 2.49267016 0.04240838 0.88010471 7.752
2
小答案
• 2.8/8.8=0.3181 • 168*0.3181=53.4408
(1)输入例子中的数据,如图所示。
切记要加权!
卡检验的SPSS操作
勾选“值”
输入2.8, 点“添加”
改成1,点“添加”, 依次进行
1个2.8,6个1,最后点 OK!
得到卡方检验结果,分两部分
死亡日期 1.00 2.00 3.00 4.00 5.00 6.00 7.00 Total O bser v ed N 55 23 18 11 26 20 15 168 Expected N 53.5 19.1 19.1 19.1 19.1 19.1 19.1 Residual 1.5 3.9 -1.1 -8.1 6.9 .9 -4.1
2
( f i npi ) 2 npi i 1
k
(3)设定显著性水平和确定否定域 ◆给定显著性水平 。
◆在零假设成立时, 2 统计量服从自由度为 k 1
的卡方分布。
2 2 2 ◆否定域为 1 (k 1)
0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00