总体分布的卡方检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

从直方图到密度曲线。
可见, Q值越大,表示观察频数与理论频数越 不接近;Q值越小,说明观察频数和理论频数 越接近。 而Q是一个服从自由度为k-1的χ2分布。 由此可以计算出检验的相伴概率值。
因此,总体分布的卡方检验是一种吻合性 检验,比较适用于一个因素的多项分类数据分 析。总体分布的卡方检验的数据是实际收集到 的样本数据,而非频数数据。 对于频数数据,需要进行加权处理!
例二 . 某门户网站为了了解网站的流量,在6 小时内,记录每分钟内访问该网站的用户数, 得到300次网站被访问记录数据:
被访问数 频数
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 5 1 1 2 3 4 11 20 27 31 29 44 31 35 17 24 10 3
SPSS 16实用教程
第10章 非参数检验
10.1 总体分布的卡方(Chi-square)检验 10.2 10.3
二项分布检验 SPSS单样本变量值随机性检验 SPSS单样本K-S检验 两独立样本非参数检验 多独立样本非参数检验
10.4
10.5 10.6
10.7
10.8
两配对样本非参数检验
多配对样本非参数检验
10.1 总体分布的卡方(Chi-square)检验
在得到一批样本数据后,人们往往希望从 中得到样本所来自的总体的分布形态是否和某 种特定分布相拟合。这可以通过绘制样本数据 直方图的方法来进行粗略的判断。如果需要进 行比较准确的判断,则需要使用非参数检验的 方法。其中总体分布的卡方检验(也记为χ2 检验)就是一种比较好的方法。
10.1.1 统计学上的定义和计算公式
卡方检验定义:总体分布的卡方检验适用 于配合度检验,是根据样本数据的实际频数推 断总体分布与期望分布或理论分布是否有显著 差异。 零假设H0:样本来自的总体分布形态和某一期 望或理论分布没有显著性差异。
总体分布的卡方检验的原理:如果从一个随机 变量 X 中随机抽取若干个观察样本,这些观 察样本落在 X 的 k 个互不相交的子集中的观 察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从 X 的总体分布。
根据数据检验每分钟访问该网站的用户数是否 服从泊松分布?
1.此数据首先需要用“频数”对“被访问数”变量进行加 权 2.其次要计算在原假设被访问数服从泊松分布的下,变量 个取值的期望频数。 计算方法:用变量取值的平均值(加权平均)作为泊 松分布参数的估计值。 各取值期望频率计算方法: N px= N*(Fλ(x)- Fλ(x-1)) SPSS中,变量计算公式:
前面已经讨论的许多统计分析方法对总体 有特殊的要求。如 T检验要求总体符合正态分布, F检验要求误差呈正态分布且各组方差整 齐,等等。 这些方法常用来在已知总体分布情况下估 计或检验总体参数,统称为参数检验。
但许多调查或实验所得的科研数据,其总 体分布未知或无法确定。 再对这样数据运用以前的假定分布情况下 的参数检验就有可能产生错误的结论。 此时人们希望检验对一个总体分布形状不 必作限制。
10.1.2 SPSS中实现过程
研究问题 某地一周内各日患忧郁症的人数分布如表 10-1所示,请检验一周内各日人们忧郁数是否 满足1:1:2:2:1:1:1。
表10-1
学生的数学成绩 周 日 期 1 2 3 4 5 患 者 数 31 38 70 80 29
6
7
24
31

实现步骤
图10-1 在菜单中选择“Weight Cases”命令
(CDF.POISSON(被访问数,泊松参数估计值) - CDF.POISSON(被访问数-1,泊松 参数估计值))*300
3.最后就是要检验观测频数与泊松分布假设下期望频数之 间是否有显著性差异。
作业!
分析上面例一和例二中的问题。 数据分别见ftp中 摇奖数据(总体卡方检验).sav 网站流量(总体卡方检验).sav
图10-2 “Weight Cases”对话框
图10-3 在菜单中选择“Chi-Square”命令
选择检验变量, 这里要检验的 是周日期的分 布状况
Exact选项对 话框提供了一 些精确检验的 方法
期望范围 (expecsted range)确定待 检验样本的取值 范围: Get from data: 由数据的最大值 和最小值确定范 围。 Use specified range:用户设定 范围。范围内的 每个单独数据值 将作为一个分组, 范围外的个案数 据将被剔除
322854280494877422164729846762075974 447568172033480711607221258178642864 9604343817284201837378613643
那么这个问题就是要对假设 H0:0~9这十个数字出现的频率相等 进行检验。 在期望值选项中,我们选择“All categories equal”选项。
10.1.3 结果和讨论
(1)本例输出结果中有两个表格,其中 第一个表格如下。
(2)输出的结果文件中第二个表格如下。
例一 . 根据摇奖号码中出现的数字值检验摇 奖的球是否均匀,即0~9每个数字出现的概率 是否均为1/10。 下面是100个摇奖摇出来的数据。本例数据是 实际收集的样本原始数据,所以不需要加权 处理。
非参数检验是指总体分布未知或知之甚少 时,利用已知数据对总体的分布形态等一般性 假设做出推断的分析方法。
非参数检验根据样本数目以及样本之间的 关系可以分为单样本非参数检验、两独立样本 非参数检验、多独立样本非参数检验、两配对 样本非参数检验和多配对样本非参数检验几种。
本章将介绍总体分布的卡方(Chisquare)检验、二项分布(Binomial)检验、 单样本K-S(Kolmogorov-Smirnov)检验、单 样本变量值随机性检验(Runs Test)、两独 立样本非参数检验、多独立样本非参数检验、 两配对样本非参数检验、多配对样本非参数检 验等8类常用的非参数检验方法。其中前4种属 于单样本非参数检验。
Biblioteka Baidu
Expected values给出 期望分布的频数: All categories equal: 所有分组子集的期望概 率值都相同,即检验总 体是否服从均匀分布。 Values:指定分组的 期望分布频率数。 本例各分组按顺序,期 望频率比值为 1:1:2:2:1:1:1,所以依 次添加1 1 2 2 1 1 1
图10-4 “Chi-Square Test”对话框
Statistics框指定输出附加 分析的结果: Descriptive:输出待检验 变量的描述统计量值。 Quartiles:输出待检验变量 的四分位数。
Missing Values说明缺失 值的处理方法。
图10-5 “Chi-Square Test:Options”对话框
相关文档
最新文档