非参数检验卡方检验

合集下载

SPSS非参数检验之一卡方检验

SPSS非参数检验之一卡方检验一、卡方检验的概念和原理卡方检验是一种常用的非参数检验方法，用于检验两个或多个分类变量之间的关联性。

它利用实际观察频数与理论频数之间的差异，来判断两个变量是否独立。

卡方检验的原理基于卡方分布，在理论上，如果两个变量是独立的，那么它们的观测频数应该等于理论频数。

卡方检验通过计算卡方值来度量观察频数与理论频数之间的差异程度，进而判断两个变量是否独立。

卡方值的计算公式为：卡方值=Σ(（观察频数-理论频数）²/理论频数）其中，观察频数为实际观察到的频数，理论频数为理论上计算得到的频数。

二、卡方检验的步骤卡方检验的步骤包括以下几个方面：1.建立假设：首先需要建立原假设和备择假设。

原假设（H0）是两个变量之间独立，备择假设（H1）是两个变量之间存在关联。

2.计算理论频数：根据原假设和已知数据，计算出各组的理论频数。

3.计算卡方值：利用卡方值的计算公式，计算观察频数与理论频数之间的差异。

4.计算自由度：自由度的计算公式为自由度=(行数-1)*(列数-1)。

5.查表或计算P值：根据卡方值和自由度，在卡方分布表中查找对应的临界值，或者利用计算机软件计算P值。

6.判断结果：判断P值与显著性水平的关系，如果P值小于显著性水平，则拒绝原假设，认为两个变量存在关联；如果P值大于显著性水平，则接受原假设，认为两个变量是独立的。

三、卡方检验在SPSS中的应用在SPSS软件中，进行卡方检验的操作相对简单。

下面以一个具体的案例来说明：假设我们有一份数据，包括了男性和女性在健康习惯（吸烟和不吸烟）方面的调查结果。

我们想要检验性别与吸烟习惯之间是否存在关联。

1.打开SPSS软件，导入数据。

2.选择"分析"菜单，点击"拟合度优度检验"。

3.在弹出的对话框中，将两个变量（性别和吸烟习惯）拖入"因子"栏目中。

4.点击"统计"按钮，勾选"卡方拟合度"。

卡方检验名词解释

卡方检验名词解释
卡方检验属于非参数检验，由于非参检验不存在具体参数和总体正态分布的假设，所以有时被称为自由分布检验。

参数和非参数检验最明显的区别是它们使用数据的类型。

非参检验通常将被试分类，如民主党和共和党，这些分类涉及名义量表或顺序量表，无法计算平均数和方差。

卡方检验分为拟合度的卡方检验和卡方独立性检验。

我们用几个例子来区分这两种卡方检验：
•对于可口可乐公司的两个领导品牌，大多数美国人喜欢哪一种？•公司采用了新的网页页面B，相较于旧版页面A，网民更喜欢哪一种页面？
以上两个例子属于拟合度的卡方检验，原因在于它们都是有关总体比例的问题。

我们只是将个体分类，并想知道每个类别中的总体比例。

它检验的内容仅涉及一个因素多项分类的计数资料，检验的是单一变量在多项分类中实际观察次数分布与某理论次数是否有显著差异。

拟合度的卡方检验定义：
主要使用样本数据检验总体分布形态或比例的假说。

测验决定所获得的的样本比例与虚无假设中的总体比例的拟合程度如何。

拟合度的卡方检验又叫最佳拟合度的卡方检验，为何取名“最佳拟合”？这是因为最佳拟合度的卡方检验的目的是比较数据（实际频数）与虚无假设。

确定数据如何拟合虚无假设指定的分布，因此取名“最佳拟合”。

关于拟合度的卡方检验有一些翻译上的区别，其实表达的是一个意思：
拟合度的卡方检验=卡方拟合优度检验=最佳拟合度卡方检验
以下统称：卡方拟合优度检验
卡方统计的公式：卡方卡方=χ2=Σ(fo−fe)2fe
公式中O代表observation，即实际频数；E代表Expectation，即期望频数。

单样本非参数检验1卡方检验【24页】

（1）建立零假设和备择假设
H0 ：总体分布函数为 F（x）； H1 ：总体分布函数不为 F（x）。
分布函数和密度函数的区别知道吧？
（2）构造和计算统计量
◆把实轴 (,分) 成 k 个不相交的区间 (,a 1 ](a ,1 ,a 2 ],,.(.a k . 1 ,, )
◆设样本观察值 x1,x2,...x,n落入每个区间的实际频数为 f i 则实际频率为 f i
因此，医学家的研究结论是正确的哦。
3.3 卡方检验的SPSS软件实现
（1）输入例子中的数据，如图所示。
切记要加权！
卡检验的SPSS操作
勾选“值”
输入2.8，点“添加”
改成1，点“添加”，依次进行
1个2.8，6个1，最后点 OK！
得到卡方检验结果，分两部分
死亡日期
O bserv ed N Expected N Residual
1.00
55
53.5
1.5
2.00
23
19.1
3.9
3.00
18
19.1
-1.1
4.00
11
19.1
-8.1
5.00
26
19.1
6.9
6.00
20
19.1
.9
7.00
15
19.1
-4.1
Total
168
注意：学习了卡方检验的方法和过程后，你会解读软件给出的分析结果吗？
答案
• P值=0.256，大于显著性水平0.05，接受原假设，认为原分布成立，即原来医生的结论是正确的。
中，拒绝零假设，即总体不服从指定分布 F(X )
即 2 的概率P值？？显著性水平

非参数卡方、单样本K-S、两个独立样本检验

非参数卡方检验1.理论非参数检验是在总体分布未知或知道甚少的情况下，不依赖于总体布形态，在总体分布情况不明时，用来检验不同样本是否来自同一总体的统计方法进。

由于非参数检验方法在推断过程中不涉及有关总体分布的参数，因而得名为“非参数”检验。

非参数检验优势：检验条件宽松，适应性强。

针对，非正态、方差不等的已及分布形态未知的数据均适用。

检验方法灵活，用途广泛。

运用符号检验、符号秩检验解决不能直接进行四则运算的定类和定序数据。

非参数检验的计算相对简单，易于理解。

但非参数检验方法对总体分布假定不多，缺乏针对性，且使用的是等级或符号秩，而不是实际数值，容易失去较多信息。

非参数卡方检验：用于检验样本数据的分布是否与某种特定分布情况相同。

非参数卡方检验通过三步检验：1.卡方统计量：X2=B 其中K 是样本分类的个数，0表示实际观测的频数，B 表示理论分布下的频数。

2.拟合优度检验：A.对总体分布建立假设。

B.抽样并编制频率分布表。

C.以原假设为真，导出期望频率。

D.计算统计量。

E.确定自由度，并查x2表，得到临界值。

F.比较x2值与临界值，做出判断。

3.独立性检验A.对总体分布建立假设。

B.抽样并编制r*c 列联表。

C.计算理论频数。

D.计算检验统计量。

E.确定自由度，并查x2表，得到临界值。

F.比较x2值与临界值，做出判断。

2.非参数卡方检验操作步骤第一步：将需检验的数据导入spss中并进行赋值后，点击分析非参数检验、旧对话框、卡方。

图2操作步骤第一步第二步：进入图中对话框后点击，首先将需检验的数据放入检验变量列表中，后在期望值选项中所以类别相等或者值（值：需要手动输入具体的分布情况）。

如果特殊情况需要调整检验置信区间，点击精确，进入图中下方对话框后点击蒙特卡洛法框里收到填入。

点击继续、确定。

图3操作步骤第二步第三步：如果需要看描述统计结果和四分位数值可以点击选项、勾选描述、四分位数。

点击继续、确实。

图4操作步骤第二步3.非参数卡方检验结果然后非参数卡方检验的描述统计、卡方检验频率表、检验统计结果就出来了。

学术研究中的非参数检验方法

学术研究中的非参数检验方法摘要：非参数检验是一种广泛应用于统计学中的统计方法，尤其在处理分类变量和数据缺失时具有独特的优势。

本文旨在介绍非参数检验的基本原理、应用场景以及其在学术研究中的重要性。

通过具体案例分析，展示非参数检验在数据分析和实证研究中的应用，并讨论其与参数检验的区别和联系。

一、非参数检验的基本原理非参数检验是一种基于数据分布不依赖于总体分布的统计方法。

它主要包括卡方检验、秩和检验、二项分布检验等。

这些方法的特点是不需要知道总体分布，也不需要假设数据服从某一特定分布，因此适用于处理不确定的数据分布情况。

二、非参数检验的应用场景非参数检验在学术研究中具有广泛的应用，例如在心理学、医学、经济学、社会学等领域。

它可以用于比较不同组之间的数据分布差异，识别数据中的异常值和趋势，以及评估数据的可靠性和稳定性。

此外，非参数检验还适用于处理缺失数据和分类变量，因为这些数据类型不适合使用参数检验。

三、非参数检验的优势和局限性非参数检验的优势在于它对数据的适用性更广，无需知道或假设数据符合特定的分布。

此外，非参数检验的结果更加稳健，能够更好地处理异常值和组间差异。

然而，非参数检验也具有一定的局限性，例如它可能无法提供精确的参数估计，对于小样本数据可能不够敏感。

四、案例分析为了更好地理解非参数检验的应用，我们以一个实际研究案例为例进行分析。

该案例涉及对一组医学数据的分析，研究人员想知道不同药物治疗效果之间的差异。

通过对两组患者的治疗结果进行非参数检验，研究人员可以比较不同药物治疗效果的数据分布，进而评估哪种药物更有效。

五、结论本文介绍了非参数检验的基本原理、应用场景、优势和局限性，并通过具体案例分析了其在学术研究中的应用。

非参数检验作为一种重要的统计方法，在处理不确定的数据分布和分类变量时具有独特的优势。

尽管它可能无法提供精确的参数估计，但对于小样本数据和异常值具有较强的鲁棒性。

在未来的学术研究中，非参数检验将继续发挥重要作用，为数据分析和实证研究提供有力支持。

r语言3组非参数检验

r语言3组非参数检验非参数检验在统计学中是一种重要的方法，用于比较两组或多组数据是否具有显著性差异。

在R语言中，我们可以使用多种非参数检验方法来处理三组数据。

下面我们将介绍三种常用的非参数检验方法：卡方检验、配对卡方检验和Fisher确切概率法。

一、卡方检验卡方检验是一种用于比较两个或多个样本率或构成比是否显著的统计方法。

在R语言中，我们可以使用`chisq.test()`函数来进行卡方检验。

对于三组数据，我们可以将每两组的数据进行比较。

首先，我们需要将三组数据分别存储在三个向量中，例如：`group1`、`group2`和`group3`。

然后，我们可以使用以下代码进行卡方检验：```r#导入R语言自带的数据集data(mtcars)#将三组数据分别存储在向量中group1<-mtcars$mpggroup2<-mtcars$hpgroup3<-mtcars$drat#进行卡方检验chisq.test(cbind(group1,group2,group3))```上述代码将输出每组数据之间的卡方统计量和对应的p值。

如果p值小于预设的显著性水平（通常为0.05），则我们可以拒绝原假设，认为两组数据之间存在显著差异。

二、配对卡方检验配对卡方检验是一种用于比较两个配对样本是否具有相似性的统计方法。

在R语言中，我们可以使用`paired.test()`函数来进行配对卡方检验。

对于三组数据，我们可以将每两组的数据进行配对比较。

首先，我们需要将每两组的数据配对存储在一个矩阵或数据框中，例如：`df`。

然后，我们可以使用以下代码进行配对卡方检验：```r#创建示例数据框df<-data.frame(group1=c(1,2,3,4),group2=c(5,6,7,8),group3=c(9,10,11,12))#进行配对卡方检验paired.test(df)```上述代码将输出每组数据的配对样本之间的卡方统计量和对应的p值。

非参数检验卡方检验讲解

行总和 பைடு நூலகம்1＝100 R2＝80 T＝180
C1＝120
( f oij f eij )2 f eij
(58 66.7)2 (42 33.3)2 (62 53.3)2 (18 26.7)2 7.61 66.7 33.3 53.3 26.7
2 0.05 (1) 3.84
独立性检验
配合度检验
• 例1：某大学二年级的公共体育课是球类课，根据自己的爱好，学生只需在篮球、足球和排球三种课程中选择一种。据以往的统计，选择这三种课程的学生人数是相等的。今年开课前对90名学生进行抽样调查，选择篮球的有39人，选择足球的28人，选择排球的23人，那么，今年学生对三种课程选择的人数比例与以往不同？
df (行数-1) （列数-1) 1
2 2 0.05 (1)
拒绝零假设，即男女对公共场所禁烟的态度有显著差异。
四格表的简易算法
赞成男女 A 58 C 62 A+C＝120 不赞成 B 42 D 18 B+D=60 A＋B＝100 C＋D＝80 N=A+B+C+D=180
N ( AD BC ) 7.61 ( A B)(C D)( A C )( B D)
• • •
类别数据的处理形态: 次数与百分比类别数据的呈现: 次数分布表与列联表类别数据的分析: 卡方检验与其它关联性分析法
卡方检验的主要内容
•
•
配合度检验
– – – – 某一个变量是否与某个理论分布或总体分布相符合检验的内容仅涉及一个变量，是一种单因子检验同时检测两个类别变量﹙X与Y﹚之间的关系时，其目的在于检测从样本得到的两个变量的观察值，是否具有特殊的关联。检测同一个样本的两个变量的关联情形

spss卡方检验和非参数检验

练习一、为试验某止疼药物的效果，将178例患者随机分为两组，用药组90 人，对照组88人，试验结果见数据chi_ex，请根据此数据回答，此药物止疼效果如何？
练习二、用两种方法检查乳腺癌患者120名，甲法检出率60%，乙法检出率 50%，两法检出都阳性的是35%，请问两种方法检出率是否有差别？
H1：B≠C
Test Statisticsb
N Chi-Squarea
VAR00001 & VAR00002 410
86.449
Asymp. Sig.
.000
a. Continuity Corrected
b. McNemar Test
χ2 =86.45， P=0.000 P<0.05，拒绝H0，接受H1，差别有显著性，两种方法检验结果不同。
二、行×列表的χ2检验
a. 什么是行×列表整理表的行数多于2，或者列数多于2。四格表是为了比较两个率（构成比）是否相等；行×列表是为了比较三组或者三组以上的率（构成比）是否相等。
b. 行×列表χ2检验的假设： H0：各组构成相同 H1：各组构成不同或不全相同
c. 行×列表的自由度：（行数-1) ×(列数-1）
L i ne a r-b y-L i ne a r Asso ci a ti on
2.333
1
.127
N of Valid Cases
25
a. Computed only for a 2x2 table
b. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 1. 60.
两型慢性布氏病患者得植物血凝素皮试反应

卡方检验与非参数检验

④ SPSS 点击确定，即可得到结果：
4.1 适合度检验
例 4.3 某批苹果进行保存实验，共60箱，每箱10个，实验结束后检查每箱苹果的变质情况，结果如下表，试检验苹果的变质数是否服从二项分布？
4.1 适合度检验
设每个苹果变质的平均概率为p，变质数x 服从二项分布，即x~B(10,p)。p根据实际观测值的平均数 p 估计：
4.1 适合度检验
③ DPS （1）输入数据与选择数据，点击菜单分类数据统计→模型拟合优度检验：
4.1 适合度检验
③ DPS 立刻得到结果：
结果中卡方值为0.4700（即Pearson卡方值，对应的p值为0.9254，大于0.05，说明实际观测值与孟德尔理论分离比9:3:3:1无显著差异。
4.1 适合度检验
① Minitab 输入数据，点击菜单统计→表格→卡方拟合优度检验（单变量）：
4.1 适合度检验
① Minitab 弹出对话框，将实际选择到观测计数后面，颜色选择到类别名称（可选）后面。检验下面选择按历史计数制定的比率，下拉条选择输入列，将理论选择到按历史计数制定的比率后面：
第四章卡方检验与非参数检验
卡方（χ2）检验主要有三种类型：
第一是适合性检验，比较观测值与理论值是否符合；第二是独立性检验，比较两个或两个以上的因子相互之间是独立还是相互有影响。
4.1 适合度检验
例4.1 有一鲤鱼遗传试验，以红色和青灰色杂交，其F2代获得不同分离尾数，问观测值是否符合孟德尔3:1遗传定律？
例某实验室分别用乳胶凝集法和免疫荧光法对 58名可疑系统红斑狼疮患者血清中抗核抗体进行测定，结果见表。问两种方法的检测结果有无差别？
4.2.1.2 配对四格表资料的χ2检验

卡方检验与非参数检验

卡方检验与非参数检验卡方检验与非参数检验是统计学中常用的两种假设检验方法。

它们在样本数据不满足正态分布或方差齐性等假设条件的情况下，仍可以进行假设检验，因此被称为非参数检验方法。

本文将详细介绍卡方检验与非参数检验的原理、应用以及比较。

一、卡方检验卡方检验是一种用于检验两个或多个分类变量之间是否存在相关性的统计方法。

它将实际观察到的频数与期望的频数进行比较，从而判断两个分类变量是否存在相关性。

卡方检验主要包括卡方拟合度检验、卡方独立性检验和卡方配对检验等。

1.卡方拟合度检验卡方拟合度检验适用于比较观察到的频数与理论上期望的频数是否有显著差异。

例如，我们可以通过卡方拟合度检验来判断一组骰子的点数是否是均匀分布的。

该方法首先根据理论假设计算每个类别的期望频数，然后计算观察频数与期望频数的差异，并根据差异的大小判断是否有显著差异。

2.卡方独立性检验卡方独立性检验适用于比较两个分类变量之间是否存在相关性。

例如，我们可以使用卡方独立性检验来判断性别与喜好类别之间是否存在相关性。

该方法首先根据理论假设计算每个类别的期望频数，然后计算观察频数与期望频数的差异，并根据差异的大小判断是否有显著差异。

3.卡方配对检验卡方配对检验适用于比较同一组体在两个时间点或处理条件下的观测值是否有差异。

例如，我们可以使用卡方配对检验来判断一种药物在服药前后对疾病症状的治疗效果。

该方法通过比较观察值和期望值之间的差异来判断是否有显著差异。

非参数检验是一种不依赖于总体分布的统计方法，它不对总体的分布形态做出任何假设，因此适用于任何类型的数据。

常见的非参数检验方法包括Wilcoxon符号秩检验、Mann-Whitney U检验、Kruskal-Wallis H检验等。

1. Wilcoxon符号秩检验Wilcoxon符号秩检验适用于比较两组配对样本数据是否存在差异。

例如，我们可以使用Wilcoxon符号秩检验来判断一种药物在服药前后对患者血压的影响。

检测特征差异的方法

检测特征差异的方法
1.方差分析(ANOVA)：方差分析是一种用于比较组间差异的统计方法。

它通过计算组内和组间的方差，判断是否存在显著
的组间差异。

2.独立样本t检验：独立样本t检验适用于比较两组之间的
均值差异。

通过计算两组样本均值、标准差以及样本大小，进
行假设检验，判断差异是否具有统计学意义。

3.配对样本t检验：配对样本t检验适用于比较同一组测试
对象在不同条件下的均值差异。

该方法通过计算样本均值、标
准差以及样本大小，进行假设检验，判断差异是否具有统计学
意义。

4.非参数检验：非参数检验方法不依赖于数据的分布情况，
适用于小样本或者无法满足参数检验假设的情况。

常见的非参
数检验方法包括Wilcoxon秩和检验、MannWhitneyU检验等。

5.卡方检验：卡方检验适用于比较两个或多个分类变量之间
的关联性。

通过计算实际观察频数与期望频数之间的差异，并
进行假设检验，判断关联性是否具有统计学意义。

6.回归分析：回归分析用于探究自变量与因变量之间的关系。

可以通过回归模型的系数来判断自变量对因变量的影响程度，
并进行显著性检验，判断差异是否具有统计学意义。

这些方法在不同的数据类型和研究场景下有不同的应用，选择合适的方法需要根据具体情况来决定。

非参数检验（卡方检验）实验报告

⾮参数检验（卡⽅检验）实验报告⼤理⼤学实验报告课程名称⽣物医学统计分析实验名称⾮参数检验（卡⽅检验）专业班级姓名学号实验⽇期实验地点2015—2016学年度第 2 学期a. 不假定零假设。

b. 使⽤渐进标准误差假定零假设。

分析：表11为LPA和FA两种检测结果的的⼀致性检验。

Kappa值是内部⼀致性系数，除数据P值判断⼀致性有⽆统计学意义外，根据经验，Kappa≥0.75，表明两者⼀致性较好0.7>Kappa ≥0.4，表明⼀致性⼀般，Kappa<0.4，则表明⼀致性较差。

本例Kappa值为0.680，P=0.000<0.01，拒绝⽆效假设，即认为两种检测⽅法结果存在⼀致性，Kappa值=0.680，0.7>Kappa≥0.4，表明⼀致性⼀般。

例1表12 周内⽇频数表观察数期望数残差1 11 16.0 -5.02 19 16.0 3.03 17 16.0 1.04 15 16.0 -1.05 15 16.0 -1.06 16 16.0 .07 19 16.0 3.0总数112分析：表12结果显⽰⼀周内各⽇死亡的理论数（Expected）为16.0，即⼀周内各⽇死亡均数；还算出实际死亡数与理论死亡数的差值（Residual）。

表13 检验统计量周⽇卡⽅ 2.875adf 6渐近显著性.824a. 0 个单元 (.0%) 具有⼩于 5 的期望频率。

单元最⼩期望频率为 16.0。

分析：Chi-Square过程，调⽤此过程可对样本数据的分布进⾏卡⽅检验。

卡⽅检验适⽤于配合度检验，主要⽤于分析实际频数与某理论频数是否相符。

卡⽅值X2=2.875，⾃由度数（df）=6，P=0.824>0.05，差异不显著，即可认为⼀周内各⽇的死亡危险性是相同的。

例2表14 ⼆项式检验类别N 观察⽐例检验⽐例精确显著性（双侧）性别组 1 0 12 .30 .50 .017 组 2 1 28 .70总数40 1.00分析：调⽤Binomial过程可对样本资料进⾏⼆项分布分析。

检验三维列联表独立性非参数检验方法

检验三维列联表独立性非参数检验方法
三维列联表独立性非参数检验方法常用的是卡方检验。

卡方检验是一种用于分析分类资料的检验方法，常用于检验两个或多个分类变量之间是否存在关联。

对于三维列联表，如果变量之间独立，则行与列的分布应该是相互独立的。

卡方检验可以评估观察值与期望值之间的偏离程度，从而判断分类变量之间是否存在统计学上的显著差异。

进行卡方检验的步骤如下：
1. 建立原假设（H0）和备择假设（H1），其中原假设假设变量之间独立，备择假设则相反。

2. 计算观察频数与期望频数之间的差异，可以利用统计软件进行计算。

3. 计算卡方统计量，用于衡量观察频数与期望频数之间的差异程度。

4. 根据自由度和显著性水平，查找卡方分布的临界值。

5. 比较计算得到的卡方统计量与临界值，判断是否拒绝原假设。

需要注意的是，卡方检验的结果只能用于判断变量之间是否存在关联，不能确定具体的关联类型或者因果关系。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

二项分布检验一、二项分布检验概念对于某分布，假定低于某指定值V的百分比占P0。如果该假设成立，则分布将满足一个规律。 H0假设：样本组中低于等于某值V的个案占百分比P0。二、操作步骤执行：
[Analyze][Nonparametric][Binomial] 选择变量(必须是数值型变量)到Test Variables检验变量窗口定义分界值“Define Dichotomy”： “Get from data”为自动分界，即变量值中只有两类数值。 “Cut point”定义分界值，检验小于该值的观测值。 “Test”定义检验百分比，例如：.10 , .50或 .75等。
/MISSING ANALYSIS. 四、应用举例：
设有若干块实验田，亩产（公斤）如下：
623 702 674 680 736 695
801 638 721 690 655 741 H0假设：产量低于650公斤的地只占10%。
Category N Observed Prop. Test Prop.
Exact Sig. (1-Tailed)
NPAR TESTS /K-S(NORMAL)= 变量名 /STATISTICS DESCRIPTIVES /MISSING ANALYSIS.
四、应用举例下列数据是否满足正态分布：
4.35 5.20 5.18 4.27 4.62 4.79 4.52 5.70 5.50 4.87 4.76 4.79 4.15 4.57 4.76 4.50 4.89 4.71 4.93 5.34 4.97 4.40 5.21 4.89 4.74 4.88 4.77 5.29 5.09 4.70 4.69 5.00 4.62 5.23 4.44 5.01 4.29 4.99 4.73 4.97 检验结论：
“Monte Carlo” 适合不满足渐进分布的大样本分布。
“Confidence”指定置信区间。 “Number of”指定近似法计算中的个案数。 “Exact”精确计算统计概率。 “Options”中可以设置选项： “Descriptive” 中将计算描述统计：均值、标准差、最大值、最小值等。
( A B)(C D)( A C)(B D)
卡方检验基本前提
• 各小格之期望次数﹙或理论次数﹚不得小于5。
• 不满足假设时的处理方法
– 小格合并法 – 增加样本数 – 去除样本法 – 使用Yate’s校正公式
非参数检验
χ2拟合优度检验
一、χ2检验概念 χ2检验是检验样本测量频数与期望频数的差异性。
– 虚拟化类别数据：由其它类型的数据型态转换成类别形式的数据, 例如由连续变量转换来的类别变量
• 类别数据的处理形态: 次数与百分比 • 类别数据的呈现: 次数分布表与列联表 • 类别数据的分析: 卡方检验与其它关联性
分析法
卡方检验的主要内容
• 配合度检验
– 某一个变量是否与某个理论分布或总体分布相符合 – 检验的内容仅涉及一个变量，是一种单因子检验
Asymp. Sig. (2-tailed) .973 检验结果：个案数为40个，Asymp. Sig. (2-tailed)= 0.973>0.05，这表明综合评比成绩是呈正态分布的。
• 独立性检验
– 同时检测两个类别变量﹙X与Y﹚之间的关系时，其目的在于检测从样本得到的两个变量的观察值，是否具有特殊的关联。
– 检测同一个样本的两个变量的关联情形
配合度检验
• 例1：某大学二年级的公共体育课是球类课，根据自己的爱好，学生只需在篮球、足球和排球三种课程中选择一种。据以往的统计，选择这三种课程的学生人数是相等的。今年开课前对90名学生进行抽样调查，选择篮球的有39人，选择足球的28人，选择排球的23人，那么，今年学生对三种课程选择的人数比例与以往不同？
[Analyze][Nonparametric Test][1-Sample K-S] 选择检验变量到Test Variables检验变量窗口中定义分布方式,复选项：正态“Normal” 均匀“Uniform” 泊松“Poisson” 指数“Exponential”
按钮“Exact”作用与前面相同按钮“Options” 作用与前面相同三、语法
随机分布情况：名次分布完全没有规律。
H0假设：样本分布是随机的，即游程不是最大或最小二、操作步骤
执行
[Analyze][Nonparametric][Runs Test] 选择检验变量到Test Variables窗口中定义分界值“Cut point”：可以用中位数“Median”、众数“Mode”、平均值 “Mean”以及自定义“Custom”为分界值。
赞成不赞成行总和
男性 fo11 =58 fo12 =42 R1＝100 女性 fo21 =62 fo22 =18 R2＝80 列总和 C1＝120 C2＝60 T＝180
男性女性列总和
赞成
fo11 =58 Fe11 =66.7 fo21 =62 Fe21 =53.3 C1＝120
不赞成
fo12 =42 Fe12 =33.3 fo22 =18 Fe22 =26.7 C2＝60
• t检验和方差分析（F检验）都属于参数检验。他们有一个基本条件，就是要求数据必须是连续的。在心理和教育研究中，我们还会用到离散数据。
类别数据的分析
• 类别数据的产生
– 原发性类别数据：当被测定的变量的本质是名义性的属性, 例如性别数据
– 操作性类别数据：以人为操作的手段所获致的分类性数据, 例如实验操作的分类结果
fei
30
30
30
df 2
2 0.05
(2)

5.99
2

2 0.05
(2)
接受零假设，即选择三种课程的学生数相等。
独立性检验
• 例2 为了解男女在公共场所禁烟上的态度，随机调查100名男性和80名女性。男性中有58人赞成禁烟，42人不赞成；而女性中则有61人赞成，19人不赞成。那么，男女在公共场所禁烟的问题所持态度不同？
<= 650
2
.166667
.1
.341
> 650
10
.8
分析结果：Exact Sig.为.341，表明H0假设，即：产量低于650公斤的地只占10%的结论可以接受。
单样本游程检验
一、游程检验概念 Runs游程：样本测量值（变量值取值）相同取值的连续串。
变量值分布可能有两类最有规则情况：比如一班同学的成绩全部在前面,而二班的全部在后面。也可能是两个班成绩不分上下，名次上是一个班一个，名次交替出现。
行总和 R1＝100
R2＝80
T＝180
2
( foij feij )2 (58 66.7)2 (42 33.3)2 (62 53.3)2 (18 26.7)2 7.61
ij
feij
66.7
33.3
53.3
26.7
df (行数-1（) 列数-1) 1
“Quartiles” 四等分百分位数的计算。缺失值“Missing Value”: “Exclude cases test by test”表示排除在做统计分析的变量中含有缺失值的个案。
三、命令语句
NPAR TEST /CHISQUARE=检测变量 /EXPECTED=对应的期望频数 /MISSING ANALYSIS.
“Values”为指定各个项的频数。检验变量取值范围“Expected Range”： “Get from data”为不限定。 “Use specied range”指定上下限。
“Exact”可以定义各种不同分布下的显著性检验，使计算更精确：
“Asymptotic only”适合于渐进分布的大样本分布。
例如：在某次考试结束后，对不同成绩进行统计的结果：
分数段 0-60分
期望频数Ei 0
测量频数Qi 1
60-75分
4
6
75-85分
8
8
85-100分
4
3
按照公式：
χ2 （Qi Ei）2 Ei
经过查表可得到P
P>α 不显著 P<= α显著
H0假设：样本的测量频数Qi与期望频数Ei差异不显著。
一旦卡方值大于某一个临界值，即可获得显著的
统计结论
2
f0 fe 2
fe
篮球观察次数（fo） 39 期望次数（fe） 30
足球 28 30
排球 23 30
2 ( foi fei )2 (39 30)2 (28 30)2 (23 30)2 4.46
篮球观察次数（fo） 39 期望次数（fe） 30
足球 28 30
排球 23 30
卡方检验的统计原理
• 卡方检验所检测的是样本观察次数﹙或百分比﹚ 与理论或总体次数﹙或百分比﹚的差异性。
• 理论或总体的分布状况，可用统计的期望值（理论值）来体现
• 卡方的统计原理，是取观察值与期望值相比较。
卡方值越大，代表统计量与理论值的差异越大，
四、应用举例某地区的人口消费结构在83年和90年的统计数字如下：
食品衣物住房燃料日用品非商品支出
83年 53 12.8 11.7 5.6 14.1 2.8 90年 44.2 10.8 15.1 4.7 16.2 9.0 建立一个数据文件：变量cost 为44个1、11个2、15个 3、16个5、9个6 检测变量：cost 期望值定义：53 13 12 6 14 3 分析结果：Asymp.sig=.010，所以85年的消费结构同 90年的消费结构差异显著。