第5章 参数检验与非参数检验
参数检验和非参数检验
参数检验和非参数检验参数检验和非参数检验是统计学中两种常用的假设检验方法。
参数检验假设总体服从其中一种特定的概率分布,而非参数检验则不对总体的概率分布进行特定的假设。
本文将分析和比较这两种假设检验方法,并讨论它们的优缺点和适用范围。
参数检验的基本思想是假设总体的概率分布属于一些已知的参数化分布族,例如正态分布或泊松分布。
然后根据样本数据计算出统计量的观察值,并基于它们进行假设检验。
常见的参数检验方法有t检验、F检验和卡方检验等。
以t检验为例,它适用于研究两个样本均值之间是否存在显著差异的情况。
假设我们有两组样本数据,分别服从正态分布。
可以使用t检验来计算两组样本均值的差异是否显著。
t检验基于样本均值和标准差来估计总体均值的差异,并通过计算t值和查表或计算p值来判断差异是否显著。
参数检验的优点是它们对总体概率分布的假设比较明确,计算方法相对简单,适用于数据符合特定分布的情况。
此外,参数检验通常具有较好的效率和统计性质。
然而,参数检验也有一些限制和缺点。
首先,参数检验通常对数据的分布假设要求较高,如果数据不符合指定的分布假设,则结果可能不可靠。
另外,参数检验对样本大小的要求较高,需要较大的样本才能获得可靠的检验结果。
此外,参数检验对异常值和离群值比较敏感,这可能会导致统计结论的错误。
与参数检验相比,非参数检验更加灵活,不需要对总体的概率分布做出特定的假设。
它适用于更广泛的数据类型和样本分布。
常见的非参数检验方法有Wilcoxon符号秩检验、Mann-Whitney U检验和Kruskal-Wallis检验等。
以Wilcoxon符号秩检验为例,它适用于比较两个相关样本的差异。
这个检验不要求样本数据满足正态分布的假设,它基于样本差值的秩次来判断差异是否显著。
非参数检验的优点在于其适用范围广泛,不需要对总体分布做出特定假设,对数据平均性和对称性的要求较低,对异常值和离群值的鲁棒性较好。
此外,非参数检验对样本大小的要求较低,可以在较小的样本情况下获得可靠的结果。
第5讲SPSS非参数检验
数据文件:“糖果中的卡路里.sav” 菜单:“分析→非参数检验→旧对话框→K个独立样本”
多独立样本非参数检验整体分析与设计的内容
输入最大值、 最小值。
Kruskal-Wallis H检 验:是曼-惠特尼U 检验在多个独立样 本下的推广。
检验各个样本是否来自有相同中位数的 总体。--- 这种检验的效能最低。
2)对数据的测量尺度无约束,对数据的要求也不严格,任何数据类型 都可以。
3)适用于小样本、无分布样本、数据污染样本、混杂样本等。
注:若参数检验模型的所有假设在数据中都能满足,而且测量达到了所 要求的水平,那么,此时用非参数检验就浪费了数据。
因此,若所需假设都满足的情况下,一般就选择参数检验方法。
卡方检验
此时,零假设:两总体的 均值无显著性差异;就可 能不成立。
K-S检验。以变量的秩 作为分析对象;而非变 量值本身。
也需要先将两组样本混 合、升序排列。
两独立样本非参数检验整体分析与设计的内容 二、操作
该检验有特定用途,给出的结果均为单侧 检验。若施加的处理时的某些个体出现正 向效应,而另一些个体出现负向效应时, 就应当采用该检验方法。 基本思想为:将一组样本作为控制样本, 另一组作为试验样本。以控制样本为对照, 检验试验样本相对于控制样本是否出现了 极端反应。若无极端反应,则认为两总体 分布无显著性差异;否则,有显著性差异。
选择分布
“结”的处理
单样本K-S检验
整体分析与设计的内容
三、补充描述性统计的P-P图和Q-Q图
P-P图的输出样子: P-P图
期望(理论)累计 概率值
去势P-P图
样本数据实际累计 概率值
实际与期望的差值
样本数据实际累计 概率值
参数检验与非参数检验的区别与应用
参数检验与非参数检验的区别与应用统计学中的参数检验和非参数检验是两种常用的假设检验方法。
本文将详细介绍参数检验和非参数检验的区别以及它们在实际应用中的具体场景。
一、参数检验参数检验是建立在对总体分布形态有所假定的基础上,通过对样本数据进行统计推断,来对总体参数进行假设检验。
它通常要求总体分布服从特定的概率分布,如正态分布。
参数检验的常见方法有:1. 单样本t检验:用于检验样本均值是否与已知总体均值有显著差异。
2. 独立样本t检验:用于比较两个独立样本的均值是否存在显著差异。
3. 配对样本t检验:用于比较同一组样本在不同条件下的均值是否存在显著差异。
4. 方差分析:用于比较多个样本组之间的均值是否存在显著差异。
参数检验的优势在于其具有较高的效率和灵敏度,适用于对总体分布形态有所了解的情况。
但它也有一些限制,如对分布形态的假设可能不成立,以及对样本量和数据类型的要求较高。
二、非参数检验非参数检验是对总体分布形态没有具体假设的情况下,通过对样本数据进行统计推断,来对总体参数进行假设检验。
非参数检验不少于参数检验的分析方法,常见的包括:1. Wilcoxon符号秩检验:用于比较两个相关样本的差异是否存在显著差异。
2. Mann-Whitney U检验:用于比较两个独立样本的中位数是否存在显著差异。
3. Kruskal-Wallis检验:用于比较多个样本组的中位数是否存在显著差异。
非参数检验的优势在于对总体分布形态没有具体要求,适用于对总体分布了解较少或不了解的情况。
它相对于参数检验来说更具广泛的适用性,但由于其推断效果较差,需要更大的样本量才能达到相同的检验效果。
三、参数检验与非参数检验的区别1. 假设要求:参数检验对总体分布形态有假设要求,如正态分布假设,而非参数检验对总体分布形态没有具体要求。
2. 统计量选择:参数检验基于已知概率分布,可以选择特定的统计量如t值、F值等;而非参数检验使用秩次统计量,如秩和、秩和秩二样序差等。
参数检验与非参数检验的区别及优缺点.ppt
u
T n1(N 1) / 2 0.5
n1n2
12N (N 1)
N
3
N
(t
3 j
tj)
uc=u/c1/2
C20=19-18-1-7∑(t3j-tj)/(N3-N) 感谢你的观看
17
式中tj为第j个相同秩次的个数。 总秩和等于N(N+1)/2
T1=n1(N+1) /2
T2=n2(N+1) /2
复习
参数:反应总体特征的指标; 如: N、 、
统计量:反应样本特征的指标; 如:n、 x、s
2019-8-17
感谢你的观看
1
第十一章 秩和检验
2019-8-17
感谢你的观看
2
参数统计
(parametric statistics)
非参数统计
(nonparametric statistics)
已知总体分布类型,对 未知参数(μ、π)进行 统计推断
2019-8-17
感谢你的观看
12
二 成组设计两样本比较的秩和检验 (Wilcoxon两样本比较法)
1、原始数据的两样本比较;
例11.2 为了比较甲、乙两种香烟的尼古丁含 量(mg),对甲香烟作了6次检测,对乙香烟作了 8次检测,问两种香烟中尼古丁含量有无差别?
2019-8-17
感谢你的观看
13
甲种香烟
2.计算检验统计量T值
(1)编秩 先将两组数据由小到大分别排队,再将 两组数据从小到大统一编秩,如遇相同数据在同 一组内,按位置顺序编;如相同数据不在同一 组内,应取平均秩次 。
(T;2)如求果秩两和样:本含含量量较相小等的,样那就本任计取为一n1,个其样秩本和的记秩和为。
参数检验与非参数检验的区别及优缺点.(课堂PPT)
别 对总体参数进行区间 和检验分布(如位置)是否
估计或假设检验
相同
优 符合条件时,检验效 应用范围广、简便、易掌握 点 能高
对资料要求严格
缺
若对符合参数检验条件的资 料用非参数检验,则检验效 能低于参数检验
点 要求资料分布型已知
资料总体方差相等
2
如H0成立,非参数检验与参数检
验效果一样好;如H0不成立,则
n(n 1)(2n 1) / 24
如果有相同秩次,应用下面的校正公式:
T n(n 1) / 4 0.5
u
n(n
1)(2n 24
1)
1 48
(t
3 j
tj)
连续性校 正数
式中 tj 为第 j 个相同秩次的个数。如有相同秩次:3.5,3.5,6,6,6, 则∑(t3j-tj)=(23-2)+(33-3)
11
22
3
n1=6ቤተ መጻሕፍቲ ባይዱ
T1=40.5
乙种香烟
尼古丁含量
秩次
28
9.5
31
13
30
12
32
14
21
2
27
8
24
5
20
1
n2=8
T2=64.5
2
感
14
1.建立假设,确立检验水准: H0:两总体分布相同 H1:两总体分布不同 =0.05
2.计算检验统计量T值
(1)编秩 先将两组数据由小到大分别排队,再将 两组数据从小到大统一编秩,如遇相同数据在同 一组内,按位置顺序编;如相同数据不在同一 组内,应取平均秩次 。
2
感
12
二 成组设计两样本比较的秩和检验 (Wilcoxon两样本比较法)
假设检验
第五章假设检验本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。
通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2.熟练掌握总体均值与总体成数指标的各种检验方法;包括:z 检验、t 检验和p-值检验;4.掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验;5.能利用Excel 进行假设检验。
第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。
假设检验与区间估计结合起来,构成完整的统计推断内容。
假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。
本章分别讨论这两类检验方法。
进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理”,对假设的正确性做出判断。
这种思维方法与数学里的“反证法”很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。
反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。
其实,我们在日常生活中,不仅不肯接受概率为0的事件,而且对小概率事件,也持否定态度。
比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。
所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。
这种事件称为“实际不可能事件”。
小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平α(0<α<1)作为小概率的界限,α的取值与实际问题的性质有关。
所以,统计检验又称显著性检验。
下面通过一个具体例子说明假设检验是怎样进行的。
【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。
统计学中各种检验的核心内容
统计学中各种检验的核心内容参数检验与非参数检验统计检验可分为两大类:参数检验和非参数检验。
参数检验假设数据来自具有特定分布的总体,例如正态分布。
非参数检验则无需此假设。
假设检验大多数统计检验涉及假设检验。
假设检验遵循以下步骤:设定零假设和备择假设计算检验统计量确定临界值根据检验统计量和临界值做出决策统计检验的类型t检验用于比较两个独立样本的均值参数检验,假设数据来自正态分布 ANOVA(方差分析)用于比较多个样本的均值参数检验,假设数据来自正态分布卡方检验用于检验分类变量之间的关联非参数检验Wilcoxon秩和检验用于比较两个独立样本的中位数非参数检验Mann-Whitney U检验用于比较两个独立样本的均值非参数检验Kruskal-Wallis检验用于比较多个样本的中位数非参数检验相关性分析用于度量两个变量之间的线性关系皮尔逊相关系数:用于度量连续变量之间的相关性(-1到1)斯皮尔曼等级相关系数:用于度量序数变量之间的相关性(-1到1)回归分析用于预测一个变量(因变量)基于另一个变量(自变量)线性回归:因变量是自变量的线性函数Logistic回归:因变量是自变量的逻辑函数,用于二分类问题显著性水平显著性水平(α)是犯第一类错误(拒绝真实零假设)的概率通常设定为0.05或0.01显著性水平越小,犯第一类错误的可能性越小,但犯第二类错误(接受虚假零假设)的可能性越大检验统计量检验统计量是用于计算检验结果的度量不同检验使用不同的检验统计量,例如t值、卡方值或U值临界值临界值是检验统计量的阈值,用于做出决策如果检验统计量大于或等于临界值,则拒绝零假设临界值通过查表或使用统计软件确定决策基于检验统计量和临界值,做出以下决策之一:拒绝零假设接受零假设拒绝零假设表明备择假设更有可能是真的,而接受零假设表明没有足够的证据拒绝它注意事项统计检验只是做出明智决策的工具,不能替代对数据的批判性思考了解检验的假设和限制对于正确解释结果至关重要有时可能需要执行多个检验来全面了解数据。
R语言——参数检验和非参数检验
参数检验和非参数检验的区别
计量资料一般是参数、非参数检验都是可以的。但是对于能使用参数检验的,首选参数检验,对不能满足条件的才选用 非参数检验。
参数检验 一般有:T检验,方差分析,(要求:方差齐性、正态分布)一般也是用于计量资料。选用非参数检验的情况 有:①总体分布不易确定(也就是不知道是不是正态分布)②分布呈非正态而无适当的数据转换方法③等级资料④一段或两段 无确定数据等(比如一段的数据是>50,是一个开区间)
当我们研究的样本处于良好情况下(近似正态、无离群点、数据量大等),传统的参数检验是很有效的。但是当这些前提条件不再满足 时,参数检验就不再有效。此时人们往往求助于非参数检验,非参数检验不再关注数据的值,而只关注数据的秩,这样就抛弃了大量可用的信 息。而置换检验采取重复随机抽样的方法,通过对样本再抽样构造经验分布,然后在此基础上生成P值进行推断,达到很好的效果。但要注意的 是,如果样本不能很好的代表总体,任何检验方法都是无效的
然而有许多观察结果却并不是真正的数值例如只是某种分类或等级倘若强行将上述运算施于这种非真正数值的观察结果则势必会歪曲事情的本来面目从而使人们对检验的有效性产生怀疑这时只有采用非参数统计才能得到有价值的结果
第5章 非参数检验
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
• 5.2.2 卡方检验
5.2 单样本的非参数检验
• 4.卡方检验SPSS实例分析
• 【例5-1】 某公司质检负责人欲了解企业一年内出现的次 品数是否均匀分布在一周的五个工作日中,随机抽取了90 件次品的原始记录,其结果如表5.1所示,问该企业一周 内出现的次品数是否均匀分布在一周的五个工作日中?
P{ X x} C p q
i 1 i n i
x
n i
19
Z
SPSS 23(中文版)统计分析实用教程(第2版)
x 0.5 np np (1 p )
电子工业出版社
5.2 单样本的非参数检验
5.2.3 二项分布检验
在大样本的情况下,计算的是Z统计量,认为在原假设下, Z统计量服从正态分布,其计算公式如下:
• (3)“设置”选项卡:用于设定检验方法及对应的选项 ,如图5-3所示。
10
SPSS 23(中文版)统计分析实用教程(第2版)
电子工业出版社
• 5.2.2 卡方检验
• 1.卡方检验的概念
5.2 单样本的非参数检验
• 卡方检验(Chi-Square Test)法,也称卡方拟合优度检验 ,它是K.Pearson给出的一种最常用的非参数检验方法,用 于检验观测数据是否与某种概率分布的理论数值相符合, 进而推断观测数据是否来自于该分布的样本。例如,根据 掷骰子试验中出现的点数,检验骰子是否均匀,即各点出 现的概率是否均为1/6。卡方检验的原假设H0:总体服从 某种理论分布。此外,卡方检验还可对定性行列表资料的 行列变量的独立性,以及线性相关性(线性趋势)进行分 析,这部分内容可参见第3章“交叉表分析”中的内容。
第五章-t检验
单样本t检验结果显示,大学生的人际关系总分显著低于检验值15分,说明大学生的人际 关系困扰程度较轻。
在绘制表格报告统计检验结果时,研究者常用*代表p值大小。一般用**代表p<0.01,用 *代表p<0.05,p大于0.05则不标注*。
17
第 一 节
检检
验验
值样
的本
差来
异自
——
总
体
t
单 样 本
的 均 值 与
第 一 节
检检
验验
值样
的本
差来
异自
——
总
体
t
单 样 本
的 均 值 与
检指
验定
二、操作方法
( 1 ) 在 SPSS 菜 单 栏 中 选 择 【 分 析 】> 【比较均值】>【单样 本t检验】菜单命令, 如图5-1所示。
10
图5-1 单样本t检验的操作命令
第 一 节
检检
验验
值样
的本
差来
异自
——
总
体
t
体
t
单 样 本
的 均 值 与
检指
验定
12
二、操作方法
(3)在【检验变量】列表框下方的【检验值】 编辑框中输入某个数值,这个数值往往是总体均值 或某个已知的值。
(4)单击【选项】按钮,将弹出【单样本t检验: 选项】对话框,如图5-3所示,根据需要设定置信区 间和缺失值的处理方式。系统默认置信区间的百分 比为95%,缺失值的处理方式为【按分析顺序排除 个案】,即当计算涉及到包含缺失值的个案时,系 统自动剔除该个案。当然,研究者也可以选择【按 列表排除个案】方式,即系统先剔除所有包含缺失 值的个案后再进行分析。但在很多情况下都保持系 统默认设置,不做改变。完成设置后,单击【继续】 按钮,返回【单样本t检验】对话框。
非参数检验相比于参数检验的缺点
非参数检验相比于参数检验的缺点
1. 较低的功效:在样本容量较小或者总体分布相对简单的
情况下,非参数检验的功效通常会比参数检验低。
这意味着非参数检验可能会更难发现存在的显著差异。
2. 需要更多的数据:为了能够产生可靠的结果,非参数检验可能需要比参数检验更多的样本数据。
3. 难以确定效应大小:与参数检验相比,非参数检验往往难以确定效应的大小。
当我们使用参数检验时,我们可以根据参数的估计值计算效应大小。
但是,在非参数检验中,我们通常需要使用基于排名或任意单位的统计量,这使得效应大小的确定更加困难。
4. 不适用于某些问题:一些问题可能需要特定类型的参数
检验。
例如,当我们需要测量两个总体均值之间的差异时,T检验或方差分析通常比非参数检验更适合。
5. 理解和解释结果可能更困难:与参数检验相比,非参数检验可能更难理解和解释其结果。
这是因为非参数检验通常使用一些非常抽象的统计量,这些统计量难以解释其实际意义。
在这种情况下,解释结果可能需要更深入的统计知识和分析
技能。
第五章非参数统计方法
此列原假设H0 为:产品包装净重服从均值为500g, 标准差为4g的正态分布。有关中间过程列在表12-3中。 因本例理论分布的总体参数μ与σ均已知,故可计算 出每一组上限为止的“理论频率”。 D统计量值为: D=max{|Sn(x)-Fn(x)|}=0.0165 查D分布表。因本例n大大超过40,我们采用近似的 公式计算临界值,即:
非参数统计的历史
非参数统计的形成主要归功于20世纪40年代~50 年代化学家F.Wilcoxon等人的工作。Wilcoxon于 1945 年 提 出 两 样 本 秩 和 检 验 , 1947 年 Mann 和 Whitney二人将结果推广到两组样本量不等的一 般情况; Pitman于1948年回答了非参数统计方法相对于参 数方法来说的相对效率方面的问题;
= 8.1824
2 χ 2 = 8.1824 < χ α (4)
故不拒绝 H 0 ,即不能认为五种不同包装方式之间销 售有显著差异。
二、Kolmogorov-Smirnov正态性检验
Kolmogorov-Smirnov 正 态 性 检 验 根 据 样 本 经验分布和理论分布的比较,检验样本是否来自 于该理论分布(R语言ks.test {stats} )。假设检 验问题: H :样本来自所给分布
第一节 非参数统计的一般问题
在统计学中,如果总体的精确率分布形式已知, 而只是其中的某些参数未知时,通常是从总体中 随机取样本,根据样本信息对总体参数进行估计 或假设检验,这就是一般所说的参数统计方法。 但在许多实际问题中,我们对总体分布的具体形 式是未知或知之甚少的,只知道总体为连续分布 还是离散分布,也不能对总体的分布形式作进一 步的假定(如假定总体为近似正态分布等),这 时要对总体的某些性质进行统计估计或假设检 验,就要采用非参数统计方法。
非参数检验的名词解释
非参数检验的名词解释
非参数检验是一种统计方法,用于在数据不满足正态分布或其他假设条件的情况下进行统计推断。
与参数检验相比,非参数检验不需要对总体参数做出假设,而是直接利用样本数据进行推断。
以下是相关名词解释:
1. 非参数:指在进行统计推断时,不对总体的分布形式或参数做出特定的假设。
非参数方法依赖于具体的样本数据,不依赖于总体的分布特征。
2. 假设检验:统计推断的一种方法,用于通过对样本数据进行分析来得出关于总体参数或总体分布的结论。
假设检验通常涉及对某个假设的拒绝或接受。
3. 正态分布:也称为高斯分布,是一种连续概率分布,常用于描述许多自然现象和随机变量的分布。
参数检验通常基于对总体数据服从正态分布的假设。
4. 参数检验:通过对总体参数的估计和假设进行统计推断的
方法。
参数检验通常要求数据满足特定的假设条件,如正态分布、独立性和方差齐性等。
5. 统计显著性:在假设检验中,用于评估观察到的差异或效应是否显著。
统计显著性通常以p值表示,若p值小于预设的显著性水平(如0.05),则可以拒绝零假设。
非参数检验在实际应用中具有灵活性和广泛适用性,特别适合处理样本数据不满足假设条件的情况。
它们不依赖于总体分布的形式,因此更加鲁棒,并可以应用于各种类型的数据集。
SPSS统计分析2:参数检验与非参数检验
参数检验与非参数检验一、参数检验与非参数检验的区别(1)参数检验:一般是数据的总体分布已知的情况下,对数据分布的参数是否落在相应范围内进行检验。
是对参数平均值、方差进行的统计检验,是推断统计的重要组成部分。
适用条件:当总体分布已知(如总体为正态分布),根据样本数据对总体分布的统计参数进行推断。
此时,总体的分布形式是给定的或是假定的,只是其中一些参数的取值或范围未知,分析的主要目的是估计参数的取值,或对其进行某种统计检验。
这类问题往往用参数检验来进行统计推断。
它不仅仅能够对总体的特征参数进行推断,还能够实现两个或多个总体的参数进行比较。
(2)非参数检验:一般是在不知道数据总体分布的前提下,检验数据的分布情况。
适用条件:在数据分析过程中,由于种种原因,往往无法对总体分布形态作简单假定,此时参数检验不再适用。
非参数检验正是基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。
二、参数检验方法及适用条件三、非参数检验方法及适用条件四、使用方法当分析某个因素对变量的影响差异时,即检验该因素分类的若干个样本差异:(1)如果因素为两个,使用独立样本T-检验,来分析两个总体平均数相等的显著性;结果判定:先看方差齐性F检验结果,再看均值相等性的t检验结果,即a.如果方差齐性显著性>0.05,则表明方差齐性显著,再看第一行的检验统计值t及显著性p(p<0.05表示差异明显);b.如果方差齐性显著性<=0.05,则表明方差显著不齐,再看第二行的检验统计值t及显著性p(p<0.05表示差异明显);(2)如果因素为多个,使用单因素方差检验(即F检验),来分析该因素的影响差异。
结果判定:方差齐性显著则看ANOVA的检验统计值F及其显著性p。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图5-5 独立样本
t
检验主对话框
2、选择若干变量作为检验变量到Test Variable(s) 检验变量框中。
3、选择一个变量作为标识变量到Grouping Variable 分组变量框中。该标识变量的两个不同取 值可对应两个不同的总体。
4、单击“Define Groups”按钮,可进入Define Groups 子对话框,如图5-6 所示。其中:Use specified values表示分别输入两个值,每个值代 表一个总体;对于Cut point 分割点栏,如果分组变 量是连续变量,则选用此项。 5、Options 选择含义与单样本t检验中的相同。
二、第Ⅰ类错误、第Ⅱ类错误与显著性水平
在进行统计推断时,有可能会出现以下两种错误, 第一类错误是拒绝真实的原假设,我们把它叫做 “拒真”的错误。第二类错误是接收错误的原假设, 我们把它叫做“取伪”的错误。在假设检验中,犯 第Ⅰ类错误的概率记为 Ⅱ类错误的概率记为
,称其为显著性水平;犯第
我们一般事先规定允许犯 。
图5-8 Chi-Square Test 对话框
2、指定待检验的变量到Test Variable List框。 3、在Expected Range 栏中,确定检验值的范围。 (1)Get from data 选项,即最小值和最大值所确 定的范围。 (2)Use specified range 选项,只检验数据中一 个子集的值,在Lower 和Upper 参数框中键入检验范 围的下限和上限。 4、在Expected Values 栏中,指定期望值。 (1)All categories equal 选项,系统默认的检验 值是所有分组的期望频数都相同。 (2)Values 选项,要求用户输入期望分布的频数 值。
中。被解释变量可以选择一个,也可以选择多个。
4、解释变量的选择及分层控制
选择解释变量作为分组变量,对被解释变量将按
解释变量分组计算基本描述统计量。选择的若干解
释变量可以放在第一层,也可以放在不同层。
5、Option选项 在主对话框中单击Option选项,展开Option对话框, 如图5-2所示。
率值,并自动根据两组样本的均值、样本数、抽样分
布方差等计算出 t 统计量的观测值和相伴概率值。
4、给定显著性水平 ,并作出决策
第一步,利用 F 检验的相伴概率值判断两总体的
方差是否相等,如果概率值小于显著性水平,则应
拒绝原假设,认为两总体方差有显著差异;反之, 如果概率值大于显著性水平,则不应拒绝原假设,
(二)单样本 t 检验过程在SPSS中的实现 1、建立或选择数据文件后,按“Analyze” →“Compare Means”→“One-Sample T Test”进 入One-Sample T Test单样本 t 检验主对话框,如 图5-3所示。
图5-3 单样本T检验对话框
2、在左边的源变量框中选择要分析的变量,将 其送入Test Variable(s)框中。在Test Value检验值 一栏中填入的大小。 3、单击“Options”按钮,弹出Options选项对 话框,如图5-4所示。
1、提出原假设。单样本 t 检验的原假设为:总体 均值与检验值之间不存在显著差异 2、选择检验统计量。单样本 t 检验的检验统计量 为 t 统计量。
3、计算检验统计量观测值和概率值。SPSS将自动 计算 t 统计量的观测值和对应的概率 p 值。 4、给定显著性水平,并作出决策 。给定显著性水 平,与检验统计量的概率值作比较。如果概率值小 于显著性水平,则应拒绝原假设;反之,如果概率 值大于显著性水平,则不能拒绝原假设。
5、单击“Options”按钮,打开Chi-Square Test :Options对话框,如图5-9所示。
图5-9 Options 对话框
(l) Statistics 栏,选择输出统计量。其中,
Descriptive 复选项,输出变量的均值、标准差、
最大值、最小值、非缺失个体的数量。Quartiles
图5-4 单样本 t 检验Options 选项对话框
(1)Confidence Interval 一栏为可信水平,系
统默认为95%,用户可以改写。
(2)Missing Values 一栏中有两个选项,一为
Exclude cases analysis by analysis 选项,带有 缺失值的观测量,当它与分析有关时才被剔除。一 为Exclude cases listwise 选项,剔除在主对话框 中Variables 矩形框中列出的变量带有缺失值的所 有观测量。 点击“Continue”按钮可返回主对话框。
两配对总体的均值是否有显著差异进行推断。前提
条件是:(1)两样本应该是配对的。首先,两样
本的观察数目相等;其次,两样本的观察值的顺序
不能随意更改。(2)样本来自的总体应服从正态
分布。
两配对样本 t 检验的基本步骤为:
1、提出原假设:两总体均值之间不存在显著差异。 2、选择检验统计量:配对样本 t 检验所采用的检 验统计量为 t 统计量。 t 3、计算检验统计量观测值和相伴概率值:SPSS 将自动计算 t 统计量的观测值以及相伴概率 P 值。 4、给定显著性水平 ,并作出决策:如果相伴概 率值小于或等于用户心中的显著性水平,则拒绝原 假设,认为两总体均值存在显著差异;相反,如果 相伴概率值大于用户心中的显著性水平,则不能拒 绝原假设,可以认为两总体均值不存在显著差异。
复选项,输出结果将包括四分位数的内容。
(2) 在Missing Values 栏中选择对缺失值的处
理方式。其中,Exclude cases test-by-test 选项,
ຫໍສະໝຸດ 三、独立样本 t 检验(一)独立样本 t 检验的概念和基本步骤
独立样本
t 检验就是根据样本数据对它们来自的
两独立总体的均值是否有显著差异进行推断。这个
推断的前提是:(1)两样本应是相互独立的,即
从一总体中抽取一批样本对从另一总体中抽取一批 样本没有任何影响,两组样本的个案数目可以不同, 个案顺序可以随意调整,即没有配对关系。(2) 样本来自的两个总体应服从正态分布。
第五章
参数检验与非参数检验
本章内容
第一节 概述 第二节 均值比较与参数检验 第三节 非参数检验
第一节 概述
一、参数检验与非参数检验
参数检验是指当总体分布已知的情况下,根据样
本数据对总体分布的统计参数(如均值、方差等)
进行推断。
非参数检验是当总体分布未知的情况下,根据样
本数据对总体的分布形式或特征进行推断。
均值比较的基本步骤为: 第一步,用户指定一个或多个变量作为分组变量,
并按分组变量的不同取值对个案数据进行分组。
第二步,指定一个变量作为汇总变量,并计算该
汇总变量在各分组下的基本描述统计量。
第三步,对第一分组变量各分组下的汇总变量均 值有无显著差异作统计检验。 原假设是:分组变量各水平下汇总变量的均值无 显著差异。
t 检验主对话框
2、选择一对或若干对配对变量作为检验变量到 Paired Variable框中,选择好配对变量。在配对变 量栏中,配对变量处于同一行,中间有“--”连接。
3、Options 选择含义与单样本检验中的相同。
第二节 非参数检验
一、 卡方检验 (一)卡方检验的概念和基本步骤
卡方检验方法可以根据样本数据,推断总体分
二、单样本
检验
(一)单样本
t
检验的概念和基本步骤
单样本 t 检验是检验某个变量的总体均值与指定 的检验值之间是否存在显著差异。这里,前提条件 是样本来自的总体应服从正态分布。如果已知总体 均数,进行样本均数与总体均数之间的差异显著性 检验也属于单样本的 检验。
单样本
t 检验的基本步骤为:
第Ⅰ类错误的概率
的概率
,然后尽量减少犯第Ⅱ类错误
。一般取
=0.10、0.05或0.01,表示概率
小的程度。
三、假设检验的基本步骤
1、根据推断检验的目标,对待推断的总体参 数或分布作一个基本假设; 2、利用收集到的样本数据和基本假设计算 某检验统计量,该统计量服从或近似服从某种统 计分布; 3、根据该统计量的值得到相伴概率
图5-6 分组子对话框
在此对话框中,选中左边的源变量矩形框中的用 于检验的变量,点击源变量框与Variable 变量框之 间的向右按钮,将其移入选中用于,用同样的方法 将其移入。
四、两配对样本 t 检验
(一)两配对样本
t 检验的概念和基本步骤
两配对样本 t 检验是根据样本数据对样本来自的
布与期望分布或某一理论分布是否存在显著差异。
它是是一种吻合性检验,通常适于对有多项分类
值的总体分布的分析,变量为离散型数据。
卡方检验的基本步骤为:
1、提出原假设:样本来自的总体分布与期望分布 或某一理论分布无显著差异。 2、选择检验统计量:卡方检验的统计量为 统计量。
2
3、计算检验统计量观测值和相伴概率 p 值: SPSS将自动计算 2 统计量的观测值及相伴概率 p 值。
认为两总体方差无显著差异。
第二步,利用
t 检验的相伴概率值判断两总体均
值是否存在显著差异。如果概率值小于显著性水平, 则应拒绝原假设,认为两总体均值有显著差异;反 之,如果概率值大于显著性水平,则不应拒绝原假