非参数统计Wald-Wolfowitz游程检验
SAS备课笔记_非参数检验
非参数检验非参数统计分析方法(Non-parametric statistics )是相对参数统计分析方法而言的,又称为不拘分布(distribution-free statistics) 的统计分析方法或无分布形式假定(assumption free statistics )的统计分析方法。
其中包括Wilcoxon 秩和检验、Kruskal-Wallis 秩和检验、friedman 秩和检验等,它们分别对应不同设计类型的资料。
SAS中对于非参数分析方法功能的实现主要由npar1way 过程来完成,从过程名字就可以看出,在此过程的处理进程中,只能一次指定一个因素进行分析。
下面我们先来了解一下npar1way 过程的语句格式以及各语句和选项的基本功能。
一、npar1way 过程语句格式简介npar1way 过程属于SAS的STAT模块,对于统计学教科书上所涉及的非参数统计方法几乎都可以通过此过程来完成。
Npar1way 过程的基本语句格式如下。
PROC NPAR1WAY选<项> ;BY 变量名;CLASS变量名;EXACT统计量选项</ 运算选项> ;FREQ变量名;OUTPUT < OUT=数据集名> < 选项> ;VAR 变量名;RUN;QUIT;Proc npar1way 语句标志npar1way 过程的开始,默认情况下(不列举任何选项):npar1way 过程对最新创建的数据集进行分析,将缺失数据排除在分析过程之外;执行方差分析过程(等同于ANOV A 选项),对样本分布位置的差异进行检验(与选项WILCOXON, MEDIAN, SAV A GE 以及VW 等效),并进行经验分布函数检验(等同于EDF 选项)。
此语句后可用的选项见下表。
Proc npar1way 语句选项及其含义选项名称选项功能或含义AB 运用Ansari-Bradley 评分进行分析DATA=数据集名指定要进行分析的数据集MEDIAN 运用中位数评分进行分析,即进行中位数检验NOPRINT 禁止所有的输出,用在仅需要创建输出数据集时ST 运用Siegel-Tukey 评分进行分析ANOVA 对原始数据进行方差分析EDF 要求计算基于经验分布的统计量MISSING 指定分组变量的缺失值为一有效的分组水平SAVAGE 运用Savage 评分进行分析VW 运用Van der Waerden评分进行分析计算CORRECT=NO 在两样本时,禁止Wilcoxon 和Siegel-Tukey 检验的连续性校正过程KLOTZ 运用Klotz 评分进行分析MOOD 运用Mood评分进行分析SCORES=DATA 以原始数据为评分值进行分析WILCOXON 对两样本进行Wilcoxon 秩和检验,对多样本进行Kruskal-Wallis 检验1. exact 语句exact 语句要求SAS 对指定的统计量(选项)进行精确概率的计算。
非参数检验操作步骤
二项式检验
检验样本是否来自指定概率为P的二项分布
样本总体与指定的二项分布无明显差异
分析—非参数检验(N)—旧时对话框(L)—二项式
游程检验
推断数据序列中两类事件的发生过程是否随机(检验一个变量两个值的分布是否是随机分布的,即检验前一个个案是否影响下一个个案的值)
在大样本条件下,游程Z近似服从正态分布
样本随机
分析—非参数检验(N)—旧时对话框(L)—游程
单样本K-S检验
适用于探索连续型随机变量的分布
样本来自的总体与指定的理论分布无显著差异
分析—非参数检验(N)—旧时对话框(L)—1样本K-S
两独立样本检验
样本所属的总体分布类型是未知的,此时两独立样本是否来自相同分布的总体
Kruskal-Wallis H检验
检验K个独立样本是否来自不同总体
分析—非参数检验(N)—旧时对话框(L)—多个独立样本
Median(中位数)检验
检验多个样本是否来自具有相同中位数的总体
样本来自的多个独立总体的中位数无显著差异
Jonckheere-Terpstra检验
检验样本来自多个独立总体的分布是否存在显著差异
若游程数较小,则样本来自的两个总体的分布形态有较大差距
摩西极端反应检验(Moses extreme reaction)
检验样本来自的两个总体分布是否存在显著差异
样本来自的两个总体分布无显著差异
若跨度很小,表明两个样本无法充分混合,可以认为实验样本存在极端反应
K个独立样本检验
推断样本来自的多个独立总体的分布是否存在显著差异
Friedman检验
样本来自的多配对总体分布无显著差异
waldwolfowitz定理
Wald-Wolfowitz定理引言Wald-Wolfowitz定理是一个统计学中的重要定理,它是由阿伯拉罕·沃尔多夫(Abraham Wald)和约瑟夫·沃尔夫维茨(Jacob Wolfowitz)于20世纪40年代提出的。
该定理主要用于检验两个独立样本是否来自同一总体分布。
本文将介绍Wald-Wolfowitz定理的基本原理、应用场景以及计算步骤。
基本原理Wald-Wolfowitz定理的基本原理是基于两个样本的秩次统计量。
秩次统计量是将样本观测值按照大小排序后,记录其在排序后序列中的位置。
对于两个独立样本,我们可以计算它们的秩次统计量,并将两个样本的秩次统计量进行比较。
Wald-Wolfowitz检验的步骤Wald-Wolfowitz检验的步骤如下:1.将两个样本的观测值按照大小进行排序,得到排序后的序列。
2.计算两个样本的秩次统计量。
3.将两个样本的秩次统计量进行比较,得到一个统计量。
4.根据统计量的分布,计算出一个p值。
5.根据显著性水平,判断两个样本是否来自同一总体分布。
应用场景Wald-Wolfowitz定理可以应用于很多实际问题中,特别是在生物学、医学和工程领域。
下面是一些常见的应用场景:遗传学研究在遗传学研究中,我们经常需要比较两组遗传数据是否来自同一总体分布。
例如,我们可以使用Wald-Wolfowitz检验来比较两个群体的染色体的长度分布是否相同。
药物疗效评估在药物疗效评估中,我们常常需要比较两种不同药物的疗效是否相同。
通过对两组患者的治疗结果进行比较,我们可以使用Wald-Wolfowitz检验来判断两种药物是否来自同一总体分布。
工程质量控制在工程领域,我们经常需要比较两个生产批次的产品质量是否一致。
通过对两个批次的产品进行抽样检验,我们可以使用Wald-Wolfowitz检验来判断两个批次的产品质量是否来自同一总体分布。
优缺点Wald-Wolfowitz检验的优点是简单易行,不需要对总体分布进行任何假设。
非参数统计 随机游程检验
在R软件中,我们可以直接调用函数进行随机游程检 验,首先需要装在软件包tseries。选择Packages-Install pacakges(s),
在弹出的对话框中选择一个稳定的镜像地址,系统会自动连 接到主页:/上的统计包。选择需要的 统计包自动安装,在输入library(tseries)。
n1 1 n 0 1 2( )( ) k 1 k 1 P(R 2k) n ( ) n1
建立了抽样分布之后,在零假设成立时,可以计算 P(R r)或者 P(R r) 的值,进行检验。
小样本的例子(p69 例3.8)
例3.8 某银行观察平时到银行柜台办理业务的人员的性别 (用M表示男性,用F表示女性): FMMMMMFMMFMMMMFMFMMMFFFMMM 解:检验假设问题如下: H0: 男女出现顺序随机 H1: 男女出现顺序不随机 =0 .05
n1 个1, n 0 n1 n ,这时R取任何一个值 R为游程个数,假设有 n 0个0, n 的概率都是1/(n ) ,R的条件分布
1ቤተ መጻሕፍቲ ባይዱ
n 1 n 1 n 1 n 1 ( 1 )( 0 ) ( 1 )( 0 ) k 1 k k k 1 P(R 2k 1) n ( ) n1
随机游程检验
在实际中,经常需要考虑一个序列中的数据出现 是否与顺序无关,这关系到数据是否独立。
如果数据有上升或下降的趋势,或有呈周期性变 化的规律等特征时,均可能表示数据与顺序是有 关的,或者说序列不是随机出现的。
基本概念
在一个二元序列中,0和1交替出现: 1000011101100001110 其中一个由0或1连续构成的串称为一个游程, 一个游程中数据的个数称为游程的长度。 一个序列中游程个数用R表示。 表示0和1交替轮 换的频繁程度。 序列长度为n,n1表示序列中1的个数,n0表示0的 个数。 如果0/1序列中0和1出现的顺序规律性不强,随机 性强,则0和1出现不会太集中,也不会太分散。 通过0和1出现的集中程度度量序列随机性大小。
非参数卡方、单样本K-S、两个独立样本检验
非参数卡方检验1.理论非参数检验是在总体分布未知或知道甚少的情况下,不依赖于总体布形态,在总体分布情况不明时,用来检验不同样本是否来自同一总体的统计方法进。
由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。
非参数检验优势:检验条件宽松,适应性强。
针对,非正态、方差不等的已及分布形态未知的数据均适用。
检验方法灵活,用途广泛。
运用符号检验、符号秩检验解决不能直接进行四则运算的定类和定序数据。
非参数检验的计算相对简单,易于理解。
但非参数检验方法对总体分布假定不多,缺乏针对性,且使用的是等级或符号秩,而不是实际数值,容易失去较多信息。
非参数卡方检验:用于检验样本数据的分布是否与某种特定分布情况相同。
非参数卡方检验通过三步检验:1.卡方统计量:X2=B 其中K 是样本分类的个数,0表示实际观测的频数,B 表示理论分布下的频数。
2.拟合优度检验:A.对总体分布建立假设。
B.抽样并编制频率分布表。
C.以原假设为真,导出期望频率。
D.计算统计量。
E.确定自由度,并查x2表,得到临界值。
F.比较x2值与临界值,做出判断。
3.独立性检验A.对总体分布建立假设。
B.抽样并编制r*c 列联表。
C.计算理论频数。
D.计算检验统计量。
E.确定自由度,并查x2表,得到临界值。
F.比较x2值与临界值,做出判断。
2.非参数卡方检验操作步骤第一步:将需检验的数据导入spss中并进行赋值后,点击分析非参数检验、旧对话框、卡方。
图2操作步骤第一步第二步:进入图中对话框后点击,首先将需检验的数据放入检验变量列表中,后在期望值选项中所以类别相等或者值(值:需要手动输入具体的分布情况)。
如果特殊情况需要调整检验置信区间,点击精确,进入图中下方对话框后点击蒙特卡洛法框里收到填入。
点击继续、确定。
图3操作步骤第二步第三步:如果需要看描述统计结果和四分位数值可以点击选项、勾选描述、四分位数。
点击继续、确实。
图4操作步骤第二步3.非参数卡方检验结果然后非参数卡方检验的描述统计、卡方检验频率表、检验统计结果就出来了。
第十章 第四节 K-S单样本检验
第四节Kolmogorov-Sirmov单样本检验一、Kolmogorov-Sirmow单样本检验Kolmogorov-Sirmov单样本检验是一种拟合优度性检验。
它的基本原理同Chi-Square检验,但比Chi-Square检验更为精确。
K-S检验是将一组样本值(观察结果)的分布和某一指定的理论分布函数(如正态分布,均匀分布,泊松分布,指数分布)进行比较,确定两者之间的符合程度。
这种检验可以确定是否有理由认为样本的观察结果来自具有该理论分布的总体。
简言之,这种检验包括确定理论分布下的累积频数分布,以及把这种累积频数分布和观察的累积频数分布进行比较(这里的理论分布系指零假设成立时所预期的分布),确定理论分布和观察分布的最大差异点,参照抽样分布并定出这样大的差异是否基于偶然。
这就是说,若观察的结果的确是从理论分布抽取的随机样本,则抽样分布将指出这种观察到的差异程度是否随机出现的。
1二、Kolmogorov-Sirmov单样本检验方法1.K-S单样本检验步骤(1)在数据输入之后,依次单击Analyze→Nonparametric Tests→ 1-Sample K-S →打开One-Sample Kolmogorov-Sirmov Test对话框;(2)在原变量栏选择所要检验的分布到Test Variable List栏;(3)在Test Distribution栏选择理论分布函数复选项:●Normal复选项:如选择此项,则检验变量是否服从正态分布,系统默认;●Uniform复选项:如选择此项,则检验变量是否服从均匀分布;●Poisson复选项:如选择此项,则检验变量是否服从泊松分布;●Exponential复选项:如选择此项,则检验变量是否服从指数分布。
(4)单击“Option”按钮,打开Options对话框:●Statistics栏:在此栏可选择Descriptive复选项,则会输出观测的均值、最小值、最大值、标准差等描述统计;选择Quartiles复选项:则输出观测的四分之一分位数、二分之一分位数和四分之三分位数。
非参数统计_第五章 两独立样本(修正版)(1)
1
2
1
5
2
1
0
0
5
4
1
4
2
3
1
双样本检验举例1
解(1)建立 假设: H 0 : 培训对服务质量没有影响 H1 : 培训对服务质量产生影响 (2)计算检验统计量 D 0.5.
(3) n m 8, 给定显著性水平 0.05, 否定域为 D | D 0.625. (4)接受零假设,即培训对服务质量没有影响。
Z
Wx ( N 1)n / 2 ~ N (0,1) mn( N 1) /12
Mann-Whitney U 检验举例1
例 5.1 为了检验两个小组工人的生产效率是否具有显著性差异,从 两个组中随机抽取20个工人,其每日生产量和组别如下表。 表 5-1 两组工人生产量
产量 标记 产量 标记 产量 标记 产量 标记
习题
作业:某社会系的两名大学生随机地从该校三年级的学生中
抽取了若干名,询问他们每周看多长时间的电视, 记录如下:
男生
女生
10 14 11 3 10 5 7 12 40 19 6 8 15 11 8 25 10 7 6 7 5 25 30 6 5 42 7 4 38 15 6 4 1 15 22
试问男生和女生看电视的时间分布是否相同(α=0.05)
Wx 135 .5, W y 74 .5,
Wxy Wx 1 n(n 1) 80.5, 2
1 Wyx Wy m(m 1) 19.5, 2
U min(Wxy , W yx ) 19 .5
Mann-Whitney U 检验举例1
(3) n m 10, 给定显著性水平 0.05, 可查得U统计量的下界为 28. (4) U=19.5<28, 拒绝零假设,即两组工人的 生产效率存在显著差异.
SPSS数据分析教程-第6章-非参数
Median test
独立样本检验举例
➢ 一个公司把他们的销售代表随机分到三个 不同的组中,进行不同的培训。两个月后 对销售进行考察,我们想通过非参数检验 比较不同组别的销售代表考试得分是否有 显著性差异。这里,不同组别的考试得分 是相互独立的,因此为独立样本数据,我 们采用独立样本非参数检验。
➢
独立样本包括两个独立样本或者两个以上的独 立样本。
➢ SPSS提供的独立样本非参数检验的方法有:
两个独立样本分布的比较
Mann-Whitney U
Kolmogorov-Smimov
Wald-Wolfowitz K个独立样本分布的比较
Kruskal-Wallis
Jonckheere-Terpstra 比较全矩
➢ Wilcoxon符号秩检验用于检验样本所来自的 总体的中位数和所给的值是否有显著区别。 该检验适用于连续型数据(或者尺度数 据),它把观测值和原假设的中心位置之 差的绝对值的秩分别按照不同的符号相加 作为其检验统计量。
➢ Wilcoxon符号秩检验的假设为:
样本所来自的总体的中位数等于给定的数值。
游程检验
➢ 游程检验用于检验某一变量的两个值的出 现顺序是否随机,对于连续型变量的随机 性检验也可以转化为只有两个取值的分类 变量的随机性的检验。游程检验通过对样 本观测值的分析,用来检验该样本所来自 的总体序列是否为随机序列(又称为白噪 声序列)。它也可以用来检验一个样本的 观测值之间是否相互独立。
二项式检验
➢ SPSS的二项式检验通过样本数据检验样本 来自的总体是否服从指定的二项分布。例 如,现代社会男、女的比例是否为1.01:1; 工厂的次品率是否为1%等都可以通过二项 式检验完成。
非参数统计分析
第十三章非参数统计分析统计推断方法大体上可分为两大类。
第一大类为参数统计方法。
常常在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。
第二大类为非参数统计方法,着眼点不是总体参数,而是总体的分布情况或者样本所在总体分布的位置/形状。
非参数统计方法大约有8种,可被划分为两大类,处理各种不同情形的数据。
单样本情形:检验样本所在总体的位置参数或者分布是否与已知理论值相同。
①Chi-Square过程:针对二分类或者多分类资料例题1:见书P243。
检验样本分布情况是否与已知理论分布相同。
运用卡方检验过程。
②Binomial过程:针对二分类资料或者可转变为二分类问题的资料。
例题2 :见书P246。
检验某一比例是否与已知比例相等,运用二项分布过程。
练习:质量监督部门对商店里面出售的某厂家的西洋参片进行了抽查。
对于25包写明为净重100g的西洋参片的称重结果为(单位:克),数据见非参数。
Sav,人们怀疑厂家包装的西洋参片份量不足,要求进行检验。
③Runs过程:用于检验样本序列是否是随机出现的。
二分类资料和连续性资料均可。
游程检验:游程的含义:假定下面是由0和1组成的一个这种变量的样本:0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0其中相同的0(或相同的1)在一起称为一个游程(单独的0或1也算)。
这个数据中有4个0组成的游程和3个1组成的游程。
一共是R=7个游程。
其中0的个数为m=15,而1的个数为n=10。
游程检验的原理判断数据序列是否是真随机序列。
该检验的原假设为数据是真随机序列,备择假设为非随机序列,在原假设成立的情况下,游程的总数不应太多也不应太少。
例题3:见书P247。
检验样本数据是否是随机出现的。
例题4:从某装瓶机出来的30盒化妆品的重量(单位克),数据见非参数.sav,为了看该装瓶机是否工作正常。
提示:实际需要验证大于和小于中位数的个数是否是随机的(零假设为这种个数的出现是随机的)。
第8讲 独立样本(两样本)非参数检验3,4:Wald-Wolfowitz游程检验和Moses检验
(两样本K-S检验)
3 Wald-Wolfowitz游程检验 4 Moses极端反应检验
应用2:分布差异
案例3:
提示:能否用游程检验? 步骤:1两组混合,由小到大排序,且标明组号。 (找人黑板做) 2按组号求游程数R 思考:若没差别,游程数是大还是小?
方法简介:
结果分析:
跨度span为401
P值小于0.05,拒 绝原假设,认为分 布不同。
游程检验分布表
游程个数R
m表示0的个数,n 表示1的个数,C1表示左边的临界值, C2表示右边的临界值, 0.025是α /2
案例:
由上面可知游程数R=4,又知m=12,n=12,查分布 表,得左侧临界值为7,落入了拒绝域,因此,拒 绝原假设,认为男孩与女孩好斗性差异显著。
大样本条件下,游程检验可用近似标准正态分布
从名字可以看出,它属于游程检验的一种,用来检验总体分布情 况是否相同。 过程:1、混合两组样本,按升序排列,标明组号。 2、按组号计算游程个数R。 若两组分布相同,应该较为分散,相互交叉,故游程数较多。因此,R 越大,接受原假设,R越小,拒绝原假设。是左边检验。 3、查分布表,确定拒绝域(详见第6讲,小样本的分布表 见下页)。 4、落入拒绝域,则拒绝原假设,认为两样本来自的总体分 布不同。
两样本(独立和相关)非参数检验主要方法 1 Mann-Whitey U检验
2 科尔莫格罗夫-斯米尔诺夫双样本检验
(两样本K-S检验)
3 Wald-Wolfowitz游程检验 4 Moses极端反应检验
应用3:两极分化显著化检验
一、应用场合
顾名思义,如果某些个体出现正向效应,而另一些个体出现负 向效应,则应当采用该检验方法。 例如:研究民众对电信资费下调的反应,用户群众会弹冠相庆, 而电信从业者及相关利益集团成员则会反应沮丧。这时可以考 虑此法。 二、算法简介 1、将两组样本混在一起,排序,求秩。 2、可以得到第一组(通常称为控制组)最大秩次和最小秩次 3、求统计量“跨度(span)”,公式: SPAN = Rank(Largest Control Value) – Rank(Smallest Control Value) + 1 4、查分布表,得出拒绝掝,“跨度”值如果较大,则拒绝原假设,认为 分布不同。
非参数统计分析NonparametricTests菜单详解
非参数统计分析――Nonparametric Tests菜单详解非参数统计分析――Nonparametric Tests菜单详解平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。
比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。
本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。
由于这一类方法不涉及总体参数,因而称为非参数统计方法。
SPSS的的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类:1、分布类型检验方法:亦称拟合优度检验方法。
即检验样本所在总体是否服从已知的理论分布。
具体包括:Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。
Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。
Runs Test:用于检验样本序列随机性。
观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。
一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。
One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。
2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。
具体包括:Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。
Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。
微观交通仿真模型的验证方法
微观交通仿真模型的验证方法邢丽;王晓原;吴芳【摘要】交通流微观仿真模型是目前广泛开展的智能运输系统项目开发、研究的重要内容.人们在研究、应用交通流微观仿真模型时,对模型验证过程重视不够.模型验证不足,使得模型本身不能达到其应有的精确程度,应用时常发生模拟结果与实际路况不能完全吻合的现象.结合一种基于投影寻踪回归的车辆跟驰模型,着重从微观角度,运用直观对比法和非参数统计方法对模型进行验证.验证结果表明,直观对比法和非参数统计方法用于模型验证是可行的.【期刊名称】《计算机工程与应用》【年(卷),期】2010(046)009【总页数】5页(P204-207,248)【关键词】微观仿真;驾驶员行为;车辆跟驰模型;游程总教检验法;游程长度检验法【作者】邢丽;王晓原;吴芳【作者单位】山东理工大学,交通与车辆工程学院,智能交通研究所,山东,淄博,255049;山东理工大学,交通与车辆工程学院,智能交通研究所,山东,淄博,255049;山东理工大学,交通与车辆工程学院,智能交通研究所,山东,淄博,255049【正文语种】中文【中图分类】U4911 引言驾驶员行为是影响交通安全和通行能力的一种重要因素[1-2]。
以计算机技术为基础的微观交通流仿真模型,可以再现各种道路、交通条件下交通流的实际动态行为,反映道路网络中单个车辆运行的随机特性和不同驾驶员组在车辆跟驰、车道变换等方面的个人偏好,逐渐成为交通运输领域,特别是目前广泛开展的智能运输系统(Intelligent Transportation Systems,ITS)项目开发、研究的重要手段[3]。
但是,人们在研究、应用交通流微观仿真模型时,往往注重模型的构建和参数标定等过程,对模型验证过程重视不够,仅对一些宏观指标进行验证或用最简单的直观对比图验证。
模型验证是保证仿真可信度的关键[4],模型验证不足,使得模型本身不能达到其应有的精确程度,以至于在后面使用时,常发生模拟结果与实际路况不能完全吻合的现象[5]。
SPSS教程 非参数监测
10.4.2 SPSS中实现过程
研究问题 某地144个周岁儿童身高数据如表10-4所 示,问该地区周岁儿童身高频数是否呈正态分 布?
表10-4
64- 68- 69- 70- 71- 72- 73- 74- 76- 78- 79- 83-
儿童身高数据
身高区间 人 2 4 7 16 20 25 24 22 16 2 6 1 数
10.1.1 统计学上的定义和计算公式
定义:总体分布的卡方检验适用于配合度 检验,是根据样本数据的实际频数推断总体分 布与期望分布或理论分布是否有显著差异。它 的零假设H0:样本来自的总体分布形态和期望 分布或某一理论分布没有显著差异。
因此,总体分布的卡方检验是一种吻合性 检验,比较适用于一个因素的多项分类数据分 析。总体分布的卡方检验的数据是实际收集到 的样本数据,而非频数数据。
实现步骤
图10-9 在菜单中选择“Runs”命令
图10-10 “Runs Test”对话框
图10-11 “Runs Test:Options”对话框
10.3.3 结果和讨论
10.4 SPSS单样本K-S检验 10.4.1 统计学上的定义和计算公式
定义:单样本K-S检验是以两位前苏联数 学家Kolmogorov和Smirnov命名的,也是一种 拟合优度的非参数检验方法。单样本K-S检验 是利用样本数据推断总体是否服从某一理论分 布的方法,适用于探索连续型随机变量的分布 形态。
10.1.2 SPSS中实现过程
研究问题 某地一周内各日患忧郁症的人数分布如表 10-1所示,请检验一周内各日人们忧郁数是否 满足1:1:2:2:1:1:1。
表10-1
学生的数学成绩 周 日 1 2 3 4 5 患 者 数 31 38 70 80 29
非参数统计期末九道题(手算+机算)
非参数统计—期末九题汇总目录1.单样本Wilcoxon符号秩检验〔SAS〕 (2)2.Wald-Wolfowitz游程检验法 (4)3.两样本的Kolmogorov-Smirnov检验 (5)4.两个独立样本的M-W-W检验〔SAS〕 (6)5.k个样本的2 检验 (9)6.k个独立样本的Kruskal-Wallis检验(R) (10)7.k个相关样本的Friedman检验〔R〕 (11)8.k个相关样本的Cochran Q检验 (12)9.完全秩评定的Kendall协和系数〔R〕 (14)1.单样本Wilcoxon 符号秩检验〔SAS 〕设5.0ε是对称的连续型分布的中位数,现随机抽查了10名普通男子的血压如下: 98 160 136 128 130 114 123 134 129 107试用Wilcoxon 符号检验法检验假设0H :5.0ε=130,1H :5.0ε≠130,显著性水平为α=0.05。
解 手算:i)秩次和计算表ii)根据表中D 的符号和D 的秩,可以计算得到-T =9+2+6+5+1+7=30 +T =8+4+3=15根据n=9,+T =15,-T =30,查表得-T 的右尾概率为0.213,P=0.213⨯2=0.426,P 值相对于显著性水平α=0.05已足够大,因此抽查数据不拒绝0H ,即认为5.0ε=130。
机算:SPSS 输出结果表2Test Statistics by – xZ -.889aAsymp. Sig. (2-tailed) .374Exact Sig. (2-tailed) .426Exact Sig. (1-tailed) .213Point Probability .033a. Based on positive ranks.b. Wilcoxon Signed Ranks Test表1显示:y-x的负秩即满足y<x的为6,而y-x的正秩即满足y-x>3的为3,同分的既满足x=y的为1,总共10。
stroop实验报告
IBM-PC 计算机一台,认知心理学教学管理系统。 本实验呈现的字符集为“绿”、“卐”和“红”,字符有三种
被试全部反应正确为止。整个实验包括辨色任务和识字 任务两部分,两者全部完成约 30 分钟。
颜色:红色、绿色和黑色,每个字符的大小约为
2.0cm×2.0cm。
2.3 实验设计与流程
本实验采用单因素被试内设计。自变量有 3 个水平: 字色一致、字色矛盾和字色无关。被试有两个任务:辨 色任务和识字任务。辨色任务要求被试对字色做出判断; 而识字任务则要求被试对字义做出判断。两个任务的顺 序在被试间对抗平衡。 单次试验流程见图 2.1 以及图 2.2。
对于 Stroop 效应的解释,主要有以下五种理论假 设(MacLeod, 1991)。Stroop 早年的解释接近于早期的相 对加工速度和自动化理论。而随着各种理论的发展,平 行分布加工模型是迄今解释 Stroop 效应的最好理论模 型。
理论一:相对加工速度理论(赛马理论)。这一理论 的依据是字义辨别要快于字色辨别。该理论认为,人们
表 3.3 Stroop 效应检验
矛盾 445± 7.99 465± 7.03
字色一致反应时柱形图 字色矛盾反应时柱形图 字色无关反应时柱形图
无关 437± 7.24 455± 6.72
辩色 识字
三种字色匹配方案差异性检验
F值
P值
F(2,147)=0.36
P=0.69
F(2,147)=0.98
P=0.38
认知心理学报告
Stroop 效应实验报告
专业 : 班级 : 学号 : 姓名 : 性别 :
心理与行为科学系 应用心理 1101 班
Stroop 效应实验报告
Stroop 效应实验报告
第6讲独立样本(两样本)非参数检验1Wilcox 秩和检验验
若把上式的分子分母同时除以n,则值不变。分子就变成 了某组的平均秩减去混合后的平均秩。若分子为0,说明 两组的平均秩相等,都等于混合后的平均秩。
1 - 12
作者:刘永亮,河北大学经济学院
非参数 统计
我赞同
•
• •
因为,无论是用哪个组的秩和,都不能 太大,也不能太小。所以, 双边检验条件下,用哪个秩和都是合理 的。 结果也是一致的。
U秩和检验
1 - 19
若取小的代入,则是左 边检验。取大的代入, 则是右边检验。若大小 都行,就注定是双边检 作者:刘永亮,河北大学经济学院 验。统一规定取小的。
非参数 统计
友情提示
•
可以证明,当两组差别不显著时,W1 和W2的期望值为
方差为:
1 - 20
作者:刘永亮,河北大学经济学院
非参数 统计
容量小的为nn样本样本11秩和为秩和为1818样本样本22的秩和为的秩和为1010样本样本11的平均秩为的平均秩为66样本样本22的平均秩为的平均秩为2525样本样本22的平均秩小故显著性水平为显著性水平为005005左边检验查表临界值为左边检验查表临界值为11w1111w11拒绝原假设
非参数 统计
样本1的秩和T1 (T1=3+4+2+6=15) 样本2的秩和T2
T2=8+8+1+8+5=30
W1=T1-n(n+1)/2 =15-4*5/2=5 W2=T2-m(m+1)/2 =30-5*6/2=15
1 - 22
作者:刘永亮,河北大学经济学院
Mann-Whitney 统计量为较小的,即5
Mann-Whitney U 秩和检验临界值 非参数 表 统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、Wald-Wolfowitz
游程检验
有低蛋白和高蛋白两种料喂养大白鼠, 以比较它们对大白鼠体重的增加是否 有显著不同的影响,为此对m=10,n=10只大白鼠分别喂养低蛋白和高蛋白两种饲 料,得增重量X,Y(单位:g)的表如下:
饲料 低蛋白 X 高蛋白 Y 64 42 71 52 72 61 75 65 82 69 增重量 83 75 84 78 90 78 91 78 96 81
给定显著性水平 =0.05,试用游程检验法检验两种饲料的影响有无显著差异。 1、手算 建立假设: H0:两种饲料对大白鼠无显著差异 H1:两种饲料对大白鼠有显著差异 将X,Y的数据按从小到大混合排列,得X,Y的混合样本序列: Y Y Y X Y Y X X X Y Y Y Y Y X X X X X X 故得游程总数U=6, m=10,n=10,查表得,U=6的概率为0.019,由于是双 侧检验,对于显著性水平α=0.05,对应的P值为2× 0.019 = 0.038 < ������. ������5,因 此拒绝原假设,即表明两种饲料对大白鼠有显著差异。 2、Spss告效应是否显著。 1、手算 建立假设: H0:广告效应不显著 H1:广告效应显著 不看广告组记为 x,看广告组记为 y。 检验统计量计算表
X 62 83 96 99 71 60 97 100 Y 87 92 90 86 94 95 82 91 D=x-y -25 -9 6 13 -23 -35 15 9 |D| 25 9 6 13 23 35 15 9 |D|的秩 7 2.5 1 4 6 8 5 2.5 D 的符号 + + + +
在非参数检验中选择两个独立样本检验
对话框: 在Define Groups输入1和2。 在Test Type选中Wald-Wolfowitz runs。
输出结果如下(输出2):
Frequencies 分组 增重量 1 2 Total N 10 10 20
Test Statistics
b,c
Exact Sig. Number of Runs 增重量 Minimum Possible Maximum Possible a. There are 2 inter-group ties involving 4 cases. b. Wald-Wolfowitz Test c. Grouping Variable: 分组 6 8
a
Z -2.068 -1.149
(1-tailed) .019 .128
a
由上表,P值与手算结果一致,因此也拒绝原假设,即表明两种饲料对大白 鼠有显著差异。
4
b
5.88
23.50
0
c
8
由上表,负秩为4,正秩也为4,同分的情况为0,总共8。负秩和为12.5,正 秩和为23.5,与手算结果一致
Test Statistics
b
看广告 - 不看广 告 Z Asymp. Sig. (2-tailed) a. Based on negative ranks. b. Wilcoxon Signed Ranks Test -.771
选择非参数检验中的两个相关样本检验
对话框中选择Wilcoxon,输出如下结果(输出1):
Ranks N 看广告 - 不看广告 Negative Ranks 4
a
Mean Rank 3.12
Sum of Ranks 12.50
Positive Ranks Ties Total a. 看广告 < 不看广告 b. 看广告 > 不看广告 c. 看广告 = 不看广告
a
.441
由上表,Z为负,说明是以负秩为基础计算的结果,其相应的双侧渐进显著 性结果为0.441,明显大于0.05,因此在α = 0.05的显著性水平下,没有理由拒 绝原假设,即表明广告效应不显著,与手算的结论一致。 3、R语言(R语言1) 输入语句: x=c(62,83,96,99,71,60,97,100) y=c(87,92,90,86,94,95,82,91) wilcox.test(x,y,exact=F,cor=F) 输出结果: Wilcoxon rank sum test data: x and y W = 33, p-value = 0.9164 alternative hypothesis: true location shift is not equal to 0 由输出结果可知,P=0.9164,远大于 =0.05,因此没有理由拒绝原假设, 即广告效应并不显著,与以上结果一致。
非参数统计期末大作业
一、Wilcoxon 符号秩检验
某个公司为了争夺竞争对手的市场,决定多公司重新定位进行宣传。在广告创意 中,预计广告投放后会产生效果。一组不看广告组和一组看广告,抽取 16 位被 调查者,让起给产品打分。现有数据如下 不看广告 看广告 62 87 83 92 96 90 99 86 71 94 60 95 97 82 100 91
由表可知: T+=1+4+5+2.5=12.5 T-=7+2.5+6+8=23.5 根据n=8, T+和T-中较大者T-=23.5, 查表得, T+的右尾概率为0.230到0.273, 在显著性水平α = 0.05下,P值显然较大,故没有理由拒绝原假设,表明广告效 应不显著。
2、Spss 在spss中输入八组数据(数据1):