数理统计5非参数检验

合集下载

非参数统计答案范文

非参数统计答案范文

非参数统计答案范文

1. 考察Mann-Whitney U检验:

问题:对两组数据进行比较,数据不符合正态分布,要判断两组数据是否有显著差异。如何选择合适的非参数检验方法?

答案:Mann-Whitney U检验是一种适用于比较两组独立样本的非参数检验方法,适用于数据不符合正态分布的情况。

2. 考察Wilcoxon符号秩和检验:

问题:对同一组数据进行配对比较,数据不符合正态分布,如何选择合适的非参数检验方法?

答案:Wilcoxon符号秩和检验是一种适用于配对样本的非参数检验方法,适用于数据不符合正态分布的情况。

3. 考察Kruskal-Wallis检验:

问题:有三组数据需要比较,但数据不符合正态分布,如何选择合适的非参数检验方法?

答案:Kruskal-Wallis检验是一种适用于比较多组独立样本的非参数检验方法,适用于数据不符合正态分布的情况。

4. 考察Friedman检验:

问题:有三组配对数据需要比较,但数据不符合正态分布,如何选择合适的非参数检验方法?

答案:Friedman检验是一种适用于比较多组配对样本的非参数检验方法,适用于数据不符合正态分布的情况。

5. 考察Mood's中位数差异检验:

问题:有两组独立样本数据需要比较,数据不符合正态分布,如何选择合适的非参数检验方法?

答案:Mood's中位数差异检验是一种适用于比较两组独立样本的非参数检验方法,适用于数据不符合正态分布的情况。

6.考察符号检验:

问题:对一组配对数据进行比较,但数据不符合正态分布,如何选择合适的非参数检验方法?

答案:符号检验是一种适用于配对样本的非参数检验方法,适用于数据不符合正态分布的情况。

统计学中的非参数统计分析

统计学中的非参数统计分析

统计学中的非参数统计分析

统计学作为一门研究数据分析和推断的学科,涉及到各种统计方法和技术。其中,非参数统计分析是一种常见且重要的方法,它不依赖于数据的特定分布假设,而是利用数据本身的特征进行分析和推断。本文将介绍非参数统计分析的基本概念、应用场景和常用方法。

非参数统计分析是相对于参数统计分析而言的。参数统计分析通常需要对数据

的分布做出假设,如正态分布、指数分布等,并利用参数估计方法来推断总体参数。然而,在实际应用中,我们往往无法确定数据的真实分布,或者分布假设不成立。这时,非参数统计分析就成为一种有力的工具。

非参数统计分析的一个重要应用是在样本比较中。假设我们想比较两组样本的

均值是否有显著差异,但无法确定数据是否符合正态分布。这时,可以使用非参数的Wilcoxon秩和检验来进行推断。该方法将两组样本的观测值按大小排序,并计

算秩次和。通过比较秩次和的大小,可以判断两组样本的均值是否有显著差异。

除了样本比较,非参数统计分析还可以用于回归分析。在传统的线性回归中,

我们通常假设自变量和因变量之间的关系是线性的,并利用最小二乘法来估计回归系数。然而,在实际应用中,变量之间的关系可能是非线性的,或者无法确定具体的函数形式。这时,非参数的局部回归方法就可以派上用场。该方法通过在每个数据点附近拟合局部线性模型,来估计变量之间的关系。这种方法不依赖于具体的函数形式,能够更好地适应数据的特点。

在实际应用中,非参数统计分析还有许多其他的方法,如Kolmogorov-Smirnov 检验、Mann-Whitney U检验等。这些方法都不依赖于数据的分布假设,能够更加

数理统计假设检验

数理统计假设检验

二、卡方拟合检验
在 H 下 , 理 论 频 数 为 n p , 设 A 中 实 际 频 数 为 v , 0 i i i
在 H 下 , 实 际 频 数 v 与 理 论 频 数 n p 应 相 差 不 大 。 0 i i
皮尔逊提出如下统计量:
2 ( v np ) i 2 = i npi i1 r
理论频数
2 ˆ ( v np ) ij 2= ij ˆij np i1 j1 s r
2 2 2 ( 2 1 1 6 . 7 5 ) ( 1 8 1 6 . 7 5 ) ( 4 4 4 8 . 5 ) 1 6 . 7 5 1 6 . 7 5 4 8 . 5
Fra Baidu bibliotek
2 另 一 方 面 , ( ( 4 1 ) ( 3 1 ) )1 2 . 5 9 0 . 9 5
1 , x y i i 令 z i 0 , x y i i
i 1 , 2 , . . . , n
n
记 p P { X Y } n z , n n n i i i i 1
2 s r 2
=
s
r
( vij n n
v i v j
i 1 j 1
n2 v i v j n2
)
2
=n
i 1 j 1
s
r

概率论与数理统计第五章统计检验

概率论与数理统计第五章统计检验

第五章统计检验

1.学习要求、重点难点

本章要求深刻理解统计检验的基本思想,统计检验的基本概念和基本步骤。

重点理解统计检验中常犯的两类错误,小概率原理在统计检验中的应用。在做参数统计检验的时候合理选择原假设与备择假设。特别是总体方差已知或者未知的情况下,选择恰当的统计量是统计检验正确与否的关键。

2.内容提要

在前一章中,我们介绍了参数估计的方法. 在生产实践和科学研究中,还有另一类重要的统计推断问题——统计检验,又称为假设检验。其思想有点类似于数学中“反证法”,它是对总体的分布或者参数作出某种假设,然后根据所得样本检验这个假设是否成立。

假设检验根据假设对象不同,分为非参数和参数的假设检验。非参假设检验针对总体分布假设所做的检验,而参数假设检验是在总体分布已知的情况下,对未知参数假设进行的检验。本章主要介绍的后者。后文提到的统计检验(假设检验)如不加说明均指参数的假设检验。

本章要求掌握以下几个基本概念。

(一)统计检验的涵义

统计检验是先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程,是利用样本的实际资料检验事先对总体某些数量特征所做的假设是否可信的一种统计分析方法。该推理方法有两个重要的特点:

(1)用了反证法的思想。

(2)利用小概率事件在一次实验中基本不发生的原理。

(二)原假设与备择假设

统计检验是从总体参数所做的一个假设开始的,假设一般包括两个部分:原假设

H和备择假设1H。

(1)原假设

H

研究者想要收集证据予以反对的假设,原假设又称虚无假设或零假设,它常是根据已有的资料,或经过周密考虑后确定的。

数理统计——精选推荐

数理统计——精选推荐

数理统计

《数理统计》练习题

⼀、判断题

1、某地1956年婴⼉死亡⼈数中死于肺炎占18%,1976年则占16%,故认为20年来对婴⼉肺炎的防治效果不明显。( x )

2、研究⼈员测量了2006例患者外周⾎的红细胞数,所得资料为计数资料。( x )

3、当样本含量越⼤时,率的标准误越⼤。( x )

4、统计分析包括统计描述和统计推断。( √ )

5、只要增加样本含量到⾜够⼤,就可以避免Ⅰ和Ⅱ型错误( x )

6、变异系数总是⼩于1 ( x)

7、若两样本均数⽐较的假设检验结果P值等于0.000,则说明差异⾮常⼤。( x )

8、⾮参数统计⽅法是⽤于检验总体中位数、极差等总体参数的⽅法。( x )

9、同⼀资料的r值越⼩,则b值越⼩。( x )

10、两个⼤样本均数的⽐较,Z检验⽐t检验要准确。x

11、样本量增⼤时,可同时减少第⼀类错误和第⼆类错误。(√ )

12、收集资料是统计⼯作的的基础,因此要求及时、准确和完整。(√ )

13、个体间的变异是抽样误差的主要来源。(√ )

14、两样本率⽐较可采⽤Z检验,也可采⽤四格表检验。√ )

16、直线回归反映两变量间的依存关系,⽽直线相关反映两变量间的相互直线关系。(√ )

17、两变量关系越密切r值越⼤。( x )

18、.描述⼀群呈正态分布变量值的集中位置,可选⽤平均数。( x)

19、对于任何分布的资料,范围内包含了80%的变量值。(√ )

20、对于任何分布的资料,范围内包含了80%的变量值。(√ )

21、对于任何分布的资料,P5~P95范围内包含了90%的变量值。(√ )

两独立样本t检验和非参数检验的实证分析

两独立样本t检验和非参数检验的实证分析

两独立样本t检验和非参数检验的实证分析摘要:教学质量是靠具体课程完成,课程的建设是教学质量提升的重

要环节和基本保证。本文简述了概率论与数理统计重点课程建设的必要性,重点在于对课程建设前后分层随机抽样得来的样本进行实证分析。实证分

析主要从基本统计分析、参数检验、非参数检验三个大的方面进行,尤其

是非参数检验方面,又具体利用了三种不同的检验法进行分析推断。

关键词:t检验;非参数检验;显著性水平;频数分析

概率论与数理统计是我国高等院校理工类、经济类、管理类各专业的

一门重要公共课程,同时也是一门应用广泛,适用性强的工具课。此门课

程的教学为学生的其他专业课及其将来毕业后的工作、继续深造等方面奠

定必要的数学,而且对培养学生的逻辑思维能力、分析判断问题能力、统

计观点、应用能力和创新能力均有着特殊而又重要的作用,是培养高素质

综合型人才的重要保证。

笔者本身是东华理工大学理学院的一线教师,这两年来,同时在江西

财经大学统计学院读研究生。在此期间,笔者主持的“概率论与数理统计”重点课程建设项目小组一直在努力的探索和研究,收获了一些成果。本文

的主要目的是针对进行重点课程建设这几年来,对搜集到的学生该门课程

的考试成绩从统计学的角度进行实证分析。尤其是从参数检验和非参数统

计两个重要角度进行探究,论证这几年来进行课程建设是否让学生成绩取

得了明显的提高。

一、基本统计分析

对数据的分析首先从基本统计分析入手。通过基本统计分析,掌握数

据的基本统计特征,同时迅速把握数据的总体分布形态。而基本统计分析

往往先从频数分析开始,由于成绩数据均为定距型数据,直接采用频数分

参数检验和非参数检验

参数检验和非参数检验

统计推断是从总体中抽取部分样本,通过对抽取部分所得到的带有随机性的数据进行合理的分析,进而对总体作出科学的判断,它是伴随着一定概率的推测,特点是:由样本推断总体,统计推断是数理统计的核心部分,统计推断的基本问题可以分为两大类:一类是参数估计问题;另一类是假设检验问题。其中假设检验方法可以分为参数检验和非参数检验两大部分。

1.参数检验:

是在给定或假定总体分布形式的基础上,对总体的未知参数进行估计或检验。它一方面以明确的总体分布为前提,另一方面需要满足某些总体参数的假定条件

2.非参数检验:

对总体分布不做严格假定,统计过程不涉及总体参数,完全依靠样本数据的顺序、秩等信息进行分析,通常在不符合参数检验的条件下使用。

参数检验的优点是针对性较强,每种方法都有其特定的使用环境,并且利用数据信息充分,一旦符合使用条件,得出的结论会非常准确。缺点是,对总体的分布要求较高,实际工作中有时无法满足使用条件。

非参数检验的优点是对总体分布没有严格要求,对样本数据类型也没有过多要求,非正态、方差不齐等都能做,适应性较强,计算方法也比较简单。缺点是对数据信息利用不充分,会降低功效。

由于检验的功效是我们选择分析方法的首要因素,因此在实际工作中,我们还是优先使用参数检验,只有在数据特征不符合参数检验要求时,才考虑使用非参数检验。

数理统计部分_方差分析与协方差分析_回归方程_非参数统计

数理统计部分_方差分析与协方差分析_回归方程_非参数统计
i 1 j 1
2
而 ( x ij x i )( x i x ) [( x i x ) ( x ij x i )] 0.
i 1 j 1 i 1 j 1 r ni
r
ni
SST SSE SSA.
结论2)
SSE

2
~ ( n r );
方差来 源
平方和 自由 均方 度 和
F值
显著 性
A B 误差 总和
0.6046 7.1245 0.8502 8.5793
2 4 7 13
0.3023 2.49 1.7811 14.66 0.1215
N **
各小区的产量矫正后没有显著的差异,各品 种的产量矫正后有极显著的差异。
可设单因素试验的因素为A,共有A1、A2、 …、Ar等r个水平、分别安排了n1、n2、…、 nr次重复试验,其中的第i个水平Ai安排了ni 次重复试验,所得到的样本为Xi1、Xi2、…、 Xini,相应的观测值为xi1、xi2、…、xini,式中 的n1+n2+…+nr= n。 水平 观测值 A1 x11 x12 … x1n A2 x21 x22 … x2n … … Ar xr1 xr2 … xrnr
四、双因素协方差分析
• (一)不考虑交互作用的双因素协方差分析
方差来源 平方和 A QA 自由 度 r-1 均方和 MQA F值 FA 显著性

非参数统计结课总结

非参数统计结课总结

非参数统计结课论文

姓名:姚文锋

班级:2011157

学号:201115726

专业:统计学

非参数统计检验方法的总结

引言:非参数统计作为数理统计学的分支,是解决很多不知道数据分布的问题的主要方法,通过运用非参数方法可以对事物起建立统计模型和数学描述。

摘要:本文主论述了非参数估计的符号检验、秩检验和ridit检验法等多种检验方法。

关键字:符号检验、秩检验、ridit检验

1、非参数估计的理解

对计量资料进行统计分析,常对计量资料进行统计分析,常用用方法有两类——参数统计和非参数统计。t检验、方差分析和直线相关回归分析都属于参数统计方法。参数统计方法要求的前提条件是,资料应服从或近似服从正态分布,t检验、方差分析还要求方差具有齐性。当前提条件不满足时,就不应选用参数统计方法。符号检验、秩和检验属于非参数统计方法。非参数统计方法对资料不要求必须是正态分布,也不要求方差必须具有齐性。当对资料的分布情况及方差情况不清楚或没把握,或者经过检验不满足正态分布或方差齐性的要求时,就应当选用非参数统计方法对资料进行统计分析。2非参数检验的方法

非参数检验不仅对资料分布没有特殊要求,除了用连续数量表示的的

资料外,它还可以对样本数据的符号、等级程度、大小顺序等进行比较,加上方法简便,易于掌握,不要求复杂的计算工具,还可查表判断,能处理一些参数法处理不了的问题,因而应用更广泛,值得学

习和推广。常用的非参数统计方法有:符号检验、秩和检验、秩检验、等级相关检验以及Ridit分析等。

符号检验是指通过符号“ +”和“-”的个数来进行统计推断的,它

2011年2月数理统计复习题(2011.2.18)

2011年2月数理统计复习题(2011.2.18)

2011年2月数理统计复习题(2011.2.18)

一、名词解释:

1、总体:根据研究目的确定的同质观察单位的全体。

2、样本:从总体中随机抽取有代表性的一部分个体,其测量值(或观察值)

的集合称为样本。

3、样本含量:样本包含的观察单位数。

4、抽样研究:对从所研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究称为抽样研究,目的是通过样本资料计算的指标去推论总体。

5、统计描述:运用一些统计指标以及统计表和统计图等,对数据的数量特征

及其分布规律进行客观地描述和表达,称为统计描述。

6、统计推断:在一定的置信度或概率保障下,根据样本资料信息推断总体特

征,叫做统计推断。常用方法是参数估计和假设检验。

7、参数:描述总体的某些数值特征称之。

8、变量:观察单位的某种属性或标志称为变量。

9、统计量:根据样本算得的某些数值特征称为统计量

10、配对设计; 将受试对象按一定条件配成对子,再随机分配每对中的两个受试者到不同处理组。

1、变异系数:(变异系数:标准差与均数之比,反映数据分布的相对离散程度,没有度量衡单位。用于观察指标单位不同或均数相差较大时资料变异程度的比较。)

2、医学参考值范围:指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标观察值的波动范围,一般在临床上用作判定正常和异常的参考标准。

3、中位数:是一个位置指标,它是指将一组个观察值按大小顺序排列后位次居中的数值。

4、极差:是一组观察值中最大值与最小值之差。

5、平均数:是描述一组观察值的集中趋势(集中位置)或平均水平的统计指标。

数理统计实验三非参数假设检验

数理统计实验三非参数假设检验

西北农林科技大学实验报告

学院名称:理学院专业年级:

姓名:学号:

课程:数理统计学报告日期:

实验三非参数假设检验

一.实验目的

1. 验证某产品的合格率是否是否低于0.9.

2. 检验某地区儿童身高是否符合正态分布。

3. 为研究心脏病猝死人数与日期的关系,收集到168个观测数据,利用这批样本数据推断猝死人数与日期的关系是否为2.8:1:1:1:1:1:1.

4. 某工厂用甲乙两种工艺生产同一种产品,利用样本数据检验两种工艺下产品使用寿命是否存在显著差异。

二.实验要求

用spss实现非参数假设检验,包括二项式检验,单样本正态分布检验,两个独立样本检验,卡方检验。

三.实验内容

(一)验证某产品的合格率是否是否低于0.9.

打开文件“非参数检验(产品合格率)”,点击分析->非参数检验->旧对话框->二项式,把数据“是否合格”添加到检验变量列表,把检验比例默认的0.5该为题目要求的0.9(如图所示)。

点击确定得到结论(如图所示)。

结论:

由上表知,SPSS的悖假设检验案例比例小于0.9的,并且在精确显著(单侧)值sig=0.193>0.05,即接受原假设检验,即二项式检验的案例比例是大于0.9的。

(二)检验某地区儿童身高是否符合正态分布。

打开文件“非参数检验(单样本KS-儿童身高)”,点击分析->非参数检验->旧对话框->1样本,把数据“周岁儿童的身高(sg)”添加到检验变量列表,检验分布默认为常规,即正态(如图所示)。

点击确定得到结论(如图所示)。

结论:由上述的结果可以看出,周岁儿童的身高是满足正态分布

非参数统计检验方法的应用

非参数统计检验方法的应用

论文投稿领域:数理经济与计量经济学

非参数统计检验方法的应用

阮曙芬1 程娇翼 1 张振中2

(1.中国地质大学数理学院,武汉 430074;2.中南大学数学科学与计算学院,长沙 410075)

摘要:本文对非参数统计中常用的三种假设检验方法进行了简单的介绍。运用

Kruskal-Wallis 检验方法对2002年前三季度的上海股市综合指数收益率数据进行了周末效应的检验,结果表明2002年上海股市综合指数收益率不具有周末效应。 关键字:符号检验;Wilcoxon 秩和检验;Kruskal-Wallis 检验

1引言

非参数统计是统计分析的重要组成部分。非参数假设检验是在总体分布未知或者总体分布不满足参数统计对总体所做的假定的时候,分析样本特点,寻找相应的非参数检验统计量。本文就是以此为出发点,介绍了非参数统计中假设检验常用的几个检验方法:符号检验、Wilcoxon 秩和检验和Kruskal-Wallis 检验,然后结合具体的问题和数据,在统计软件SAS 中作相应的非参数检验。

2非参数假设检验介绍

2.1 配对样本的符号检验

符号检验是根据正、负符号进行假设检验的方法。这种检验方法用于配对设计数值变量资料的假设检验,常常是差值不服从正态分布或者总体分布未知的情况下不能用t 检验的时候使用。其原理是对差值进行编制并冠以符号,然后对正负秩和进行比较检验。

设随机变量12,,...,n X X X 相互独立同分布,分布为()F x ,()F x 在0x =连续。假设检验问题

2.2 两独立样本的Wilcoxon 秩和检验

清华时立文spss第8章

清华时立文spss第8章

2
8.1 非参数检验概述
非参数检验处理问题大致分为 两类:一类是两个母体的分布 未知,用两组样本来检验它们 是否相同;另一类是假设一组 样本的母体分布,然后用另一 组样本来检验它是否正确。
3
8.1.1 非参数统计与参数统计
参数统计是这样一种检验:它的模型对抽出研究样本的总体的参数 规定了某些条件。由于这些条件通常未受检验,因此假设它们成立。 参数检验结果的意义取决于这些假设的合理性。参数检验也要求所 分析的数据要至少是从间隔量表水平的测量中获取的。 非参数检验是这样一种检验:其模型对于被抽样总体的参数不规定 条件。大多数非参数检验都包含一定的假设,即观测是独立的,所 研究的变量具有基础的连续性。不过这些假设比起参数检验的假设 来要少,并且弱得多。而且,非参数检验并不要求像参数检验所要 求的那么高的测量,大多数非参数检验用于顺序量表的数据,也有 一些用于名称量表的数据。 在现实生活中,往往不知道客观现象的总体分布情况如何,因此应 用参数检验的方法就会产生困难。例如,要检验两个总体的均值是 否相同,利用T分布进行检验,就需要假定两个总体的分布都是服 从正态分布的。但若不知道总体分布的情况或总体不满足正态分布 的假设,应用T检验就会存在困难。在不知道客观现象服从何种分 布的情况下,需要根据样本信息来推断总体是否属于某种理论分布。 在数理统计中,对不考虑原来的总体分布进行估计和检验的方法统 称为非参数统计方法。

第五章数理统计的基础知识

第五章数理统计的基础知识

第五章数理统计的基础知识

在前四章的概率论部分中,我们讨论了概率论的基本概念、思想和方法。知道随机变量的统计规律性是通过随机变量的概率分布来全面描述的。在概率论的许多问题中,概率分布通常是已知的或假设为已知的,在这一前提下我们去研究它的性质、特点和规律性,即讨论我们关心的某些概率、数字特征的计算以及对某些问题的判断、推理等。

但在许多实际问题中,所涉及到的某个随机变量服从什么分布我们可能完全不知道,或有时我们能够根据某些事实推断出分布的类型,但却不知道其分布函数中的某些参数。

例如:1、某种电子元件的寿命服从什么分布是完全不知道的。

2、检测一批灯泡是否合格,则每个灯泡可能合格,也可能不合格,则服从(0—1)

分布,但其中的参数p 未知。

对这类问题要深入研究,就必须知道与之相应的分布或分布中的参数.数理统计要解决的

首要问题就是:确定一个随机变量的分布或分布中的参数.

数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集、整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。

数理统计研究的内容非常广泛,可分为两大类:

一是:怎样有效地收集、整理有限的数据资料.

二是:怎样对所得的数据资料进行分析和研究,从而对所考察对象的某些性质作出尽可能精确可靠的判断—本书中参数估计和假设检验。

第一节数理统计的基本概念

一、总体与总体的分布

在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个元素称为个体。总体中所包含的个体的个数称为总体的容量. 容量为有限的总体称为有限总体;容量为无限的总体称为无限总体. 总体和个体之间的关系就是集合与元素之间的关系。

非参数统计学讲义(第五章)讲稿2

非参数统计学讲义(第五章)讲稿2

第五章 相关和回归

§1 引言

所谓相关,是指两组或两组以上观察结果之间的连带性或联系。换句话说,也就是各组观察结果所反映的特性之间有关系。如几个亲生兄弟间的智商与出生顺序有关系,受教育程度与性别有关系,出生率X 和文盲率Y 之间的关系等等。在实际问题的研究中,人们常常想知道两组或两组以上的观察结果是否有联系,同时也想知道联系的程度如何。前面的统计检验能够在一定的显著性水平上,确定各组观察值的关系是否存在。

相关方法被用来度量两个或更多变量之间的线性关系的强度,是回归分析的基础。 在数理统计学中,我们使用相关系数定义变量X 和变量Y 之间的相关性。

)

var()var(),cov(),(Y X Y X Y X corr =

=ρ1

(0.1)

对于样本),(11Y X ,),(22Y X ,……,),(n n Y X 来说,Pearson 相关系数为

∑∑∑∑∑∑----=

----=

2

2

2

2

11

)

()())(()

()()

)((Y Y X X Y Y X X Y Y X X Y Y X X r i i i i i i n

i i n (0.2)

如果在这个样本中的n 个观察值独立,则r 是ρ的渐近无偏估计;如果它又是二元正态分布,则r 是ρ的ML 估计。

为了检验0:0=ρH ,0:1≠ρH ,可以选取统计量)2(~122

---=n t r n r

t

结论:Pearson 相关系数度量的是一种线性关系,而我们所要介绍的非参数的Spearman 秩相关系数s r 和Kendall τ相关系数实际上度量的是一种形式的相依联系,或是更广义的单调关系。因此相关的概念被推广,不仅指线性相关,而泛指相依或联系。

数理统计PPT(研究生)3-3

数理统计PPT(研究生)3-3

量, Y 表示汽车拥有量,则电话拥有量与汽车拥有量
与汽车拥有量是否独立的问题可视为随机变量 X 与Y
是否独立问题。下面介绍随机变量 X 与 Y 的独立性
2检验法。
19
1、问题的描述 设总体为随机向量 ( X ,Y ) , X 的所有可能的不同取 值为 a1 , a2 ,..., ar , Y 的所有可能的不同取值为 b1 , b2 ,..., bs 对 ( X ,Y ) 做 n 次独立观测,得到事件 { X ai ,Y b j } 的 频数 nij (i 1,2,..., r ;1,2,..., s ).据此检验
5
在实际中还会遇到下列类似的问题。
例 3.3.1 某消费者协会为了确定市场上消费者对5 种品牌啤酒的喜好情况,随机抽取了1000名啤酒爱 好者作为样本进行了如下试验:每个人得到5种品牌 的啤酒各一瓶,但都未标明牌子。这5瓶啤酒按分别 写着A、B、C、D、E字母的5张纸片随机确定的顺序 送给每一个人。
x , y
(3.3.7)
列联表
Y X
b1
n11 n21

b2
n12 n22

... ... ...
bs
n1 s
ni n1 n2

a1 a2

n2 s

ar
n j
nr 1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如果检验的参数是一个特定值,比如产品的不合格率, 由于产品的合格与不合格问题属于二项式分布,此时 就还可以用:
np: 观察值 的期望值
(Y np)2 (Y np)2 [n Y n(1 p)]2 = np np n(1 p) (Y np) = np(1 p)
解:T-=1+6+2+5=14 T+=8+4+3+7+9=31,
T=T-=14, N=9, 查符号秩次检验表,双侧检验,
T0.05=6, 因为T> T0.05, 所以,两次血色素检查差异不显著。
数理统计在化学中的应用
李 振 华 制 造
注意:对同一问题用符号检验法和符号等级检验法, 如果出现矛盾的结果,应该相信符号等级检验法的结 果,因为它既考虑差值的符号,也考虑其大小,利用 了更多的信息,所以结果相对可靠些。
数理统计在化学中的应用
李 振 华 制 造
$5.5 秩和检验
秩和即秩次的和或等级之和。秩和检验法也叫MannWhitney-Wilcoxon检验,它常被译为曼-惠特尼-维 尔克松检验,简称M-W-W检验,也称Mann-Whitney Z检验。 (一)适用资料 1)秩和检验法与参数检验法中独立样本的t检验法相 对应。当“总体正态”这一前提不成立时,不能用t检 验,可以用秩和检验法; 2)当两个样本都为定序(顺序)变量时,也需使用 秩和法进行差异显著性检验。
2
X 20.05,1 CHIINV(0.05,1) 3.84
因为X2 < X20.05,1, 所以优级品率没有出现下降的变化。
数理统计在化学中的应用
李 振 华 制 造
$5.3 符号检验
$5.3.1 符号检验 检验不知道分布类型的数据 根据统计资料的符号,可以简便地来检验两组成对的 数据是否属于同一总体。两个样本既可以是互相独立 ,也可以是相关的,也就是说既可检验两总体是否存 在显著差异,也可检验是否来自同一总体。 思想:若两个样本差异不显著,正差值与负差 值的个数应大致各占一半。 假定P(X>Y),则如果X与Y属于同一总体的话, P(X>Y)=0.5
(r 0.5) N / 2 r N / 2, r 0.5 Z N /2 r N / 2, r 0.5
r n或n
数理统计在化学中的应用
李 振 华 制 造
$5.3.2 符号检验的步骤
4. X2检验:如X2< 2/2,v,接受H0,否则拒绝H0。 在样本数比较小的情况下,查符合检验表检验 并不是很灵敏。
百度文库
数理统计在化学中的应用
李 振 华 制 造
$5.4.2 符号秩次检验的步骤
1、N<25或30(小样本) (1)把相关样本对应数据之差值按绝对值从小到大作等级排 列(注意差值为零时,零不参加等级排列);如果差值相 同,则就取它们的平均秩次; (2)在各等级前面添上原来的正负号; (3)分别求出带正号的等级和(T+)与带负号的等级和(T-) ,取两者之中较小的记作T; (4)建立假设:H0: T+ = TH1: T+ T(4)根据N,T查成对秩和检验表 T>T表:接受H0 TT表:拒绝H0
数理统计在化学中的应用
李 振 华 制 造
例5-4 为了比较两种血浆皮质醇放射免疫测定法,每份标本同时用H3法和 I131法测定,数据及秩次计算见下表,用非参数法进行显著性检验。
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 H3法 10.0 7.0 5.5 5.5 6.0 14.0 10.0 5.5 7.5 8.0 2.5 2.5 10.0 3.0 8.5 5.5 7.5 I131法 7.0 6.5 4.0 4.0 9.0 14.0 10.0 6.0 7.0 6.0 2.2 2.0 6.2 2.0 7.5 3.0 7.5 差值绝对值 3.0 0.5 1.5 1.5 3.0 0.0 0.0 0.5 0.5 2.0 0.3 0.5 3.8 1.0 1.0 2.5 0.0 等级 秩次
X X
2
(Ok Tk )2 Tk k 1
m
(v m 1)
2
(Ok Tk 0.5)2 Tk k 1
2
v=1
数理统计在化学中的应用
李 振 华 制 造
数理统计在化学中的应用
李 振 华 制 造
数理统计在化学中的应用
李 振 华 制 造
$5.4 Wilcoxon符号秩次检验
数理统计在化学中的应用
李 振 华 制 造
数理统计在化学中的应用
李 振 华 制 造
$5.3.2 符号检验的步骤
2. 2检验:如2< 2/2,1,接受H0,否则拒绝H0。
2
(| n n | 1)2 n n (v 1)
3. N25:Z-检验,查t检验表(双侧),如|Z|<z/2 ,接受H0,否则拒绝H0。
数理统计在化学中的应用
李 振 华 制 造
数理统计在化学中的应用
李 振 华 制 造
例5-2 (讲义上的解是错的)
一试剂公司按现行生产工艺生产的化学试剂,其优品 率要占到10%。现从一批产品中抽取100个进行检验, 结果发现优级品仅5个。问是否优级品率出现了下降 的变化(=0.05)?
X2
(Y np)2 (5 100 0.1) 2 [95 100 0.9]2 = np 100 0.1 100 0.9 (Y np) (5 100 0.1)2 2.78 100 0.1 0.9 np(1 p)
12
13
14
17
7
10
22
23
66
73
49
55
14
15
21
25
13
16
24
25
81
89
61
68
数理统计在化学中的应用
李 振 华 制 造
2、N>25(大样本)
当N>25时,一般认为T的分布接近正态分布,其平均数和标 准差分别为:
N ( N 1) T , 4 N N 1 2 N 1 T 24 进行Z 检验 T-T Z=
第五章:非参数检验方法
数理统计在化学中的应用
$5.1 非参数检验方法概述

非参数统计是一种不要求变量值为某种特定分布和 不依赖某种特定理论的统计方法,或者是在不了解 总体分布及其全部参数的情况下的统计方法。非参 数统计方法开始于20世纪中期,早期的符号检验可 以追溯到18世纪。实际工作中,有许多资料常不能 确定或假设其总体变量值的分布,因此参数统计不 宜使用,不知道总分布,就不能比较参数,而只能 比较非参数。所谓非参数,即指数据的正负符号, 大小顺序号,综合判断所划分的名次、严重程度、 优劣等级等,利用直接说明或比较两个或几个样本 的非参数的方法均属于非参数统计法。
数理统计在化学中的应用
李 振 华 制 造
$5.3.2 符号检验的步骤
1. 编符号:一对一比较,如果前者大于后者,或者前 者较优,记以符号”+”,否则记以”-”,如二者相 等或不能判明优劣,就记为”0”。 2. 建立假设: H0: P(X1>X2) = P(X2>X1) = 0.5 H1: P(X1>X2)≠ P(X2>X1) ≠ 0.5 3. 清点“+”、“-”、“0”各有几个,分别记为n+、n、n0 4. 进行显著性检验 1. 查符号检验表(表中N=n++n-):r = min(n+, n-), 查表,如r>表值,差异不显著,r 表值,差异 显著。(讲义附录的表是错的)
数理统计在化学中的应用
李 振 华 制 造
参数检验和非参数检验

参数检验:指总体分布服从正态分布或总体 分布 已知条 件下的统计检验。 非参数检验:指总体分布不要求服从正态分布或总 体分布情况不明时,用来检验数据资料是否来自同 一个总体的统计检验方法。

数理统计在化学中的应用
李 振 华 制 造

通常非参数统计方法适用于以下几种情况 未知分布型,或样本数太少(n6)而使得分布状 况尚未显示出来 非参数性,只能以严重程度、优劣等级、效果 大小、名次先后以及综合判断等方式记录其符 号或等级 分布程度偏态 组内个别随机变量偏离过大。
T
数理统计在化学中的应用
李 振 华 制 造
例 某幼儿园对10名儿童在刚入园时和入园一年后均进行了 血色素检查,结果如下,试问两次检查有否明显变化?
儿童 刚入园 一年后 差值 差值绝对 值排等级 添符号 A B C D E F G H I J 12.3 11.3 13.0 15.0 12.0 15.0 13.5 12.8 10.0 11.0 12.0 14.0 13.8 13.8 11.4 14.0 13.5 13.5 12.0 14.7 -0.3 2.7 0.8 -1.2 -0.6 -1.0 0 0.7 2.0 3.7 1 -1 8 8 4 4 6 -6 2 -2 5 -5 3 3 7 7 9 9
数理统计在化学中的应用
李 振 华 制 造
成对资料秩和检验表
对子数 (n) 6 7 8 9 10 11 较小的秩号之和 =0.05 0 2 4 6 8 11 =0.01 — — 0 2 3 5 对子数 (n) 16 17 18 19 20 21 较小的秩号之和 =0.05 30 35 40 46 52 59 =0.01 20 23 28 32 38 43
$5.4.1 Wilcoxon符号秩次检验的基本思想 如果两个总体的分布相同,每个配对数值的差应 服从以0为中心的对称分布。也即是将差值按照绝对 值的大小编秩(排顺序)并给秩次加上原来差值的符 号后,所形成的正秩和与负秩和在理论上是相等的( 满足差值总体中位数为0的假设),如果二者相差太 大,超出界值范围,则拒绝原假设。 符号检验没有充分应用信息,主要是大小。
2
X
2
(v 1)
观察值
李 振 华 制 造
数理统计在化学中的应用
$5.2.1 X2拟合检验的步骤
1. 把观察到的不同类别的频数分别归入k类,这些频 数之和应是独立观察到总频数之和。 2. 假设H0,即确定出每一类应有的期望数Tk(或np) 。如k>2,只要有20%的Tk(或np)<5,就要合并 相邻精度类别以减少k值,以此来增加某些Tk值。 如k=2,只有当Tk都5时,才能应用式5-1来进行X2 检验,否则就需要应用修正式来检验。 3. 计算X2。 4. 根据给定的置信概率,查X2分布表,如果计算值小 于表值,则接受H0,反之则拒绝。
数理统计在化学中的应用
李 振 华 制 造
$5.2 Pearson’s X2拟合检验


需要研究所研究的对象或者实验的结果是否与预期 的原假设之间有显著性的差异,也就是检验观察值 与理论值之间的紧密程度。X2拟合检验就是用来确 定事件出现的频数分布与某一理论分布之间的差别 是否是随机性的。 实测值或观 2 X 定义: 察值频数
数理统计在化学中的应用
李 振 华 制 造
$5.4.2 秩和检验的步骤
1、小样本:两个样本容量均小于10(n110,n210) (1)将两个样本数据混合由小到大排列秩次(如果大小相同 就计算它们的平均秩次); (2)把样本容量较小的样本中各数据的秩次相加,以T表示; (3)建立假设 H0: A = B H1: A B (4)检验 把T值与秩和检验表中的临界值比较 T T1或T T2,则表明两样本差异显著; T1 < T <T2,则意味着两样本差异不显著。
李 振 华 制 造
数理统计在化学中的应用
非参数检验的优点和缺点:

优点:
a. 不受总体分布的限制,适用范围广。 b. 适宜定量模糊的变量和等级变量。 c. 方法简便易学。

缺点:当测量的数据能够满足参数统计的所有假设时,非 参数检验方法虽然也可以使用,但效果远不如参数检验方 法。由于当数据满足假设条件时,参数统计检验方法能够 从其中广泛地充分地提取有关信息。非参数统计检验方法 对数据的限制较为宽松,只能从中提取一般的信息,相对 参数统计检验方法会浪费一些信息。
X
2
(Ok Tk )2 Tk k 1
m
(v m 1)
m

2
( xk )2 2 k 1
m
理论频数 的期望值
试验结果只有两 个,且频数较小
X
2
(Ok Tk 0.5) 2 Tk k 1
2
数理统计在化学中的应用
李 振 华 制 造
$5.2 Pearson's chi-square test
相关文档
最新文档