非参数统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其一是样本容量不大; 其二是总体服从何种分布未知。下面我们来构造一 种检验的方法,看他们的资非产参数负统计债分析有无显著性差异。
将两类企业的资产负债混合排序,并给出其序次,这在统 计中称为“秩”。在这张表中我们有两个可用的信息。
负债率 55 59 61 64 64 65 70 73 75 76 77
非参数统计分析
【例1】 在我国的工业和商业企业中随机抽取22家企 业进行资产负债率行业差异分析,其某年底的资产负债率 (%)如下:
工 64 76 55 82 59 82 70 75 61 64 73 83 业 商 77 80 80 65 93 91 84 91 84 86 业
两个行业的负债水平是否有显著性差异a=0.05。这 样的数据中有两个问题:
8 . K related Samples Test K个相关样本检验 (检验k个相关总体差异性)
非参数统计分析
思考的要点 什么是计数统计量; 什么是秩统计量,为什么要讨论秩; 为什么要讨论秩的分布、秩的期望和方差; 什么是符号秩和线性符号秩; 线性符号秩的期望和方差。
非参数统计分析
第一节 关于非参数统计
非参数统计分析
5. 2 independent Samples Test 两个独立样本检 验(检验两个独立总体差异性)
6. K independent Samples Test K个独立样本检 验(检验k个独立总体的差异性)
7. 2 related Samples Test 两个相关样本检验 (检验两个相关总体差异性)
主要特点
不要求总体分布已知或对总体分布作任何限制性假 定; 不以估计总体参数为目的; 能适用于定性变量中的定类数据或定序数据 ,也能 适用于定距数据和定比数据这种定量变量 方法直观,易于理解,运算比较简单。 缺点是检验的功效不如参数检验方法。
非参数统计分析
非参数统计及一些概念
非参数统计分析
非参数检验的过程
游程数是大还是小呢?
非参数统计分析
非参数统计归纳起来有如下的三点优点: 1. 对总体的假定少; 2. 可以处理许多有问题数据,比如污染的正态 分布,有奇异值的情形; 3. 容易计算,当然如果不去证明统计量渐近分 布。
在参数统计学中,最基本的概念是总体、样本、随机变量、 概率分布、估计和假设检验等。其很大一部分内容是建立在正 态分布相关的理论基础之上的。总体的分布形式或分布族往往 是给定的或者是假定了的,所不知道的仅仅是一些参数的值。 于是,人们的任务就是对一些参数,比如均值和方差(或标准 差),进行点估计或区间估计,或者是对某些参数值进行各种 检验,比如检验正态分布的均值是否相等或等于零等等.最常 见的检验为对正态总体的t—检验、F—检验等。又比如,线性 回归分析中,需要估计回归系数j, j称为参数,所以线性回 归分析应该属于参数统计的范畴。
非参数统计分析
然而,在实际生活中,那种对总体分布的假定并不是 能随便做出的。有时,数据并不是来自所假定分布的总体。 或者数据根本不是来自一个总体,数据因为种种原因被严 重污染。这样,在假定总体分布的情况下进行推断的做法 就可能产生错误的结论。于是,人们希望在不假定总体分 布的情况下,尽量从数据本身来获得所需要的信息。这就 是非参数统计的宗旨。因为非参数统计方法不利用关于总 体分布的相关信息,所以,就是在对于总体分布的任何信 息都没有的情况下,它也能很容易而又较为可靠地获得结 论。这时非参数方法往往优于参数方法。这种方法称为 “无母数统计”,即不知到总体信息的统计方法。
非参数统计
非参数统计分析
估计总体的分布函数 是否等于已知的分布
狭义非参数统计
非参数统计
估计总体的密度函数的 曲线,但是不能写出解释式
检验两或以上个总体的分 布是否相同,通常是检验其 中位数是否相等
非参数计量经济学
非参数模型 半参数模型
wk.baidu.com
非参数统计分析
非参数统计
非参数统计(亦称非参数检验),是根据样本资料对总 体的某种性质或关系进行假设检验的统计推断方法。
秩
1 2 3 4 5 6 7 8 9 10 11
组别 1 1 1 1 1 2 1 1 1 1
2
负债率 80 80 82 82 83 84 84 86 91 91 93
秩
12 13 14 15 16 17 18 19 20 21 22
组别 2 2 1 1 1 2 2 2 2 2
2
非参数统计分析
如果我们将12家工业企业的秩相加是94,其平均秩是7.88,将 10家商业企业的秩相加得159,其平均秩为15.9,这就给我们一个 可以考虑的信息,两种企业的资产负债是有差异的。他们的平均秩 不同。
非参数统计分析
在不知总体分布的情况下如何利用数据所包含 的信息呢?一组数据最基本的信息就是次序。如果可 以把数据按大小次序排队,每一个具体数目都有它 在整个数据中(从最小的数起)的位置或次序,称为
该数据的秩(rank)。数据有多少个观察值,就有多
少个秩。在一定的假定下,这些秩和秩的统计量的 分布是求得出来的,而且和原来的总体分布无关。 这样就可以进行所需要的统计推断。注意:非参数 统计的名字中的“非参数(nonparametric)”意味着 其方法不涉及描述总体分布的有关数值参数(均值 和方差等);它被称为和分布无关(distribution— free),是因为其推断方法和总体分布无关;不应理 解为与所有分布(例如有关秩的分布)无关。
另 一 个 想 法 是 好 像 工 业 排 的 顺 序 相 对 靠 前 , 有 11111 , 2 , 1111,222,111,222222共有6段(相同特点的个案的一段称为游 程)。如果原假设成立,则两个行业的负债水平的分布使相同的, 将其混合后,应能较为充分、均匀地混合,游程数R应该比较大,
反之当游程数R较小,则说明两个总体的分布可能不同。那么6这个
1. Chi-Square test 卡方检验(检验总体是否服 从某个给定的离散分布)
2. Binomial test 二项分布检验(检验总体是否服 从二项分布)
3. Runs test 游程检验(检验样本序列是否随机 )
4. 1-Sample Kolmogorov-Smirnov test 一个样本柯 尔莫哥洛夫-斯米诺夫检验(检验总体是否服 从某个连续分布)
将两类企业的资产负债混合排序,并给出其序次,这在统 计中称为“秩”。在这张表中我们有两个可用的信息。
负债率 55 59 61 64 64 65 70 73 75 76 77
非参数统计分析
【例1】 在我国的工业和商业企业中随机抽取22家企 业进行资产负债率行业差异分析,其某年底的资产负债率 (%)如下:
工 64 76 55 82 59 82 70 75 61 64 73 83 业 商 77 80 80 65 93 91 84 91 84 86 业
两个行业的负债水平是否有显著性差异a=0.05。这 样的数据中有两个问题:
8 . K related Samples Test K个相关样本检验 (检验k个相关总体差异性)
非参数统计分析
思考的要点 什么是计数统计量; 什么是秩统计量,为什么要讨论秩; 为什么要讨论秩的分布、秩的期望和方差; 什么是符号秩和线性符号秩; 线性符号秩的期望和方差。
非参数统计分析
第一节 关于非参数统计
非参数统计分析
5. 2 independent Samples Test 两个独立样本检 验(检验两个独立总体差异性)
6. K independent Samples Test K个独立样本检 验(检验k个独立总体的差异性)
7. 2 related Samples Test 两个相关样本检验 (检验两个相关总体差异性)
主要特点
不要求总体分布已知或对总体分布作任何限制性假 定; 不以估计总体参数为目的; 能适用于定性变量中的定类数据或定序数据 ,也能 适用于定距数据和定比数据这种定量变量 方法直观,易于理解,运算比较简单。 缺点是检验的功效不如参数检验方法。
非参数统计分析
非参数统计及一些概念
非参数统计分析
非参数检验的过程
游程数是大还是小呢?
非参数统计分析
非参数统计归纳起来有如下的三点优点: 1. 对总体的假定少; 2. 可以处理许多有问题数据,比如污染的正态 分布,有奇异值的情形; 3. 容易计算,当然如果不去证明统计量渐近分 布。
在参数统计学中,最基本的概念是总体、样本、随机变量、 概率分布、估计和假设检验等。其很大一部分内容是建立在正 态分布相关的理论基础之上的。总体的分布形式或分布族往往 是给定的或者是假定了的,所不知道的仅仅是一些参数的值。 于是,人们的任务就是对一些参数,比如均值和方差(或标准 差),进行点估计或区间估计,或者是对某些参数值进行各种 检验,比如检验正态分布的均值是否相等或等于零等等.最常 见的检验为对正态总体的t—检验、F—检验等。又比如,线性 回归分析中,需要估计回归系数j, j称为参数,所以线性回 归分析应该属于参数统计的范畴。
非参数统计分析
然而,在实际生活中,那种对总体分布的假定并不是 能随便做出的。有时,数据并不是来自所假定分布的总体。 或者数据根本不是来自一个总体,数据因为种种原因被严 重污染。这样,在假定总体分布的情况下进行推断的做法 就可能产生错误的结论。于是,人们希望在不假定总体分 布的情况下,尽量从数据本身来获得所需要的信息。这就 是非参数统计的宗旨。因为非参数统计方法不利用关于总 体分布的相关信息,所以,就是在对于总体分布的任何信 息都没有的情况下,它也能很容易而又较为可靠地获得结 论。这时非参数方法往往优于参数方法。这种方法称为 “无母数统计”,即不知到总体信息的统计方法。
非参数统计
非参数统计分析
估计总体的分布函数 是否等于已知的分布
狭义非参数统计
非参数统计
估计总体的密度函数的 曲线,但是不能写出解释式
检验两或以上个总体的分 布是否相同,通常是检验其 中位数是否相等
非参数计量经济学
非参数模型 半参数模型
wk.baidu.com
非参数统计分析
非参数统计
非参数统计(亦称非参数检验),是根据样本资料对总 体的某种性质或关系进行假设检验的统计推断方法。
秩
1 2 3 4 5 6 7 8 9 10 11
组别 1 1 1 1 1 2 1 1 1 1
2
负债率 80 80 82 82 83 84 84 86 91 91 93
秩
12 13 14 15 16 17 18 19 20 21 22
组别 2 2 1 1 1 2 2 2 2 2
2
非参数统计分析
如果我们将12家工业企业的秩相加是94,其平均秩是7.88,将 10家商业企业的秩相加得159,其平均秩为15.9,这就给我们一个 可以考虑的信息,两种企业的资产负债是有差异的。他们的平均秩 不同。
非参数统计分析
在不知总体分布的情况下如何利用数据所包含 的信息呢?一组数据最基本的信息就是次序。如果可 以把数据按大小次序排队,每一个具体数目都有它 在整个数据中(从最小的数起)的位置或次序,称为
该数据的秩(rank)。数据有多少个观察值,就有多
少个秩。在一定的假定下,这些秩和秩的统计量的 分布是求得出来的,而且和原来的总体分布无关。 这样就可以进行所需要的统计推断。注意:非参数 统计的名字中的“非参数(nonparametric)”意味着 其方法不涉及描述总体分布的有关数值参数(均值 和方差等);它被称为和分布无关(distribution— free),是因为其推断方法和总体分布无关;不应理 解为与所有分布(例如有关秩的分布)无关。
另 一 个 想 法 是 好 像 工 业 排 的 顺 序 相 对 靠 前 , 有 11111 , 2 , 1111,222,111,222222共有6段(相同特点的个案的一段称为游 程)。如果原假设成立,则两个行业的负债水平的分布使相同的, 将其混合后,应能较为充分、均匀地混合,游程数R应该比较大,
反之当游程数R较小,则说明两个总体的分布可能不同。那么6这个
1. Chi-Square test 卡方检验(检验总体是否服 从某个给定的离散分布)
2. Binomial test 二项分布检验(检验总体是否服 从二项分布)
3. Runs test 游程检验(检验样本序列是否随机 )
4. 1-Sample Kolmogorov-Smirnov test 一个样本柯 尔莫哥洛夫-斯米诺夫检验(检验总体是否服 从某个连续分布)