《非参数统计分析》PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
另 一 个 想 法 是 好 像 工 业 排 的 顺 序 相 对 靠 前 , 有 11111 , 2 , 1111,222,111,222222共有6段(相同特点的个案的一段称为游 程)百度文库如果原假设成立,则两个行业的负债水平的分布使相同的, 将其混合后,应能较为充分、均匀地混合,游程数R应该比较大,
反之当游程数R较小,则说明两个总体的分布可能不同。那么6这个
6. K independent Samples Test K个独立样 本检验(检验k个独立总体的差异性)
7. 2 related Samples Test 两个相关样本检验 (检验两个相关总体差异性)
8 . K related Samples Test K个相关样本检验 (检验k个相关总体差异性)
在不知总体分布的情况下如何利用数据所包含 的信息呢?一组数据最基本的信息就是次序。如果可 以把数据按大小次序排队,每一个具体数目都有它 在整个数据中(从最小的数起)的位置或次序,称为
该数据的秩(rank)。数据有多少个观察值,就有多
少个秩。在一定的假定下,这些秩和秩的统计量的 分布是求得出来的,而且和原来的总体分布无关。 这样就可以进行所需要的统计推断。注意:非参数 统计的名字中的“非参数(nonparametric)”意味着 其方法不涉及描述总体分布的有关数值参数(均值 和方差等);它被称为和分布无关(distribution— free),是因为其推断方法和总体分布无关;不应理 解为与所有分布(例如有关秩的分布)无关。
非参数计量经济学
非参数模型 半参数模型
第一章 非参数统计及一些概念
教学中使用的软件SPSS和R。 SPSS的非 参数统计菜单已经比较全面了。
SPSS非参数检验的过程
1. Chi-Square test 卡方检验(检验总体是否服 从某个给定的离散分布)
2. Binomial test 二项分布检验(检验总体是否 服从二项分布)
思考的要点 什么是计数统计量; 什么是秩统计量,为什么要讨论秩; 为什么要讨论秩的分布、秩的期望和方差; 什么是符号秩和线性符号秩; 线性符号秩的期望和方差。
第一节 关于非参数统计
在参数统计学中,最基本的概念是总体、样本、随机变量、 概率分布、估计和假设检验等。其很大一部分内容是建立在正 态分布相关的理论基础之上的。总体的分布形式或分布族往往 是给定的或者是假定了的,所不知道的仅仅是一些参数的值。 于是,人们的任务就是对一些参数,比如均值和方差(或标准 差),进行点估计或区间估计,或者是对某些参数值进行各种 检验,比如检验正态分布的均值是否相等或等于零等等.最常 见的检验为对正态总体的t—检验、F—检验和最大似然比检验 等。又比如,线性回归分析中,需要估计回归系数j, j称为 参数,所以线性回归分析应该属于参数统计的范畴。
组别 1 1 1 1 1 2 1 1 1 1
2
负债率 80 80 82 82 83 84 84 86 91 91 93
秩
12 13 14 15 16 17 18 19 20 21 22
组别 2 2 1 1 1 2 2 2 2 2
2
如果我们将12家工业企业的秩相加是94,其平均秩是7.88,将 10家商业企业的秩相加得159,其平均秩为15.9,这就给我们一个 可以考虑的信息,两种企业的资产负债是有差异的。他们的平均秩 不同。
游程数是大还是小呢?
【例2】 模拟一个污染的正态分布,计算其样本均值,但是样本均值非正态分布 了。这个分布是以0.8的概率是标准正态分布,0.2的概率混进方差为9的正态分布。 workfile a u 1 1000 series junzhi for !i=1 to 1000 smpl 1 20 series y1=rnd series y2=nrnd series a smpl if y1<0.8 a=y2 smpl if y1>=0.8 a=9*y2 smpl 1 20 scalar mean=@mean(a) junzhi(!i)=mean next smpl 1 1000 junzhi.hist
第二篇 非参数统计
参考书 《非参数统计》 中国统计出版社 吴喜之 《非参数统计》 人民大学出版社 王 星 《非参数统计讲义》 北京大学出版社 孙山泽
估计总体的分布函数 是否等于已知的分布
狭义非参数统计
非参数统计
估计总体的密度函数的 曲线,但是不能写出解释式
检验两或以上个总体的分 布是否相同,通常是检验其 中位数是否相等
【例1】 在我国的工业和商业企业中随机抽取22家企 业进行资产负债率行业差异分析,其某年底的资产负债率 (%)如下:
工 64 76 55 82 59 82 70 75 61 64 73 83 业 商 77 80 80 65 93 91 84 91 84 86 业
两个行业的负债水平是否有显著性差异a=0.05。这 样的数据中有两个问题:
其一是样本容量不大; 其二是总体服从何种分布未知。下面我们来构造一 种检验的方法,看他们的资产负债有无显著性差异。
将两类企业的资产负债混合排序,并给出其序次,这在 统计中称为“秩”。在这张表中我们有两个可用的信息。
负债率 55 59 61 64 64 65 70 73 75 76 77
秩
1 2 3 4 5 6 7 8 9 10 11
3. Runs test 游程检验(检验样本序列是否随机) 4. 1-Sample Kolmogorov-Smirnov test 一个样
本柯尔莫哥洛夫-斯米诺夫检验(检验总体是 否服从某个连续分布)
5. 2 independent Samples Test 两个独立样 本检验(检验两个独立总体差异性)
然而,在实际生活中,那种对总体分布的假定并不是 能随便做出的。有时,数据并不是来自所假定分布的总体。 或者数据根本不是来自一个总体,数据因为种种原因被严 重污染。这样,在假定总体分布的情况下进行推断的做法 就可能产生错误的结论。于是,人们希望在不假定总体分 布的情况下,尽量从数据本身来获得所需要的信息。这就 是非参数统计的宗旨。因为非参数统计方法不利用关于总 体分布的相关信息,所以,就是在对于总体分布的任何信 息都没有的情况下,它也能很容易而又较为可靠地获得结 论。这时非参数方法往往优于参数方法。在台湾这种方法 称为“无母数统计”,即不知到总体信息的统计方法。
反之当游程数R较小,则说明两个总体的分布可能不同。那么6这个
6. K independent Samples Test K个独立样 本检验(检验k个独立总体的差异性)
7. 2 related Samples Test 两个相关样本检验 (检验两个相关总体差异性)
8 . K related Samples Test K个相关样本检验 (检验k个相关总体差异性)
在不知总体分布的情况下如何利用数据所包含 的信息呢?一组数据最基本的信息就是次序。如果可 以把数据按大小次序排队,每一个具体数目都有它 在整个数据中(从最小的数起)的位置或次序,称为
该数据的秩(rank)。数据有多少个观察值,就有多
少个秩。在一定的假定下,这些秩和秩的统计量的 分布是求得出来的,而且和原来的总体分布无关。 这样就可以进行所需要的统计推断。注意:非参数 统计的名字中的“非参数(nonparametric)”意味着 其方法不涉及描述总体分布的有关数值参数(均值 和方差等);它被称为和分布无关(distribution— free),是因为其推断方法和总体分布无关;不应理 解为与所有分布(例如有关秩的分布)无关。
非参数计量经济学
非参数模型 半参数模型
第一章 非参数统计及一些概念
教学中使用的软件SPSS和R。 SPSS的非 参数统计菜单已经比较全面了。
SPSS非参数检验的过程
1. Chi-Square test 卡方检验(检验总体是否服 从某个给定的离散分布)
2. Binomial test 二项分布检验(检验总体是否 服从二项分布)
思考的要点 什么是计数统计量; 什么是秩统计量,为什么要讨论秩; 为什么要讨论秩的分布、秩的期望和方差; 什么是符号秩和线性符号秩; 线性符号秩的期望和方差。
第一节 关于非参数统计
在参数统计学中,最基本的概念是总体、样本、随机变量、 概率分布、估计和假设检验等。其很大一部分内容是建立在正 态分布相关的理论基础之上的。总体的分布形式或分布族往往 是给定的或者是假定了的,所不知道的仅仅是一些参数的值。 于是,人们的任务就是对一些参数,比如均值和方差(或标准 差),进行点估计或区间估计,或者是对某些参数值进行各种 检验,比如检验正态分布的均值是否相等或等于零等等.最常 见的检验为对正态总体的t—检验、F—检验和最大似然比检验 等。又比如,线性回归分析中,需要估计回归系数j, j称为 参数,所以线性回归分析应该属于参数统计的范畴。
组别 1 1 1 1 1 2 1 1 1 1
2
负债率 80 80 82 82 83 84 84 86 91 91 93
秩
12 13 14 15 16 17 18 19 20 21 22
组别 2 2 1 1 1 2 2 2 2 2
2
如果我们将12家工业企业的秩相加是94,其平均秩是7.88,将 10家商业企业的秩相加得159,其平均秩为15.9,这就给我们一个 可以考虑的信息,两种企业的资产负债是有差异的。他们的平均秩 不同。
游程数是大还是小呢?
【例2】 模拟一个污染的正态分布,计算其样本均值,但是样本均值非正态分布 了。这个分布是以0.8的概率是标准正态分布,0.2的概率混进方差为9的正态分布。 workfile a u 1 1000 series junzhi for !i=1 to 1000 smpl 1 20 series y1=rnd series y2=nrnd series a smpl if y1<0.8 a=y2 smpl if y1>=0.8 a=9*y2 smpl 1 20 scalar mean=@mean(a) junzhi(!i)=mean next smpl 1 1000 junzhi.hist
第二篇 非参数统计
参考书 《非参数统计》 中国统计出版社 吴喜之 《非参数统计》 人民大学出版社 王 星 《非参数统计讲义》 北京大学出版社 孙山泽
估计总体的分布函数 是否等于已知的分布
狭义非参数统计
非参数统计
估计总体的密度函数的 曲线,但是不能写出解释式
检验两或以上个总体的分 布是否相同,通常是检验其 中位数是否相等
【例1】 在我国的工业和商业企业中随机抽取22家企 业进行资产负债率行业差异分析,其某年底的资产负债率 (%)如下:
工 64 76 55 82 59 82 70 75 61 64 73 83 业 商 77 80 80 65 93 91 84 91 84 86 业
两个行业的负债水平是否有显著性差异a=0.05。这 样的数据中有两个问题:
其一是样本容量不大; 其二是总体服从何种分布未知。下面我们来构造一 种检验的方法,看他们的资产负债有无显著性差异。
将两类企业的资产负债混合排序,并给出其序次,这在 统计中称为“秩”。在这张表中我们有两个可用的信息。
负债率 55 59 61 64 64 65 70 73 75 76 77
秩
1 2 3 4 5 6 7 8 9 10 11
3. Runs test 游程检验(检验样本序列是否随机) 4. 1-Sample Kolmogorov-Smirnov test 一个样
本柯尔莫哥洛夫-斯米诺夫检验(检验总体是 否服从某个连续分布)
5. 2 independent Samples Test 两个独立样 本检验(检验两个独立总体差异性)
然而,在实际生活中,那种对总体分布的假定并不是 能随便做出的。有时,数据并不是来自所假定分布的总体。 或者数据根本不是来自一个总体,数据因为种种原因被严 重污染。这样,在假定总体分布的情况下进行推断的做法 就可能产生错误的结论。于是,人们希望在不假定总体分 布的情况下,尽量从数据本身来获得所需要的信息。这就 是非参数统计的宗旨。因为非参数统计方法不利用关于总 体分布的相关信息,所以,就是在对于总体分布的任何信 息都没有的情况下,它也能很容易而又较为可靠地获得结 论。这时非参数方法往往优于参数方法。在台湾这种方法 称为“无母数统计”,即不知到总体信息的统计方法。