王静龙《非参数统计分析》(1-8章)教案

合集下载

王静龙《非参数统计分析》(6章)课程教案

王静龙《非参数统计分析》(6章)课程教案

引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。

例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。

《非参数统计分析》教案

《非参数统计分析》教案

添加标题
添加标题
添加标题
添加标题
案例分析:通过分析具体案例,帮 助学生理解抽象概念和理论
实验操作:通过实验操作,让学生 亲身体验统计方法的应用过程
评价方式
课堂表现:观察学 生的课堂参与度、 回答问题的准确性 和思考问题的深度
作业完成情况:评 估学生对课堂内容 的理解和应用能力
小组讨论:鼓励学 生之间的合作与交 流,培养团队协作 能力
介绍非参数统计分析的基本 方法
介绍非参数统计分析在各个 领域的应用
介绍非参数统计分析的概念 和特点
介绍非参数统计分析的优缺 点和注意事项
导入:介绍非参数统计分 析的概念和背景
教学步骤
定义与概念:讲解非参数 统计分析和相关概念
方法与步骤:详细介绍非 参数统计分析的方法和步 骤
案例分析:通过具体案例 来展示非参数统计分析的 应用
总结与回顾:总结本次课 程的内容,回顾非参数统 计分析的方法和步骤
作业与思考:布置相关作 业和思考题,引导学生深 入思考
教学重点
重点知识点1:非参数统计的 基本概念
重点知识点2:非参数统计与 参数统计的区别
重点知识点3:非参数统计的 优缺点
重点知识点4:非参数统计的 应用场景
教学难点
难点概念:难以理解或掌 握的基本概念或原理
难点应用:将理论知识应 用于实际问题的能力
难点计算:复杂的统计计 算和分析方法
难点理解:对统计原理和 方法的深入理解和掌握
教学方法
案例教学法:通 过具体案例的分 析和讨论,帮助 学生理解和掌握 非参数统计分析 的基本概念和方
法。
互动式教学法: 采用课堂互动、 小组讨论等方式, 鼓励学生积极参 与,提高学生的 学习兴趣和主动

《非参数统计》课程教学大纲

《非参数统计》课程教学大纲

Z N U E L 《非参数统计》课程教学大纲一、课程的性质和目的本课程是学习非参数统计和了解统计前沿的基本课程。

本课程结合R 软件来讲解非参数统计方法的原理与应用。

课程的目的是使学生认识到非参数统计方法是统计中最常用的推断方法之一,理解非参数统计方法与参数统计方法的区别,理解非参数统计的基本概念,掌握非参数统计的基本方法,能应用非参数统计方法去解决实际问题。

二、课程教学内容及学时分配第一章 引言(2学时)本章内容:统计的概念,非参数统计的方法,参数统计与非参数统计的比较。

本章要求:了解非参数统计的历史,了解非参数统计方法与参数方法的区别,认识非参数统计方法的必要性。

第二章 R 基础(6学时)本章内容:R 环境,向量的定义和表示,向量的基本操作,向量的基本运算,向量的逻辑运算,R 的图形功能。

本章要求:熟悉R 中基本数据处理,掌握在R 中进行基本运算,能编写简单的计算函数,会绘制图形.第三章 单一样本的推断问题(6学时)本章内容:单样本推断问题,中心位置推断,符号检验,游程检验,Cox-Stuart 趋势检验,分位数检验,Wilcoxon 符号秩检验,分布检验,Kolmogorov-Smirnov 检验,Liliefor 正态检验,中位数检验,定性数据检验和成对数据检验,秩和检验。

本章要求:掌握符号检验,能用符号检验解决中位数检验问题、定性数据检验问题和成对数据检验问题。

掌握Wiloxon 秩和检验法,掌握符号秩和检验,能用符号秩和检验解对称中心的检验问题和成对数据检验问题,初步理解秩的概念。

第四章 两样本位置和尺度检验(8学时)本章内容:位置检验,Mood 中位数检验法,Mann-Whiteney 检验,Mood 检验,Moses 检验。

本章要求:掌握Mood 中位数检验法,Mann-Whiteney 统计量检验法和比较两样本的尺度参数的秩检验方法。

通过本章学习使学生进一步理解秩和统计量的概念。

非参数统计分析课程设计

非参数统计分析课程设计

非参数统计分析课程设计一、课程设计背景随着社会的不断进步,数据分析越来越受到人们的重视。

而统计学是一种非常实用的数据分析工具,具有广泛的应用性。

在统计学中,参数统计和非参数统计是两种常用的方法。

参数统计需要对数据进行假设检验,所以要求数据服从某些特定的分布,但是在现实中,很多数据并不服从正态分布或其他分布,这时就需要用到非参数统计。

非参数统计可以对数据进行处理,不需要对数据分布做假设前提,使得分析更为柔性和全面。

因此,非参数统计在实践中具有较高的应用价值。

二、课程设计目的通过本次课程设计,学生应该能够掌握以下知识和能力:1.理解非参数统计的基本概念和本质;2.掌握非参数统计的常用方法和理论基础;3.能够使用 Python 等工具对数据进行非参数统计分析;4.能够对数据进行有效的描述和检验。

三、课程设计内容本次课程设计包含以下几个方面的内容:3.1 非参数统计概述1.非参数统计的定义及其应用范围;2.非参数统计与参数统计的对比;3.常见的非参数统计方法及其特点。

3.2 非参数分布检验1.Kolmogorov-Smirnov (KS) 检验;2.Anderson-Darling (AD) 检验;3.Shapiro-Wilk (SW) 检验;4.Chi-Square (CS) 检验。

3.3 非参数方差分析1.Kruskal-Wallis (KW) 检验;2.Friedman (FR) 检验;3.Mood’s Median (MM) 检验。

3.4 非参数回归分析1.线性回归分析;2.多项式回归分析;3.核密度估计回归分析。

四、课程设计要求1.学生需自行确定数据分析的题目,可以是自己感兴趣的任何领域;2.学生需使用 Python 等工具对数据进行处理和分析;3.学生需要提交一份完整的分析报告,包括数据清洗、数据可视化、统计分析、结论总结等内容。

五、参考文献1.Hollander, M., & Wolfe, D. A. (1973). Nonparametricstatistical methods. John Wiley & Sons.2.Gibbons, J. D., & Chakraborti, S. (2011). Nonparametricstatistical inference(Vol. 23). CRC press.3.Conover, W. J. (1980). Practical nonparametric statistics.Wiley, New York.4.Wasserman, L. (2006). All of nonparametric statistics. Springer Science & Business Media.。

王静龙《非参数统计分析》教案

王静龙《非参数统计分析》教案

.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。

例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(±),随即抽取n=100件零件,数据如下:表经计算,平均长度为cm x 4958.8=,非常接近中心位置,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。

这说明产品有接近三分之一不合格,三分之二合格,所以需要更换供应厂 商,而用非参数分析却是另外一个结果。

以下是100个零件长度的分布表:这说明有90%的零件长度在)2.05.8(±cm 之间,有9%的零件不合格,所以工厂不需要换供应商。

例2 哪一个企业职工的工资高? 表两个企业职工的工资显然,企业1职工的工资高,倘若假设企业1与企业2的职工工资分别服从正态分布),(),,(22σσb N a N ,则这两个企业职工的工资比较问题就可以转化为一个参数的假设检验问题,原假设为b a H =:0,备择假设为b a H >:0 则 ))11(,(~2σnm b a N y x +-- 若0H 为真,则其中])()([2112122∑∑==-+--+=ni i m i i wy y x x n m S 拒绝域为:}325.1{)}20({90.0≥=≥t t t 检测值为:282.1=t故不能拒绝原假设,认为两企业的工资水平无差异。

也可以用值-P 检验由于1073.0)282.1)20((=≥t P故不能拒绝原假设,认为两企业的工资水平无差异。

这里我们采用的显着性水平为.但这个统计结论与实际数据不相符合。

主要是因为假设工资服从正态分布,这个假设是错误的,用错误的假设结合参数分析自然得出的结论不可靠。

非参数统计教学大纲

非参数统计教学大纲

遵义师范学院课程教学大纲非参数统计教学大纲(试行)课程编号:280020 适用专业:统计学学时数:64 学分数: 4执笔人:黄建文审核人:系别:数学教研室:统计学教研室编印日期:二〇一五年七月课程名称:非参数统计课程编码:学分:4总学时:64课堂教学学时:64实践学时:适用专业:统计学先修课程:高等数学、线性代数、概率论、数理统计一、课程的性质与目标:(一)该课程的性质本课程属专业方向选修课程。

非参数统计形成于二十世纪四十年代,是与参数统计相比较而存在的统计学一个年轻、活跃而前沿的分支,含有丰富的统计思想并在实践中有着广泛的应用。

非参数统计方法不依赖于总体分布及其参数,适用于多种类型的数据,进行统计推断时仅需要一些非常一般性的假设,因而具有良好的稳健型,在总体分布未知的情况下往往比参数统计方法有效。

(二)该课程的教学目标本课程的教学目的是使学生了解非参数统计在推断统计体系中日益重要的作用,理解非参数统计方法和参数统计方法的区别。

要求学生掌握本课程的基本知识、基本概念、基本原理和基本方法,能应用非参数统计方法解决一些简单的实际问题;注重学生统计思维能力和实践能力的培养,进一步培养学生重视原始资料的完整性与准确性、对数据处理持严肃认真态度的专业素质。

二、教学进程安排课外学习时数原则上按课堂教学时数1:1安排。

三、教学内容与要求第一章引言【教学目标】通过本章学习,使学生清楚非参数统计的研究对象,了解非参数统计的历史,明白非参数统计方法和参数统计方法的区别,认识学习非参数统计方法的必要性,了解非参数统计的一些基本概念与基本工具;通过对初等推断统计的简单回顾,要求学生提炼并把握推断统计思想的实质,为后续章节学习非参数统计的分析技巧和主要思想打下基础。

【教学内容和要求】主要教学内容:非参数统计研究内容;非参数统计小史;初等推断统计回顾;非参数统计基本概念。

教学重点与难点:教学重点是通过与参数统计异同的比较,介绍非参数统计的研究内容与研究方法;教学难点是对检验的相对效率、秩检验统计量、U统计量等非参数统计基本概念的理解。

王静龙《非参数统计分析》(1-6章)教案---精品管理资料

王静龙《非参数统计分析》(1-6章)教案---精品管理资料

引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。

例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1。

18.503 8.508 8.498 8。

347 8。

494 8。

500 8。

498 8.500 8.502 8.501 8。

491 8.504 8。

502 8.503 8.501 8。

505 8.492 8。

497 8。

150 8.496 8。

501 8.489 8.506 8.497 8。

505 8。

501 8。

500 8。

499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8。

505 8.510 8。

499 8。

489 8.496 8.500 8。

503 8.497 8。

504 8。

503 8.506 8.497 8。

507 8。

346 8.310 8.489 8。

499 8.492 8。

497 8。

506 8。

502 8.505 8.489 8.503 8.492 8.501 8。

499 8.804 8。

505 8。

504 8.499 8。

506 8。

499 8。

493 8。

494 8。

490 8。

505 8。

511 8。

502 8。

505 8。

503 8.782 8.502 8.509 8。

499 8.498 8.493 8.897 8.504 8。

493 8。

494 7.780 8.509 8.499 8.503 8。

494 8.511 8。

501 8。

497 8。

493 8.501 8.495 8。

461 8.504 8。

691经计算,平均长度为cm x 4958.8=,非常接近中心位置8。

5cm,样本标准差为()1047.0112=--=∑=ni i n x x s cm 。

《非参数统计学》课程教学大纲

《非参数统计学》课程教学大纲

非参数统计学(Nonparamatric Statistics)一、课程说明课程编号:046301课程性质:专业必修课适用专业:财经类统计学专业开设。

开课学期:一般可在第四学期开设学时与学分:总课时:40学时。

其中讲授32学时,实验8学时。

学分:2.5学分。

先修课程:概率论与数理统计学、描述统计学。

二、开课目的非参数统计是与参数统计相比较而存在的统计学一个年轻、活跃而前沿的分支,含有丰富的统计思想并在实践中有着广泛的应用。

非参数统计方法不依赖于总体分布及其参数,适用于多种类型的数据,进行统计推断时仅需要一些非常一般性的假设,因而具有良好的稳健性,在总体分布未知的情况下往往比参数统计方法有效。

对统计学专业来说,非参数统计学课程直接构成了其学科体系的一个不可或缺的部分。

通过本课程的学习,要求学生掌握本学科的基本知识、基本概念、基本原理和基本方法;培养统计思维能力和工作能力,培养重视原始资料的完整、准确,对数据处理持严肃认真的科学态度。

设置本课程的总体目标是:1.使学生了解非参数统计在推断统计体系中日益重要的作用,理解非参数统计方法和参数统计方法的区别。

2.使学生系统地掌握各种非参数统计方法及其基本思想。

3.掌握各种方法的应用条件和适用场合,以便根据具体情况正确选用非参数统计方法,正确运用非参数统计方法处理实际数据资料。

4.把所学的统计专业知识与所处理的实际问题紧密结合起来,对计算结果给出合理的解释,从而作出科学的定论。

5.为进一步学习其他专业课程打好基础。

三、教学要求(一)教学方法与手段本课程注重实践,着重培养学生的实际动手能力、对基础资料的综合分析能力。

课堂讲授通过大量实例来介绍非参数统计的基本方法;充分利用多媒体等现代化教学手段,使用SPSS进行理论与实践教学;选取实际经济生活中大量实例,要求学生用所学的非参数统计方法进行定量分析,以激发学生学习本课程的兴趣,进而培养学生分析问题与解决问题的能力。

王静龙《非参数统计分析》章教案

王静龙《非参数统计分析》章教案

.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。

例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。

王静龙《非参数统计分析》章教案

王静龙《非参数统计分析》章教案

.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。

例如:分析下面的供应商的产品是否合格合格产品的标准长度为(±),随即抽取n=100件零件,数据如下:表经计算,平均长度为cm x 4958.8=,非常接近中心位置,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。

%66)1047.04958.84.8()1047.04958.86.8()4.8()6.8()6.84.8(≈-Φ--Φ=-Φ--Φ=≤≤σμσμX P这说明产品有接近三分之一不合格,三分之二合格,所以需要更换供应厂 商,而用非参数分析却是另外一个结果。

以下是100个零件长度的分布表:这说明有90%的零件长度在)2.05.8(±cm 之间,有9%的零件不合格,所以工厂不需要换供应商。

例2 哪一个企业职工的工资高 表两个企业职工的工资显然,企业1职工的工资高,倘若假设企业1与企业2的职工工资分别服从正态分布),(),,(22σσb N a N ,则这两个企业职工的工资比较问题就可以转化为一个参数的假设检验问题,原假设为b a H =:0,备择假设为b a H >:0 则 ))11(,(~2σnmb a N y x +-- 若0H 为真,则)20()2(~11t n m t nm S y x t w =-++-=其中])()([2112122∑∑==-+--+=ni i m i i wy y x x n m S 拒绝域为:}325.1{)}20({90.0≥=≥t t t 检测值为:282.1=t故不能拒绝原假设,认为两企业的工资水平无差异。

也可以用值-P 检验由于1073.0)282.1)20((=≥t P故不能拒绝原假设,认为两企业的工资水平无差异。

王静龙《非参数统计分析》(6章)课程教案

王静龙《非参数统计分析》(6章)课程教案

引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。

例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。

非参数统计教学大纲

非参数统计教学大纲

《非参数统计》课程教学大纲一、课程基本信息课程代码:G05306课程名称:非参数统计课程性质:选修课课程类别:专业与专业方向课程适用专业:统计学总学时:48学时总学分:3学分先修课程:概率论、数理统计后续课程:统计预测与决策课程简介:非参数统计是与参数统计相比较而存在的统计学一个年轻、活跃而前沿的分支,含有丰富的统计思想并在实践中有着广泛的应用。

形成于二十世纪四十年代,在二次世界大战后得到迅速发展,现已成长为一个体系博大、理论精深且富于实用价值的分支,是高等学校统计学专业本科生的一门专业选修课。

非参数统计方法不依赖于总体分布及其参数,适用于多种类型的数据,进行统计推断时仅需要一些非常一般性的假设,因而具有良好的稳健型,在总体分布未知的情况下往往比参数统计方法有效。

针对非参数统计方法,展开基本理论和方法的学习,课程内容依次介绍计数统计量、秩统计量、线性秩统计量、U统计量、功效函数、检验的渐近相对效率、由经验分布产生的非参数估计、Hodges-Lehmann估计等非参数统计的概念与方法。

本课程的教学目的是使学生了解非参数统计在推断统计体系中日益重要的作用,理解非参数统计方法和参数统计方法的区别。

要求学生掌握本课程的基本知识、基本概念、基本原理和基本方法,能应用非参数统计方法解决一些简单的实际问题;注重学生统计思维能力和实践能力的培养,进一步培养学生重视原始资料的完整性与准确性、对数据处理持严肃认真态度的专业素质。

选用教材:《非参数统计讲义》,孙山泽[M].北京:北京大学出版社,2002参考书目:[1]《非参数统计方法》,吴喜之,王兆军[M].北京:高等教育出版社,2006;[2]《非参数统计分析》,王静龙[M].北京:高等教育出版社,2006;[3]《非参数统计方法》,李裕奇[M].北京:国防工业出版社,1998;[4]《非参数统计教程》,陈希孺,柴根象[M].上海:华东师范大学出版社,1993二、课程总目标通过本课程的学习,使学生了解非参数统计在推断统计体系中日益重要的作用,理解非参数统计方法和参数统计方法的区别。

第一章非参数统计分析

第一章非参数统计分析

然而,在实际生活中,那种对总体分布的假定并不是 能随便做出的。有时,数据并不是来自所假定分布的总体。 或者数据根本不是来自一个总体,数据因为种种原因被严 重污染。这样,在假定总体分布的情况下进行推断的做法 就可能产生错误的结论。于是,人们希望在不假定总体分 布的情况下,尽量从数据本身来获得所需要的信息。这就 是非参数统计的宗旨。因为非参数统计方法不利用关于总 体分布的相关信息,所以,就是在对于总体分布的任何信 息都没有的情况下,它也能很容易而又较为可靠地获得结 论。这时非参数方法往往优于参数方法。在台湾这种方法 称为“无母数统计”,即不知到总体信息的统计方法。
H0 : M 7000; H1 : M 7000
因为S 5 ,P(S 5) 0.1508 0.05 ,故接受原假设。
第二节 秩统计量
一、秩统计量
设 X1, ,Xn来自总体X的样本,记 R i 为样本点
X i的秩,即
n
Ri (Xi Xj 0)
j1
(XiXj 0) 1 0
Xi Xj Xi Xj
第二节 计数统计量
一、计数统计量
设是一个随机变量,对于一个给定的常数0, 定义随机变量
Ψ (X 0 0 )
1 ψ(t) 0
t 0 t 0
称随机变量为X按0分段的计数统计量。即满足 括号里的条件得1,否则得0。
二、计数统计量的应用
n
最常用的计数统计量为 B i i1
符号检验。设随机变量X1,…,Xn是从某个总体X中
思考的要点 什么是计数统计量; 什么是秩统计量,为什么要讨论秩; 为什么要讨论秩的分布、秩的期望和方差; 什么是符号秩和线性符号秩; 线性符号秩的期望和方差。
第一节 关于非参数统计
在参数统计学中,最基本的概念是总体、 样本、随机变量、概率分布、估计和假设检验 等。其很大一部分内容是建立在正态分布相关 的理论基础之上的。总体的分布形式或分布族 往往是给定的或者是假定了的,所不知道的仅 仅是一些参数的值。

《非参数统计分析》(1-8章)教案.doc

《非参数统计分析》(1-8章)教案.doc

.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。

例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni in x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。

王静龙《非全全参数统计分析报告报告材料》课后计算题参考问题详解

王静龙《非全全参数统计分析报告报告材料》课后计算题参考问题详解

王静龙《非参数统计分析》课后习题计算题参考答案习题一1. One Sample t-test for a MeanSample Statistics for xN Mea n Std. Dev. Std. Error 26 1.38 8.20 1.61Hypothesis TestNull hypothesis: Mea n of x = 0Alternative: Mea n of x A= 0t Statistic Df Prob > t0.861 25 0.397695 % Con fide nee In terval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计习题二 1.1S +=13 n =39 H o : me 二 6500: me :: 6500P 〈S 「3l=BINOMDIST(13,39,0.5,1) =0.026625957另外:在excel2010中有公式BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数BINO M 」N V(39,0.5,0.05)=14■v d * rZS +=13" = 13r 1 *广n m *'n""\ m :Eii=0J > CL》jd=sup d * :*2)以上两种都拒绝原假设, 即中位数低于 65001.2BINOM.INV(40,0.5,1 -0.025)=26 d=n-c=40-26=14x 14 二 5800 x 26 二 6400 me = x 20 = 62002.S +=40 n =70 H 0: me =6500: me= 65002P 「S — 40; -2*(1-BIN0MDIST(39,70,0.5,1)) =0.281978922则接受原假设,即房价中位数是 65003.1S +=1552 n =1552 527 二 2079 1 1H o : p 出:p —2 2n 比较大,则用正态分布近似另外:S +=1552 n =1552 527 = 2079I *(1 5 c =inf c : I [12 丿 iI *(1 : m = inf m : — 12丿 m=BINOM.INV(2079,0.5,0.975)=1084则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则r 1 *5、 n m(n xa |m = i nf $ m :[S |[> 1 —— 1 I2 z U 丿 2j . * i -c nz P^S -1552」1039.5-1552+0.5「519.75=5.33E-112nm *zi =0-1 -21 J I n ) a ]实用文档p 的比估计是:1522=0.74651320794.S ” =18154 n =157860H 0 :F 0.906 =H1 : P0.906- 65p =1 -0.906 =0.094 S ~ b(n, p)P fS _18154: -1 -BIN0MDIST(18153,157860,0.094,1) =0因为0〈 0.05则拒绝原假设习题四 1.符号秩和检验统计量:+W =6+8+10+1+4+12+9+11+2+7=70p 值为2P(W +^70 ),当 n=12得5.025=65 所以p 值小于2P W + -65 =0.05 即拒绝原假设2.符号秩和检验统计量:W+=2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p值为2P(W+^234.5,当n=25 得c°.°25=236所以p值小于2P W+-236 =0.05即接受原假设符号检验:+S =18 n =26H 0: me = 0 已:me = 02P〈S _18.;=2*(1-BIN0MDIST(17,25,0.5,1))=0.043285251则拒绝原假设t 检验:t 统计量=0.861 df=25 p=0.3976 接受原假设3.(1)W +=5+2+2=9 n =8 查表可得:00.025 =33 d -n(n 1)c_30.0250.025 '2 2P(W +乞3) =0.05 2P(W + 乞9) 0.05 则接受原假设7070 75 75 75 8080 80 80 80 80 80 85 85 85 8590 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105 105 105 105 110 110 110 110 110 115 115 120AWalsh 平均由小到大排列: 50 55 60 65 65 70 85 9090 90 90 90d =n n 1 /4 -0.5 -U忙./2・.n n 1 2n 1 /24 =27.5-0.5 -1.96 .10 11 21/24 = 7.77101146c =n n 1 /4 0.5 5_一./2.. n n 1 2n 1 /24 =27.5 0.5 1.96、、10 11 21/24 =47.22898853因为c不是整数,则丸介于w(k)与w(k+1)之间,其中k表示比d大的最小整数即为8A九为70与75之间,即为72.5则H-L的点估计为9095%的区间估计为172.5,1051习题五1.122800 25200 26550 26550 26900 27350 28500 28950 29900 30150 30450 30450 30650 30800 31000 31300 31350 31350 31800 32050 32250 32350 32750 32900 33250 33550 33700 33950 34100 34800 35050 35200 3550035600 35700 35900 36100 36300 36700 37250 37400 37750 38050 38200 38200 38800 39200 39700 40400 41000-7p「yP(i,24,25,50) =0.005060988p值很小,则拒绝原假设即认为女职工的收入比男职工的低。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

王静龙《非参数统计分析》(1-8章)教案.引言一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。

例如:分析下面的供应商的产品是否合格?合格产品的标准长度为(8.5±0.1),随即抽取n=100件零件,数据如下:表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.504 8.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506 8.497 8.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.505 8.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.507 8.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.492 8.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.505 8.511 8.502 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.504 8.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.501 8.495 8.461 8.504 8.691经计算,平均长度为cm x 4958.8=,非常接近中心位置8.5cm ,样本标准差为()1047.0112=--=∑=ni i n x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。

%66)1047.04958.84.8()1047.04958.86.8()4.8()6.8()6.84.8(≈-Φ--Φ=-Φ--Φ=≤≤σμσμX P这说明产品有接近三分之一不合格,三分之二合格,所以需要更换供应厂 商,而用非参数分析却是另外一个结果。

以下是100个零件长度的分布表:这说明有90%的零件长度在)2.05.8(±cm 之间,有9%的零件不合格,所以工厂不需要换供应商。

例2 哪一个企业职工的工资高? 表1.3两个企业职工的工资显然,企业1职工的工资高,倘若假设企业1与企业2的职工工资分别服从正态分布),(),,(22σσb N a N ,则这两个企业职工的工资比较问题就可以转化为一个参数的假设检验问题,原假设为b a H =:0,备择假设为b a H >:0 则 ))11(,(~2σnmb a N y x +-- 若0H 为真,则)20()2(~11t n m t nm S y x t w =-++-=其中])()([2112122∑∑==-+--+=ni i m i i wy y x x n m S拒绝域为:}325.1{)}20({90.0≥=≥t t t 检测值为:282.1=t故不能拒绝原假设,认为两企业的工资水平无差异。

也可以用值-P 检验由于1073.0)282.1)20((=≥t P故不能拒绝原假设,认为两企业的工资水平无差异。

这里我们采用的显著性水平为0.1.但这个统计结论与实际数据不相符合。

主要是因为假设工资服从正态分布,这个假设是错误的,用错误的假设结合参数分析自然得出的结论不可靠。

这时候有两种方法处理,一种更换其他分布的假设,二是用非参数数据的方法的分析。

非参数统计如同光谱抗生素,应用范围十分广泛。

参数统计与非参数统计针对不同的情况提出的统计方法,它们各有优缺点,互为补充。

第二章描述性统计§2.1 表格法和图形法表格法主要有列频数分布表和频率分布表例2.1 某公司测试新灯丝的寿命,列表如下:(1)找到最小值43,最大值116;(2)将组数分为5~20组,最小值),分16组,组距为5(最大值组距-对应的直方图为:§2.2 表格法和图形法数值方法主要是用数值来表示数据的中心位置(或者平均大小)和离散程度等。

1 3 5 3 3 1 323 24 4列1平均 2.833333标准误差0.34451中位数 3众数 3标准差 1.193416方差 1.424242峰度-0.20317偏度-0.00713区域 4最小值 1最大值 5求和34观测数12它的平均数,中位数,众数差不多大。

但大部分情况不是这样的,例如:§表2.3 某保险公司赔款样本数据频率分布表0--400 2400--800 32800--1200 241200--1600 191600--2000 102000--2400 62400--2800 32800--3200 23200--3600 13600--4000 1合计100平均数,中位数,众数分别为:1224,1000,600,这三者相差较大。

左峰的时候:众数≤中位数≤平均数,右峰的时候:平均数≤中位数≤众数。

平均数容易受到异常值的影响,故不能很好地代表中心位。

例如某地农户收入增长了2.9%,但减收的农户却是60%,为了更好地反映中心位,所以很α的切尾平均数。

人们熟知的去掉最大值与最小值的平均数也是切尾平均数。

多情况采用%§2.4 经济专业毕业生的月收入数据去掉最大值2340,最小值1700,的切尾平均数比总体平均数要小,它为1924,而总体平均数为1940.但中位数都一样,均为1905,中位数表现了稳定性。

因此我们不仅用平均数表示中心位置,有时候也用中位数描述数据的中心位置。

另外,众数也能用来描述数据的中心位置,尤其是定性数据的中心位置,例如:§2.5 有缺陷的小巧克力不合格品问题的频数频率分布表这种情况下计算平均数和中位数没有多大意义,相反众数为1,众数值得关注。

一般情况,平均数,中位数,众数应该综合考量,这三个数目,使得我们可以从不同角度表达数据的中心位置,给评估对象一个全面的评价,例如:某企业的职工收入的平均数为5700,元,中位数为3000元,众数为2000元,这说明收入2000元的人最多,有一半职工低于3000元,有一半职工高于3000元,平均数5700大于中位数,说明有些员工工资特别高。

平均数与中位数为何可以表示数据的中心位置呢?主要是因为:2121)(min )(∑∑==-=-ni i ani ia x x x (2.1)∑∑==-=-ni iani i a x me x 11min (2.2)这说明用不同的距离标准衡量,平均数与中位数到各点的距离最近。

另外平均数的物理意义还有重心的意义,在重心位置,系统可以平衡,在图2.8处,平均数为4,中位数为3,就意味着把树木集中在3这点,所走的路最短。

* ** ** * * * * * * 1 2 3 4 5 6 7 8 9 中位数 平均数§2.2.2 表示离散程度的数值表示离散程度的数值一般有方差,四分位数,而四分位数又分上四分位数与下四分位数。

为表示数据的离散程度,我们一般用五个数概括,即最小值,下四分位数,中位数,上四分位数,最大值,分别记为.,,,,43210Q Q Q Q Q例如:将12名经济专业毕业生月收入数据处理结果如下:(用Minitab)用统计软件Minitab画箱线图(见图2.9)图2.9四分位数的计算分位数是将总体的全部数据按大小顺序排列后,处于各等分位置的变量值.如果将全部数据分成相等的两部分,它就是中位数;如果分成四等分,就是四分位数;八等分就是八分位数等.四分位数也称为四分位点,它是将全部数据分成相等的四部分,其中每部分包括25%的数据,处在各分位点的数值就是四分位数.四分位数有三个,第一个四分位数就是通常所说的四分位数,称为下四分位数,第二个四分位数就是中位数,第三个四分位数称为上四分位数,分别用Q1、Q2、Q3表示.四分位数作为分位数的一种形式,在统计中有着十分重要的作用和意义,现就四分位数的计算做一详细阐述.一、资料未分组四分位数计算第一步:确定四分位数的位置.Qi 所在的位置=i(n+1)/4,其中i=1,2,3.n表示资料项数.第二步:根据第一步四分位数的位置,计算相应四分位数.例1:某数学补习小组11人年龄(岁)为:17,19,22,24,25,28,34,35,36,37,38.则三个四分位数的位置分别为:Q1所在的位置=(11+1)/4=3,Q2所在的位置=2(11+1)/4=6,Q3所在的位置=3(11+1)/4=9.变量中的第三个、第六个和第九个人的岁数分别为下四分位数、中位数和上四分位数,即:Q1=22(岁)、Q2=28(岁)、Q3=36(岁)我们不难发现,在上例中(n+1)恰好是4的整数倍,但在很多实际工作中不一定都是整数倍.这样四分位数的位置就带有小数,需要进一步研究.带有小数的位置与位置前后标志值有一定的关系:四分位数是与该小数相邻的两个整数位置上的标志值的平均数,权数的大小取决于两个整数位置的远近,距离越近,权数越大,距离越远,权数越小,权数之和应等于1.例2:设有一组经过排序的数据为12,15,17,19,20,23,25,28,30,33,34,35,36,37,则三个四分位数的位置分别为:Q1所在的位置=(14+1)/4=3.75,Q2所在的位置=2(14+1)/4=7.5,Q3所在的位置=3(14+1)/4=11.25.变量中的第3.75项、第7.5项和第11.25项分别为下四分位数、中位数和上四分位数,即:Q1=0.25×第三项+0.75×第四项=0.25×17+0.75×19=18.5; Q2=0.5×第七项+0.5×第八项=0.5×25+0.5×28=26.5;Q3=0.75×第十一项+0.25×第十二项=0.75×34+0.25×35=34.25. 二、资料已整理分组的组距式数列四分位数计算第一步:向上或向下累计次数(因篇幅限制,以下均采取向上累计次数方式计算); 第二步:根据累计次数确定四分位数的位置:Q1的位置 = (∑f+1)/4,Q2的位置 = 2(∑f +1)/4,Q3的位置 = 3(∑f +1)/4 式中:∑f 表示资料的总次数; 第三步:根据四分位数的位置计算各四分位数(向上累计次数,按照下限公式计算四分位数):Qi=Li+fi ×di 式中:Li ——Qi 所在组的下限,fi ——Qi 所在组的次数,di ——Qi 所在组的组距;Qi-1——Qi 所在组以前一组的累积次数,∑f ——总次数. 例3:某企业工人日产量的分组资料如下: 根据上述资料确定四分位数步骤如下: (1)向上累计方式获得四分位数位置:Q1的位置=(∑f +1)/4=(164+1)/4=41.25 Q2的位置=2(∑f +1)/4=2(164+1)/4=82.5 Q3的位置=3(∑f +1)/4=3(164+1)/4=123.75(2)可知Q1,Q2,Q3分别位于向上累计工人数的第三组、第四组和第五组,日产量四分位数具体为:Q1=L1+■×d1=70+■×10=72.49(千克) Q2=L2+■×d2=80+■×10=80.83(千克) Q3=L3+■×d3=90+■×10=90.96(千克) shitouwa4320 2014-10-23§2.2.3 标准误假设产生数据的总体的均值为μ,方差为2σ。

相关文档
最新文档