(时修改)兰)中_文_摘_要

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

摘要

本文主要介绍线性模型的数据变换以及相应的参数估计和假设检验方法。第一章主要介绍了数据处理方法的背景及其方法,并进一步阐述数据处理方法的方差稳定化变换和线性化变化方法。第二章主要介绍了数据处理方法的因变量Box-Cox变换方法,研究了Box-Cox变换下的线性模型中的参数进行了估计。第三章是在第二章的基础上对其参数估计进行假设检验,利用似然比统计量和score统计量以及Atkinson检验统计量进行数据变换模型的假设检验。第四章系统研究了数据变换模型的统计诊断,研究了模型的影响分析,并推导除了数据删除模型的参数估计公式,证明了数据删除模型(CDM)与均值漂移模型(MSOM)的等价性。

关键词:Box-Cox变换; 线性模型; 诊断;参数估计

Abstract

试试事实上

Keywords: Box-Cox transform; linear model; diagnosis; parameter estimation

目录

摘要............................................................................................................. I ABSTRACT ............................................................................................. II 目录........................................................................................................ I II 第1章绪论 . (1)

1.1问题的提出 (1)

1.2国内外研究现状 (2)

1.3本文的主要工作 (3)

第2章线性模型的参数估计 (4)

2.1B OX-C OX变换 (4)

2.2变换参数的极大似然估计和算法 (4)

2.3自变量的变换及双边变换 (7)

2.3.1极大似然估计 (7)

2.3.2A TKINSON估计 (8)

第3章线性模型的假设检验 (9)

3.1似然比统计量 (9)

3.2SCORE统计量 (10)

3.3A TKINSON统计量 (11)

第4章数据变换模型的统计诊断 (11)

4.1诊断模型分析 (12)

4.2基于数据删除模型的诊断方法 (13)

4.3基于A TKINSON模型的诊断方法 (16)

4.3自变量变换模型的统计诊断 (17)

基于数据删除模型的广义C OOK距离 (18)

基于数据删除模型的似然距离 (19)

第5章线性模型数据变换统计诊断实例 (24)

5.1雪雁模型 (24)

参考文献 (28)

第一章 绪 论

随着现代科学技术的迅猛发展,统计分析理论也在不断的发展和完善。在

统计分析过程当中,建立数学模型是一个十分重要的研究课题,如炼钢厂的工

程师希望有一个炼钢过程的数学模型,以实现计算机自动控制;气象研究工作

者要根据气压、雨量、风速的数学模型来预报天气;从事城市规划工作的专家

们更需要建立一个包括人口、交通、能源、污染大系统的数学模型,为领导者

做出城市发展规划决策提供可靠的科学依据。在复杂系统中,具有很多不确定

的因素,建立数学模型时经常使用概率统计模型;从而统计推断方法成为统计

分析中极其重要的分析方法。通常人们习惯应用回归分析的手段来处理这类问

题。回归分析的理论及方法发展得非常快,它不仅已成为统计学的一个重要分

支,而且也被人们广泛地应用也各个领域。随着回归分析理论的不断发展,线

性回归模型已成为目前重要的研究课题。其中对数据的处理方法尤其显得重

要。本章第一节主要阐述数据处理的方法及背景;第二节则简要介绍关于上述

数据处理方法下的模型的研究现状。

1.1问题的提出

统计诊断就是对从实际问题中收集起来的数据和提炼出来的模型以及由此

出发所作的推断方法的合理性进行深入细致的分析,并通过一些诊断统计量来

检查数据、模型及推断方法中可能存在的“毛病”,进而提出“治疗”方案。

在几乎所有的统计诊断问题中,都将涉及到两个基本概念:异常点和强影响

点。面对诊断后的数据,我们应当采取有效的“治疗”措施。近年来的实践证

明,数据变换是处理有问题数据的一种好方法,它对许多数据都是行之有效

的,特别是对异常点较多的模型,其效果更佳。

给定一组数据若,,,1),,(n i x y T

i i =用模型εβ+=X Y 进行拟合,则要求

数据满足以下条件:

1) 线性条件,即因变量的数学期望和为之参数之间具有线性关系:βX y E =)(;

2) 方差齐性,即误差项),0(~2I σε;

3) 正态性,在某些情况下要求ε服从正态分布),0(2I N σ;

其中T p T n T n y y Y ),,(,),,(,),,(1011-===βββεεε 。X 为p n ⨯阶满之矩

阵,其第i 行为),,,1(11-ip i x x 。

如果某些数据不全部满足上述三个条件,它们之中就可能出现异常点。如

果异常点较多,就不能坚定地加以删除,必须对数据和模型本身进行研究。实

践证明,通过数据变换能找出更合适的新的回归模型,在该回归模型中,原来

的异常点(或至少大部分异常点)将变为正常点。

数据变换的方法有很多种,但它们大致可划分为两大类,一类为方差稳定

化变换和线性变换。它们的共同特点是,通过数据的实际背景或残差分析等方

法,可以大致确定因变量的方差或期望与自变量的函数关系,对于一些特殊的

函数关系,可以对因变量或自变量进行相应的变换,使得变换后的数据能满足

上述的三个条件。另一类为数据的Box-Cox 变换对许多实际数据都是行之有效

的,它可以明显地改进数据的异方差性、非对称性和非正态性。该变换在各方

面得到广泛的应用,至今仍是许多统计学家十分关心的课题。

1.2 国内外研究现状

统计诊断是七十年代中期才发展起来的一门统计新分支。它以强烈的应用

背景、新颖的统计思想、广泛的研究内容和丰富的实际成果在广大统计工作者

面前展现出一个理论与应用结合的崭新领域。统计学的出发点是一个数据集,

该数据集往往是根据在实际工作中逐步积累起来的历史资料或围绕某一特定目

标收集起来的数据,经初步加工整理而成。为了通过数据集研究实际问题,通

常的做法是把它纳入某一方便有效的统计模型进行研究。但是,全体统计模型

都只能是对客观过程的一种近似描述,它不可避免地包含某些假定,甚至模型

本身也是也是一种假定。人们自然有理由要问:我们选择的模型能不能大体上

反映所要研究的实际问题?它是否与数据集中集大多数的数据相一致?我们所

得到的数据集中会不会有个别数据由于收集或整理过程中的疏忽和失误或其他

种种原因而出现较大的误差?另外,数据集中各个数据点对我们进行统计诊断

相关文档
最新文档