异常值点对单位根检验的致命影响

合集下载

异常值的检验方法和判断标准

异常值的检验方法和判断标准

异常值的检验方法和判断标准1. 引言1.1 异常值的重要性异常值在数据分析中扮演着至关重要的角色,它们可能会对我们的分析结果产生影响,甚至导致我们做出错误的决策。

正确地检测和处理异常值至关重要。

异常值可能会影响我们对数据集的整体分布的理解。

如果数据中存在异常值,那么数据的均值、方差等统计量可能会被扭曲,从而误导我们对数据的解读。

通过寻找和排除异常值,我们可以更准确地描述数据的特征。

异常值也可能会影响我们建立的统计模型的准确性。

在一些情况下,异常值可能会对模型参数的估计造成严重偏差,从而影响我们对数据的预测能力。

及时发现和处理异常值可以提高我们建立的模型的质量。

1.2 异常值的定义异常值是指在数据集中与其他观测值明显不同的数值,它们可能是由于测量误差、数据录入错误或者真实现象导致的极端数值。

异常值在数据分析中具有重要性,因为它们可能对统计分析和模型建立产生影响,导致结果不准确或失真。

异常值的存在会影响数据的分布、均值和方差等统计性质,因此在数据处理和分析过程中需要进行检测和处理。

通常情况下,异常值可以通过与数据的整体分布进行比较来确定,例如通过绘制箱线图、直方图或散点图等可视化方法来识别异常值。

除了可视化方法外,统计学方法如Z-score、IQR等也常用于检测异常值。

机器学习方法如聚类分析、异常检测算法等也可以用来识别异常值。

专家经验在实际数据处理中也是重要的,经验丰富的专家可以通过直觉和经验判断数据中的异常值。

异常值在数据分析中起着重要作用,正确的检测和处理异常值可以确保数据分析结果的准确性和可靠性。

在实际应用中,我们需要综合考虑不同的方法来识别异常值,并根据具体情况选择合适的处理方法。

2. 正文2.1 可视化方法可视化方法是一种直观、直觉的异常值检验方法,通过图形展示数据的分布情况,可以帮助我们识别异常值。

常用的可视化方法包括箱线图、散点图、直方图等。

箱线图是一种常用的可视化方法,可以直观地展示数据的中位数、四分位数和异常值情况。

实验结果的异常值与偏离度分析

实验结果的异常值与偏离度分析

实验结果的异常值与偏离度分析实验结果的异常值一直是科学研究者和实验室技术人员关注的焦点之一。

异常值的存在可能会导致数据分析的不准确性,进而影响科学研究的可靠性和推广性。

因此,对实验结果的异常值进行分析和处理是十分必要的。

一、异常值的定义和分类异常值是指在一组数据中与其他数据明显不符的观测值。

对于实验结果而言,异常值通常可以分为两类:正常异常和特殊异常。

正常异常是指在一定范围内出现的一些偏离正常分布的观测值,可能是由于随机误差或系统性因素引起的。

这些异常值对于整体数据的分析结果影响较小,可以接受或进行适当的调整。

特殊异常是指与正常分布存在明显差异的观测值,可能是由于实验操作错误、设备故障或其他外界干扰引起的。

这些异常值对于整体数据的分析结果影响较大,需要进行深入研究和处理。

二、异常值的分析方法1. 箱线图法箱线图是一种常用的探测异常值的方法。

它通过绘制数据的最大值、最小值、中位数和上下四分位数,以箱子的形式展示数据的分布情况。

通过观察箱线图可以发现是否存在异常值。

2. Grubbs检验法Grubbs检验法是一种基于统计学原理的异常值检测方法。

它通过计算观测值与平均值之间的差异,判断是否存在明显的异常值。

该方法可用于检测单个异常值或多个异常值。

3. 3σ原则3σ原则是一种常用的异常值判断方法。

它基于正态分布的假设,认为大部分数据会分布在平均值附近,并通过计算数据与平均值的偏离程度,判断是否存在异常值。

3σ原则一般认为,偏离平均值3倍标准差之外的数据可以被视为异常值。

三、异常值的处理方法针对异常值的处理方法因实际情况而异,需要根据具体实验和研究目的进行权衡和选择。

常见的处理方法包括:1. 删除异常值当异常值对整体数据的影响较大且无法排除干扰因素时,可以考虑删除异常值。

但删除异常值需要慎重,应充分考虑异常值的产生原因,避免因删除影响数据的真实性和完整性。

2. 替换异常值当异常值不是由于实验操作错误或设备故障引起时,可以考虑将其替换为合理的数值。

异常值的判断方法

异常值的判断方法

异常值的判断方法一、背景介绍在数据分析中,异常值是指数据集中与其他数据点明显不同的值。

它们可能是由于测量错误、数据输入错误或真实的异常情况导致的。

判断和处理异常值是数据分析和建模的重要步骤,因为它们可能会对结果产生重大影响。

二、异常值的影响异常值对数据分析和建模有以下几种影响:1. 异常值可能导致偏差。

如果一个样本中存在一个极端值,它可能会使整个样本偏离正常分布。

2. 异常值可能影响统计结果。

例如,平均数和标准差等统计量受极端值的影响较大。

3. 异常值可能导致模型不稳定。

当使用线性回归等模型时,极端值可能导致拟合不良或过拟合。

三、判断异常值的方法1. 统计方法统计方法是最常用的判断异常值的方法之一。

以下是几种统计方法:(1)Z-score 方法:Z-score 表示一个观测点与平均数之间的距离,以标准差为单位。

如果一个观测点的 Z-score 大于 3 或小于 -3,则可以将其视为异常值。

(2)箱线图法:箱线图可以用来检测数据的分布情况,以及是否存在异常值。

箱线图的上边缘、下边缘和中位数可以用来确定异常值。

(3)Grubbs' Test 方法:Grubbs' Test 是一种基于极差的统计方法,它可以用来检测单个异常值。

该方法假设数据服从正态分布,并计算出一个极端值与其他值之间的距离,如果这个距离超过了某个阈值,则将其视为异常值。

2. 可视化方法可视化方法是另一种常用的判断异常值的方法。

以下是几种可视化方法:(1)散点图法:散点图可以用来检测数据点之间是否存在异常值。

如果一个数据点远离其他数据点,则可能是一个异常值。

(2)直方图法:直方图可以用来检测数据分布情况,以及是否存在异常值。

如果直方图中存在一个或多个高峰,则可能存在异常值。

(3)密度图法:密度图可以用来检测数据分布情况,以及是否存在异常值。

如果密度图中存在一个或多个高峰,则可能存在异常值。

四、处理异常值的方法处理异常值有以下几种常见方法:1. 删除删除是最简单、最常见的处理异常值的方法之一。

稳健统计方法在异常值分析中

稳健统计方法在异常值分析中

稳健统计方法在异常值分析中异常值(Outlier)是指在数据集中与其他观测值显著不同的数值,可能是由于测量误差、数据录入错误或者真实的特殊情况所导致。

在数据分析中,异常值的存在会对统计结果产生较大影响,因此异常值的检测和处理是数据分析中一个重要的环节。

稳健统计方法是一种能够有效应对异常值干扰的统计分析方法,本文将探讨稳健统计方法在异常值分析中的应用。

一、异常值的影响异常值的存在会对数据分析结果产生较大的影响,主要表现在以下几个方面:1. 对均值的影响:异常值往往会使得样本均值产生较大偏移,导致对总体均值的估计产生误差。

2. 对方差的影响:异常值会增加样本方差的大小,使得对总体方差的估计不准确。

3. 对回归分析的影响:在回归分析中,异常值会对回归系数的估计产生较大影响,导致回归模型的拟合效果不佳。

因此,及时准确地检测和处理异常值对于保证数据分析结果的准确性和可靠性至关重要。

二、稳健统计方法的特点稳健统计方法是一种能够在数据中存在异常值的情况下依然能够产生可靠结果的统计方法。

其主要特点包括:1. 对异常值具有鲁棒性:稳健统计方法能够有效地减少异常值对统计结果的影响,保证统计分析的稳定性和准确性。

2. 不依赖于数据分布的假设:稳健统计方法通常不对数据的分布做出假设,能够适用于各种类型的数据。

3. 适用范围广泛:稳健统计方法在回归分析、方差分析、聚类分析等领域都有广泛的应用。

三、稳健统计方法在异常值分析中的应用1. 中位数与四分位数:中位数和四分位数是稳健统计方法中常用的统计量,它们不受异常值的影响,能够更好地反映数据的集中趋势和离散程度。

2. 离群值检测方法:基于距离或密度的离群值检测方法能够有效地识别异常值,如基于箱线图、Z分数、LOF(局部离群因子)等方法。

3. 稳健回归分析:稳健回归方法能够有效地降低异常值对回归系数估计的影响,提高回归模型的拟合效果。

4. 稳健方差分析:在方差分析中,采用稳健方差分析方法能够减少异常值对方差分析结果的影响,提高统计检验的准确性。

统计调查方案设计如何处理调查数据的异常值

统计调查方案设计如何处理调查数据的异常值

统计调查方案设计如何处理调查数据的异常值统计调查是收集和分析数据以了解特定问题或现象的过程。

然而,在处理大量数据时,异常值的存在可能会对结果产生不良影响。

因此,设计一个合适的统计调查方案来处理调查数据的异常值至关重要。

本文将就如何处理调查数据的异常值进行探讨。

一、异常值的定义和识别异常值是指与其他数据点明显不同的观测值,可能是由于测量误差、数据录入错误或样本独特性等原因导致。

在识别异常值时,可以采用以下方法:1. 箱线图法:通过绘制箱线图,识别数据离群点,离群点可以被视为异常值。

2. Z-score标准化法:通过计算每个数据点与平均值的标准差之间的距离,超出一定范围的数据被标记为异常值。

3. 专家判断法:根据领域专家的知识和经验,判断某些观测值是否属于异常值。

二、异常值的处理方法一旦异常值被识别出来,接下来需要选择合适的处理方法。

以下是几种常见的异常值处理方法:1. 删除异常值:如果异常值对整体分析结果影响较大或者异常值的出现确实是由于录入错误等原因导致的,可以选择删除这些异常值。

2. 修正异常值:通过使用合适的方法对异常值进行修正,使其更接近于其他数据点的取值,从而减小其对结果的影响。

3. 分组处理:将数据分成不同的组,对每个组内的异常值采取不同的处理方式,如用中位数替代异常值。

三、异常值处理方案的选择选择适合的异常值处理方案需要考虑多个因素,其中包括数据的性质、异常值产生的原因以及异常值对结果的影响程度等。

以下是几个指导原则:1. 保留异常值:某些情况下,异常值可能包含有用的信息,删除或修正这些值可能导致信息的丢失。

因此,在进行异常值处理时,需要先考虑异常值对研究问题的影响。

2. 多种处理方法结合:不同的异常值处理方法在不同的情况下可能有不同的效果,因此可以尝试多种处理方法并比较它们的结果,选择效果最好的处理方法。

3. 异常值检验的可靠性:异常值的识别和处理要建立在可靠的统计方法和分析技术的基础上,以避免对结果产生误导。

数据预处理中的异常值检测及处理方法

数据预处理中的异常值检测及处理方法

数据预处理中的异常值检测及处理方法在数据预处理的过程中,异常值的检测和处理一直是一个十分重要的步骤。

因为异常值的存在会对数据分析产生极大的影响,甚至会导致结果的不准确。

因此,在进行数据预处理时,必须要进行异常值的检测和处理。

本文将对异常值的检测和处理方法进行介绍。

一、异常值的定义异常值指的是数值数据中与其他相对应的数据有显著差异的数值数据点。

这些数据点通常是由于操作过程中的偶然误差或测量误差所引起,而不是由于真实数据特征所引起的数据点。

异常值通常表现为与其他数据点相比较极端的数据点,极值和缺失值也可能被认为是异常值。

二、异常值的检测方法1.基于统计方法的异常值检测基于统计方法的异常值检测通常使用数据的均值、方差等统计量和分布来判断数据的异常程度。

常见的检测方法有Z-score统计量法、箱线图法等。

Z-score统计量法:以数据的均值为中心,计算每个数据值与均值的偏离程度,如果数据点的绝对偏差高于某个设定的阈值,则认为该数据点是异常值。

箱线图法:以数据的四分位数为基础,通过定义异常值的阈值来识别异常值。

箱线图被描述为一个带状图,其中中间的矩形代表数据的四分位数,矩形上下两端代表着数据集的上下限。

而在这两端之外的数据点则被认为是异常值。

2.基于机器学习的异常值检测机器学习算法在异常值检测中的应用越来越广泛。

常见的算法包括基于聚类的异常值检测、基于距离的异常值检测等。

基于聚类的异常值检测:将数据集分为通常数量的类别,然后计算每个数据点与其所属类别的距离,并将距离值与类别内所有数据点之间的平均距离进行比较。

如果距离很大,则数据点被认为是异常值。

基于距离的异常值检测:使用距离衡量数据点之间的相似性。

在一些情况下,数据点之间距离很远可能被认为是异常值。

三、异常值的处理方法在检测到异常值后,应该考虑如何处理这些异常值。

处理异常值的方法包括重构、删除等。

1.重构异常值重构异常值是将异常值替换为预处理后的数值。

例如,可以使用平均值或中位数来替换异常值。

异常值对计量建模影响的典型案例

异常值对计量建模影响的典型案例
o les,e pe ily t aa ta k o mul c lj e rt e t g,s ra o rl t n tsi g,heeo c d siiy tsig a d u t ut r i s c al hef tla tc st t oln a j tsi i y n e ilc reai e tn o tr s e a t t e tn n ni c
点群 。
二 、 常 值 对 复 共 线 性 关 系 检 验 的 异 影 响 案 例
复共线 性关 系是经济 计量建模 中最值 得关 注的
本 文 获 国 家 自然 科 学 基 金项 目“ 于 资 产 价 格 波 动 的 扩 展 货 基 币政 策规 则 构 建 及 其 仿 真 研 究 ” 78 3 1 、0 8年 度 教 育 部 回 国 (0 7 05)2 0 人员 科 研 启 动 金 项 目“ 产 价 格 波动 对 货 币政 策规 则 影 响 的 实 证 研 资 究 ” 教外 司 留 [0 8 80号 )2 0 ( 20 ]9 、0 9年 度 东 北 财 经 大 学 社 会 与行 为 跨 学 科 研 究 中 心核 心 项 目“ 会 科 学 跨 学科 定 量 方 法研 究 ” 20 社 、0 9年
的标 准 范 式 检 验 。 然 而 , 们 在 使 用 计 量 模 型 进 行 人
值对 复共线 性关 系检验 、 列相关 性检验 、 序 异方差性 检验 、 单位 根检验 等 经济 计量 检 验 产生 致命 影 响 的
典型案 例 , 为经济计 量 学 的教 学 与相 关 建模 理论 研
究提供 有说 服力 的数 据 资料 , 望获 得 抛砖 引 玉 的 期
The Ty c lEx m p e f I fue e o h o o e r c pi a a lso n l nc n t e Ec n m t i

如何应对实验数据分析中的异常值与离群点

如何应对实验数据分析中的异常值与离群点

如何应对实验数据分析中的异常值与离群点在实验数据分析中,异常值与离群点是常见的问题,它们可能会对数据的准确性和可靠性产生负面影响。

因此,对于这些异常值与离群点的处理是非常重要的。

本文将探讨如何应对实验数据分析中的异常值与离群点,帮助读者更好地理解和处理这些问题。

1. 什么是异常值与离群点在开始讨论异常值与离群点的处理方法之前,我们首先需要明确什么是异常值与离群点。

异常值是指与其他观测值明显不同的数据点,它们可能是由于测量误差、数据录入错误或者实验条件变化等原因导致的。

离群点则是指与大部分观测值相距较远的数据点,它们可能是由于实验中的特殊情况或者异常事件引起的。

2. 异常值与离群点的影响异常值与离群点对数据分析的影响是不可忽视的。

首先,它们可能会导致数据的偏差,从而影响到对实验结果的准确性和可靠性的判断。

其次,异常值与离群点也可能会对统计模型的建立和参数估计产生不良影响,从而影响到对数据的解释和预测能力。

3. 如何检测异常值与离群点在处理异常值与离群点之前,我们需要先进行检测。

常见的异常值与离群点检测方法包括:3.1 统计方法:通过计算数据的均值、方差、标准差等统计指标,可以判断是否存在异常值与离群点。

例如,可以使用箱线图、Z分数、T分布等方法来检测异常值与离群点。

3.2 可视化方法:通过绘制散点图、直方图、密度图等图形,可以直观地观察数据的分布情况,进而判断是否存在异常值与离群点。

3.3 基于模型的方法:通过建立合适的统计模型,可以对数据进行拟合和预测,从而判断是否存在异常值与离群点。

例如,可以使用回归模型、聚类模型等方法来检测异常值与离群点。

4. 如何处理异常值与离群点一旦检测到异常值与离群点,我们需要对其进行处理。

常见的处理方法包括:4.1 删除:对于明显的异常值与离群点,可以选择直接删除。

然而,删除数据可能会导致样本量的减少,从而影响到数据的分析结果。

因此,在删除之前需要仔细考虑。

4.2 替换:对于不明显的异常值与离群点,可以选择用其他合理的数值进行替换。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键词: 单位根检验;协整建模;异常值点;强影响点;Cook 距离 中图分类号:C8 文献标识码:A 文章编号: 1000-2154(2009)01-0076-08
一、引 言
协整理论是当代经济计量学发展中最具代表性的、具有里程碑意义的创新成果。协整理论自 Granger (1981)[1],Engle and Granger(1987)[2]提出以来,已经成为世界各国经济学家分析经济变量之间结构均衡关 系的标准方法。尤其是以 2003 年 Granger 与 Engle 共同获得诺贝尔经济学奖为标志,早期提出的以线性为 特征的线性协整理论已经基本趋于成熟,形成一整套标准的、甚至是固定的建模程序和步骤。近十几年来, 经济计量学家大多致力于拓展线性协整理论的研究,并将注意力转移到非线性协整理论、Panel Data 协整 理论、拟协整理论、结构变动协整理论、协整 P—T 分解技术、分形协整理论、季节协整理论、非参数协整理 论、半参数协整理论等领域,并取得了极为丰富的、深刻的研究成果,更好地应用到国民经济结构分析与政 策行为模拟和预测,有效地指导了经济和社会实践。然而,也有一部分专家、学者致力于传统协整模型的稳 健性研究,尤其关注异常值、均值漂移、方差革新扰动及方差结构变化等对协整建模的影响。这是对传统协 整 理 论 的 进 一 步 完 善 和 深 化 ,同 时 也 开 辟 了 现 代 协 整 理 论 研 究 的 新 方 向 — — — 协 整 诊 断 理 论 , 它 不 仅 涵 盖 传 统的线性协整理论,而且也适用于上述现代协整理论。这是一个亟待开发的领域,它是绚丽多姿的协整理 论百花园中重要的一员。
验统计量并不非常 t 分布,而是服从一个非标准的极限分布,检验所用的临界值随样本容量及是否包含常
数项、趋势项、哑变量等而有所变化,由随机模拟的方法获得,较早由文献 Davidson and MacKinnon
(1993)[26],Fuller (1976)[24]给出,现在已经在计量经济学软件中得到普及。
78
商业经济与管理
2009 年
二、单位根检验的模型分析框架
目前,ADF 检验是一种得到普遍认可的单位根检验方法,由 Fuller(1976) , [24] Dickey and Fuller (1979)
提 [25] 出和发展。它所依托的模型如下:
p-1
Σ*
△yt =Φyt-1 + αj △yt-j +ut
第 1 期 总第 207 期 2009 年 1 月
商业经济与管理 JO商URN业AL 经OF B济USIN与ESS管ECO理NOMICS
No . 1 Vol. 207
Jan2. 0200909年
异常值点对单位根检验的致命影响
赵进文 1,2
(1. 东北财经大学 统计学院,大连 116025;2. 中国人民大学 应用统计科学研究中心,北京 100872)
残差序列为:
这里,
,而

为考察残差序列的自相关性,需要进行Portmanteau 检验。该检验所对应的原假设和备择假设为:
ห้องสมุดไป่ตู้
对至少一个 i=1,…,h 成立。
这里, 和 LBh 来检验:
表示残差序列的自相关系数。该对假设可以通过如下两个检验统计量 Qh

这里,
。若用 表示由估计所得 ARMA(p,q)模型获取的残差,则在原假设成
摘 要: 单位根检验是协整建模及误差修正分析的基础与前提。 单位根检验结果是否可 信,直接影响后续的协整建模过程,从而影响变量之间长期的结构均衡关系,以及短期的误差修 正机制。事实上,单位根检验对样本异常值点十分敏感,从而容易导致检验结果的不稳定。与现 有大多文献中的模拟数据不同,本文以实例给出了这样一个强有力证据:即使是单个异常值点, 也可以对单位根检验产生致命的攻击。同时,比较了不同单位根检验方法对异常值点影响的敏 感度。最后,建议了一种诊断单位根检验强影响点的预识别方法。
此 外 , 趋 势 结 构 变 动 点 往 往 是 异 常 值 点 , 因 而 也 会 强 烈 地 影 响 单 位 根 检 验 与 协 整 检 验 。Perron (1989,1990,1993)[20][21][22],Perron 和 Vogelsang (1992)[10]相继发展了结构变动点存在且时刻已知时的有效 单位根检验方法。这些检验允许变动发生在水平漂移、斜率,或者二者兼有的情况,甚至允许变动发生在 AO 类异常和 IO 类革新异常变动情形。不过,Christiano (1992) 注 [23] 意到,这些检验并不适合这样的情况: 变动发生时刻的确定是由建模者对数据进行分析后而人为选定的。因此,变动日期的确定对单位根检验与 协整检验的影响问题仍然没有得到彻底解决。近年来的研究发现,在模型中引入哑变量,可以有效地改善 结构变动和异常值点对单位根检验与协整检验的影响, 但这种方法同样也存在人为设定哑变量节点的问 题。
与现有以随机模拟为主要手段研究单位根与协整检验诊断的文献不同, 本文综合应用统计诊断的分 析工具— ——Cook 距离、杠杆值、WK 统计量等影响度量,预识别出了美国脂肪数据实例中的异常值点,尔后 以此为基础,进一步进行了单位根检验。分析表明,该实例给出了这样一个强有力证据:即使是单个异常值 点,也可以对单位根检验产生致命的攻击。基于此研究,我们首次建议了一种诊断单位根检验强影响点的 预识别方法。
此外,在本检验中,关于序列 yt 的滞后差分阶数的确定,非常值得关注,它直接影响单位根检验的结
果。通常,滞后差分阶数由模型选择准则(例如 AIC 准则、BIC 准则、SC 准则等)或序贯检验程序来确定。
为 评 价 该 检 验 的 有 效 性 ,还 需 要 进 行 一 些 残 差 分 析 。用 表 示 模 型 (1)下 对 应 的 残 差 序 列 ,相 应 的 标 准 化
第1期
赵进文: 异常值点对单位根检验的致命影响
77
性水平下,这些少数异常值的存在与否,将直接决定是拒绝、还是接受原假设,这时,协整建模以及误差修 正分析的结果将变得不再可信。这类协整模型通常称为“伪协整模型”或“虚协整模型”,相应的误差修正模 型则称为“伪误差修正模型”或“虚误差修正模型”。这种能够左右假设检验结果的少数异常值点,我们称之 为 检 验 强 影 响 点 或 点 群 (赵 进 文 ,1994a,1994b ,2000)[3][4][5]。
在无条件异方差的原假设 H0 成立下,该检验统计量渐近服从 χ2(q)分布。 再次,需要对残差序列进行正态性检验,即进行 Jarque-Bera 检验。对应的原假设和备择假设为:

vs.

第1期
赵进文: 异常值点对单位根检验的致命影响
(1)
j=1
相应的原假设和备择假设为:
H0 ∶ Φ = 0 vs. H1 ∶ Φ < 0
该检验基于模型(1)下系数 Φ 的 OLS 估计所服从的 t 统计量。若 t 统计量值小于相应的临界值,则拒
绝原假设 H0,认为序列 yt 是平稳的。若 H0 成立,则序列 yt 有单位根,从而是非平稳的。需要指出的是,该检
事实上,尽管协整理论多姿多彩,有各种不同的分类,但它们之间有一个核心的联系纽带,这就是假设 检验。不同的协整模型可以有不同的参数(函数或泛函)估计,但它们是否合理,在多大程度上是合理的,归 根结底要通过假设检验来判定。这样,一旦假设检验的结果受到少数异常值的致命影响,也即在同一显著
收稿日期: 2008 - 10 - 23 基金 项 目: 国 家 自 然 科 学 基 金 项 目 (70873015;70473012);教 育 部 人 文 社 会 科 学 重 点 研 究 基 地— ——中 国 人 民 大 学 应 用 统 计 科 学 研 究 中 心 重 大 项 目 (05jjd910153);辽 宁 省 高 等 学 校 优 秀 人 才 支 持 计 划 (辽 教 发 [2006]124 号 )以 及 2008 年 度 教 育 部回国人员科研启动金项目联合资助。 作者 简 介: 赵 进 文 (1964 - ),男,山 西 榆 社人 ,东 北 财 经 大 学 统 计 学 院 特 级 教 授 ,博 士 生 导 师 ,博 士 后 合 作 导 师 ,经 济 学 博士(后),主要从事经济计量学、模型诊断、稳健建模、宏观经济政策分析、统计学、数学等方面研究。
在传统回归模型下研究检验强影响点的诊断方法、影响评价、信息识别、稳健处理方法等,已经积累了 大量的学术文献。例如,Cook and Weisberg(1982)[6],Huber(1981)[7],韦博成,鲁国斌,史建清(1991)[8],赵进 文(2000,2004) 等 [5][9] 等。然而,在协整模型下研究检验强影响点的诊断方法、影响评价、信息识别、稳健处 理方法等,则是最近十来年的事,并且,进展相当缓慢。这主要是由于协整模型的结构和影响机理错综复 杂,完全不同于传统的回归模型。文献 Perron and Vogelsang(1992)[10]比较早地研究了单变量单位根检验受 均值水平漂移及异常值影响的情况。Lucas (1995a,b)[11][12],Franses and Haldrup(1994)[13]指出,如果异常观 测值以孤立异常点(AO)存在时,则拒绝单位根的检验将是有偏的,并且,AO 异常点会严重影响实际的协 整分析。他们采用蒙特卡洛方法展现了 Johansen 协整检验的实际不足,这些不足明显超过那些没有异常值 点的情况。因此,在异常值点存在的情况下,使用标准临界值会导致虚假协整的检验结论。为降低异常值点 对单位根检验、协整检验的影响,Lucas(1997) 基 [14] 于非高斯伪似然函数,建议了一种 Johansen—型检验程 序,比较有效。Franses and Lucas(1998) 利 [15] 用 Johansen—型检验程序研究了协整分析中的异常值点探测 问题,发展了一种新的基于异常值点稳健协整检验的诊断工具,该方法的一个重要特征是能够识别非典型 事件出现的大致日期。Lee and Strazicich (1999) 通 [16] 过随机模拟方法研究了革新异常值点(IO)对协整检 验的影响,估计了突变点的可能发生日期及可疑的检验 拒绝问题 。Leybourne and Newbold (2000)[17],Kim et al. (2000)[18] 讨论了 Dickey-Fuller 型检验和 PP 检验的渐近分布受异常值点及样本容量的影响情况。 Harvey, D.I., Leybourne, S.J. and Newbold, P. (2001) 研 [19] 究了具有内生确定的水平变动下革新异常(IO)对 单位根检验的影响问题。
相关文档
最新文档