统计预测误差

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对统计预测误差的理解和评价

摘要:统计预测误差的来源可归结于统计预测的三个基本要素:信息、方法、判断,并可将其理解为数据的错误,模型的选择偏差和不确定性导致的判断失误,且由前两方面造成的“规范性错误”可加以控制。

关键字:统计预测误差误差来源误差分析

一、对统计预测的基本认识

预测是根据事物的历史资料及现状,运用一定的理论方法,探寻事物的演变规律,并对其未来发展状况作出推断的一种科学推测。而统计预测是建立在预测这个基础上从统计学的角度去研究预测理论和方法的一门学科。简单地说,统计预测就是根据统计信息并运用统计方法去科学地估计未来。因此,我们可以发现统计预测实质上是经历了三个过程:信息、方法、判断,而方法的选择是统计预测中最重要的一个环节,这个方法实际上是让我们从理论认识到模型建立的一个过程,它的重要性在于让我们可以通过模型将未来与现在及过去的统计特征联系起来。

二、统计预测误差存在的必然性

统计预测是一种估算,既然是估算,那么其结果与实际情况就存在着一定的偏差,也即是预测结果不可能完全准确,这个差距就是预测误差。预测误差是个变量,在统计预测中是不可避免的,但我们可以深入研究产生误差的原因,计算并分析误差的大小,将预测误差适当地加以控制,提高预测结果的准确性。统计预测方法分为定性预测方法和定量预测方法,且由于统计学的数量性特征使得统计预测的主体无疑是定量预测,但无论是哪一种,统计预测都要求我们得到一个被量化的结果,这无疑是对我们的预测的准确性有一个很大的要求。从预测中的任何一个环节或者是被要求的一个量化结果来看,其实都是会导致误差存在的一种体现,甚至于说没有一个模型是完完整整正确的、没有一个结果是与实际分毫不差的。因此,也就有了预测学家George Box的那句话:“所有的模型都是错误的,但有些是可用的。”

三、统计预测误差的来源分析

首先我们应该了解误差的来源。从《一个简单类比引发的思考》中,作者由日常生活中驱车旅行这样一个简单的类比来分析模型预测的实际困难,作者认为即使通过地图去规划时间计划,在实际实施起来时也无法完全按照计划行使,因此,预测本身面临很多困难,这些困难导致了预测结果与实际结果的偏差。就驱车旅行而言,作者将这种偏差的来源归结为三方面:一是地图本身可能不准确,二是地图与现实不符,三是意外的发生。生活中很多事情都是可以以小见大的,其实将这样一个简单实例作为统计预测的缩影,我们也能切实地发现统计预测误差的来源。地图的不准确是收集的信息、数据的问题,地图与现实不符实际上可看做是我们选择的模型与所要研究的问题不匹配或者是在模型的选择上还不够准确,而意外的发生则是统计预测中的不确定性、不稳定状态,这种不确定性恰好直接影响了我们的判断。从以上三方面对比来看,这些误差恰好来源于统计预测的三个基本要素:信息,方法,判断,因此也正好说明了误差存在的必然性。根据这三个大的方向去研究误差,我们可以发现误差存在于每一个统计预测的步骤,任何一个细微的改变可能都会导致更大或者更小的误差。

四、统计预测误差的分析与评价

我们将来自信息与方法两方面的误差统称为“规范错误”,既是规范性的错误,那么则是可以允许且可以减小的,而针对由于未来不确定性导致的预测失误则是难以避免的,一旦出现没有预知到的意外,那么统计预测基本原则中的类推性原则则会被破坏,这种结构性的改变会使数据和模型完全不适用,因此我们在这里着重分析来自前两个方面的误差。

统计预测需要的信息,主要是统计数据,特别是定量数据,其中既包含了一手资料得来的数据也包含了二手资料得来的数据,若是要整个统计预测更为精确,那么相比之下一手数据更能为精确性提供保证,而且对于预测我们需要的数据实际是很庞大的,很多时候我们需要某些总体指标,但是现实却不允许,那么我们一般情况下取得这些数据的方法就是抽样调查以样本估计总体,所以信息上的误差就被大量地转移到了抽样误差和估计误差上了,因此我们需要更谨慎地选

Var中,因此择适合的抽样组织形式和进行正确的估计。抽样误差一般体现在()y

我们要通过deff去降低方差以选择最佳抽样方法从而保证数据的准确性,对于估计误差难以避免应选择适合的置信度。

统计预测中方法的选择实际上就是对模型的确定,因此是很重要的一部分。首先我们要知道没有一个模型是完全符合的,我们只需要找到最优的那一个,所以要针对数据和预测目的确定。来自方法的预测误差往往是由偏离数据和目的造成的,例如在回归预测中的最小二乘法其实要求的就是对数据的拟合佳使残差平方和最小,但是如果一味地增加变量以使数据拟合达到最好反而会使变量的增加毫无意义,因此难以达到预测目的。模型的建立是依据理论将信息科学规范化,这种科学性不仅体现在要对症下药,还体现在考虑预测的大环境,比如虚拟变量的影响,周期性的影响等。总的来说,从方法上降低误差的途径就是选择最优模型,其基本准则是:符合预测对象特点,符合统计资料规律,在保证精度条件下最简便。

相关文档
最新文档