回归中缺失值处理方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在《SPSS统计分析方法及应用》一书中,对时间序列数据缺失处理给出了几种解决方法,可以供我们设计的时候参考:

新生成一个由用户命名的序列,选择处理缺失值的替代方法,单击Change按钮。替代方法有以下几种:

①Series mean:表示用整个序列的均值作为替代值。

②Mean of nearby points:表示利用邻近点的均值作为替代值。对此用Span of nearby points框指定数据段。在Number后输入数值k,以表示缺失值为中心,前后分别选取k个数据点。这样填补的值就是由这2k个数的平均数。也可以选择All,作用同Series mean选项。

“附(邻)近点的跨度”:系统默认的是2,即缺失值上下两个观察值作为范围。

若选择“全部”,即将所有的观察值作为临近点。

③Median of nearby points:表示利用邻近点的中位数作为替代值。数据指定方法同上。

④Linear interpolation:为线性插值法,表示利用缺失值前后两时点数据的某种线性组合进行填补,是一种加权平均。

线性插值法应用线性插值法填补缺失值。用该列数据缺失值前一个数据和后一个数据建立插值直线,然后用缺失点在线性插值函数的函数值填充该缺失值。如果前后值有一个缺失,则得不到缺失值的替换值。

⑤Linear trend at point:为线性趋势值法,表示利用回归拟合线的拟合值作为替代值。

缺失点处的线性趋势法应用缺失值所在的整个序列建立线性回归方程,然后用该回归方程在缺失点的预测值填充缺失值。

*注意:如果序列的第一个和最后一个数据为缺失值,只能利用序列均值和线性趋势值法处理,其他方法不适用。

相关文档
最新文档