SPSS17神经网络学习pdf

相关主题

人工神经网络基础

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

SPSS 神经网络TM17.0 – 说明书

建立预测模型的新工具

您的组织需要从复杂多变的业务中发现潜在的模式和联系，做出更好的决定。您可能正在使用SPSS Statistics Base 和它的一个或者几个附加模块来帮助您做这些事情。如果这样，您已经知道了它的强大和多功能性。但是，您可以做得更多。

使用SPSS神经网络，可以帮助您探索数据中微妙或者隐藏的模式。这个附加模块可以帮助您发现数据中更复杂的关系，产生更有效果的预测模型。

SPSS神经网络是对SPSS Statistics Base以及附加模块中传统统计方法的一个补充。您可以使用SPSS神经网络发现数据中间的新关系，然后用传统的统计技术检验其显著性。

SPSS神经网络可以仅仅作为客户端软件安装，但是为了得到更好的性能和扩展性，它也可以与SPSS Statistics Base Sever一起作为Client/Server安装。

为什么要使用神经网络？

神经网络是一个非线性的数据建模工具集合，它包括输入从始至终控制整个过程

SPSS神经网络，包括多层感知器（MLP）或者径向基函数（RBF）两种方法。

这两种方法都是有监督的学习技术－也就是说，他们根据输入的数据映射出关系。这两种方法都采用前馈结构，意思是数据从一个方向进入，通过输入节点、隐藏层最后进入输出节点。你对过程的选择受到输入数据的类型和网络的复杂程度的影响。此外，多层感知器可以发现更复杂的关系，径向基函数的速度更快。MLP可以发现更复杂的关系，而通常来说RBF更快。

使用这两种方法的任何一种，您可以将数据拆分成训练集、测试集、验证集。训练集用来估计网络参数。测试集用来防止过度训练。验证样本用来单独评估最终的网络，它将应用于整个数据集和新数据。

在多层感知（MLP）对话框中，你可以选择你想包含用神经网络技术探索数据的结果可以用多种图形格式

所示的多层感知器，数据前馈式通过输入层、隐藏层传递到输出层。

■ 选项“结构”用来设置神经网络的结构，您可以设定：

– 是否使用自动选择结构– 神经网络的隐藏层个数

– 隐藏层单元之间的激活函数（双曲函数或者S 型函数）– 输出层单元之间的激活函数（标识，双曲, S 型, SoftMax 函数）

特性

多层感知器(MLP)

MLP 通过多层感知器来拟和神经网络。多层感知器是一个前馈式有监督的结构。它可以包含多个隐藏层。一个或者多个因变量，这些因变量可以是连续型、分类型、或者两者的结合。如果因变量是连续型，神经网络预测的连续值是输入数据的某个连续函数。如果因变量是分类型，神经网络会根据输入数据，将记录划分为最适合的类别。

■ 预测

– 因子– 协变量

■ 选项“除外”列出MLP 中需要排除的因子或者协变量。当

因子或者协变量包含大量的变量时，这个选项很有用。

■ 选项“缩放” 对协变量和因变量进行变换

– 因变量 (如果需要变换)：标准化，正态化，调整的正态化，或者无

– 协变量：标准化，正态化，调整的正态化，或者无

■ 选项“拆分”用来设定对当前活动数据集的拆分方法。

训练样本用来训练神经网络、测试集是一个独立的数据集，用来跟踪预测无法来防止过度训练。验证集是另外一个独立的数据集，用来评估最后的神经网络。您可以设定：

– 相对记录数来随机分配训练样本

– 预测值或者分类– 预测的伪概率

■ 选项“输出文件”将神经网络的结构输出保存成包含突

触权重的XML 格式。

径向基函数(RBF)

RBF 程序拟和一个前馈型、有监督学习的径向基函数网络，包括输入层、隐藏层（也就是径向基函数层）、输出层。输入向量通过隐藏层传递到径向基函数。类似MLP ，RBF 可以进行预测和分类。

RBF 程序分两个阶段训练网络：

1．程序通过聚类方法确定径向基函数。以及每个径向基

函数的中心和宽度。

2．估计径向基函数的连接权重。在预测和分类中都使用激

活函数作为均方误差函数。使用普通最小二乘方法求均方误差的最小值。

由于RBF 训练过程分两个阶段，因此,一般情况下，RBF 网络的训练速度优于MLP 。

■ 选项“停止训练”决定神经网络停止训练的规则。您可

以设置：

– 预测误差下降的次数 – 训练时间或者最大训练时间– 最大收敛次数– 训练误差的相对变化率– 训练误差率准则

■ 选项“缺失”用来控制分类变量（因子和分类因变量）

的缺失值是否被作为有效值使用。

■ 选项“打印”指定输出内容，也可以请求一个敏感性分析。您可以设置：– 处理过程设置概要

– 神经网络的基本信息，包括因变量、输入和输出单元个数、隐藏层单元个数、激活函数

– 神经网络输出结果的概要信息，包括：总体平均误差、停止规则、训练时间– 每个分类因变量的分类表

系统需求

■ 软件：SPSS Statistics Base 17.0■ 其他系统需求根据平台有所不同

MLP 和RBF 的选项基本相同，除了以下几个：

■ 如果使用“结构”选项，用户可以指定隐藏层的高斯径

基函数：标准RBF 或者普通RBF

■ 当使用“准则”选项时，用户可以指定RBF 的计算参数，

指定隐藏层单元的交叠方式。