支持向量机(SVM)原理及应用概述分析

合集下载

简述支持向量机的原理与应用范围

简述支持向量机的原理与应用范围
支持向量机（Support Vector Machine，SVM）是一种常见的监督学习算法，主要用于分类和回归问题。

它在机器学习领域有着广泛的应用。

原理：
支持向量机的核心思想是找到一个最优的超平面，将不同类别的样本点尽可能地分开。

其基本原理可以概括为以下几个步骤：
1.将样本点映射到高维空间中，使得样本点在新的空间中能够线性可分。

2.在新的空间中找到一个最优的超平面，使得离该超平面最近的样本点到该
超平面的距离最大化。

3.根据最优的超平面进行分类或回归预测。

应用范围：
支持向量机广泛应用于以下领域：
•文本分类：支持向量机可以根据文本的特征将其分类为不同的类别，常用于垃圾邮件过滤、情感分析等任务。

•图像识别：支持向量机可以通过学习图像的特征，实现图像的分类和识别，常用于人脸识别、物体识别等任务。

•生物信息学：支持向量机可以用于基因表达数据的分类和预测，帮助研究人员理解基因功能和疾病机制。

•金融预测：支持向量机可以根据历史数据对股票价格、汇率等进行预测，用于金融市场的决策和交易。

•异常检测：支持向量机可以通过学习正常样本的特征，检测异常样本，常用于网络入侵检测、信用卡欺诈检测等场景。

综上所述，支持向量机是一种强大的机器学习算法，其原理简单而有效，应用范围广泛。

通过合理选择核函数和参数调优，支持向量机能够获得较好的分类和回归性能。

(完整版)支持向量机(SVM)原理及应用概述分析

支持向量机( SVM )原理及应用一、SVM 的产生与发展自1995年Vapnik (瓦普尼克)在统计学习理论的基础上提出SVM作为模式识别的新方法之后，SVMH直倍受关注。

同年，Vapnik和Cortes提出软间隔(soft margin)SVM,通过引进松弛变量i度量数据X i的误分类(分类出现错误时i大于0)，同时在目标函数中增加一个分量用来惩罚非零松弛变量(即代价函数)，SVM勺寻优过程即是大的分隔间距和小的误差补偿之间的平衡过程；1996年，Vapnik等人又提出支持向量回归(Support Vector Regression , SVR)的方法用于解决拟合问题。

SVF同SV啲出发点都是寻找最优超平面(注：一维空间为点；二维空间为线；三维空间为面；高维空间为超平面。

)，但SVR勺目的不是找到两种数据的分割平面，而是找到能准确预测数据分布的平面，两者最终都转换为最优化问题的求解；1998年，Weston等人根据SVM原理提出了用于解决多类分类的SVM方法(Multi-Class Support Vector Mach in es，Multi-SVM)，通过将多类分类转化成二类分类，将SVM^用于多分类问题的判断：此外，在SVMJ法的基本框架下，研究者针对不同的方面提出了很多相关的改进算法。

例如，Suykens提出的最小二乘支持向量机(Least Square Support Vector Machine ，LS— SVM 算法,Joachims等人提出的SVM-1ight，张学工提出的中心支持向量机(Central Support Vector Machine, CSVM)Scholkoph和Smola基于二次规划提出的v-SVM等。

此后，台湾大学林智仁(Lin Chih-Jen)教授等对SVM勺典型应用进行总结，并设计开发出较为完善的SVM工具包，也就是LIBSVM(A Library for Support Vector Machines) 。

支持向量机简介与基本原理

支持向量机简介与基本原理支持向量机（Support Vector Machine，SVM）是一种常用的机器学习算法，被广泛应用于模式识别、数据分类以及回归分析等领域。

其独特的优势在于可以有效地处理高维数据和非线性问题。

本文将介绍支持向量机的基本原理和应用。

一、支持向量机的基本原理支持向量机的基本思想是通过寻找一个最优超平面，将不同类别的数据点分隔开来。

这个超平面可以是线性的，也可以是非线性的。

在寻找最优超平面的过程中，支持向量机依赖于一些特殊的数据点，称为支持向量。

支持向量是离超平面最近的数据点，它们对于确定超平面的位置和方向起着决定性的作用。

支持向量机的目标是找到一个超平面，使得离它最近的支持向量到该超平面的距离最大化。

这个距离被称为间隔（margin），最大化间隔可以使得分类器更具鲁棒性，对新的未知数据具有更好的泛化能力。

支持向量机的求解过程可以转化为一个凸优化问题，通过求解对偶问题可以得到最优解。

二、支持向量机的核函数在实际应用中，很多问题并不是线性可分的，此时需要使用非线性的超平面进行分类。

为了解决这个问题，支持向量机引入了核函数的概念。

核函数可以将低维的非线性问题映射到高维空间中，使得原本线性不可分的问题变得线性可分。

常用的核函数有线性核函数、多项式核函数、高斯核函数等。

线性核函数适用于线性可分问题，多项式核函数可以处理一些简单的非线性问题，而高斯核函数则适用于复杂的非线性问题。

选择合适的核函数可以提高支持向量机的分类性能。

三、支持向量机的应用支持向量机在实际应用中有着广泛的应用。

在图像识别领域，支持向量机可以用于人脸识别、物体检测等任务。

在生物信息学领域，支持向量机可以用于蛋白质分类、基因识别等任务。

在金融领域，支持向量机可以用于股票市场预测、信用评估等任务。

此外，支持向量机还可以用于文本分类、情感分析、异常检测等领域。

由于其强大的分类性能和泛化能力，支持向量机成为了机器学习领域中的重要算法之一。

支持向量机算法的原理和应用

支持向量机算法的原理和应用支持向量机(Support Vector Machine, SVM)是一种基于统计学习理论的机器学习算法，它可以在数据集中找到一个最优超平面，将不同类别的样本分割开来。

在分类问题中，SVM通过构建一个超平面来对不同类别的样本进行分类；在回归问题中，SVM可以用来拟合非线性关系的数据。

SVM的核心思想是最大化间隔，即找到一个能够将不同类别的样本分隔开的超平面，使得两侧最近的样本点到超平面的距离最大。

这些最近的样本点被称为支持向量，它们决定了最终划分超平面的位置。

SVM的基本原理可以分为以下几个步骤：1.数据准备：首先需要对数据进行预处理，包括数据清洗、归一化、特征提取等。

2.特征选择：选择与分类问题相关的特征。

3.模型构建：构建SVM模型，选择适当的核函数、设置参数。

4.模型训练：使用已标记的训练样本进行模型训练，找到最佳的超平面。

5.模型预测：用训练好的模型对新样本进行预测，即将新样本进行分类。

SVM算法的应用非常广泛，主要包括以下几个方面：1.二分类问题：SVM在二分类问题中表现出色，特别适用于具有较大类别间距离且样本数目较少的情况。

例如，在垃圾邮件分类中，SVM可以将垃圾邮件和正常邮件进行有效地区分。

2.多分类问题：通过将多个二分类器组合起来，SVM可以用于解决多分类问题。

例如，在手写数字识别中，可以使用SVM对不同的数字进行分类。

3.异常检测：SVM可以用于异常检测，通过将异常样本与正常样本分开。

例如，在网络入侵检测中，SVM可以帮助识别潜在的入侵行为。

4.文本分类：SVM在文本分类问题中也有广泛的应用。

例如，在垃圾短信识别中，可以使用SVM对短信进行分类。

5.图像识别：SVM在图像识别问题中有很好的表现。

例如，在人脸识别中，可以使用SVM对不同人脸进行分类。

除了以上几个应用领域，SVM还可以应用于生物信息学、计算机视觉、自然语言处理等问题的解决。

尽管SVM算法在许多问题中都表现出色，但也存在一些限制。

支持向量机算法和应用

支持向量机算法和应用支持向量机（SVM）是一种非常具有优势的机器学习算法，可用于分类和回归任务。

它使用一种称为“核技巧”的方法将数据映射到高维空间，并在这些空间中查找超平面，以将数据集分为两类。

SVM算法已经在许多实际应用中成功应用，包括图像识别、文本分类、金融预测和医学诊断等领域。

SVM算法的原理支持向量机算法的基本原理是将数据点映射到高维空间中，然后找到一个超平面来区分它们。

超平面是一个n维空间（其中n表示特征维数）中的线性分隔面，可以将其视为一个二分类器。

在二维空间中，超平面是一条直线，可用于将两组数据分开。

但是，许多数据集不是线性可分的，这意味着无法在特征空间中找到一个超平面，以将数据集分成两类。

在这种情况下，SVM使用核技巧将数据映射到高维空间中，更准确地找到一个超平面。

SVM的支持向量是指离超平面最近的数据点。

它们在算法中发挥着重要的作用，因为它们可以确定超平面的位置。

支持向量机算法使用这些支持向量来最大化超平面和每个类之间的距离，从而实现最佳分类。

SVM算法的应用支持向量机算法已广泛应用于各个领域，以下是其中一些成功的案例。

1. 图像识别SVM算法在图像识别中独树一帜，因为它能够处理高维数据。

图像可以表示为像素点的向量，而每个像素点都可以表示为颜色或灰度值。

这些像素值可以用于训练SVM，从而识别不同的物体。

例如，支持向量机算法可以用于检测医学图像中的病变和肿瘤，并对其进行分类。

SVM也可以识别CAD图像中的零件，并将其分为不同的类别。

2. 文本分类支持向量机算法还可以用于文本分类。

它能够学习不同文本的特征，并在其文本分类时使用这些特征。

例如，当使用SVM将电子邮件分类为垃圾邮件或非垃圾邮件时，SVM算法会查找特定单词或短语，并将垃圾邮件与非垃圾邮件区分开来。

SVM也可以用于文本情感分析，例如，对于Twitter数据进行分析，判断用户发言是否为正面或负面情感。

在金融领域，SVM的应用范围也很广，可以帮助预测某家公司的股票是否值得购买。

使用支持向量机进行文本分类任务

使用支持向量机进行文本分类任务支持向量机（Support Vector Machine，SVM）是一种常用的机器学习算法，广泛应用于文本分类任务。

本文将介绍SVM的基本原理，以及如何使用SVM进行文本分类。

一、支持向量机的基本原理支持向量机是一种二分类模型，其基本原理是找到一个超平面，将不同类别的样本分开。

在二维空间中，这个超平面就是一条直线；在多维空间中，这个超平面就是一个超平面。

支持向量机的目标是找到一个最优的超平面，使得离该超平面最近的样本点到该超平面的距离最大化。

具体来说，SVM通过将样本映射到高维特征空间，将低维线性不可分的问题转化为高维线性可分的问题。

然后，通过求解约束最优化问题，找到一个最优的超平面。

在这个过程中，只有一部分样本点被称为支持向量，它们离超平面最近。

二、文本分类任务文本分类是将文本按照一定的标准划分到不同的类别中。

在实际应用中，文本分类任务非常常见，如情感分析、垃圾邮件识别等。

文本分类任务的关键是将文本表示成机器学习算法可以处理的形式。

常用的文本表示方法有词袋模型（Bag-of-Words）和词向量（Word Embedding）。

词袋模型将文本看作是一个词的集合，忽略了词序和语法结构。

词向量则将每个词映射到一个实数向量，可以保留一定的语义信息。

三、使用支持向量机进行文本分类在使用支持向量机进行文本分类时，首先需要将文本表示成机器学习算法可以处理的形式。

常见的方法是使用词袋模型或词向量。

1. 词袋模型词袋模型将文本表示为一个固定长度的向量，向量中的每个维度表示一个词的出现频率或权重。

可以使用TF-IDF等方法对词的重要性进行加权。

2. 词向量词向量将每个词映射到一个实数向量。

常见的词向量模型有Word2Vec和GloVe等。

词向量可以保留一定的语义信息，更适合表示文本的语义特征。

在将文本表示成机器学习算法可以处理的形式后，可以使用支持向量机进行分类。

具体步骤如下：1. 划分训练集和测试集将标记好类别的文本数据集划分为训练集和测试集，通常采用交叉验证的方法。

支持向量机原理及应用

支持向量机原理及应用支持向量机（Support Vector Machine，SVM）是机器学习中一种强大的分类和回归方法。

它的原理是通过将数据映射到高维空间中，找到一个最优的超平面来实现分类或回归任务。

SVM在许多领域都有广泛的应用，例如图像分类、文本分类、生物信息学和金融等。

SVM的核心思想是找到一个能够最大化分类边界的超平面。

超平面是一个能够将分类样本分开的线性空间。

SVM通过将输入样本映射到高维空间中，使得线性可分问题变为了线性可分的问题。

在高维空间中，SVM选择一个能够最大化样本间距的超平面，这就是SVM的原理之一SVM的另一个重要原理是核技巧。

在非线性可分问题中，SVM使用核函数将数据映射到高维空间中，通过在高维空间中找到一个超平面来实现分类。

核函数可以将原始空间中的非线性问题转化为高维空间中的线性问题，从而大大提高了SVM的分类准确率。

SVM的应用非常广泛，其中最经典的应用之一是图像分类。

图像分类是指根据图像的内容将其归入特定的类别。

SVM可以利用其强大的分类能力来将图像分为属于不同类别的准确性高。

在图像分类中，SVM通常使用特征向量作为输入来训练模型，然后使用该模型将新的图像分类为预定义的类别。

SVM在文本分类中也有广泛的应用。

文本分类是指将文本归类为不同的类别，例如将电子邮件分类为垃圾邮件或非垃圾邮件。

SVM可以利用其在高维空间中找到超平面的能力，找出文字特征与类别之间的关系，从而实现文本分类。

SVM在文本分类中的应用有助于提高准确性和效率，特别是在大规模数据集上。

此外，SVM还在生物信息学中发挥重要作用。

生物信息学包括生物学、计算机科学和统计学等领域，用于研究和解释生物学数据。

SVM可以用于分析和预测生物学数据，如基因表达数据和蛋白质序列。

SVM在生物信息学中的应用有助于揭示生物学的内在规律，提高疾病诊断和治疗方法的准确性。

此外，SVM还被广泛应用于金融领域。

金融领域需要对股票市场、外汇市场和其他金融市场进行预测和分析。

支持向量机(SVM)原理详解

支持向量机（SVM）原理详解支持向量机(Support Vector Machine, SVM)是一种机器学习算法，用于二分类和多分类问题。

它的基本思想是寻找一个超平面，能够将不同类别的数据分隔开来，并且与最近的数据点之间的间隔最大。

一、原理概述：SVM的基本原理是将原始数据映射到高维空间中，使得在该空间中的数据能够线性可分，然后在高维空间中找到一个最优的超平面。

对于线性可分的情况，SVM通过最大化分类边界与最近数据点之间的距离，并将该距离定义为间隔，从而使分类边界具有更好的泛化能力。

二、如何确定最优超平面：1.线性可分的情况下：SVM寻找一个能够将不同类别的数据分开的最优超平面。

其中，最优超平面定义为具有最大间隔(margin)的超平面。

间隔被定义为超平面到最近数据点的距离。

SVM的目标是找到一个最大化间隔的超平面，并且这个超平面能够满足所有数据点的约束条件。

这可以通过求解一个凸二次规划问题来实现。

2.线性不可分的情况下：对于线性不可分的情况，可以使用一些技巧来将数据映射到高维空间中，使其线性可分。

这种方法被称为核技巧(kernel trick)。

核技巧允许在低维空间中计算高维空间的内积，从而避免了直接在高维空间中的计算复杂性。

核函数定义了两个向量之间的相似度。

使用核函数，SVM可以在高维空间中找到最优的超平面。

三、参数的选择：SVM中的参数有两个主要的方面：正则化参数C和核函数的选择。

1.正则化参数C控制了分类边界与数据点之间的权衡。

较大的C值将导致更少的间隔违规，增加将数据点分类正确的权重，可能会导致过拟合；而较小的C值将产生更宽松的分类边界，可能导致欠拟合。

2.核函数选择是SVM中重要的一步。

根据问题的特点选择合适的核函数能够更好地处理数据，常用的核函数有线性核函数、多项式核函数和高斯核函数等。

四、优缺点：SVM有以下几个优点：1.在灵活性和高扩展性方面表现出色，尤其是在高维数据集上。

2.具有良好的泛化能力，能够很好地处理样本数量较少的情况。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

支持向量机（SVM ）原理及应用一、SVM 的产生与发展自1995年Vapnik(瓦普尼克)在统计学习理论的基础上提出SVM 作为模式识别的新方法之后，SVM 一直倍受关注。

同年，Vapnik 和Cortes 提出软间隔(soft margin)SVM ，通过引进松弛变量i ξ度量数据i x 的误分类(分类出现错误时i ξ大于0)，同时在目标函数中增加一个分量用来惩罚非零松弛变量(即代价函数)，SVM 的寻优过程即是大的分隔间距和小的误差补偿之间的平衡过程；1996年，Vapnik 等人又提出支持向量回归 (Support Vector Regression ，SVR)的方法用于解决拟合问题。

SVR 同SVM 的出发点都是寻找最优超平面(注：一维空间为点；二维空间为线；三维空间为面；高维空间为超平面。

)，但SVR 的目的不是找到两种数据的分割平面，而是找到能准确预测数据分布的平面，两者最终都转换为最优化问题的求解；1998年，Weston 等人根据SVM 原理提出了用于解决多类分类的SVM 方法(Multi-Class Support Vector Machines ，Multi-SVM)，通过将多类分类转化成二类分类，将SVM 应用于多分类问题的判断：此外，在SVM 算法的基本框架下，研究者针对不同的方面提出了很多相关的改进算法。

例如，Suykens 提出的最小二乘支持向量机 (Least Square Support Vector Machine ，LS —SVM)算法，Joachims 等人提出的SVM-1ight ，张学工提出的中心支持向量机 (Central Support Vector Machine ，CSVM)，Scholkoph 和Smola 基于二次规划提出的v-SVM 等。

此后，台湾大学林智仁(Lin Chih-Jen)教授等对SVM 的典型应用进行总结，并设计开发出较为完善的SVM 工具包，也就是LIBSVM(A Library for Support Vector Machines)。

LIBSVM 是一个通用的SVM 软件包，可以解决分类、回归以及分布估计等问题。

二、支持向量机原理SVM 方法是20世纪90年代初Vapnik 等人根据统计学习理论提出的一种新的机器学习方法，它以结构风险最小化原则为理论基础，通过适当地选择函数子集及该子集中的判别函数，使学习机器的实际风险达到最小，保证了通过有限训练样本得到的小误差分类器，对独立测试集的测试误差仍然较小。

支持向量机的基本思想：首先，在线性可分情况下，在原空间寻找两类样本的最优分类超平面。

在线性不可分的情况下，加入了松弛变量进行分析，通过使用非线性映射将低维输入空间的样本映射到高维属性空间使其变为线性情况，从而使得在高维属性空间采用线性算法对样本的非线性进行分析成为可能，并在该特征空间中寻找最优分类超平面。

其次，它通过使用结构风险最小化原理在属性空间构建最优分类超平面，使得分类器得到全局最优，并在整个样本空间的期望风险以某个概率满足一定上界。

其突出的优点表现在：(1)基于统计学习理论中结构风险最小化原则（注:所谓的结构风险最小化就是在保证分类精度（经验风险）的同时，降低学习机器的VC 维，可以使学习机器在整个样本集上的期望风险得到控制。

）和VC维理论(注：VC维（Vapnik-Chervonenkis Dimension）的概念是为了研究学习过程一致收敛的速度和推广性，由统计学理论定义的有关函数集学习性能的一个重要指标。

)，具有良好的泛化能力，即由有限的训练样本得到的小的误差能够保证使独立的测试集仍保持小的误差。

(2)支持向量机的求解问题对应的是一个凸优化问题，因此局部最优解一定是全局最优解。

(3)核函数的成功应用，将非线性问题转化为线性问题求解。

(4)分类间隔的最大化，使得支持向量机算法具有较好的鲁棒性。

由于SVM自身的突出优势，因此被越来越多的研究人员作为强有力的学习工具，以解决模式识别、回归估计等领域的难题。

1．最优分类面和广义最优分类面SVM是从线性可分情况下的最优分类面发展而来的，基本思想可用图1来说明。

对于一维空间中的点，二维空间中的直线，三维空间中的平面，以及高维空间中的超平面，图中实心点和空心点代表两类样本，H为它们之间的分类超平面，H1，H2分别为过各类中离分类面最近的样本且平行于分类面的超平面，它们之间的距离△叫做分类间隔(margin)。

图1 最优分类面示意图W所谓最优分类面要求分类面不但能将两类正确分开，而且使分类间隔最大。

将两类正确分开是为了保证训练错误率为0，也就是经验风险最小(为O)。

使分类空隙最大实际上就是使推广性的界中的置信范围最小？，从而使真实风险最小。

推广到高维空间，最优分类线就成为最优分类面。

设线性可分样本集为}1,1{,,,...,1),,(x _-+∈∈=y R x n i y d i i 是类别符号。

d 维空间中线性判别函数的一般形式为是类别符号。

d 维空间中线性判别函数的一般形式为b x w x g +⋅=)(（主：w 代表Hilbert 空间中权向量；b 代表阈值。

），分类线方程为0=+⋅b x w ？。

将判别函数进行归一化，使两类所有样本都满足1|)(|=x g ，也就是使离分类面最近的样本的1|)(|=x g ，此时分类间隔等于||||/2w ？，因此使间隔最大等价于使||||w (或2||||w )最小。

要求分类线对所有样本正确分类，就是要求它满足n i b x w y i ,...,2,1,01])[(=≥-+⋅ （1-1）满足上述条件(1-1)，并且使2||||w 最小的分类面就叫做最优分类面，过两类样本中离分类面最近的点且平行于最优分类面的超平面H 1，H 2上的训练样本点就称作支持向量(supportvector)，因为它们“支持”了最优分类面。

利用Lagrange （拉格朗日）优化方法可以把上述最优分类面问题转化为如下这种较简单的对偶问题，即：在约束条件，01=∑=i n i iy α （1-2a ）n i i ,...,2,1,0=≥α (1-2b)下面对i α（主：对偶变量即拉格朗日乘子）求解下列函数的最大值：∑∑==-=nj i j i j i j i ni x x y y 1,1i )(21Q αααα）（？（1-3）若*α为最优解，则∑==n i i y w 1**αα（1-4）即最优分类面的权系数向量是训练样本向量的线性组合。

注释（1-3）式由来：利用Lagrange 函数计算如下，实例计算：图略，可参见PPTx1 =(0, 0), y1 = +1x2 =(1, 0), y2 = +1x3 =(2, 0), y3 = -1x4 =(0, 2), y4 = -1 2121(,,)((())1)li i i i L w b w y x w b αα==-⋅⋅+-∑(,,)0(,,)0L w b L w b b w αα∂∂==∂∂110l li i i i i i i a y w y x α====∑∑121,111()()0,1,...,,0()sgn(())l li i j i j i j i i j li i i i li i i i W y y x x i l and y f x y x x b ααααααα=====-⋅≥===⋅⋅+∑∑∑∑可调用Matlab 中的二次规划程序，求得α1, α2, α3, α4的值，进而求得w 和b 的值。

这是一个不等式约束下的二次函数极值问题，存在唯一解。

根据k ühn-Tucker 条件，解中将只有一部分(通常是很少一部分)i α不为零，这些不为0解所对应的样本就是支持向量。

求解上述问题后得到的最优分类函数是：})(sgn{})sgn{()(1****∑=+⋅=+⋅=ni i i i b x x y b x w x f α (1-5) 根据前面的分析，非支持向量对应的i α均为0，因此上式中的求和实际上只对支持向量进行。

*b 是分类阈值，可以由任意一个支持向量通过式(1-1)求得(只有支持向量才满足其中的等号条件)，或通过两类中任意一对支持向量取中值求得。

从前面的分析可以看出，最优分类面是在线性可分的前提下讨论的，在线性不可分的情况下，就是某些训练样本不能满足式(1-1)的条件，因此可以在条件中增加一个松弛项参数0i ≥ε，变成：n i b x w y i i i ,...,2,1,01])[(=≥+-+⋅ε (1-6)对于足够小的s>0，只要使∑==ni i F 1)(σσεε (1-7) 最小就可以使错分样本数最小。

对应线性可分情况下的使分类间隔最大，在线性不可分2221234223341()()(444)2Q αααααααααα=+++--++123412013/41/41120312002144231113,02224()3220w b g x x x αααα=⎧⎪=⎪⎨=⎪⎪=⎩⎡⎤-⎢⎥⎡⎤⎡⎤⎡⎤=--=⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎢⎥-⎢⎥⎣⎦⎡⎤⎡⎤=---=⎢⎥⎢⎥⎣⎦⎣⎦=--=情况下可引入约束：k c ≤2||w || （1-8）在约束条件(1-6)幂1(1-8)下对式(1-7)求极小，就得到了线性不可分情况下的最优分类面，称作广义最优分类面。

为方便计算，取s=1。

为使计算进一步简化，广义最优分类面问题可以迸一步演化成在条件(1-6)的约束条件下求下列函数的极小值：)(),(21,1∑=+=n i i C w w w εεφ）（ (1-9) 其中C 为某个指定的常数，它实际上起控制对锩分样本惩罚的程度的作用，实现在错分样本的比例与算法复杂度之间的折衷。

求解这一优化问题的方法与求解最优分类面时的方法相同，都是转化为一个二次函数极值问题，其结果与可分情况下得到的(1-2)到(1-5)几乎完全相同，但是条件(1-2b)变为：n i C ,...,1,0i =≤≤α (1-10)2．SVM 的非线性映射对于非线性问题，可以通过非线性交换转化为某个高维空间中的线性问题，在变换空间求最优分类超平面。

这种变换可能比较复杂，因此这种思路在一般情况下不易实现。

但是我们可以看到，在上面对偶问题中，不论是寻优目标函数（1-3）还是分类函数(1-5)都只涉及训练样本之间的内积运算）（i x x ⋅。

设有非线性映射H R d →Φ:将输入空间的样本映射到高维(可能是无穷维)的特征空间H 中，当在特征空间H 中构造最优超平面时，训练算法仅使用空间中的点积，即)()(j i x x φφ⋅，而没有单独的)(i x φ出现。