1500字范文 > 支持向量机原理（一）线性支持向量机

支持向量机原理（一）线性支持向量机

时间：2022-08-07 13:26:28

相关推荐

支持向量机原理（一）线性支持向量机

SVM压制了神经网络好多年，如果不考虑集成学习算法，不考虑特定的训练集，在分类算法中SVM表现排第一。

SVM是一个二元分类算法。

SVM学习策略：间隔最大化，可形式化为一个求解凸二次规划问题。

间隔最大化使它有别于感知机。

SVM包括核技巧，使它成为非线性分类器。

支持向量机模型包括：线性可分支持向量机、线性支持向量机、非线性支持向量机。当训练集线性可分，通过硬间隔最大化学习的线性分类器为线性可分支持向量机，又称硬间隔支持向量机；通过软间隔最大化学习的线性分类器为线性支持向量机，又称软间隔支持向量机；当训练及线性不可分，通过核技巧及软间隔最大化学习的称为非线性支持向量机。

1. 回顾感知机模型

在感知机原理中，在二维就是找到一条直线，在三维或者更高维就是找到一个超平面，将所有二元类别分开。这个超平面定义为：wTx+b=0。如图，在超平面wTx+b=0上方定义y=1，在超平面下方定义y=-1。可以看出满足这个超平面的不止一个。我们尝试找到最好的。

感知机损失函数优化的思想：让所有误分类点(定义为M)到超平面的距离之和最小，即下面式子的最小化：

当w和b扩大N倍，分母L2范数也会扩大N倍。也就是分子，分母有倍数关系。所以可以固定分子或分母为1，然后求分母倒数或另一个分子最小化作为损失函数。感知机模型中，固定分母||w||2=1，则感知机损失函数简化为：

2. 函数间隔与集合间隔

超平面为wTx+b=0，|wTx+b|为点x到超平面的相对距离。当wTx+b与y同号，分类正确，否则，分类不正确。这里引入函数间隔的感念，定义函数间隔 γ’为：

即函数间隔就是感知机模型中误分类点到超平面距离的分子。对于训练集中m个样本点对应的m个函数间隔的最小值，就是整个训练集的函数间隔。

函数间隔并不能正常反应点到超平面的距离，在感知机模型中，分子成比例增长，分母也增长。为了统一度量，对法向量w加上约束条件，得到几何间隔γ为：

几何间隔是点到超平面的真正距离，感知机模型里用到的距离就是几何距离。

3. 支持向量

感知机利用误分类最小的策略，求得分离超平面有无穷多个；线性可分支持向量机利用间隔最大化求得最优分离超平面只有一个。

如图，线性可分支持向量机：决策边界(实)，间隔边界(虚)，支持向量(红点)。