1500字范文 > 【精简推导】支持向量机（拉格朗日乘子法对偶函数 KKT条件）

【精简推导】支持向量机（拉格朗日乘子法对偶函数 KKT条件）

时间：2021-06-12 06:05:18

支持向量机，就是通过找出边际最大的决策边界，来对数据进行分类的分类器。因此，支持向量分类器又叫做最大边际分类器。

（疯狂暗示：这是一个最优化问题啊~）

直接上目标求解函数：

这个式子是支持向量机基本形（这个目标式子的由来可以参考西瓜书）。一看这就是一个二次凸优化问题，虽然可以直接用优化包求解，但是效率不高，而且对于后面引入核函数也不方便。因此我们习惯用拉格朗日乘子法求解这个优化问题。

故事从这里开始：

高等数学教过：求解带约束条件的最优化问题，可以用拉格朗日乘子法，因此上式求解可以写成：

上式是拉格朗日乘子，而和都是我们已知的特征矩阵和标签。拉格朗日函数分为两部分。第一部分是我们的原始损失函数，第二部分加了不等式的约束条件。我们希望，不仅能够代表我们原有的损失函数和约束条件，还能够表示我们想要最小化损失函数来求解和，所以我们要先以为参数，求解的最大值，然后再以和为参数，求解的最小值。因此，我们的目标可以写作：

--------------------------------------------------【插曲】为什么拉格朗日能转化成其对偶函数？--------------------------------------------------------

对于任何一个拉格朗日函数：

，都存在一个与它相对应的对偶函数,只带有拉格朗日乘子作为它的唯一参数。如果这个的最优解存在，并可以表示为min，并且对偶函数的最优化也存在，并可以表示为,则我们可以定义一个对偶差异，拉格朗日函数的最优解与其对偶函数的最优解之间的差异值，：

如果，则称与其对偶函数之间存在强对偶关系。此时我们就可以通过求解对偶函数的最优解来替代求解原始函数的最优解。

什么时候强对偶关系存在？答：拉格朗日必须满足KKT条件：

首先是所有的一阶导数必须为0，其次约束条件中的函数小于等于0，再其次，拉格朗日乘子大于等于0，以及约束条件乘以拉格朗日乘子必须等于0（即，不同i的取值下，两者之间至少有一个为0）。当所有限制都被满足，则拉格朗日函数的最优解与其对偶函数的最优解相等，我们就可以将原始的最优化问题转换成为对偶函数的最优化问题。

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------

先来求解拉格朗日函数：

分别对和求导：

（1）

（2）

（我们发现两个导数的结果中都有，因此到这里还是无法求出和。把1式和2式带入到拉格朗日函数，我们得到一个只含有未知数的式子，这个式子被称为拉格朗日对偶函数。把对偶函数的结果求解出来，再带入到1,2就得到了w和b的解）

为了把拉格朗日函数转成其对偶问题，我们来看看其是否满足强对偶关系。

其一：我们在上面已经求导让拉格朗日函数对w，b求导等于0，得到式子：

(一阶导数必须为0,第一个条件满足。)

其二：由于最开始的约束有：，

因此拉格朗日中约束条件（约束条件函数小于0，第二个条件满足）

其三：拉格朗日乘子，天然满足。

其四：所以随后之剩下约束条件乘以拉格朗日乘子是否等于0成了: