2023-06-16 15:07 知乎_产品

关注

Day46：SVM详解与案例

alt

在上一节中，我们讲解了一种分类模型——逻辑回归，在本节中，我们将讲解另一种分类模型——支持向量机（Support Vector Machine，SVM）。我们将从数学推理的角度出发，详细介绍SVM的原理，然后，我们将实现一个实际案例。

1. SVM原理

SVM是一种经典的监督学习算法，适用于二分类和多分类问题。它的目标是找到一个最优超平面，能够最大化样本的间隔（即离超平面最近的样本点的距离最大化），从而达到更好的分类效果。

1.1 线性可分情况：

假设我们的训练数据集为{(x₁, y₁), (x₂, y₂), ..., (xₙ, yₙ)}，其中xᵢ是输入特征向量，yᵢ是对应的类别标签（1或-1）。
SVM的目标是找到一个超平面，其方程为wx + b = 0，能够将正负样本完全分开。
对于任意数据点xᵢ，它满足wxᵢ + b > 0当且仅当yᵢ = 1，满足wxᵢ + b < 0当且仅当yᵢ = -1。
因此，我们可以定义一个函数h(x) = wx + b，对于正样本h(x) > 0，对于负样本h(x) < 0。

1.2 最大间隔：

SVM的目标是找到一个最优超平面，使得正负样本之间的间隔最大化。
间隔定义为超平面到最近的样本点的距离，我们希望找到的超平面能够最大化这个间隔。
设超平面上的两个支持向量为x₊和x₋，它们分别满足h(x₊) = 1和h(x₋) = -1。
超平面到x₊和x₋的距离之和为2/||w||，其中||w||是权重向量w的范数。
因此，我们的目标是最大化2/||w||，等价于最小化||w||²/2，即将问题转化为一个优化问题。

1.3 优化问题：

SVM的优化问题可以表示为：min 1/2 * ||w||²s.t. yᵢ(wxᵢ + b) ≥ 1, ∀i
这是一个凸二次规划问题，可以使用拉格朗日乘子法来求解。
引入拉格朗日乘子αᵢ来构建拉格朗日函数，并对w和b求偏导数。
最终得到优化问题的对偶形式：max Σ αᵢ - 1/2 * Σ Σ αᵢ αⱼ yᵢ yⱼ (xᵢ·xⱼ)s.t. Σ αᵢ yᵢ = 0, αᵢ ≥ 0, ∀i
在求解对偶问题时，可以使用支持向量的方式，只需要计算支持向量上的αᵢ和b即可。

1.4 多分类问题：

SVM最初是为二分类问题设计的，但可以通过一些技巧扩展到多分类问题。
一种常用的方法是一对多（One-vs-Rest，OvR）策略，将多类别问题转化为多个二分类问题。
对于每个类别，训练一个二分类的SVM模型，判断一个样本点属于哪个类别的方法是，选择具有最大决策函数值的类别。

2. 实际案例

以上是SVM的数学推理过程，现在我们将使用内置库数据集实现一个实际案例：

我们首先导入库，然后随机生成一个两个聚类中心的类别数据集：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.svm import SVC

# 生成数据集
X, y = make_blobs(n_samples=100, centers=2, random_state=0, cluster_std=0.

剩余60%内容，订阅专栏后可继续查看/也可单篇购买

大模型-AI小册文章被收录于专栏

1. AI爱好者，爱搞事的 2. 想要掌握第二门语言的Javaer或者golanger 3. 决定考计算机领域研究生，给实验室搬砖的uu，强烈建议你花时间学完这个，后续搬砖比较猛 4. 任何对编程感兴趣的，且愿意掌握一门技能的人

全部评论

推荐最新楼层

牛客489853314号

woc牛

点赞回复分享

发布于 2023-07-14 15:33 上海

不愿透露姓名的神秘牛友

07-07 11:35

这是老板破防了吗？

程序员小白条：话太多，没实力和学历，差不多回答回答就行了，身份地位不一样

点赞评论收藏

分享

不愿透露姓名的神秘牛友

07-10 12:10

《本科不行要大专》

要不我去考一个本升专吧。。。

点赞评论收藏

分享

06-19 11:01

已编辑

郑州升达经贸管理学院视频编辑

25应届生找工作

年龄：22 薪资：5000+学历：本科专业：网络与新媒体期望：视频剪辑师，摄影师要求：做好双休，大小周也可以，要有五险工作地点：杭州

求offer的大角牛：你可以去****上投投看看，牛客大多数是it开发，技术支持，测试类的工作

点赞评论收藏

分享

07-05 15:02

已编辑

中国科学技术大学科研助理

面试70min左右，最后的手撕代码有思路但没写出来

点赞评论收藏

分享

07-07 15:18

门头沟学院嵌入式工程师

一句话说明现在的就业形势有多差

怎么起名字：早知道就不读书了，害得我送外卖还得扶眼镜

点赞评论收藏

分享

评论

2

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习生的蛐蛐区 #

54182次浏览 407人参与

# 运营面经 #

115576次浏览 1249人参与

# 你认为小厂实习有用吗？ #

20573次浏览 248人参与

# 说说你知道的学历厂 #

38952次浏览 236人参与

# 应届生，你找到工作了吗 #

21187次浏览 152人参与

# 计算机有哪些岗位值得去？ #

16952次浏览 158人参与

# 哪一瞬间觉得自己长大了 #

9932次浏览 221人参与

# 面试尴尬现场 #

32192次浏览 217人参与

# 你找工作的时候用AI吗？ #

18699次浏览 231人参与

# 下班后的时间你怎么安排 #

10237次浏览 140人参与

# 烟草笔面经互助 #

17841次浏览 184人参与

# 社会教会你的第一课 #

36387次浏览 458人参与

# 电网笔面经互助 #

36893次浏览 357人参与

# 秋招最大的收获是什么？ #

36108次浏览 309人参与

# lastday知无不言 #

58285次浏览 475人参与

# 三一重工求职进展汇总 #

13373次浏览 61人参与

# 材料人，你们签了哪个公司 #

7475次浏览 18人参与

# 你的领导最像哪种动物，为什么? #

14334次浏览 106人参与

# 学历贬值真的很严重吗？ #

22410次浏览 163人参与

# 你上一次加班是什么时候？ #

87628次浏览 572人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务