敬请关注 YOLO Vision 2025!
2025年9月25日
英国夏令时 10:00 - 18:00
混合活动
Yolo Vision 2024
词汇表

支持向量机 (SVM)

探索支持向量机 (SVM) 在分类、回归和异常值检测方面的强大功能,以及实际应用和见解。

支持向量机 (SVM) 是一种功能强大且通用的监督学习算法,用于分类和回归任务。从本质上讲,SVM 找到一个最佳超平面或决策边界,以最好地将数据点分离到不同的类中。SVM 特别有效的原因在于它旨在最大化裕度,即分离超平面与任何类的最近数据点之间的距离。 Cortes 和 Vapnik 的基础论文中详细介绍了这一原则,有助于提高模型的泛化能力,使其不易过度拟合

SVM 如何工作

该算法的工作原理是将每个数据项绘制为 n 维空间中的一个点(其中 n 是特征的数量)。然后,通过找到能够最好地分离类别的超平面来进行分类。

  • 超平面:这是决策边界。在具有两个特征的数据集中,它是一条线;在具有三个特征的数据集中,它是一个平面。对于更多特征,它变成一个超平面。
  • 支持向量:这些是距离超平面最近的数据点。它们至关重要,因为它们定义了边距,移除它们会改变超平面的位置。在斯坦福大学 CS229 讲义中可以找到支持向量的出色可视化。
  • Margin(边距):边距是支持向量与超平面之间的间隙。SVM 的目标是找到最大化此边距的超平面,从而创建最强大的分离。
  • 核技巧:对于非线性可分的数据,SVM 使用一种称为核技巧的技术。这种强大的方法涉及将数据转换到更高维度的空间,在该空间中可以找到线性分离器,而无需显式计算数据在该新空间中的坐标。径向基函数 (RBF) 等常用核可以处理非常复杂的非线性关系。您可以查阅 SVM 核指南 了解更多详情。

实际应用

支持向量机(SVM)在许多领域都非常有效,尤其是在处理高维数据问题时。

  • 生物信息学:在基因组学和蛋白质组学中,SVM 用于分类蛋白质和分析基因表达数据。 例如,它们可以帮助基于微阵列数据识别癌症亚型,这是一项涉及数千个特征的任务。 这使得它们成为AI 医疗保健中的重要工具。
  • 图像分类:在深度神经网络占据主导地位之前,SVM 是图像分类的顶级模型。它们已成功用于在 MNIST 等数据集上手写数字识别以及在 Caltech-101 上对象识别等任务。
  • 文本分类: 在自然语言处理 (NLP)中,SVM在垃圾邮件检测和情感分析等任务中非常有效。它们可以有效地管理由文本向量化方法创建的高维特征空间。

SVM 与其他算法的比较

Logistic 回归 等更简单的算法相比,SVM 的目标是最大化间隔,而不仅仅是找到一个 分离边界,这可以带来更好的泛化效果。 与 决策树随机森林 等基于树的方法不同,SVM 构建一个最佳超平面(可能在高维空间中)。 虽然像 Ultralytics YOLO 这样的现代 深度学习 模型擅长从原始数据(如 计算机视觉 (CV) 中的像素)中自动特征提取,但 SVM 通常需要仔细的 特征工程,但在较小的数据集或特征明确定义的特定类型的结构化数据上可以表现得非常好。 您可以在 UCI 机器学习存储库 中找到许多此类数据集。

常见的实现包括 LibSVMscikit-learn 中的 SVM 模块。虽然 SVM 通常不是现代 CV 框架(如 PyTorchTensorFlow)的核心,但它可以集成到更广泛的工作流程中。使用诸如 Ultralytics HUB 等平台可以简化此类模型以及各种其他模型的训练和管理,从而简化从MLOps生命周期,包括数据标注超参数调优和最终模型部署

加入 Ultralytics 社区

加入人工智能的未来。与全球创新者联系、协作和共同成长

立即加入
链接已复制到剪贴板