Descubra la potencia de las máquinas de vectores soporte (SVM) para la clasificación, regresión y detección de valores atípicos, con aplicaciones y conocimientos del mundo real.
La máquina de vectores soporte (SVM) es un algoritmo de aprendizaje supervisado potente y versátil que se utiliza tanto para tareas de clasificación como de regresión. En esencia, una SVM encuentra un hiperplano óptimo o límite de decisión que separa mejor los puntos de datos en diferentes clases. Lo que hace que la SVM sea especialmente eficaz es su objetivo de maximizar el margen, es decir, la distancia entre el hiperplano de separación y los puntos de datos más cercanos de cualquier clase. Este principio, detallado en el artículo fundacional de Cortes y Vapnik, ayuda a mejorar la capacidad de generalización del modelo, haciéndolo menos propenso al sobreajuste.
El algoritmo funciona representando cada dato como un punto en un espacio n-dimensional (donde n es el número de características). A continuación, la clasificación se realiza encontrando el hiperplano que crea la mejor separación entre clases.
Las SVM son eficaces en muchos ámbitos, especialmente para problemas con datos de alta dimensión.
En comparación con algoritmos más sencillos como la regresión logística, las SVM buscan maximizar el margen en lugar de limitarse a encontrar un límite de separación, lo que puede conducir a una mejor generalización. A diferencia de los métodos basados en árboles, como los árboles de decisión o los bosques aleatorios, las SVM construyen un único hiperplano óptimo (posiblemente en un espacio de alta dimensión). Mientras que los modelos modernos de aprendizaje profundo como Ultralytics YOLO sobresalen en la extracción automática de características a partir de datos sin procesar (como píxeles en visión por ordenador (CV)), las SVM a menudo requieren una ingeniería de características cuidadosa, pero pueden funcionar excepcionalmente bien en conjuntos de datos más pequeños o tipos específicos de datos estructurados donde las características están bien definidas. Puede encontrar muchos de estos conjuntos de datos en el repositorio de aprendizaje automático de la UCI.
Las implementaciones más populares incluyen LibSVM y el módulo SVM en scikit-learn. Aunque SVM no suele ser el núcleo de marcos de CV modernos como PyTorch o TensorFlow, puede integrarse en flujos de trabajo más amplios. La formación y gestión de estos modelos, junto con otros varios, puede racionalizarse utilizando plataformas como Ultralytics HUB, que simplifica el ciclo de vida de MLOps desde el etiquetado de datos hasta el ajuste de hiperparámetros y el despliegue final del modelo.