Descubra el poder de las máquinas de vectores de soporte (SVM) para la clasificación, la regresión y la detección de valores atípicos, con aplicaciones e información del mundo real.
La Máquina de Vectores de Soporte (SVM) es un algoritmo de aprendizaje supervisado potente y versátil que se utiliza tanto para tareas de clasificación como de regresión. En esencia, una SVM encuentra un hiperplano óptimo o un límite de decisión que separa mejor los puntos de datos en diferentes clases. Lo que hace que SVM sea particularmente eficaz es su objetivo de maximizar el margen: la distancia entre el hiperplano de separación y los puntos de datos más cercanos de cualquier clase. Este principio, detallado en el documento fundacional de Cortes y Vapnik, ayuda a mejorar la capacidad de generalización del modelo, haciéndolo menos propenso al sobreajuste.
El algoritmo funciona representando cada elemento de datos como un punto en un espacio n-dimensional (donde n es el número de características). La clasificación se realiza entonces encontrando el hiperplano que crea la mejor separación entre las clases.
Las SVM son eficaces en muchos dominios, especialmente para problemas con datos de alta dimensionalidad.
En comparación con algoritmos más simples como la Regresión Logística, las SVM buscan maximizar el margen en lugar de simplemente encontrar un límite de separación, lo que puede llevar a una mejor generalización. A diferencia de los métodos basados en árboles como los Árboles de Decisión o los Bosques Aleatorios, las SVM construyen un único hiperplano óptimo (posiblemente en un espacio de alta dimensión). Mientras que los modelos modernos de aprendizaje profundo como Ultralytics YOLO sobresalen en la extracción de características automática de datos sin procesar (como píxeles en visión artificial (CV)), las SVM a menudo requieren una ingeniería de características cuidadosa, pero pueden tener un rendimiento excepcionalmente bueno en conjuntos de datos más pequeños o tipos específicos de datos estructurados donde las características están bien definidas. Puede encontrar muchos de estos conjuntos de datos en el Repositorio de Aprendizaje Automático de la UCI.
Las implementaciones más populares incluyen LibSVM y el módulo SVM en scikit-learn. Aunque SVM no suele ser el núcleo de los frameworks de CV modernos como PyTorch o TensorFlow, puede integrarse en flujos de trabajo más amplios. El entrenamiento y la gestión de estos modelos, junto con otros varios, pueden optimizarse utilizando plataformas como Ultralytics HUB, que simplifica el ciclo de vida de MLOps desde el etiquetado de datos hasta el ajuste de hiperparámetros y la implementación final del modelo.