Descubra o poder das Máquinas de Vetores de Suporte (SVMs) para classificação, regressão e detecção de outliers, com aplicações e insights do mundo real.
A Máquina de Vetores de Suporte (SVM) é um algoritmo de aprendizado supervisionado poderoso e versátil usado tanto para tarefas de classificação quanto de regressão. Em sua essência, uma SVM encontra um hiperplano ou limite de decisão ideal que melhor separa os pontos de dados em diferentes classes. O que torna a SVM particularmente eficaz é seu objetivo de maximizar a margem—a distância entre o hiperplano de separação e os pontos de dados mais próximos de qualquer classe. Este princípio, detalhado no artigo fundamental de Cortes e Vapnik, ajuda a melhorar a capacidade de generalização do modelo, tornando-o menos propenso a overfitting.
O algoritmo funciona plotando cada item de dados como um ponto em um espaço n-dimensional (onde n é o número de características). A classificação é então realizada encontrando o hiperplano que cria a melhor separação entre as classes.
SVMs são eficazes em muitos domínios, especialmente para problemas com dados de alta dimensionalidade.
Comparado a algoritmos mais simples como Regressão Logística, os SVMs visam maximizar a margem em vez de apenas encontrar um limite separador, o que pode levar a uma melhor generalização. Ao contrário de métodos baseados em árvores, como Árvores de Decisão ou Random Forests, os SVMs constroem um único hiperplano ideal (possivelmente em um espaço de alta dimensão). Enquanto os modelos modernos de aprendizado profundo, como o Ultralytics YOLO, se destacam na extração de características automática de dados brutos (como pixels em visão computacional (CV)), os SVMs geralmente exigem uma engenharia de características cuidadosa, mas podem ter um desempenho excepcionalmente bom em conjuntos de dados menores ou tipos específicos de dados estruturados onde as características são bem definidas. Você pode encontrar muitos desses conjuntos de dados no Repositório de Machine Learning da UCI.
Implementações populares incluem LibSVM e o módulo SVM em scikit-learn. Embora o SVM não seja tipicamente o núcleo das estruturas de CV modernas como PyTorch ou TensorFlow, ele pode ser integrado em fluxos de trabalho mais amplos. O treinamento e o gerenciamento de tais modelos, juntamente com vários outros, podem ser simplificados usando plataformas como o Ultralytics HUB, que simplifica o ciclo de vida do MLOps desde a rotulagem de dados até o ajuste de hiperparâmetros e a implantação final do modelo.