Khám phá sức mạnh của Máy Vector Hỗ Trợ (SVM) cho phân loại, hồi quy và phát hiện ngoại lệ, với các ứng dụng và hiểu biết sâu sắc trong thế giới thực.
Máy vectơ hỗ trợ (SVM) là một thuật toán học có giám sát mạnh mẽ và linh hoạt, được sử dụng cho cả tác vụ phân loại và hồi quy. Về cốt lõi, một SVM tìm một siêu phẳng hoặc ranh giới quyết định tối ưu, phân tách tốt nhất các điểm dữ liệu thành các lớp khác nhau. Điều làm cho SVM đặc biệt hiệu quả là mục tiêu tối đa hóa lề—khoảng cách giữa siêu phẳng phân tách và các điểm dữ liệu gần nhất của bất kỳ lớp nào. Nguyên tắc này, được trình bày chi tiết trong bài báo nền tảng của Cortes và Vapnik, giúp cải thiện khả năng khái quát hóa của mô hình, làm cho nó ít bị quá khớp (overfitting) hơn.
Thuật toán hoạt động bằng cách vẽ mỗi mục dữ liệu dưới dạng một điểm trong không gian n chiều (trong đó n là số lượng đặc trưng). Việc phân loại sau đó được thực hiện bằng cách tìm siêu phẳng tạo ra sự phân tách tốt nhất giữa các lớp.
SVM có hiệu quả trong nhiều lĩnh vực, đặc biệt đối với các bài toán có dữ liệu chiều cao.
So với các thuật toán đơn giản hơn như Hồi quy Logistic, SVM hướng đến việc tối đa hóa khoảng cách biên thay vì chỉ tìm một ranh giới phân tách, điều này có thể dẫn đến khả năng tổng quát hóa tốt hơn. Không giống như các phương pháp dựa trên cây như Cây Quyết Định hoặc Rừng Ngẫu Nhiên, SVM xây dựng một siêu phẳng tối ưu duy nhất (có thể trong một không gian nhiều chiều). Trong khi các mô hình học sâu hiện đại như Ultralytics YOLO vượt trội trong việc trích xuất đặc trưng tự động từ dữ liệu thô (như pixel trong thị giác máy tính (CV)), SVM thường yêu cầu thiết kế đặc trưng cẩn thận nhưng có thể hoạt động đặc biệt tốt trên các bộ dữ liệu nhỏ hơn hoặc các loại dữ liệu có cấu trúc cụ thể, nơi các đặc trưng được xác định rõ. Bạn có thể tìm thấy nhiều bộ dữ liệu như vậy trong Kho lưu trữ Machine Learning UCI.
Các triển khai phổ biến bao gồm LibSVM và mô-đun SVM trong scikit-learn. Mặc dù SVM thường không phải là cốt lõi của các framework CV hiện đại như PyTorch hoặc TensorFlow, nhưng nó có thể được tích hợp vào các quy trình làm việc rộng hơn. Việc huấn luyện và quản lý các mô hình như vậy, cùng với nhiều mô hình khác, có thể được hợp lý hóa bằng cách sử dụng các nền tảng như Ultralytics HUB, giúp đơn giản hóa vòng đời MLOps từ gán nhãn dữ liệu đến điều chỉnh siêu tham số và triển khai mô hình cuối cùng.