Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

Destek Vektör Makinesi (SVM)

Destek Vektör Makinelerini (SVM) keşfedin. Optimal hiperdüzlemler, çekirdek hilesi ve SVM'lerin Ultralytics gibi modern modellerle karşılaştırılması hakkında bilgi edinin.

Destek Vektör Makinesi (SVM), sınıflandırma ve regresyon zorlukları için yaygın olarak kullanılan sağlam ve çok yönlü bir denetimli öğrenme algoritmasıdır. Sadece eğitim hatalarını en aza indirgemeyi amaçlayan birçok algoritmanın aksine, SVM veri noktalarını farklı sınıflara en iyi şekilde ayıran optimal sınırı (hiperdüzlem olarak adlandırılır) bulmaya odaklanır. Birincil amaç, bu karar sınırı ile her kategoriden en yakın veri noktaları arasındaki mesafe olan marjı en üst düzeye çıkarmaktır. Mümkün olan en geniş ayrımı önceliklendirerek, model yeni, görülmemiş veriler üzerinde daha iyi genelleme sağlar ve standart doğrusal regresyon gibi daha basit yöntemlere kıyasla aşırı uyum riskini etkili bir şekilde azaltır. .

Temel Mekanizmalar ve Kavramlar

SVM'lerin nasıl çalıştığını anlamak için, her bir boyutun belirli bir özelliği temsil ettiği çok boyutlu bir uzayda çizilen verileri görselleştirmek yararlıdır. Algoritma, gruplar arasında en etkili ayrımı bulmak için bu uzayda gezinir.

  • Optimal Hiperdüzlem: Temel amaç, girdi alanını bölen düz bir düzlem (veya daha yüksek boyutlarda hiperdüzlem) belirlemektir. Basit bir 2D veri kümesinde bu, bir çizgi olarak görünür; 3D'de ise düz bir yüzey haline gelir. Optimal hiperdüzlem, herhangi bir sınıftaki en yakın veri noktalarından mümkün olan en uzak mesafeyi koruyarak net bir ayrım sağlayan düzlemdir.
  • Destek Vektörleri: Bunlar, karar sınırına en yakın olan kritik veri noktalarıdır. Hiperdüzlemin konumunu ve yönünü etkili bir şekilde destekledikleri veya tanımladıkları için "destek vektörleri" olarak adlandırılırlar. Diğer veri noktalarını değiştirmek veya kaldırmak genellikle model üzerinde hiçbir etkiye sahip değildir, ancak bir destek vektörünü hareket ettirmek sınırı önemli ölçüde kaydırır. Bu kavram, Scikit-learn SVM kılavuzunda ayrıntılı olarak açıklandığı gibi, SVM'lerin verimliliğinin merkezinde yer alır. Scikit-learn SVM kılavuzu.
  • Çekirdek Hilesi: Karmaşık doğal dil işleme (NLP) veri kümeleri gibi gerçek dünya verileri nadiren doğrusal olarak ayrılabilir. SVM'ler, verileri doğrusal bir ayırıcıyla sınıfları etkili bir şekilde ayırabilen daha yüksek boyutlu bir uzaya yansıtan "çekirdek hilesi" adlı bir teknik kullanarak bu sınırlamayı aşar. Yaygın çekirdekler arasında Radyal Temel Fonksiyon (RBF) ve polinom çekirdekleri bulunur ve bunlar modelin karmaşık, doğrusal olmayan ilişkileri yakalamasına olanak tanır.

SVM ve İlgili Algoritmalar

SVM'leri diğer makine öğrenimi tekniklerinden ayırmak, uygulayıcıların tahminsel modelleme projeleri için doğru aracı seçmelerine yardımcı olur.

  • Lojistik Regresyon: Her ikisi de doğrusal sınıflandırıcıdır, ancak optimizasyon hedefleri önemli ölçüde farklıdır. Lojistik Regresyon olasılıksaldır ve gözlemlenen verilerin olasılığını en üst düzeye çıkarırken, SVM geometriktir ve sınıflar arasındaki marjı en üst düzeye çıkarır. SVM'ler iyi ayrılmış sınıflarda daha iyi performans gösterirken, Lojistik Regresyon kalibre edilmiş olasılık çıktıları sunar.
  • K-En Yakın Komşular (KNN): KNN, bir noktayı komşularının çoğunluk sınıfına göre sınıflandıran, parametrik olmayan, örnek tabanlı bir öğrenicidir. Buna karşılık, SVM, küresel bir sınırı öğrenen parametrik bir modeldir. SVM'ler, genellikle eğitildikten sonra daha hızlı çıkarım gecikmesi sunar, çünkü çalışma zamanında tüm veri kümesini depolamaya ve aramaya gerek yoktur.
  • Karar Ağaçları: Bir karar ağacı , hiyerarşik kurallar kullanarak veri alanını dikdörtgen bölgelere ayırır. SVM'ler, çekirdekler aracılığıyla karmaşık, eğri karar sınırları oluşturabilir; karar ağaçları ise aşırı derinleşmeden ve aşırı uyumlanmaya eğilimli hale gelmeden bu sınırları yaklaşık olarak belirlemekte zorlanabilir. .
  • Modern Derin Öğrenme (ör. YOLO26): SVM'ler genellikle uzmanların ilgili girdileri seçtiği manuel özellik mühendisliğine dayanır. Ultralytics gibi gelişmiş modeller, ham görüntülerden doğrudan otomatik özellik çıkarma konusunda mükemmeldir ve bu da onları gerçek zamanlı nesne algılama ve örnek segmentasyonu gibi karmaşık algısal görevler için çok daha üstün kılar.

Gerçek Dünya Uygulamaları

Destek Vektör Makineleri, doğrulukları ve yüksek boyutlu verileri işleme yetenekleri nedeniyle çeşitli endüstrilerde büyük önem taşımaktadır. .

  • Biyoinformatik: SVM'ler, protein yapısı tahmini ve gen sınıflandırması için yaygın olarak kullanılmaktadır. Karmaşık biyolojik dizileri analiz ederek, araştırmacılar belirli hastalıklarla ilgili kalıpları belirleyebilir ve bu da erken teşhis ve kişiselleştirilmiş tıpta yardımcı olur.
  • Metin Sınıflandırma: Metin özetleme ve spam filtreleme alanında, SVM'ler metin vektörlerinin yüksek boyutluluklarını yönetmede mükemmeldir. classify "spam" veya "spam değil" olarak etkili bir şekilde classify ve haber makalelerini konuya göre yüksek hassasiyetle kategorize edebilirler.

Uygulama Örneği

Modern bilgisayar görme görevleri genellikle Ultralytics gibi uçtan uca modeller kullanırken, SVM'ler bu modellerden çıkarılan özellikleri sınıflandırmak için hala güçlüdür. Örneğin, bir YOLO detect ve özelliklerini çıkarmak için kullanılabilir, ardından bir SVM, özel bir görev için classify belirli özellik vektörlerini classify üzere eğitilebilir.

Aşağıda, popüler olanı kullanan kısa bir örnek verilmiştir. scikit-learn kütüphaneyi kullanarak sentetik veriler üzerinde basit bir sınıflandırıcı eğitmek. sentetik veriler.

from sklearn import svm
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split

# Generate synthetic classification data
X, y = make_classification(n_features=4, random_state=0)
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

# Initialize and train the Support Vector Classifier
clf = svm.SVC(kernel="linear", C=1.0)
clf.fit(X_train, y_train)

# Display the accuracy on the test set
print(f"Accuracy: {clf.score(X_test, y_test):.2f}")

Daha büyük veri kümelerini yönetmek veya SVM iş akışlarını değiştirebilecek veya geliştirebilecek derin öğrenme modellerini eğitmek isteyen ekipler için, Ultralytics kesintisiz veri etiketleme ve model dağıtımı için araçlar sağlar. Matematiksel temellerle ilgilenenler, Cortes ve Vapnik (1995) tarafından yazılan ve SVM'lerin gürültülü gerçek dünya verilerini etkili bir şekilde işlemek için yumuşak kenar optimizasyonunu ayrıntılı olarak anlatan orijinal makaleye başvurabilirler.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın