Yapay zeka ve ML'de metin sınıflandırması, NLP, spam algılama ve duygu analizi için Naive Bayes sınıflandırıcılarının basitliğini ve gücünü keşfedin.
Naive Bayes, aşağıdaki alanlarda kullanılan oldukça verimli bir olasılıksal sınıflandırıcıdır uygulayan makine öğrenimi (ML) Bayes teoreminin ilkeleri güçlü bir özellikler arasında bağımsızlık varsayımı. Basitliğine rağmen, bu algoritma genellikle daha Özellikle metin tabanlı uygulamalarda sofistike teknikler. Bu aileye aittir denetimli öğrenme algoritmaları ve ünlü hem eğitim aşamasında hem de tahminler üretirken hızı için bir çıkarım motoru. Çünkü nispeten Gerekli tahminleri yapmak için az miktarda eğitim verisi parametreleri, sınıflandırma problemleri için popüler bir temel yöntem olmaya devam etmektedir.
"Naive" terimi algoritmanın temel önermesinden kaynaklanmaktadır: belirli bir algoritmanın varlığının Bir sınıftaki özelliğin başka herhangi bir özelliğin varlığıyla ilgisi yoktur. Örneğin, bir meyve bir sınıf olarak kabul edilebilir elma kırmızı, yuvarlak ve yaklaşık 3 inç çapındaysa. Bir Naive Bayes sınıflandırıcısı bu özelliklerin her birini dikkate alır Olası korelasyonlardan bağımsız olarak meyvenin elma olma olasılığına bağımsız olarak katkıda bulunmak Renk, yuvarlaklık ve boyut arasında.
Gerçek dünya verilerinde özellikler nadiren tamamen bağımsızdır. Bununla birlikte, bu basitleştirme modelin hesaplama karmaşıklığını önemli ölçüde azaltır ve aşağıdaki gibi sorunlardan kaçınır yüksek boyutlu veri kümelerinde aşırı uyum. Bu da onu Bayesian Network'ten farklı olarak açık bir şekilde değişkenler arasındaki karmaşık bağımlılıkları ve nedensel ilişkileri yönlendirilmiş asiklik bir grafik kullanarak modeller. Bir yandan Bayesian Ağları, sıkı sıkıya bağımlı sistemlerin daha doğru bir temsilini sunar, Naive Bayes hesaplama verimliliği.
Naive Bayes, yüksek boyutlu verileri içeren senaryolarda, özellikle de Doğal Dil İşleme (NLP).
Naive Bayes metin için güçlü olsa da, aşağıdaki gibi karmaşık algısal görevlerde genellikle yetersiz kalır bilgisayarla görme (CV). Görüntü verilerinde piksel değerleri yüksek oranda korelasyon gösterir; "naif" varsayım, nesneleri aşağıdakilere göre tanımlamaya çalışırken bozulur bağımsız pikseller. Aşağıdaki gibi görevler için görüntü sınıflandırma veya gerçek zamanlı nesne algılama, sofistike derin öğrenme (DL) modelleri tercih edilir.
Gibi modern mimariler YOLO11 konvolüsyonel kullanmak Naive Bayes'in göz ardı ettiği karmaşık özellik hiyerarşilerini ve uzamsal ilişkileri yakalamak için katmanlar. Ancak, Naif Bayes, temel çizgiyi belirlemek için yararlı bir ölçüt olmaya devam etmektedir Daha yoğun kaynak kullanan modelleri eğitmeden önce doğruluk.
Bu arada ultralytics paketi derin öğrenmeye odaklanırken, Naive Bayes tipik olarak
standart scikit-learn kütüphane. Aşağıdaki örnekte bir Gauss Naive Bayes'in nasıl eğitileceği gösterilmektedir
modeli, sürekli veriler için kullanışlıdır.
import numpy as np
from sklearn.naive_bayes import GaussianNB
# Sample training data: [height, weight] and class labels (0 or 1)
X = np.array([[5.9, 175], [5.8, 170], [6.1, 190], [5.2, 120], [5.1, 115]])
y = np.array([0, 0, 0, 1, 1])
# Initialize and train the classifier
model = GaussianNB()
model.fit(X, y)
# Predict class for a new individual
prediction = model.predict([[6.0, 180]])
print(f"Predicted Class: {prediction[0]}")
Naive Bayes'in birincil avantajı son derece düşük çıkarım gecikmesi ve ölçeklenebilirlik. İşleyebilir gibi diğer algoritmaları yavaşlatabilecek devasa veri kümeleri Destek Vektör Makineleri (SVM). Ayrıca, bağımsızlık varsayımı ihlal edildiğinde bile şaşırtıcı derecede iyi performans gösterir.
Bununla birlikte, bağımsız özelliklere dayanması, nitelikler arasındaki etkileşimleri yakalayamayacağı anlamına gelir. Eğer bir tahmin kelimelerin kombinasyonuna bağlıdır (örneğin, "iyi değil"), Naive Bayes modellere kıyasla zorlanabilir dikkat mekanizmalarını kullanarak veya Transformatörler. Ayrıca, testteki bir kategori veri eğitim setinde mevcut değilse, model sıfır olasılık atar; bu sorun genellikle aşağıdaki yöntemlerle çözülür Laplace yumuşatma.

