Yolo Vision Shenzhen
Shenzhen
Şimdi katılın
Sözlük

DBSCAN (Yoğunluğa Dayalı Gürültülü Uygulamaların Uzamsal Kümelenmesi)

Makine öğreniminde örüntüleri tanımlamak, gürültüyü işlemek ve karmaşık veri kümelerini analiz etmek için güçlü bir kümeleme algoritması olan DBSCAN'ı keşfedin.

DBSCAN (Yoğunluğa Dayalı Uzamsal Kümeleme Uygulamaları ve Gürültü), yakından paketlenmiş veri noktalarını bir araya getirmek için kullanılan popüler bir denetimsiz öğrenme algoritmasıdır ve düşük yoğunluklu bölgelerde tek başına bulunan noktaları aykırı değerler olarak işaretler. Diğer kümeleme yöntemlerinden farklı olarak DBSCAN, küme sayısının önceden belirtilmesini gerektirmez. Rastgele şekilli kümeleri bulma yeteneği ve gürültüye karşı dayanıklılığı, onu veri madenciliği ve veri analitiği için güçlü bir araç haline getirir. Algoritma ilk olarak Martin Ester, Hans-Peter Kriegel, Jörg Sander ve Xiaowei Xu tarafından 1996'da yayınlanan ve alanında temel bir çalışma haline gelen bir makalede tanıtıldı.

DBSCAN Nasıl Çalışır

DBSCAN, kümeleri belirli bir alandaki veri noktalarının yoğunluğuna göre tanımlar. İki temel parametre üzerinde çalışır:

  • Epsilon (ε veya eps): Bu parametre, bir veri noktası etrafındaki bir komşuluğun yarıçapını tanımlar. Bu mesafe içindeki tüm noktalar komşu olarak kabul edilir.
  • Minimum Nokta (MinPts): Bu, yoğun bir bölge veya küme oluşturmak için gereken minimum veri noktası sayısıdır (noktanın kendisi dahil).

Bu parametrelere dayanarak, DBSCAN her bir veri noktasını üç türden birine ayırır:

  1. Temel Noktalar: Bir nokta, en azından MinPts içinde eps komşuluğundadır. Bu noktalar bir kümenin iç kısmıdır.
  2. Sınır Noktaları: Bir nokta, eğer içindeyse bir sınır noktasıdır eps bir çekirdek noktanın komşuluğundadır ancak kendisi bir çekirdek nokta olmak için yeterli komşuya sahip değildir. Bu noktalar bir kümenin kenarını oluşturur.
  3. Gürültü Noktaları (Aykırı Değerler): Bir nokta, ne bir çekirdek nokta ne de bir sınır noktası ise gürültü olarak kabul edilir. Bunlar, herhangi bir kümeye ait olmayan aykırı değerlerdir.

Algoritma, rastgele bir noktayla başlar ve komşuluğunu alır. Eğer bir çekirdek noktaysa, yeni bir küme oluşturulur. Algoritma daha sonra, doğrudan ulaşılabilen tüm komşuları ekleyerek kümeyi yinelemeli olarak genişletir; bu işlem, herhangi bir kümeye daha fazla nokta eklenemeyene kadar devam eder. scikit-learn belgelerinde görsel bir uygulamayı görebilirsiniz.

Gerçek Dünya Yapay Zeka/Makine Öğrenimi Uygulamaları

DBSCAN'in gürültüyü tanımlama ve doğrusal olmayan kümeleri keşfetme yeteneği, onu çeşitli alanlarda oldukça değerli kılar:

  • Coğrafi Uzamsal Analiz: Şehir planlamacıları ve coğrafyacılar, mekansal verileri analiz etmek için DBSCAN'ı kullanır. Örneğin, trafik olaylarının GPS koordinatlarını kümeleyerek kaza sıcak noktalarını belirleyebilirler. Benzer şekilde, salgınları izleyen epidemiyologlara yardımcı olarak, bildirilen hastalık vakalarının kümelerini bulmak için kullanılabilir. Japonya Coğrafi Uzamsal Bilgi Otoritesi gibi kuruluşlar, haritalama için benzer yoğunluk tabanlı yöntemler kullanır.
  • Finansta Anomali Tespiti: Finans sektöründe, DBSCAN hileli işlemleri tespit etmek için kullanılabilir. Bir müşterinin tipik harcama kalıplarını kümeleyerek, bu kümelerin dışına düşen herhangi bir işlem (yani, gürültü olarak etiketlenen) daha fazla araştırma için işaretlenebilir. Bu yaklaşım, modern sahtekarlık tespit sistemlerinin önemli bir bileşenidir.

DBSCAN ve Ultralytics

Ultralytics ekosistemi öncelikle denetimli öğrenme modellerine, örneğin nesne tespiti, görüntü sınıflandırması ve örnek segmentasyonu gibi görevler için Ultralytics YOLO'ya odaklanır. DBSCAN denetimsiz bir yöntem olsa da, prensipleri bilgisayarlı görü (CV)'nün daha geniş bağlamında önemlidir.

Örneğin, yoğun bir caddenin videosunda YOLO11 gibi bir modelle nesne algılama gerçekleştirdikten sonra, algılanan sınırlayıcı kutuların merkez koordinatlarına DBSCAN uygulanabilir. Bu işlem sonrası adım, bireysel yaya algılamalarını farklı kalabalıklarda gruplandırarak daha yüksek düzeyde sahne anlayışı sağlayabilir. Veri dağılımını anlamak, eğitim için veri kümeleri hazırlarken de çok önemlidir. DBSCAN kullanılarak yapılan keşifsel veri analizi, Ultralytics HUB gibi platformlar kullanılarak yönetilebilen ve görselleştirilebilen veri kümesindeki örüntüleri veya anormallikleri ortaya çıkarabilir.

İlgili Terimlerden Ayırt Etme

  • K-Means Kümeleme: En önemli fark, K-Ortalamaların kullanıcının küme sayısını belirtmesini gerektirmesidir (k) önceden tanımlarken, DBSCAN küme sayısını otomatik olarak belirler. K-Means ayrıca küresel olmayan kümelerle de zorlanır ve her noktayı bir kümeye zorladığı için aykırı değerlere karşı hassastır. DBSCAN, keyfi şekilli kümeleri bulmada mükemmeldir ve aykırı değerleri gürültü olarak etkili bir şekilde izole eder.
  • Hiyerarşik Kümeleme: Bu yöntem, dendrogram olarak bilinen bir küme ağacı oluşturur. İç içe geçmiş küme yapılarını görselleştirmek için yararlı olmakla birlikte, DBSCAN'a kıyasla büyük veri kümelerinde hesaplama açısından daha maliyetli olabilir. Aralarındaki seçim genellikle veri kümesi boyutuna ve istenen çıktıya bağlıdır; bu da doğru kümeleme algoritmasını seçme kılavuzlarında belirtilmiştir.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve birlikte büyüyün

Şimdi katılın
Bağlantı panoya kopyalandı