Makine öğreniminde örüntüleri tanımlamak, gürültüyü işlemek ve karmaşık veri kümelerini analiz etmek için güçlü bir kümeleme algoritması olan DBSCAN'ı keşfedin.
DBSCAN (Yoğunluğa Dayalı Uzamsal Kümeleme Uygulamaları ve Gürültü), yakından paketlenmiş veri noktalarını bir araya getirmek için kullanılan popüler bir denetimsiz öğrenme algoritmasıdır ve düşük yoğunluklu bölgelerde tek başına bulunan noktaları aykırı değerler olarak işaretler. Diğer kümeleme yöntemlerinden farklı olarak DBSCAN, küme sayısının önceden belirtilmesini gerektirmez. Rastgele şekilli kümeleri bulma yeteneği ve gürültüye karşı dayanıklılığı, onu veri madenciliği ve veri analitiği için güçlü bir araç haline getirir. Algoritma ilk olarak Martin Ester, Hans-Peter Kriegel, Jörg Sander ve Xiaowei Xu tarafından 1996'da yayınlanan ve alanında temel bir çalışma haline gelen bir makalede tanıtıldı.
DBSCAN, kümeleri belirli bir alandaki veri noktalarının yoğunluğuna göre tanımlar. İki temel parametre üzerinde çalışır:
eps): Bu parametre, bir veri noktası etrafındaki bir komşuluğun yarıçapını tanımlar. Bu mesafe içindeki tüm noktalar komşu olarak kabul edilir.Bu parametrelere dayanarak, DBSCAN her bir veri noktasını üç türden birine ayırır:
MinPts içinde eps komşuluğundadır. Bu noktalar bir kümenin iç kısmıdır.eps bir çekirdek noktanın komşuluğundadır ancak kendisi bir çekirdek nokta olmak için yeterli komşuya sahip değildir. Bu noktalar bir kümenin kenarını oluşturur.Algoritma, rastgele bir noktayla başlar ve komşuluğunu alır. Eğer bir çekirdek noktaysa, yeni bir küme oluşturulur. Algoritma daha sonra, doğrudan ulaşılabilen tüm komşuları ekleyerek kümeyi yinelemeli olarak genişletir; bu işlem, herhangi bir kümeye daha fazla nokta eklenemeyene kadar devam eder. scikit-learn belgelerinde görsel bir uygulamayı görebilirsiniz.
DBSCAN'in gürültüyü tanımlama ve doğrusal olmayan kümeleri keşfetme yeteneği, onu çeşitli alanlarda oldukça değerli kılar:
Ultralytics ekosistemi öncelikle denetimli öğrenme modellerine, örneğin nesne tespiti, görüntü sınıflandırması ve örnek segmentasyonu gibi görevler için Ultralytics YOLO'ya odaklanır. DBSCAN denetimsiz bir yöntem olsa da, prensipleri bilgisayarlı görü (CV)'nün daha geniş bağlamında önemlidir.
Örneğin, yoğun bir caddenin videosunda YOLO11 gibi bir modelle nesne algılama gerçekleştirdikten sonra, algılanan sınırlayıcı kutuların merkez koordinatlarına DBSCAN uygulanabilir. Bu işlem sonrası adım, bireysel yaya algılamalarını farklı kalabalıklarda gruplandırarak daha yüksek düzeyde sahne anlayışı sağlayabilir. Veri dağılımını anlamak, eğitim için veri kümeleri hazırlarken de çok önemlidir. DBSCAN kullanılarak yapılan keşifsel veri analizi, Ultralytics HUB gibi platformlar kullanılarak yönetilebilen ve görselleştirilebilen veri kümesindeki örüntüleri veya anormallikleri ortaya çıkarabilir.
k) önceden tanımlarken, DBSCAN küme sayısını otomatik olarak belirler. K-Means ayrıca küresel olmayan kümelerle de zorlanır ve her noktayı bir kümeye zorladığı için aykırı değerlere karşı hassastır. DBSCAN, keyfi şekilli kümeleri bulmada mükemmeldir ve aykırı değerleri gürültü olarak etkili bir şekilde izole eder.
