Unsupervised Learning
Etiketlenmemiş verilerdeki gizli kalıpları keşfetmek için denetimsiz öğrenmeyi keşfet. Kümeleme, anomali tespiti ve bunun modern yapay zeka çözümlerini nasıl desteklediği hakkında bilgi edin.
Denetimsiz öğrenme, bir algoritmanın insan müdahalesi olmadan etiketlenmemiş verilerden kalıpları öğrendiği bir makine öğrenimi türüdür. Bir modeli eğitmek için etiketli girdi-çıktı çiftlerine dayanan denetimli öğrenmenin aksine, denetimsiz öğrenme geçmiş etiketleri olmayan verilerle ilgilenir. Sistem temel olarak girdi verileri içindeki gizli yapıları, kalıpları veya ilişkileri keşfederek kendi kendine öğretmeye çalışır. Bu yaklaşım, bugün üretilen verilerin büyük çoğunluğu (görüntüler, videolar, metinler ve sensör kayıtları) yapılandırılmamış ve etiketlenmemiş olduğundan özellikle değerlidir.
Link to this sectionDenetimsiz Öğrenme Nasıl Çalışır#
Denetimsiz senaryolarda, algoritma verilerdeki ilginç yapıları keşfetmek için kendi haline bırakılır. Amaç genellikle verilerin altında yatan dağılımı modellemek veya verinin kendisi hakkında daha fazla şey öğrenmektir. Eğitim sırasında "doğru cevaplar" sağlanmadığından, model geleneksel anlamda doğruluk açısından değerlendirilemez. Bunun yerine performans, genellikle modelin boyutsallığı ne kadar iyi azalttığına veya benzer veri noktalarını ne kadar iyi gruplandırdığına göre ölçülür.
Bu metodoloji, insanların genellikle yeni kavramları nasıl öğrendiğini yansıtır. Örneğin bir çocuk, "köpek" ve "kedi" isimlerini başlangıçta bilmek zorunda kalmadan, farklı şekillerini ve davranışlarını gözlemleyerek köpekleri ve kedileri birbirinden ayırt edebilir. Benzer şekilde, denetimsiz algoritmalar bilgileri doğal benzerliklere göre gruplandırır. Bu yetenek, sistemlerin sürekli insan denetimi olmaksızın yeni ortamlara uyum sağlamasına olanak tanıdığı için yapay genel zeka (AGI) geliştirilmesi için temeldir.
Link to this sectionDenetimsiz Öğrenmedeki Temel Teknikler#
Denetimsiz öğrenme, her biri farklı türdeki veri analizi problemleri için uygun olan birkaç farklı tekniği kapsar:
- Kümeleme: Bu, algoritmanın birbirine benzer veri noktalarını grupladığı en yaygın uygulamadır. Popüler bir yöntem, verileri özellik benzerliğine göre k farklı gruba ayıran K-Means kümelemedir. Bu, benzer satın alma davranışlarına sahip müşteri gruplarını belirlemek için pazar segmentasyonunda yaygın olarak kullanılır.
- Boyut Azaltma: Yüksek boyutlu veriler karmaşık olabilir ve işlenmesi hesaplama açısından maliyetli olabilir. Temel Bileşen Analizi (PCA) gibi teknikler, temel bilgilerini korurken bir veri kümesindeki değişken sayısını azaltır. Bu, veri görselleştirmeyi basitleştirir ve diğer makine öğrenimi modellerinin eğitimini hızlandırır.
- Anomali Tespiti: "Normal" verilerin neye benzediğini öğrenerek, denetimsiz modeller normalden önemli ölçüde sapan aykırı değerleri tanımlayabilir. Bu, olağandışı işlem kalıplarının güvenlik uyarılarını tetiklediği finansta dolandırıcılık tespiti için çok önemlidir.
- Birliktelik Kuralı Öğrenme: Bu teknik, büyük veritabanlarındaki değişkenler arasındaki ilginç ilişkileri keşfeder. Pazar sepeti analizi için yaygın olarak kullanılır ve perakendecilerin ekmek satın alan müşterilerin büyük olasılıkla tereyağı da satın alacağını anlamalarına yardımcı olur.
Link to this sectionDenetimsiz ve Denetimli Öğrenme Karşılaştırması#
Denetimsiz öğrenmeyi denetimli öğrenmeden ayırmak önemlidir. Temel fark kullanılan verilerdedir. Denetimli öğrenme etiketli bir veri kümesi gerektirir, yani her eğitim örneği doğru bir çıktı ile eşleştirilir (örneğin "kedi" etiketli bir kedi resmi). Model, hatayı en aza indirmek için girdileri çıktılara eşlemeyi öğrenir.
Buna karşılık, denetimsiz öğrenme etiketsiz veriler kullanır. Modele çıktısının doğru olup olmadığını söyleyen bir geri bildirim döngüsü yoktur. Veri etiketlemenin pahalı veya zaman alıcı olduğu durumlarda sıklıkla kullanılan, az miktarda etiketli veriyi büyük miktarda etiketsiz veriyle birleştirerek öğrenme doğruluğunu artıran yarı denetimli öğrenme adı verilen bir orta yol mevcuttur.
Link to this sectionGerçek Dünya Uygulamaları#
Denetimsiz öğrenme, günlük hayatta karşılaştığımız birçok teknolojiye güç verir. İşte iki somut örnek:
-
Perakendede Müşteri Segmentasyonu: E-ticaret platformları, önceden tanımlanmış kategoriler olmadan milyonlarca kullanıcı etkileşimini analiz eder. Kümeleme algoritmalarını kullanarak "hafta sonu kelepir avcıları" veya "teknoloji meraklıları" gibi belirgin kullanıcı kişiliklerini tanımlarlar. Bu, son derece kişiselleştirilmiş pazarlama kampanyalarına ve öneri sistemlerine olanak tanıyarak müşteri deneyimini önemli ölçüde iyileştirir.
-
Genomik Dizi Analizi: Biyoinformatikte araştırmacılar, genetik verileri analiz etmek için denetimsiz öğrenmeyi kullanırlar. Algoritmalar, farklı popülasyonlar arasında benzer genetik belirteçleri veya mutasyonları bulmak için DNA dizilerini kümelendirir. Bu, her bir gen fonksiyonu hakkında ön bilgiye ihtiyaç duymadan evrimsel ilişkileri anlamaya ve hastalıklara yönelik genetik yatkınlıkları belirlemeye yardımcı olur.
Link to this sectionKod Örneği: Scikit-Learn ile Kümeleme#
Ultralytics YOLO26 temel olarak denetimli bir nesne algılama çerçevesi olsa da, denetimsiz teknikler genellikle çapa kutusu dağılımlarını analiz etmek veya veri kümesi özelliklerini kümelendirmek gibi ön işleme adımlarında kullanılır. Aşağıda, temel bir denetimsiz teknik olan K-Means kümelemeyi gerçekleştirmek için sklearn kullanan basit bir örnek bulunmaktadır.
import numpy as np
from sklearn.cluster import KMeans
# Generate synthetic data: 10 points with 2 features each
X = np.array([[1, 2], [1, 4], [1, 0], [10, 2], [10, 4], [10, 0]])
# Initialize KMeans with 2 clusters (k=2)
kmeans = KMeans(n_clusters=2, random_state=0, n_init="auto")
# Fit the model to the data (no labels provided!)
kmeans.fit(X)
# Predict which cluster each point belongs to
print(f"Labels: {kmeans.labels_}")
# Output will group the first 3 points together (0) and the last 3 together (1)Link to this sectionDerin Öğrenmede Denetimsiz Öğrenmenin Rolü#
Modern derin öğrenme (DL) giderek daha fazla denetimsiz ilkeleri entegre etmektedir. Öz Denetimli Öğrenme (SSL) gibi teknikler, modellerin verilerden kendi denetim sinyallerini oluşturmalarına olanak tanır. Örneğin, Doğal Dil İşlemede (NLP), GPT-4 gibi modeller, bir cümledeki bir sonraki kelimeyi tahmin etmek için büyük miktarda metin üzerinde önceden eğitilir ve açık etiketler olmadan dilin yapısını etkili bir şekilde öğrenir.
Benzer şekilde, bilgisayarlı görüde (CV), öz kodlayıcılar (autoencoders) verimli veri kodlamalarını öğrenmek için kullanılır. Bu sinir ağları, görüntüleri daha düşük boyutlu bir temsile sıkıştırır ve ardından yeniden oluşturur. Bu süreç, ağa görsel verilerin en belirgin özelliklerini öğretir; bu da görüntü gürültüsü giderme ve üretken modelleme gibi görevler için yararlıdır.
Eğitim için veri kümelerini yönetmek isteyenler için Ultralytics Platform, denetimli eğitim süreci başlamadan önce kümeleri veya anomalileri belirlemeye yardımcı olabilecek veri dağılımlarını görselleştirme araçları sunar. Verilerinizin yapısını denetimsiz keşif yoluyla anlamak, genellikle sağlam yapay zeka çözümleri oluşturmaya giden ilk adımdır.






