Sözlük

Güven

Yapay zeka güven puanlarını tanımlayın. Modellerin tahmin kesinliğini nasıl ölçtüğünü, güvenilirlik için eşikleri nasıl belirlediğini ve güveni doğruluktan nasıl ayırdığını öğrenin.

Makine öğreniminde güven puanı, tek bir tahmine atanan ve modelin tahminin doğru olduğuna dair kesinliğini gösteren sayısal bir değerdir. Yüzde veya 0 ile 1 arasında bir olasılık değeri olarak ifade edilen bu değer, modelin tek bir örnek için kendi çıktısına olan "inancını" ölçer. Örneğin, bir nesne algılama görevinde, Ultralytics YOLO11 gibi bir model bir görüntüdeki bir arabayı tanımlayabilir ve 0,95 (veya %95) güven puanı atayabilir, bu da bulgusundan çok emin olduğunu gösterir. Bu puan, kullanıcıların modelin sonuçlarını gerçek dünya senaryolarında filtrelemesine, önceliklendirmesine ve yorumlamasına yardımcı olan kritik bir çıktıdır.

Güven puanı tipik olarak bir sinir ağının (NN) son katmanının çıktısından, genellikle bir softmax veya sigmoid fonksiyonundan elde edilir. Bu değer, belirli bir kesinlik seviyesinin altına düşen tahminleri atmak için bir güven eşiğinin ayarlandığı pratik uygulamalarda çok önemlidir. Geliştiriciler bu eşiği ayarlayarak, ilgili tüm tespitleri yakalamak ve model dağıtımında önemli bir husus olan yanlış pozitifleri en aza indirmek arasındaki dengeyi sağlayabilirler.

Gerçek Dünya Uygulamaları

Güven puanları, yapay zeka sistemlerini daha güvenilir ve eyleme geçirilebilir hale getirmek için çok önemlidir. Sistemlerin belirsizliği ölçmesine ve buna göre farklı tepkileri tetiklemesine olanak tanırlar.

  • Otonom Araçlar: Sürücüsüz araçlarda güven puanları güvenlik için hayati önem taşır. Bir nesne algılayıcısı bir yayayı %98 güvenle tespit edebilir, bu da aracın yavaşlaması veya durması için açık bir sinyaldir. Tersine, bir nesneyi yalnızca %30 güvenle tespit ederse, sistem onu belirsiz olarak işaretleyebilir ve harekete geçmeden önce doğasını doğrulamak için diğer sensörleri kullanabilir. Bu, yüksek kesinlikteki tehditlere odaklanarak kazaların önlenmesine yardımcı olur. Bu konuyla ilgili daha fazla ayrıntı için sürücüsüz araçlarda yapay zekanın rolü hakkında bilgi edinebilirsiniz.
  • Tıbbi Görüntü Analizi: Bir yapay zeka modeli, tıbbi görüntülemede tümörleri tespit etmek gibi hastalık belirtileri için tıbbi taramaları analiz ettiğinde, güven puanı çok değerlidir. 99 güvene sahip bir tespit, bir radyoloğun incelemesi için hemen işaretlenebilir. 60 güvene sahip bir bulgu "belirsiz" veya "daha fazla inceleme gerekiyor" olarak işaretlenebilir, böylece belirsiz vakaların uzmanları yanlış alarmlarla boğmadan insan incelemesi almasını sağlar. FDA, tıbbi cihazlarda AI/ML konusunda rehberlik sağlamaktadır.

Güven ve Diğer Ölçütler

Tek bir tahminin güven puanını genel model değerlendirme metrikleriyle karıştırmamak önemlidir. Birbirleriyle ilişkili olsalar da performansın farklı yönlerini ölçerler:

  • Doğruluk: Tüm veri kümesi genelinde doğru tahminlerin genel yüzdesini ölçer. Model performansı hakkında genel bir fikir verir ancak tek tek tahminlerin kesinliğini yansıtmaz. Bir model yüksek doğruluğa sahip olabilir ancak yine de bazı tahminleri düşük güvenle yapabilir.
  • Kesinlik: Gerçekten doğru olan pozitif tahminlerin oranını gösterir. Yüksek hassasiyet, daha az yanlış alarm anlamına gelir. Güven, modelin tahminine olan inancını yansıtır, bu da doğrulukla uyumlu olabilir veya olmayabilir.
  • Geri Çağırma (Hassasiyet): Modelin doğru tespit ettiği gerçek pozitif örneklerin oranını ölçer. Yüksek geri çağırma, daha az gözden kaçan tespit anlamına gelir. Güven, kaç tane gerçek pozitifin bulunduğuyla doğrudan ilgili değildir.
  • F1-Skoru: Kesinlik ve Hatırlama değerlerinin harmonik ortalamasıdır ve her ikisini de dengeleyen tek bir ölçüm sağlar. Güven, model performansının toplu bir ölçüsü değil, tahmin düzeyinde bir puan olarak kalır.
  • Ortalama Ortalama Hassasiyet (mAP): Nesne algılamada farklı güven eşikleri ve sınıflar arasında hassasiyet-hatırlama eğrisini özetleyen yaygın bir metriktir. mAP hesaplaması güven eşiklerini içerirken, güven puanının kendisi her bir tespit için geçerlidir.
  • Kalibrasyon: Güven puanlarının gerçek doğruluk olasılığı ile ne kadar uyumlu olduğunu ifade eder. İyi kalibre edilmiş bir modelin %80 güvenle yaptığı tahminler zamanın yaklaşık %80'inde doğru olmalıdır. Modern sinir ağlarından elde edilen güven puanları, model kalibrasyonu üzerine yapılan araştırmalarda tartışıldığı gibi, her zaman doğal olarak iyi kalibre edilmiş değildir.

Özetle, güven, bireysel YZ tahminlerinin kesinliğini değerlendirmek için değerli bir çıktıdır ve gerçek dünya uygulamalarında daha iyi filtreleme, önceliklendirme ve karar verme sağlar. Ultralytics HUB gibi araçları kullanarak izleyebileceğiniz ve analiz edebileceğiniz gibi, bir modelin genel performansını değerlendiren metrikleri tamamlar, ancak bunlardan farklıdır.

Ultralytics topluluğuna katılın

Yapay zekanın geleceğine katılın. Küresel yenilikçilerle bağlantı kurun, işbirliği yapın ve büyüyün

Şimdi katılın
Panoya kopyalanan bağlantı