YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024

Yeniliklerinizin etkisini tartmak için yapay zeka performansını ölçme

Abirami Vina

5 dakikalık okuma

22 Ağustos 2024

Doğru KPI'lar ve performans metrikleriyle yapay zeka inovasyonlarınızın başarısını izleyebilirsiniz. Yapay zeka uygulamalarının etkisini nasıl takip edip optimize edeceğinizi öğrenin.

Daha önce yapay zekanın sağlık hizmetleri, üretim ve turizm gibi farklı sektörlerde nasıl kullanılabileceğini incelemiştik. Ayrıca yapay zekanın günlük iş görevlerini nasıl iyileştirebileceğine baktık ve önde gelen yapay zeka iş fikirlerini tartıştık. Tüm bu tartışmalar kaçınılmaz olarak aynı temel soruya yol açıyor: bu tür yapay zeka uygulamalarının başarısını nasıl ölçebiliriz? Bu önemli bir soru çünkü sadece yapay zeka çözümlerini uygulamak yeterli değil. Bu çözümlerin aslında sonuç verdiğinden emin olmak, onları ezber bozan hale getiriyor. 

Bir yapay zeka modelinin süreçleri daha verimli hale getirmede, inovasyonu tetiklemede veya sorunları çözmede gerçekten etkili olup olmadığını belirlemek için Yapay Zeka performans metriklerini ölçebiliriz. Doğru temel performans göstergelerine (KPI'lar) odaklanarak, bir yapay zeka çözümünün ne kadar iyi çalıştığını ve nerede iyileştirilmesi gerekebileceğini anlayabiliriz.

Bu makalede, yapay zeka uygulamalarının başarısını en alakalı KPI'lar ile nasıl ölçeceğimize bakacağız. İş KPI'ları ve yapay zeka performans KPI'ları arasındaki farkları ele alacak, kesinlik ve hatırlama gibi temel metriklerin üzerinden geçecek ve özel yapay zeka çözümleriniz için en iyi KPI'ları seçmenize yardımcı olacağız.

Yapay zeka iş KPI'ları ile yapay zeka performans KPI'ları arasındaki fark

__wf_reserved_inherit
Şekil 1. Yapay Zeka İş KPI'ları ve Yapay Zeka Performans KPI'larının karşılaştırılması.

KPI'ları düşündüğünüzde, özellikle kurumsal yapay zeka hakkında konuşurken, hepsinin yatırım getirisi (ROI), maliyet tasarrufu veya elde edilen gelir gibi iş metrikleriyle ilgili olduğunu varsaymak doğaldır. Bu Yapay Zeka İş KPI'ları, yapay zekanın bir şirketin genel başarısını nasıl etkilediğini ölçer ve daha geniş iş hedefleriyle uyumludur. 

Ancak, Yapay Zeka Performans KPI'ları, doğruluk, kesinlik ve hatırlama gibi metrikleri kullanarak yapay zeka sisteminin kendisinin ne kadar iyi çalıştığına odaklanır. Aşağıda bu metriklerin ayrıntılarına gireceğiz, ancak özünde, iş KPI'ları yapay zekanın finansal ve stratejik faydalarını sergilerken, performans KPI'ları bir yapay zeka modelinin işini etkili bir şekilde yaptığından emin olur.

Bazı metrikler aslında her iki amaca da hizmet edebilir. Örneğin, bir görevi tamamlamak için gereken süre veya kaynaklardaki azalma gibi verimlilik kazanımları, hem bir performans KPI'sı (AI çözümünün ne kadar iyi çalıştığını gösteren) hem de bir iş KPI'sı (maliyet tasarruflarını ve üretkenlik iyileştirmelerini ölçen) olabilir. Müşteri memnuniyeti başka bir çapraz metriktir. Hem teknik performansı hem de genel iş hedefleri üzerindeki etkisi açısından yapay zeka destekli bir müşteri hizmetleri aracının başarısını yansıtabilir.

Temel yapay zeka performans metriklerini anlama

Bir yapay zeka modelinin ne kadar iyi performans gösterdiğini ölçmek için kullanılan birkaç yaygın metrik vardır. İlk olarak, tanımlarına ve nasıl hesaplandıklarına bakacağız. Ardından, bu metriklerin nasıl izlenebileceğini göreceğiz.

Hassasiyet

Hassasiyet, bir yapay zeka modelinin gerçek pozitifleri (modelin bir nesneyi veya durumu olması gerektiği gibi doğru bir şekilde tanımladığı durumlar) ne kadar doğru bir şekilde tanımladığını ölçen bir metriktir. Örneğin, bir yüz tanıma sisteminde, sistemin eğitildiği bir kişinin yüzünü doğru bir şekilde tanıması ve tanımlaması durumunda gerçek bir pozitif oluşur tespit et

Kesinliği hesaplamak için, önce doğru pozitiflerin sayısını sayın. Daha sonra bunu, modelin pozitif olarak etiketlediği toplam öğe sayısına bölebilirsiniz. Bu toplam, hem doğru tanımlamaları hem de yanlış pozitifler olarak adlandırılan hataları içerir. Esasen, kesinlik size modelin bir şeyi tanıdığını iddia ettiğinde ne sıklıkla doğru olduğunu söyler.

__wf_reserved_inherit
Şekil 2. Kesinliği Anlamak.

Yanlış pozitiflerin sonuçlarının maliyetli veya yıkıcı olabileceği senaryolarda özellikle önemlidir. Örneğin, otomatik üretimde, yüksek bir hassasiyet oranı, sistemin kusurlu ürünleri daha doğru bir şekilde işaretleyebileceğini ve iyi ürünlerin gereksiz yere atılmasını veya yeniden işlenmesini önleyebileceğini gösterir. Bir diğer iyi örnek ise güvenlik gözetimidir. Yüksek hassasiyet, yanlış alarmları en aza indirmeye ve yalnızca bir güvenlik yanıtı gerektiren gerçek tehditlere odaklanmaya yardımcı olur.

Geri Çağırma (Recall)

Geri çağırma (Recall), bir yapay zeka modelinin bir veri kümesi içindeki tüm ilgili örnekleri veya gerçek pozitifleri belirleme yeteneğini ölçmeye yardımcı olur. Basitçe söylemek gerekirse, bir yapay zeka sisteminin tespit etmek için tasarlandığı bir durumun veya nesnenin tüm gerçek vakalarını ne kadar iyi yakalayabildiğini temsil eder. Geri çağırma, doğru tespit sayısının, tespit edilmesi gereken toplam pozitif vaka sayısına bölünmesiyle hesaplanabilir (modelin doğru bir şekilde tanımladığı ve kaçırdığı vakaları içerir).

Kanser tespiti için kullanılan Yapay zeka destekli bir tıbbi görüntüleme sistemi düşünün. Bu bağlamda hatırlama (recall), sistemin doğru bir şekilde tanımladığı gerçek kanser vakalarının yüzdesini yansıtır. Kanser teşhisini kaçırmak hasta bakımı için ciddi sonuçlara yol açabileceğinden, yüksek hatırlama bu tür senaryolarda hayati öneme sahiptir.

Hassasiyet ve geri çağırma karşılaştırması

Hassasiyet ve geri çağırma, bir yapay zeka modelinin performansını değerlendirme söz konusu olduğunda aynı madalyonun iki yüzü gibidir ve genellikle bir denge gerektirirler. Buradaki zorluk, bir metriği iyileştirmenin genellikle diğerinin aleyhine olabilmesidir. 

Daha yüksek hassasiyet hedeflediğinizi varsayalım. Model daha seçici hale gelebilir ve yalnızca çok emin olduğu pozitifleri belirleyebilir. Öte yandan, geri çağırmayı iyileştirmeyi hedefliyorsanız, model daha fazla pozitif belirleyebilir, ancak bu daha fazla yanlış pozitif içerebilir ve hassasiyeti düşürebilir. 

Buradaki püf noktası, uygulamanızın özel ihtiyaçlarına göre kesinlik ve hatırlama arasında doğru dengeyi bulmaktır. Bunun için kullanışlı bir araç, farklı eşiklerde iki metrik arasındaki ilişkiyi gösteren Kesinlik-Hatırlama eğrisidir. Bu eğriyi analiz ederek, modelin özel kullanım durumunuz için en iyi performansı gösterdiği optimal noktayı belirleyebilirsiniz. Bu ödünleşmeyi anlamak, amaçlanan kullanım durumları için en iyi şekilde performans göstermeleri için yapay zekâ modellerine ince ayar yaparken yardımcı olur.

__wf_reserved_inherit
Şekil 3. Bir Kesinlik-Geri Çağırma Eğrisi Örneği.

Ortalama hassasiyet (mAP)

Ortalama Hassasiyet (mAP), modelin bir görüntü içindeki birden fazla nesneyi tanımlaması ve sınıflandırması gereken nesne algılama gibi görevler için yapay zeka modellerinin performansını değerlendirmek için kullanılan bir ölçüdür. mAP, modelin tanımak üzere eğitildiği tüm farklı kategorilerde ne kadar iyi performans gösterdiğini gösteren tek bir puan verir. Şimdi bunun nasıl hesaplandığına bakalım.

Bir Kesinlik-Geri Çağırma Eğrisi altındaki alan, o sınıf için Ortalama Kesinliği (AP) verir. AP, modelin belirli bir sınıf için tahminleri ne kadar doğru yaptığını, çeşitli güven düzeylerinde hem kesinliği hem de geri çağırmayı dikkate alarak ölçer (güven düzeyleri, modelin tahminlerinde ne kadar emin olduğunu ifade eder). Her sınıf için AP hesaplandıktan sonra, mAP, bu AP değerlerinin tüm sınıflar arasında ortalaması alınarak belirlenir.

__wf_reserved_inherit
Şekil 4. Çeşitli sınıfların ortalama kesinliği.

mAP, yayaları, araçları ve trafik işaretleri gibi birden fazla nesnenin aynı anda algılanması gereken otonom sürüş gibi uygulamalarda kullanışlıdır. Yüksek bir mAP puanı, modelin tüm kategorilerde sürekli olarak iyi performans gösterdiği anlamına gelir, bu da onu çok çeşitli senaryolarda güvenilir ve doğru kılar.

Performans metriklerini zahmetsizce hesaplayın

Temel yapay zeka performans metriklerini hesaplama formülleri ve yöntemleri göz korkutucu görünebilir. Ancak, Ultralytics paketi gibi araçlar bunu basit ve hızlı hale getirebilir. İster nesne tespiti, ister segmentasyon veya sınıflandırma görevleri üzerinde çalışıyor olun, Ultralytics, kesinlik, geri çağırma ve ortalama kesinlik (mAP) gibi önemli metrikleri hızlı bir şekilde hesaplamak için gerekli araçları sağlar.

Ultralytics'i kullanarak performans metriklerini hesaplamaya başlamak için, Ultralytics paketini aşağıda gösterildiği gibi kurabilirsiniz.

Bu örnekte, bir önceden eğitilmiş YOLOv8 modelini yükleyip performans metriklerini doğrulamak için kullanacağız, ancak Ultralytics tarafından sağlanan desteklenen modellerden herhangi birini yükleyebilirsiniz. İşte bunu nasıl yapabileceğiniz:

Model yüklendikten sonra, veri kümenizde doğrulama gerçekleştirebilirsiniz. Aşağıdaki kod parçacığı, kesinlik, geri çağırma ve mAP dahil olmak üzere çeşitli performans metriklerini hesaplamanıza yardımcı olacaktır:

Ultralytics gibi araçları kullanmak, performans metriklerini hesaplamayı çok daha kolay hale getirir, böylece modelinizi geliştirmek için daha fazla zaman harcayabilir ve değerlendirme sürecinin ayrıntıları hakkında daha az endişelenebilirsiniz.

Yapay zeka performansı, dağıtımdan sonra nasıl ölçülür?

Yapay zeka modelinizi geliştirirken, performansını kontrollü bir ortamda test etmek kolaydır. Ancak, model dağıtıldıktan sonra işler daha karmaşık hale gelebilir. Neyse ki, yapay zeka çözümünüzü dağıtımdan sonra izlemenize yardımcı olabilecek araçlar ve en iyi uygulamalar bulunmaktadır. 

Prometheus, Grafana ve Evidently AI gibi araçlar, modelinizin performansını sürekli olarak izlemek için tasarlanmıştır. Gerçek zamanlı içgörüler sağlayabilir, anormallikleri tespit edebilir ve olası sorunlar konusunda sizi uyarabilirler. Bu araçlar, üretimdeki yapay zeka modellerinin dinamik yapısına uyum sağlayan otomatik, ölçeklenebilir çözümler sunarak geleneksel izlemenin ötesine geçer.

Yapay zeka modelinizin dağıtımdan sonraki başarısını ölçmek için izleyebileceğiniz bazı en iyi uygulamalar şunlardır:

  • Net performans metrikleri belirleyin: Modelinizin ne kadar iyi çalıştığını düzenli olarak kontrol etmek için doğruluk, kesinlik ve yanıt süresi gibi temel metrikleri belirleyin.
  • Veri kayması olup olmadığını düzenli olarak kontrol edin: Modelinizin işlediği verilerdeki değişikliklere dikkat edin, çünkü bu durum düzgün yönetilmezse tahminlerini etkileyebilir.
  • A/B testi yapın: Mevcut modelinizin performansını yeni sürümler veya ince ayarlarla karşılaştırmak için A/B testini kullanın. Bu, model davranışındaki iyileştirmeleri veya gerilemeleri nicel olarak değerlendirmenize olanak tanır.
  • Performansı belgeleme ve denetleme: Yapay zeka sisteminizde yapılan değişikliklerin ve performans metriklerinin ayrıntılı kayıtlarını tutun. Bu, denetimler, uyumluluk ve modelinizin mimarisini zaman içinde geliştirmek için çok önemlidir.

Optimal yapay zeka KPI'larını seçmek sadece bir başlangıçtır

Bir yapay zeka çözümünü başarıyla uygulamak ve yönetmek, doğru KPI'ları seçmeye ve bunları güncel tutmaya bağlıdır. Genel olarak, yapay zeka çözümünün hem teknik olarak hem de iş etkisi açısından ne kadar iyi performans gösterdiğini vurgulayan metrikleri seçmek hayati önem taşır. Teknolojik gelişmeler veya iş stratejinizdeki değişiklikler gibi şeyler değiştikçe, bu KPI'ları tekrar gözden geçirmek ve ayarlamak önemlidir. 

Performans incelemelerinizi dinamik tutarak, yapay zeka sisteminizin güncel ve etkili kalmasını sağlayabilirsiniz. Bu metrikleri takip ederek, operasyonlarınızı iyileştirmeye yardımcı olacak değerli içgörüler elde edersiniz. Proaktif bir yaklaşım, yapay zeka çabalarınızın gerçekten değerli olmasını ve işinizi ileriye taşımanıza yardımcı olmasını garanti eder!

Topluluğumuza katılın ve bizimle birlikte yenilikler yapın! Yapay zeka alanındaki ilerlemelerimizi görmek için GitHub depomuzu keşfedin. Üretim ve sağlık hizmetleri gibi sektörleri öncü yapay zeka teknolojisiyle nasıl yeniden şekillendirdiğimizi öğrenin. 🚀

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Bağlantı panoya kopyalandı