Gerçek dünya uygulamaları için adil, doğru ve güvenilir makine öğrenimi modelleri sağlamak amacıyla, yapay zekadaki veri kümesi yanlılığını nasıl belirleyeceğinizi ve azaltacağınızı öğrenin.
Veri seti önyargısı, eğitmek için kullanılan bilgilerdeki sistematik bir hata veya dengesizlik anlamına gelir makine öğrenimi (ML) modelleri, sonuç olarak hizmet etmeleri amaçlanan gerçek dünya ortamını tam olarak yansıtmayan sistemler. Bu bağlamda bilgisayar görüşü (CV), modeller tanımayı öğrenir tamamen eğitim verilerine dayanan kalıplar. Eğer bu temel çarpıktır - örneğin, belirli bir demografik veya çevresel durumu aşırı temsil ederek - model bu kör noktaları "miras alacaktır". Bu olgu, zayıf genellemenin birincil nedenidir. Yapay zeka sistemi testlerde iyi performans gösteriyor ancak kullanıma sunulduğunda başarısız oluyor farklı senaryolarda gerçek zamanlı çıkarım.
Önyargının nereden kaynaklandığını anlamak, önlemeye yönelik ilk adımdır. Genellikle hastalığın erken evrelerinde ortaya çıkar. ve veri̇ toplama ve açiklama süreç:
Veri seti yanlılığının sonuçları, küçük rahatsızlıklardan yüksek riskli işlerde kritik güvenlik hatalarına kadar değişebilir. endüstriler.
Genellikle birlikte tartışılsa da, veri seti yanlılığını aşağıdakilerden ayırmak yararlı olacaktır algoritmik önyargı.
Her ikisi de yapay zekadaki daha geniş önyargı sorununa katkıda bulunur ve Bunları ele almak yapay zeka etiğinin merkezinde yer alır ve Yapay zekada adalet.
Geliştiriciler önyargıyı tespit etmek ve azaltmak için çeşitli teknikler kullanabilir. Kullanılması sentetik veriler gerçek dünyadaki boşlukları doldurmaya yardımcı olabilir veri azdır. Ek olarak, titiz parçalayan model değerlendirmesi Alt gruplara göre performans (sadece genel bir ortalama yerine) gizli eksiklikleri ortaya çıkarabilir.
Bir diğer güçlü yöntem de veri artırımıdır. Tarafından Eğitim görüntülerini yapay olarak değiştirerek -renkleri, dönüşü veya ışığı değiştirerek- geliştiriciler modeli öğrenmeye zorlayabilir önyargılı tesadüfi ayrıntılara dayanmak yerine daha sağlam özellikler.
Aşağıdaki örnekte, eğitim sırasında artırmanın nasıl uygulanacağı gösterilmektedir Ultralytics YOLO11 nesne ile ilgili önyargıları azaltmaya yardımcı olmak için yönlendirme veya aydınlatma koşulları:
from ultralytics import YOLO
# Load a YOLO11 model
model = YOLO("yolo11n.pt")
# Train with augmentations to improve generalization
# 'fliplr' handles left-right orientation bias
# 'hsv_v' varies brightness to handle lighting bias
model.train(
data="coco8.yaml",
epochs=5,
fliplr=0.5, # 50% probability of flipping image horizontally
hsv_v=0.4, # Vary image brightness (value) by +/- 40%
)
Veri seti kalitesini proaktif olarak yöneterek ve aşağıdaki gibi araçlar kullanarak artırma hiperparametreleri, mühendisler sorumlu yapay zeka herkes için güvenilir bir şekilde işleyen sistemler. Adalet ölçütleri hakkında daha fazla okuma için aşağıdaki gibi kaynaklar IBM'in Yapay Zeka Adaleti 360 mükemmel açık kaynak sağlar araç setleri.
