Görüntüleme Yapay Zekası sistemlerinde Yapay Zeka yanlılığını ve veri seti yanlılığını anlama
Veri seti yanlılığının bilgisayarlı görü modellerini nasıl etkilediğini ve Ultralytics YOLO11'in akıllı veri artırma ve esnek eğitim araçlarıyla yanlılığı azaltmaya nasıl yardımcı olduğunu öğren.

Yapay zeka (YZ) modelleri sorunları çözme biçimimizi değiştiriyor ancak mükemmel değiller. Otonom araçlardan sağlık hizmetlerindeki tanı araçlarına kadar, verileri yorumlamak ve kararlar almak için YZ'ye güveniyoruz. Peki verinin kendisi kusurlu olduğunda ne olur?
Yapay zekada yanlılık, genellikle kimse fark etmeden modellerde gelişen tutarsızlık modellerini ifade eder. Bu yanlılıklar, modellerin hatalı, tutarsız ve hatta zararlı tahminlerde bulunmasına neden olabilir. Bilgisayarlı görüde yanlılık genellikle tek bir ana kaynağa dayanır: veri kümesi. Modeli eğitmek için kullanılan veriler dengesiz veya temsil edici değilse, model bu boşlukları yansıtacaktır.
Veri kümesi yanlılığının nasıl oluştuğuna, bilgisayarlı görü modellerini nasıl etkilediğine ve geliştiricilerin bunu tespit edip önlemek için alabileceği adımlara daha yakından bakalım. Ayrıca, Ultralytics YOLO11 gibi modellerin, yeni ve görülmemiş veriler üzerinde iyi performans göstererek ve herkese daha eşit hizmet vererek, daha iyi genelleme yapan daha adil YZ sistemleri oluşturma çabalarını nasıl destekleyebileceğini göstereceğiz.
Link to this sectionYapay zeka yanlılığı nedir ve neden önemlidir?#
Yapay zeka yanlılığı, YZ sisteminde çarpık veya hatalı sonuçlara yol açan tutarlı hataları ifade eder. Daha basit bir ifadeyle, model görsel girdinin bir türünü diğerlerine tercih etmeye başlar; bu da modelin adaletini etkiler, ancak bu daha iyi performans gösterdiği için değil, eğitim biçiminden kaynaklanır.
Bu durum, özellikle modellerin görsel verilerden öğrendiği bilgisayarlı görü alanında yaygın olabilir. Bir veri kümesi çoğunlukla tek bir nesne, sahne veya kişi türünü içeriyorsa, model sadece bu vakalar için iyi çalışan kalıpları öğrenir.
Büyük şehirlerden alınan trafik görüntüleriyle eğitilmiş bir model hayal et. Kırsal bir alanda kullanılırsa, alışılmadık yol düzenlerini yanlış sınıflandırabilir veya daha önce hiç görmediği araç türlerini tespit edemeyebilir. İşte bu, eylem halindeki yapay zeka yanlılığıdır. Bu durum, modelin yeni veya çeşitli girdilerde iyi performans gösterme yeteneği olan genelleme becerisinin sınırlı olmasına ve doğruluğun düşmesine yol açar.
Sağlık veya güvenlik gibi doğruluğun esas olduğu uygulamalarda, bu hatalar sadece sinir bozucu değil, aynı zamanda tehlikeli olabilir. Yanlılığı ele almak, performans, güvenilirlik ve emniyet ile ilgilidir.
Link to this sectionVeri kümesi yanlılığı model davranışını nasıl etkiler#
Veri kümesi yanlılığından bahsettiğimizde, bir modeli eğitmek için kullanılan verilerdeki dengesizliği veya sınırlamayı kastediyoruz. Veri kümesi yanlılığı, eğitim verileri modellemesi amaçlanan gerçek dünya çeşitliliğini yeterince yansıtmadığında ortaya çıkar.
Bilgisayarlı görü modelleri dünyayı anlamaz. Onlar kalıpları anlarlar. Gördükleri tek köpek görüntüleri arka bahçelerdeki golden retriever'lar ise, karlı bir yolda bir husky'yi tanıyamayabilirler.

Şekil 1. Kaynak veriyi yeniden ağırlıklandırmak, daha iyi model doğruluğuna ulaşmaya yardımcı olur.
Bu, veri kümesi yanlılığının neden olduğu temel zorluklardan birini vurguluyor. Model, anlayışını kendisine gösterilene dayandırır. Eğer bu eğitim verisi gerçek dünya çeşitliliğini yansıtmıyorsa, modelin davranışı daralır ve bilinmedik koşullarda daha az etkili hale gelir.
Görüntü sınıflandırıcılar, her iki veri kümesi de aynı görev için oluşturulmuş olsa bile, eğitildiklerinden farklı bir veri kümesinde test edildiklerinde genellikle önemli ölçüde daha kötü performans gösterirler. Aydınlatma, arka planlar veya kamera açılarındaki küçük değişiklikler, doğrulukta gözle görülür düşüşlere yol açabilir. Bu, veri kümesi yanlılığının bir modelin genelleme yeteneğini ne kadar kolay etkileyebileceğini gösterir.
Bunlar uç durumlar değildir. Bunlar, veri hattının model mimarin kadar önemli olduğunun işaretleridir.
Link to this sectionYapay zeka eğitim verilerindeki yanlılık türleri#
Yanlılık, geliştirme sürecinde, genellikle veri toplama, etiketleme veya kürasyon sırasında ince yollarla görülebilir. Aşağıda, eğitim verilerini etkileyebilecek üç ana yanlılık türü yer almaktadır:
Link to this sectionSeçim yanlılığı#
Seçim yanlılığı, veri kümesi gerçek dünya kullanımında görülen çeşitliliği temsil etmediğinde ortaya çıkabilir. Bir yaya algılama modeli yalnızca açık, gündüz çekilmiş görüntüler üzerinde eğitilirse, gece veya sisli havalarda iyi performans göstermez. Dolayısıyla seçim süreci, kritik durumları kaçırmıştır.

Şekil 2. Sadece çeşitli olmayan bir alt kümenin seçildiği seçim yanlılığının görsel bir gösterimi.
Bu yanlılık, veri toplama biçimi nedeniyle veri kümesi tüm gerçek dünya senaryolarını kapsamadığında ortaya çıkar. Örneğin, sadece açık, gündüz görüntüleri üzerinde eğitilmiş bir yaya algılama modeli sis, kar veya düşük ışıkta başarısız olabilir. Bu durum genellikle veriler ideal veya uygun koşullar altında toplandığında gerçekleşir ve modelin çeşitli ortamlarda performans gösterme yeteneğini sınırlar. Toplama çalışmalarını daha çeşitli ortamları içerecek şekilde genişletmek, bu tür yanlılıkları azaltmaya yardımcı olur.
Ayrıca, içeriğin belirli konumlara, dillere veya sosyoekonomik bağlamlara doğru büyük ölçüde çarpıtılmış olabileceği çevrimiçi kaynaklardan oluşturulan veri kümelerinde de ortaya çıkabilir. Veri kümesini çeşitlendirmek için kasıtlı bir çaba gösterilmezse, model bu sınırlamaları miras alacaktır.
Link to this sectionEtiket yanlılığı#
Etiket yanlılığı, insan etiketleyiciler yanlış veya tutarsız etiketler uyguladığında ortaya çıkar. Yanlış bir etiket zararsız görünebilir, ancak bu sıklıkla gerçekleşirse model yanlış çağrışımları öğrenmeye başlar.
Tutarsız etiketleme, özellikle nesne algılama gibi karmaşık görevlerde eğitim sırasında modelin kafasını karıştırabilir. Örneğin, bir etiketleyici bir aracı "araba" olarak etiketlerken, diğeri benzer bir aracı "kamyon" olarak etiketleyebilir. Bu tutarsızlıklar, modelin güvenilir kalıpları öğrenme yeteneğini etkiler ve çıkarım sırasında doğruluğun düşmesine yol açar.

Şekil 3. Veri hatlarındaki yanlılık, gerçek dünya dengesizliklerinden kaynaklanır.
Etiket yanlılığı, belirsiz etiketleme yönergelerinden veya aynı verilerin farklı yorumlanmasından da kaynaklanabilir. İyi belgelenmiş etiketleme standartları oluşturmak ve kalite kontrol kontrolleri yapmak, bu zorlukları önemli ölçüde azaltabilir.
Etiketleyiciler için devam eden eğitim ve her örneği birden fazla etiketleyicinin gözden geçirdiği fikir birliği etiketlemesinin kullanılması, etiket yanlılığını en aza indirmek ve veri kümesi kalitesini iyileştirmek için iki etkili stratejidir.
Link to this sectionTemsil yanlılığı#
Temsil yanlılığı genellikle daha geniş toplumsal eşitsizlikleri yansıtır. Daha zengin veya daha bağlantılı bölgelerde toplanan veriler, daha az temsil edilen popülasyonların veya ortamların çeşitliliğini yakalamakta başarısız olabilir. Bu yanlılığı ele almak, gözden kaçan grupların ve bağlamların kasıtlı olarak dahil edilmesini gerektirir.
Temsil yanlılığı, belirli gruplar veya sınıflar veri kümesinde yeterince temsil edilmediğinde ortaya çıkar. Bunlar demografik grupları, nesne kategorilerini veya çevresel koşulları içerebilir. Bir model yalnızca tek bir cilt tonu, tek bir nesne türü veya tek bir arka plan stili görürse, tahminleri bu dengesizliği yansıtacaktır.
Bu tür bir yanlılığı, belirli gruplar veya kategoriler diğerlerinden çok daha küçük miktarlarda dahil edildiğinde gözlemleyebiliriz. Bu, modelin tahminlerini veri kümesindeki baskın örneklere doğru çarpıtabilir. Örneğin, birincil olarak tek bir demografik üzerinde eğitilmiş bir yüz tanıma modeli, tüm kullanıcılar arasında doğru performans göstermekte zorlanabilir. Veri çeşitliliği ile bağlantılı olan seçim yanlılığının aksine, temsil yanlılığı gruplar arasındaki dengeyle ilgilidir.
Çeşitlilik denetimleri ve hedeflenmiş veri genişletme stratejileri, tüm ilgili demografilerin ve kategorilerin eğitim veri kümesi boyunca uygun şekilde temsil edilmesini sağlamaya yardımcı olabilir.
Link to this sectionVeri kümesi yanlılığı nasıl tespit edilir ve azaltılır#
Gerçek dünya dağıtımlarında, yapay zeka yanlılığı sadece birkaç yanlış tahmin anlamına gelmez. Bazı insanlar için iyi çalışan ancak herkes için çalışmayan sistemlerle sonuçlanabilir.
Otomotiv yapay zekasında, algılama modelleri yaya grupları arasında tutarsız performans gösterebilir ve bu da yetersiz temsil edilen bireyler için daha düşük güvenlik sonuçlarına yol açabilir. Sorun modelin niyeti değildir. Eğitildiği görsel girdilerdir. Tarımda bile, nesne algılamadaki yanlılık, farklı ışık veya hava koşullarında mahsullerin zayıf tanımlanması anlamına gelebilir. Bunlar, modelleri sınırlı veya dengesiz veri kümeleri üzerinde eğitmenin yaygın sonuçlarıdır.
Yapay zeka yanlılığını düzeltmek, nereye bakacağını bilmekle başlar. Eğitim kümen eksik anahtar örnekler içeriyorsa veya dar bir aralığı aşırı temsil ediyorsa, modelin bu boşlukları yansıtacaktır. İşte bu yüzden yapay zekada yanlılık tespiti, her geliştirme hattında kritik bir adımdır.

Şekil 4. Yapay zeka yanlılığını azaltmak ve adaleti iyileştirmek için temel adımlar.
Veri kümeni analiz ederek başla. Sınıflar, ortamlar, aydınlatma, nesne ölçekleri ve demografiler genelindeki dağılıma bak. Bir kategori baskınsa, modelin büyük olasılıkla diğerlerinde düşük performans gösterecektir.
Ardından, performansa bak. Model belirli ayarlarda veya belirli nesne türleri için daha mı kötü performans gösteriyor? Eğer öyleyse, bu öğrenilmiş bir yanlılığın işaretidir ve genellikle verilere geri döner.
Dilim düzeyinde değerlendirme anahtardır. Bir model ortalamada %90 doğruluk bildirebilir ancak belirli bir grup veya koşulda sadece %60 performans gösterebilir. Bu dilimleri kontrol etmeden, bunu asla bilemezsin.
Eğitim ve değerlendirme sırasında adalet metriklerini kullanmak bir diğer güçlü araçtır. Bu metrikler standart doğruluk puanlarının ötesine geçer ve modelin verilerin farklı alt kümeleri arasında nasıl davrandığını değerlendirir. Aksi takdirde fark edilmeyecek kör noktaların ortaya çıkmasına yardımcı olurlar.
Veri kümesi kompozisyonu ve model testindeki şeffaflık, daha iyi modellere yol açar.
Link to this sectionVeri çeşitliliği ve artırma yoluyla adaleti iyileştirme#
Yanlılığı belirledikten sonra, bir sonraki adım boşluğu kapatmaktır. Bunu yapmanın en etkili yollarından biri, YZ modellerinde veri çeşitliliğini artırmaktır. Bu, farklı popülasyonlardan tıbbi görüntüler veya alışılmadık çevresel koşullar olsun, yetersiz temsil edilen senaryolardan daha fazla örnek toplamak anlamına gelir.
Daha fazla veri eklemek, özellikle çeşitliliği artırdığında değerli olabilir. Ancak, adaleti iyileştirmek aynı zamanda doğru türde örnekleri toplamaya da bağlıdır. Bunlar, modelinin karşılaşması muhtemel gerçek dünya çeşitliliğini yansıtmalıdır.
Veri artırma bir diğer değerli stratejidir. Döndürme, çevirme, aydınlatmayı ayarlama ve nesneleri ölçeklendirme, farklı gerçek dünya koşullarını simüle etmeye yardımcı olabilir. Artırma, sadece veri kümesi çeşitliliğini artırmakla kalmaz, aynı zamanda modelin görünüm, aydınlatma ve bağlamdaki değişikliklere karşı daha sağlam hale gelmesine de yardımcı olur.
Çoğu modern eğitim hattı varsayılan olarak artırmayı içerir, ancak göreve özel ihtiyaçlara göre ayarlamaya odaklanmak gibi stratejik kullanım, onu adalet için etkili kılan şeydir.
Link to this sectionBoşlukları doldurmak için sentetik verileri kullanma#
Sentetik veriler, gerçek dünya örneklerini taklit eden yapay olarak oluşturulmuş verileri ifade eder. Belirli senaryolar çok nadir veya doğal ortamda yakalanamayacak kadar hassas olduğunda yardımcı bir araç olabilir.
Örneğin, makinelerdeki nadir kusurları veya uç durumdaki trafik ihlallerini tespit etmek için bir model oluşturuyorsan, bu vakaları sentetik veriler kullanarak simüle edebilirsin. Bu, modeline eğitim kümenizde sık sık karşılaşmayabileceği olaylardan öğrenme fırsatı verir.
Çalışmalar, eğitime hedeflenmiş sentetik veriler eklemenin veri kümesi yanlılığını azaltabildiğini ve demografik gruplar ve ortamlar genelinde performansı artırabildiğini ortaya koymuştur.
Sentetik veriler, gerçek dünya örnekleriyle eşleştirildiğinde en iyi performansı gösterir. Veri kümeni tamamlar; onun yerini almaz.
Link to this sectionYOLO11 etik YZ'yi nasıl destekler#
Yanlı olmayan YZ modelleri oluşturmak aynı zamanda kullandığın araçlara da bağlıdır. YOLO11 esnek, ince ayar yapılması kolay ve oldukça uyarlanabilir olacak şekilde tasarlanmıştır, bu da onu veri kümesi yanlılığını azaltmak için güçlü bir seçenek haline getirir.
YOLO11, modeli eğitirken gelişmiş veri artırma tekniklerini destekler; bu da model genellemesini iyileştirmek ve aşırı uyumu azaltmak için çeşitli görüntü bağlamları ve harmanlanmış örnekler sunar.
YOLO11 ayrıca, daha etkili özellik çıkarımı için iyileştirilmiş bir omurga ve boyun mimarisine sahiptir. Bu yükseltme, modelin standart modellerin zorlanabileceği yetersiz temsil edilen veya uç durum senaryolarında kritik olan ince ayrıntıları tespit etme yeteneğini artırır.
YOLO11'in uç ve bulut ortamlarında yeniden eğitilmesi ve dağıtılması basit olduğundan, ekipler performans boşluklarını belirleyebilir ve alanda yanlılık keşfedildiğinde modeli hızla güncelleyebilir.
Adil YZ tek seferlik bir hedef değildir. Bu, değerlendirme, öğrenme ve ayarlama döngüsüdür. YOLO11 gibi araçlar, bu döngüyü daha hızlı ve daha üretken hale getirmeye yardımcı olur.
Link to this sectionÖne çıkanlar#
Yapay zeka yanlılığı, adaletten performansa kadar her şeyi etkiler. Bilgisayarlı görü yanlılığı genellikle veri kümelerinin toplanma, etiketlenme ve dengelenme biçiminden kaynaklanır. Neyse ki, bunu tespit etmenin ve azaltmanın kanıtlanmış yolları vardır.
Verilerini denetleyerek ve model performansını farklı senaryolar genelinde test ederek başla. Daha iyi eğitim kapsamı oluşturmak için hedeflenmiş veri toplama, artırma ve sentetik veriler kullan.
YOLO11, özel modelleri eğitmeyi, güçlü artırma tekniklerini uygulamayı ve yanlılık bulunduğunda hızlı yanıt vermeyi kolaylaştırarak bu iş akışını destekler.
Adil YZ inşa etmek sadece yapılması gereken doğru şey değildir. Aynı zamanda daha akıllı, daha güvenilir sistemler kurmanın yoludur.
Büyüyen topluluğumuza katıl! YZ hakkında daha fazla bilgi edinmek için GitHub depomuzu keşfet. Kendi bilgisayarlı görü projelerine başlamaya hazır mısın? Lisanslama seçeneklerimize göz at. Çözüm sayfalarımızı ziyaret ederek üretimde YZ ve tarımda görü tabanlı YZ hakkında bilgi edin!






