Bilgisayarla görme projelerinde pekiştirmeli öğrenmeden yararlanma

Abirami Vina

5 dakika okuma

5 Haziran 2025

Bilgisayarla görme uygulamalarında pekiştirmeli öğrenmenin, sistemlerin görmesine, karar vermesine ve sektörler arası gerçek dünya uygulamalarında gelişmesine nasıl yardımcı olduğunu keşfedin.

Yapay zekayı (YZ) açıklamanın basit bir yolu, insanların nasıl düşündüğünü ve öğrendiğini yeniden yaratmaya odaklanan bir alan olmasıdır. Tıpkı insanlar gibi makinelerin de zaman içinde performanslarını geliştirmelerine olanak tanıyan farklı yöntemler olan YZ'deki öğrenme teknikleri fikri buradan gelmektedir.

Daha önce, denetimli, denetimsiz, pekiştirmeli ve transfer öğrenimi dahil olmak üzere temel YZ öğrenme tekniklerini ve her birinin YZ modellerinin bilgiyi işlemesine ve karar vermesine yardımcı olmada nasıl önemli bir rol oynadığını araştırdık.

Bugün, yapay zeka sistemlerine bir ortamla etkileşime girerek ve geri bildirime dayalı olarak gelişerek deneyim yoluyla öğrenmeyi öğreten bir teknik olan pekiştirmeli öğrenmeye daha yakından bakacağız. Özellikle, pekiştirmeli öğrenmenin bilgisayarla görme uygulamalarına (makinelerin dünyadan gelen görsel bilgileri yorumlamasını ve anlamasını sağlayan sistemler) nasıl uygulanabileceğini keşfedeceğiz.

Takviyeli öğrenme ve bilgisayarla görme gibi kavramları bir araya getirmek heyecan verici yeni olasılıkların önünü açmaktadır ve aktif bir araştırma alanıdır. Yapay zeka sistemlerinin gördüklerini tanımasını ve bu görsel bilgilere dayanarak bilinçli kararlar almasını sağlar. 

Pekiştirmeli öğrenme nedir?

Takviyeli öğrenme, bir yapay zeka arac ısının eylemlerde bulunarak ve ödüller veya cezalar şeklinde geri bildirim alarak öğrendiği bir makine öğrenimi dalıdır. Amaç, hangi eylemlerin zaman içinde en iyi sonuçlara yol açtığını bulmaktır.

Pekiştirmeli öğrenmeyi bir köpeği eğitmek gibi düşünebilirsiniz. Bir köpek komut üzerine oturduğunda, ona bir ödül verirsiniz. Bir süre sonra köpek oturmanın bir ödül getirdiğini öğrenir. Takviyeli öğrenmede, yapay zeka ajanı veya modeli köpek gibidir; çevre, etrafındaki dünyadır ve ödül, doğru hareketi yapıp yapmadığını anlamasına yardımcı olur.

Bu, yapay zeka modeline doğru cevapların birçok örneğinin gösterildiği denetimli öğrenmeden farklıdır. Örneğin, modele bir köpek resmi gösterilebilir ve "Bu bir köpek" denebilir. 

Öte yandan pekiştirmeli öğrenme etiketli verilere dayanmaz. Bunun yerine, bir oyun oynamak ve hangi hamlelerin kazanmanıza yardımcı olduğunu bulmak gibi, farklı eylemler deneyerek ve sonuçlardan öğrenerek öğrenmeyi içerir.

__wf_reserved_inherit
Şekil 1. Takviyeli öğrenme ve denetimli öğrenme.

Takviyeli öğrenme, kararların adım adım verildiği ve her seçimin bir sonraki adımı değiştirdiği görevler için çok önemlidir. Bu tür öğrenme, strateji video oyunlarında oyunu oyuncular için daha zorlu ve ilgi çekici hale getirmek için kullanılır.

Yapay zeka çözümlerinde pekiştirmeli öğrenme nasıl çalışır?

Bisiklete binmeyi nasıl öğrendiğinizi düşünün. İlk başta düşebilirsiniz. Ancak pratik yaptıkça, dengede kalmanıza neyin yardımcı olduğunu anlamaya başlarsınız. Ne kadar çok sürerseniz, o kadar iyi olursunuz. Yaparak öğrenirsiniz, sadece ne yapmanız gerektiğini söyleyerek değil.

Takviyeli öğrenme yapay zeka için de benzer bir şekilde çalışır. Deneyim yoluyla öğrenir - farklı eylemler deneyerek, ne olduğunu gözlemleyerek ve zaman içinde doğru seçimleri yapma yeteneğini kademeli olarak geliştirerek.

__wf_reserved_inherit
Şekil 2. Pekiştirmeli öğrenmenin nasıl çalıştığını anlamak.

İşte pekiştirmeli öğrenmenin bazı temel bileşenlerine bir bakış:

  • Temsilci: Aracı, öğrenen veya karar verendir. Eylemlerde bulunarak çevre ile etkileşime girer ve belirli bir hedefe ulaşmayı amaçlar.
  • Çevre: Çevre, aracının etkileşimde bulunduğu her şeyi içerir. Temsilcinin eylemlerine yanıt olarak değişir ve sonuçlara göre geri bildirim sağlar.
  • Durum: Bir durum, ortamdaki mevcut durumun anlık görüntüsünü temsil eder. Etmen, çevresini anlamak ve bir sonraki adımda ne yapacağını belirlemek için durumu gözlemler.
  • Eylem: Eylem, aracı tarafından yapılan ve çevreyi etkileyen bir hareket veya karardır. Her eylem yeni bir duruma yol açar ve gelecekteki ödülleri etkileyebilir.
  • Ödül: Ödül, basitçe, ajana eyleminin faydalı olup olmadığını söyleyen çevreden gelen bir geri bildirimdir. Pozitif ödüller ajanı iyi eylemleri tekrarlamaya teşvik ederken, negatif ödüller kötü eylemlerin cesaretini kırar.
  • Politika: Politika, temsilcinin mevcut duruma göre eylem seçme stratejisidir. Zaman içinde, temsilci kazanabileceği toplam ödülleri maksimize etmek için politikasını geliştirir.

Takviyeli öğrenme, bu bileşenleri birlikte kullanarak yapay zeka sistemlerinin sürekli deneme yanılma yoluyla etkili davranışlar öğrenmesini mümkün kılar. Her denemede, aracı daha yüksek ödüllere ve daha iyi sonuçlara yol açan eylemleri seçmede daha iyi hale gelir.

Bilgisayarla görmede pekiştirmeli öğrenme yenilikleri

Bilgisayarla görme, görüntülerdeki nesneleri tespit etme, bir resimde ne olduğunu sınıflandırma ve bir görüntüyü farklı parçalara ayırma gibi görevler için kullanılır. Ultralytics YOLO11 gibi bilgisayarla görme modelleri bu tür görevleri destekler ve görsel içgörüler toplayabilen etkili uygulamalar oluşturmak için kullanılabilir.  

Bununla birlikte, bu Görsel Yapay Zeka görevleri takviyeli öğrenme ile birleştirildiğinde, sonuç sadece görmekle kalmayan, aynı zamanda görsel içgörülere dayalı olarak nasıl hareket edeceğini öğrenen ve zaman içinde daha iyi hale gelen bir Yapay Zeka çözümüdür.

Bilgisayarla görme uygulamalarında pekiştirmeli öğrenmenin ilginç bir örneği, robotların depolarda kullanılmasıdır. Kameralar ve bilgisayarlı görüş sistemleri ile donatılmış robotlar çevrelerini analiz edebilir, her bir ürünün nerede olduğunu tespit edebilir, şeklini ve boyutunu belirleyebilir ve rafta nasıl konumlandırıldığını anlayabilir.

Robot bir öğeyi her almaya çalıştığında geri bildirim alır - öğe doğru şekilde alınırsa başarı, düşürülürse başarısızlık. Zaman içinde robot, farklı öğeler için hangi eylemlerin en iyi sonucu verdiğini öğrenir. Sabit bir dizi talimatı takip etmek yerine, deneyim yoluyla sürekli olarak gelişir.

__wf_reserved_inherit
Şekil 3. Nesneleri almak için görsel yapay zeka ve takviyeli öğrenme kullanan bir robotik kol.

Bilgisayarla görmede pekiştirmeli öğrenme uygulamaları

Artık pekiştirmeli öğrenmenin ne olduğunu ve bilgisayarla görmedeki rolünü daha iyi anladığımıza göre, pekiştirmeli öğrenme ve bilgisayarla görmenin birlikte kullanıldığı bazı örneklere daha yakından bakalım.

Daha akıllı araçlar için Vision AI ve takviyeli öğrenmenin entegrasyonu

Otonom araçlar hem çevrelerini anlamak için Görme Yapay Zekasına hem de gördüklerine dayanarak karar vermek için pekiştirmeli öğrenmeye güvenebilir. Bunun en iyi örneği AWS DeepRacer'dır.

AWS DeepRacer, bir kamera ve takviyeli öğrenme kullanarak nasıl sürüleceğini öğrenen tamamen otonom 1/18 ölçekli bir yarış arabasıdır. Ne yapması gerektiği söylenmek yerine, deneyerek, hatalar yaparak ve bunlardan öğrenerek işleri kendi kendine çözüyor.

Bu küçük arabanın kamerası bir çift göz gibi çalışarak önündeki yolu yakalıyor. Gördüklerine dayanarak, araba nasıl yönlendirileceğini ve ne kadar hızlı gideceğini öğreniyor. Her turda daha iyi hale geliyor. Örneğin, geçmiş denemelerden öğrenerek daha geniş dönüşler almayı veya keskin virajlardan önce yavaşlamayı öğrenebilir.

DeepRacer için eğitim, modelin sürüş becerilerini geliştirdiği ve pratik yaptığı sanal bir ortamda başlar. Belirli bir performans seviyesine ulaştığında, bu beceriler fiziksel araçlarla gerçek dünya pistlerine aktarılır. 

__wf_reserved_inherit
Şekil 4. AWS DeepRacer otonom sürüş için görüş ve takviye öğrenimi kullanıyor. Görüntü kaynağı: Amazon. 

Otonom cerrahi robotlara doğru ilerliyoruz

Dikkat çeken heyecan verici bir araştırma alanı, robotik cerrahide Görme Yapay Zekası ve takviye öğrenmenin entegrasyonudur. Şu anda bu uygulama hala büyük ölçüde teoriktir. Araştırmacılar sanal ortamlarda simülasyonlar yürütüyor.

Bununla birlikte, ilk deneyler umut verici sonuçlar göstermekte ve cerrahi robotların nihayetinde karmaşık, hassas prosedürleri daha fazla hassasiyet, uyarlanabilirlik ve minimum insan müdahalesi ile gerçekleştirebileceğini düşündürmektedir.

__wf_reserved_inherit
Şekil 5. Cerrahi robotlar giderek daha gelişmiş hale geliyor.

Örneğin, bir gazlı bez parçasının cerrahi bir bölgeden dikkatlice kaldırılması gereken bir durum düşünün. Vision AI ile donatılmış bir robot, gazlı bezi ve çevresindeki dokuları tanımlamak için segmentasyonu kullanarak önce sahneyi analiz edecektir. 

Takviyeli öğrenme daha sonra cerrahi robotun göreve nasıl yaklaşacağına karar vermesine, gazlı bezi kavramak için en iyi açıyı, ne kadar basınç uygulayacağını ve yakındaki hassas bölgeleri rahatsız etmeden nasıl kaldıracağını belirlemesine yardımcı olacaktır. Zamanla ve simüle edilmiş ortamlarda tekrarlanan uygulamalarla robot bu ince, kritik hareketleri artan beceri ve güvenle gerçekleştirmeyi öğrenebilir.

Görme yapay zekasında pekiştirmeli öğrenmenin artıları ve eksileri

Takviyeli öğrenme, Vision AI sistemlerinin basit tanımanın ötesine geçmesine ve gördüklerine dayanarak kararlar almaya başlamasına olanak tanır. Bu da robotik, otomasyon ve gerçek zamanlı etkileşim gibi alanlarda yeni olasılıkların önünü açıyor. 

Pekiştirmeli öğrenmeyi Vision AI iş akışlarına entegre etmenin bazı önemli avantajları şunlardır:

  • Etiketli verilere daha az bağımlılık: Bu sistemler etkileşimden öğrenebilir, bu nedenle başlamak için büyük etiketli veri kümelerine ihtiyaç duymazlar.
  • Belirsizliği daha iyi ele alır: Takviyeli öğrenme, yalnızca mükemmel verilere güvenmek yerine geri bildirime dayalı eylemleri ayarlayarak eksik veya gürültülü görsel bilgilerle başa çıkabilir.
  • Uzun vadeli öğrenmeyi destekler: Sadece tek adımlı kararlardan değil, eylem dizilerinden öğrenerek modellerin zaman içinde gelişmesine yardımcı olur.

Öte yandan, takviyeli öğrenmenin dikkate alınması gereken bazı sınırlamaları şunlardır:

  • Kredi atama sorunu: Temsilci için, özellikle uzun karar dizilerinde, hangi belirli eylemlerin nihai sonuca katkıda bulunduğunu bulmak zor olabilir.
  • Güvenli olmayan keşif riski: Eğitim sırasında, aracı sağlık hizmetleri veya otonom sürüş gibi gerçek dünya uygulamalarında kabul edilemeyecek güvenli olmayan veya istenmeyen eylemleri deneyebilir.
  • Yavaş yakınsama: Özellikle karmaşık görevler için modelin gerçekten iyi bir performansa ulaşması uzun zaman alabilir.

Önemli çıkarımlar

Bilgisayarla görme projelerinde takviyeli öğrenme, yapay zeka sistemlerinin çevrelerini anlamalarını ve deneyim yoluyla nasıl hareket edeceklerini öğrenmelerini sağlar. Ultralytics YOLO11 gibi gerçek zamanlı nesne algılama sağlayan modellerle, sistem gördüklerine dayanarak bilinçli kararlar verebilir.

Bu yaklaşım, yapay zekanın yalnızca etiketlenmiş verilere dayanmak yerine deneme ve geri bildirim yoluyla gelişmesine olanak tanıyarak geleneksel yöntemlerin ötesine geçer. Sürekli öğrenmeyi destekler ve zaman içinde daha iyi hale gelen daha esnek, uyarlanabilir ve akıllı Vision AI sistemlerinin oluşturulmasına yardımcı olur.

Büyüyen topluluğumuza katılın. Yapay zekaya daha derinlemesine dalmak için GitHub depomuzu ziyaret edin. Kendi yapay görme projelerinizi mi başlatmak istiyorsunuz? Lisanslama seçeneklerimizi keşfedin. Çözüm sayfalarımızda üretimde yapay zeka ve otomotiv sektöründe yapay zeka hakkında daha fazla bilgi edinin.

Yapay zekanın gelecekteki
adresini birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Panoya kopyalanan bağlantı