Yolo Vision Shenzhen
Shenzhen
Şimdi katılın

Bilgisayarla Görü, Görsel Yapay Zeka aracılarının nasıl karar verdiğini yönlendirir

Abirami Vina

4 dakika okuma

20 Ocak 2025

Yapay zeka ajanlarının endüstrileri yeniden icat etmek için bilgisayarlı görmeyi nasıl kullandığını öğrenin. Güvenlik, sürücüsüz arabalar ve daha fazlası gibi alanlardaki uygulamalarını keşfedin.

Üretimden perakendeye kadar her sektör kendi süreç zorluklarıyla karşı karşıyadır ve bu sorunları çözmek için yenilikçi yollar bulmak, başarılı işletmeler yürütmenin her zaman anahtarı olmuştur. Son zamanlarda, yapay zeka aracıları birçok alanda popüler bir çözüm haline geldi. Bu sistemler, verileri analiz etmenin ötesine geçiyor. Aynı zamanda harekete de geçebiliyorlar. 

Örneğin, üretimde yapay zeka aracıları, kusurları gerçek zamanlı olarak tespit edebilir ve üretimi sorunsuz bir şekilde sürdürmek için otomatik olarak kalite kontrol önlemleri başlatabilir. Benzer şekilde, lojistik ve perakende sektöründe, akıllı gözetim kullanarak birden fazla konumu izleyebilir ve ekipleri olağandışı aktivitelere karşı anında uyarabilirler. 

Bu eğilim büyüdükçe, yapay zeka aracıları dünya çapında endüstrileri aktif olarak dönüştürüyor. Küresel yapay zeka aracıları pazarı 2024'te 5,1 milyar dolara ulaştı ve 2030'a kadar 47,1 milyar dolara ulaşması bekleniyor.

__wf_reserved_inherit
Şekil 1. Küresel AI agent pazar büyüklüğüne bir bakış.

Bu gelişmelerin arkasındaki temel teknolojilerden biri bilgisayarlı görü'dür. Makinelerin görsel verileri işlemesini ve yorumlamasını sağlayarak, Görüntü İşleme Yapay Zekası, yapay zeka aracılarının gerçek zamanlı nesne tespiti, örnek segmentasyonu ve nesne takibi gibi bilgisayarlı görü görevlerini inanılmaz bir doğrulukla gerçekleştirmesini mümkün kılar. Makinelerin gördükleri ile nasıl karar verdikleri arasındaki boşluğu doldurarak, birçok yapay zeka destekli çözümün kritik bir parçası haline gelir.

Bu makalede, yapay zeka ajanlarını ve bunların bilgisayarlı görü ile ilişkisini inceleyeceğiz. Ayrıca, farklı yapay zeka ajanı türlerini ve bunların görüntü tabanlı uygulamalarda nasıl kullanıldığını tartışacağız. Hadi başlayalım!

Yapay zeka aracıları (AI agents) nelerdir?

Görsel tabanlı yapay zeka agent'larına dalmadan önce, bu sistemlerin ne kadar çok yönlü olabileceğini görmek için genel olarak yapay zeka agent'larını anlamak için biraz zaman ayıralım.

Yapay zeka ajanı, bir insanın yardımına ihtiyaç duymadan görevleri veya soruları anlayabilen ve yanıtlayabilen akıllı bir sistemdir. Birçok yapay zeka ajanı, temel soruları yanıtlamaktan karmaşık süreçleri yönetmeye kadar çok çeşitli görevleri yerine getirmek için makine öğrenimi ve doğal dil işlemeyi (NLP) kullanır. 

Bazı yapay zeka aracıları, her güncelleme için insan girdisine dayanan geleneksel yapay zeka sistemlerinden farklı olarak, zamanla öğrenme ve gelişme yeteneğine bile sahiptir. İşte bu yüzden yapay zeka aracıları hızla yapay zekanın vazgeçilmez bir parçası haline geliyor. Görevleri otomatikleştirebilir, kararlar alabilir ve sürekli denetime ihtiyaç duymadan çevreleriyle etkileşim kurabilirler. Özellikle tekrarlayan ve zaman alan görevleri yönetmek için kullanışlıdırlar.

Örneğin, müşteri hizmetleri ve konaklama gibi sektörlerde AI aracılarını bulabilirsiniz. AI aracıları, müşteri hizmetlerinde para iadelerini işlemek ve kişiselleştirilmiş ürün önerileri sunmak için kullanılmaktadır. Bu arada, konaklama sektöründe otel personelinin konuk isteklerini yönetmesine, oda servisini kolaylaştırmasına ve konuklara yakındaki turistik yerleri önermesine yardımcı olabilirler. Bu örnekler, AI aracıların günlük süreçleri nasıl daha hızlı ve daha verimli hale getirdiğini göstermektedir.

Görüntü işleme yapay zeka ajanlarının nasıl çalıştığını anlama

Şimdi de yapay zeka (AI) ajanlarının nasıl çalıştığına hızlıca bir göz atalım. Her yapay zeka ajanı benzersiz ve belirli görevler için tasarlanmış olsa da, hepsi aynı üç ana adımı paylaşır: algılama, karar verme ve eylem.

İlk olarak, algılama adımında, yapay zeka aracıları neler olduğunu anlamak için farklı kaynaklardan bilgi toplar. Sonraki adım karar vermedir. Topladıkları bilgilere dayanarak, durumu analiz etmek ve en iyi hareket tarzına karar vermek için algoritmalarını kullanırlar. Son olarak, eylem vardır. Bir karar verdikten sonra, bunu uygularlar - ister bir soruyu yanıtlamak, ister bir görevi tamamlamak veya bir sorunu bir insanın ele alması için işaretlemek olsun.

Kulağa basit gelebilir, ancak AI aracısının türüne bağlı olarak, bu adımların çalışmasını sağlamak için genellikle perde arkasında çok şey olur. Karmaşık verileri analiz etmekten gelişmiş makine öğrenimi modellerini kullanmaya kadar, her AI aracısı kendi yolunda belirli görevleri yerine getirmek için oluşturulmuştur. 

Örneğin, birçok AI aracısı NLP aracılığıyla dili işlemeye odaklanırken, diğerleri - vision AI aracıları olarak bilinir - görsel verileri işlemek için bilgisayarlı görü entegre eder. Ultralytics YOLO11 gibi gelişmiş bilgisayarlı görü modellerini kullanan vision AI aracıları, daha hassas görüntü analizi gerçekleştirebilir.

__wf_reserved_inherit
Şekil 2. YOLO11 kullanılarak bir görüntüdeki elmaları sayma örneği.

Otonom sürüşlü arabalarda kullanılan vizyon yapay zeka aracıları

Gelin, yukarıda açıklanan üç ana adımda vizyon yapay zeka aracılarının nasıl çalıştığını görmek için otonom sürüşlü arabaları bir örnek olarak kullanalım:

  • Algılama: Otonom sürüşteki Görüntü İşleme (Vision AI) aracıları, araca takılan kameralardan ve sensörlerden görsel veriler toplar. Bu veriler, diğer araçlar, yayalar, trafik sinyalleri ve yol işaretleri gibi çevrenin görüntülerini ve videolarını içerir.
  • Karar Verme: Yapay zeka aracısı, bu görsel verileri YOLO11 gibi modelleri kullanarak işler. Arabalar ve yayalar gibi nesneleri tanımlar, engelleri veya ani şerit değişikliklerini algılar ve trafik akışı ve sinyal durumları gibi kalıpları tanır. Bu, arabanın yol koşullarını gerçek zamanlı olarak anlamasına yardımcı olur.
  • Hareket: Yapay zeka ajanı, analizine dayanarak, bir engelden kaçınmak için direksiyonu çevirmek, hızı ayarlamak veya kırmızı ışıkta durmak gibi eylemlerde bulunur. Bu kararlar, güvenli ve verimli sürüş sağlamak için hızla alınır.

Waymo'nun sürücüsüz arabaları bu teknolojinin harika bir örneğidir. Çevrelerini anlamak, gerçek zamanlı kararlar almak ve insan girdisi olmadan yollarda güvenli ve verimli bir şekilde gezinmek için vizyon yapay zeka aracılarını kullanırlar.

__wf_reserved_inherit
Şekil 3. Waymo'nun yapay zeka tabanlı sürücüsüz taksisi.

Görüntü işleme YZ aracı türleri 

Yapay zeka ajanlarının nasıl çalıştığını ve bilgisayarlı görüyü nasıl kullandıklarını gördüğümüze göre, farklı yapay zeka ajanı türlerine bakalım. Her tür, basit eylemlerden daha karmaşık karar verme ve öğrenmeye kadar belirli görevler için tasarlanmıştır.

Basit refleks ajanları

Basit refleks ajanları, en temel yapay zeka ajanı türüdür. Herhangi bir geçmişi veya gelecekteki sonuçları dikkate almadan, tamamen mevcut duruma göre belirli girdilere önceden tanımlanmış eylemlerle yanıt verirler. Bu ajanlar tipik olarak davranışlarını yönlendirmek için basit "eğer-o zaman" kurallarını kullanır.

Görüntü analizi açısından, basit bir refleks ajanı belirli bir rengi (örneğin kırmızı) algılamak ve anında bir eylemi (kırmızı nesneleri vurgulamak veya saymak gibi) tetiklemek için programlanabilir. Bu, basit görevler için işe yarayabilirken, ajanın önceki deneyimlerden öğrenmemesi veya uyum sağlamaması nedeniyle daha karmaşık ortamlarda yetersiz kalır.

Model tabanlı refleks ajanları

Model tabanlı refleks ajanları, basit refleks ajanlarından daha gelişmiştir çünkü durumu daha iyi anlamak için ortamlarının dahili bir modelini kullanırlar. Bu model, eksik veya tamamlanmamış bilgileri işlemelerine ve daha bilinçli kararlar almalarına olanak tanır. 

Örneğin, AI güvenlik kamera sistemlerini ele alalım. İçlerine entegre edilmiş bilgisayarlı görü yapay zeka aracıları, gerçek zamanlı olarak neler olduğunu analiz etmek için bilgisayarlı görü kullanabilir. Hareketleri ve eylemleri normal davranış modeline göre karşılaştırarak, hırsızlık gibi olağandışı etkinlikleri tespit etmelerine ve potansiyel güvenlik tehditlerini daha doğru bir şekilde işaretlemelerine yardımcı olabilirler.

__wf_reserved_inherit
Şekil 4. Hırsızlığı tespit etmek için bilgisayarlı görü kullanımına bir örnek.

Fayda tabanlı ajanlar

Ürün takibi için kullanılan bir fayda odaklı drone düşünün. Engellerden kaçınırken daha fazla alanı kapsayacak şekilde uçuş yolunu ayarlar ve iş için en iyi rotayı seçer. Bu, drone'nun hangi alana öncelik vereceği veya nasıl verimli bir şekilde gezineceği gibi birden fazla potansiyel eylemi değerlendirdiği ve etkinliğini en üst düzeye çıkaranı seçtiği anlamına gelir. 

Benzer şekilde, fayda tabanlı ajanlar, en büyük faydayı veya sonucu elde etmek için çeşitli seçenekler arasından en iyi eylemi seçmek üzere tasarlanmıştır. Bunun için tasarlanan Vision AI ajanları, görüntüler veya sensör verileri gibi farklı görsel girdileri işleyebilir ve analiz edebilir ve önceden tanımlanmış kriterlere göre en yararlı sonucu seçebilir.

 

__wf_reserved_inherit
Şekil 5. Yardımcı drone'lar, ürün takibi için kullanılabilir.

Hedef tabanlı ajanlar

Hedef tabanlı ajanlar, fayda tabanlı ajanlara benzerdir, çünkü her ikisi de belirli hedeflere ulaşmayı amaçlar. Ancak, hedef tabanlı ajanlar tamamen kendilerini tanımlanmış hedeflerine yaklaştıran eylemlere odaklanır. Her eylemi, genel değer veya ödünleşimler gibi diğer faktörleri tartmadan, hedeflerine ulaşmalarına nasıl yardımcı olduğuna göre değerlendirirler.

Örneğin, otonom sürüşlü bir araba, hedefi bir varış noktasına ulaşmak olduğunda hedef tabanlı bir aracı olarak çalışır. Engellerden kaçınmak, trafik işaretlerine uymak ve rotada kalmak için doğru dönüşleri seçmek gibi kararlar almak için YZ kameralarından ve sensörlerden gelen verileri işler. Bu kararların tümü, varış noktasına güvenli ve verimli bir şekilde ulaşma hedefiyle ne kadar uyumlu olduklarına göre yönlendirilir. Fayda tabanlı aracıların aksine, hedef tabanlı aracılar, verimlilik veya optimizasyon gibi ek kriterleri dikkate almadan yalnızca hedefe ulaşmaya odaklanır.

__wf_reserved_inherit
Şekil 6. Çevresindeki nesneleri tanımlamak için bilgisayar görüşünü kullanan otonom bir araba.

Öğrenen ajanlar

Bilgisayar görüşüne aşina iseniz, yeni verilerden öğrenerek modellerin geliştiği bir süreç olan ince ayar'ı duymuş olabilirsiniz. Öğrenme aracıları da benzer şekilde çalışır, deneyim kazandıkça zamanla uyum sağlar ve gelişirler. Görsel tabanlı kalite kontrolü gibi uygulamalarda, bu aracıların her incelemede kusurları tespit etme yeteneği artar. Performanslarını iyileştirme yeteneği, güvenlik ve hassasiyetin hayati önem taşıdığı havacılık gibi alanlarda özellikle önemlidir.

Hiyerarşik ajanlar

Hiyerarşik ajanlar, karmaşık görevleri daha küçük, daha yönetilebilir adımlara bölerek basitleştirir. Üst düzey bir ajan genel süreci denetler, stratejik kararlar alırken, alt düzey ajanlar belirli görevleri ele alır. Birden çok adım ve ayrıntılı yürütme içeren operasyonlar söz konusu olduğunda daha verimlidir.

Örneğin, otomatikleştirilmiş bir depoda, daha üst düzey bir robot, hangi öğelerin hangi alanlara gitmesi gerektiğine karar vererek sıralama sürecini planlayabilir. Aynı zamanda, daha alt düzey robotlar, boyut, şekil veya etiketler gibi özellikleri analiz ederek ve bunları doğru kutulara yerleştirerek öğeleri bilgisayarlı görü kullanarak tanımlamaya odaklanır. Sorumlulukların net bir şekilde bölünmesi, sistemin sorunsuz çalışmasına yardımcı olur.

__wf_reserved_inherit
Şekil 7. Bir robotik yapay zeka aracısının paketleri ayıklama örneği.

Bir görüntü işleme yapay zeka ajanı oluşturmaya nasıl başlanır

Görsel yeteneklere sahip bir yapay zeka aracısının özünde bir bilgisayarlı görü modeli bulunur. Günümüzde mevcut olan en yeni ve en güvenilir bilgisayarlı görü modellerinden biri Ultralytics YOLO11'dir. YOLO11, gerçek zamanlı verimliliği ve doğruluğu ile bilinir ve bu da onu bilgisayarlı görü görevleri için mükemmel kılar.

İşte YOLO11'in yetenekleriyle kendi yapay zeka aracınızı oluştururken yer alan farklı süreçler:

  • Bir veri kümesihazırlayın: Yapay zeka aracınızın gerçekleştireceği görevle ilgili etiketli görüntüleri toplayın ve önceden işleyin.
  • Modeli özel olarak eğitin: YOLO11'i, benzersiz uygulamanız için doğruluğunu ve performansını artırmak amacıyla özel olarak veri kümeniz üzerinde eğitin.
  • Bir karar verme çerçevesiyle entegre edin: Eğitilmiş modeli, yapay zeka aracısının görsel girdilere dayalı kararlar almasını sağlayan bir sisteme bağlayın.
  • Test et ve iyileştir: Yapay zeka aracısını dağıtın, performansını test edin, geri bildirim toplayın ve doğruluğu ve güvenilirliği artırmak için modeli ayarlayın.

Önemli çıkarımlar

Bilgisayarlı görü ile entegre edilmiş yapay zeka ajanları - vision AI ajanları - görevleri otomatikleştirerek, süreçleri hızlandırarak ve karar almayı iyileştirerek sektörleri değiştiriyor. Trafiği kontrol eden akıllı şehirlerden, yüz tanıma kullanan güvenlik sistemlerine kadar bu ajanlar, yaygın sorunlara yeni çözümler getiriyor. 

Ayrıca, zamanla öğrenmeye ve gelişmeye devam edebilirler, bu da onları değişen ortamlarda faydalı kılar. YOLO11 gibi araçlarla, bu yapay zeka aracılarını oluşturmak ve kullanmak daha kolaydır, bu da daha akıllı, daha verimli çözümlere yol açar.

Yapay zeka hakkında bilgi edinmek için topluluğumuza katılın ve GitHub depomuza göz atın. Çözüm sayfalarımızda sağlık hizmetlerinde bilgisayarlı görü ve tarımda yapay zeka'nın çeşitli uygulamalarını keşfedin. Başlamak için mevcut lisanslama seçeneklerine göz atın!

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Bağlantı panoya kopyalandı