YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024

2025'te Bilgisayarlı Görü hakkında bilmeniz gereken her şey

Abirami Vina

5 dakikalık okuma

15 Ocak 2025

Bilgisayarlı görünün, nesne tespiti, görüntü sınıflandırması ve poz tahmini gibi YZ destekli görevlerle endüstrileri nasıl dönüştürdüğünü keşfedin.

Yirmi yıl önce, makinelerin ve bilgisayarların dünyayı görebilmesi ve anlayabilmesi fikri sadece bilim kurguydu. Günümüzde, yapay zeka (YZ) alanındaki gelişmeler sayesinde bu kavram bir gerçeklik haline geldi. Özellikle, bir YZ dalı olan bilgisayarlı görü (BG), makinelerin görüntüleri ve videoları anlamasını ve analiz etmesini sağlar. İster gerçek zamanlı olarak nesneleri tanımlamak, ister güvenlik sistemlerini iyileştirmek veya karmaşık görevleri otomatikleştirmek olsun, potansiyeli mümkün olanın sınırlarını zorluyor. 

Bilgisayarlı görü, çeşitli endüstriler benzersiz yeteneklerini benimsemenin farklı yollarını keşfederken teknolojinin geleceğini hızla şekillendiriyor. Bilgisayarlı görü teknolojisinin küresel pazar büyüklüğü 2024'te 19,83 milyar dolara ulaştı ve önümüzdeki yıllarda yıllık %19,8 oranında büyümesi bekleniyor.

__wf_reserved_inherit
Şekil 1. Bilgisayarlı görünün küresel pazar büyüklüğü.

Bu makalede, bilgisayarlı görüye daha yakından bakacak, ne olduğunu, nasıl geliştiğini ve bugün nasıl çalıştığını ele alacağız. Ayrıca en ilginç uygulamalarından bazılarını da keşfedeceğiz. Hadi başlayalım!

Bilgisayarlı görü nedir?

Bilgisayarlı görü, bilgisayarlara resim veya video dosyaları gibi görsel verilerin içeriğini anlamayı öğretmek için makine öğrenimi ve sinir ağlarından yararlanan bir YZ alt alanıdır. İşlenen görüntülerden elde edilen içgörüler, daha iyi kararlar almak için kullanılabilir. Örneğin, bilgisayarlı görü, raf görüntülerini analiz ederek envanter seviyelerini izlemek veya otomatik ödeme sistemleriyle alışveriş deneyimini geliştirmek için perakende sektöründe kullanılabilir. Birçok işletme, akıllı telefon fotoğraflarına filtre eklemekten üretimde kalite kontrolüne kadar değişen farklı uygulamalar için zaten bilgisayarlı görü teknolojisini kullanıyor. 

Şunu merak ediyor olabilirsiniz: Bilgisayarlı görü çözümlerine neden bu kadar ihtiyaç var? Kusurları tespit etmek veya kalıpları tanımak gibi sürekli dikkat gerektiren görevler insanlar için zor olabilir. Gözler yorulabilir ve özellikle hızlı tempolu veya karmaşık ortamlarda ayrıntılar kaçırılabilir. 

İnsanlar farklı boyutlarda, renklerde, aydınlatmada veya açılarda nesneleri tanımada iyi olsalar da, baskı altında tutarlılığı korumakta genellikle zorlanırlar. Öte yandan, bilgisayarlı görü çözümleri durmaksızın çalışır, büyük miktarda görsel veriyi hızlı ve doğru bir şekilde işler. Örneğin, tıkanıklığı tespit etmek, sinyal zamanlamasını optimize etmek veya hatta bir insan gözlemcinin tespit edebileceğinden daha hızlı bir şekilde kazaları belirlemek için trafiği gerçek zamanlı olarak analiz edebilir.

Bilgisayarlı görünün tarihini anlamak

Yıllar içinde bilgisayar görüşü, teorik bir kavramdan çeşitli sektörlerde inovasyonu yönlendiren güvenilir bir teknolojiye dönüştü. Gelişimini tanımlayan bazı önemli kilometre taşlarına bir göz atalım:

  • 1950'ler - 1960'lar: Araştırmacılar, görsel verileri işlemek ve analiz etmek için algoritmalar geliştirmeye başladılar, ancak sınırlı işlem gücü nedeniyle ilerleme yavaş oldu.
  • 1970'ler: Bu on yılda, Hough Dönüşümü gibi algoritmalarda büyük gelişmeler görüldü ve bu da görüntülerdeki çizgilerin ve geometrik şekillerin tespitini iyileştirdi. Optik Karakter Tanıma (OCR) da ortaya çıkarak makinelerin basılı metinleri okumasını mümkün kıldı.
  • 1980'ler - 1990'lar: Makine öğrenimi, bilgisayar görüşünde rol oynamaya başlayarak daha gelişmiş yeteneklerin ve gelecekteki atılımların önünü açtı.
  • 2000'ler - 2010'lar: Derin öğrenme, bilgisayar görüşüne yeni bir boyut kazandırarak makineleri görsel verileri daha etkili bir şekilde yorumlamakla donattı. Nesne tanımlama, hareket analizi ve karmaşık görev yürütme gibi yetenekleri geliştirdi.

Günümüzde bilgisayar görüşü hızla ilerliyor ve sağlık hizmetleri, otonom araçlar ve akıllı şehirler gibi alanlarda sorunları çözme şeklimizi dönüştürüyor. Gerçek zamanlı bilgisayar görüşü görevleri için tasarlanan Ultralytics YOLO (You Only Look Once) modelleri, çeşitli sektörlerde Vision AI'yı etkili ve doğru bir şekilde uygulamayı kolaylaştırıyor. Yapay zeka ve donanım gelişmeye devam ettikçe, bu modeller işletmelerin gelişmiş görsel veri analizini kullanarak daha akıllı kararlar almasına ve operasyonları kolaylaştırmasına yardımcı oluyor.

Bilgisayar görüşünün nasıl çalıştığını açıklamak

Bilgisayar görüşü sistemleri, görüntüleri analiz etmek için insan beyninin çalışma şeklinden ilham alan algoritmalar olan sinir ağlarını kullanarak çalışır. Evrişimsel Sinir Ağları (CNN'ler) adı verilen belirli bir tür, resimlerdeki kenarlar ve şekiller gibi desenleri tanımada özellikle iyidir. 

Görsel verileri basitleştirmek için, havuzlama (pooling) gibi teknikler bir görüntünün en önemli kısımlarına odaklanırken, ek katmanlar özellikleri tanımlama veya nesneleri algılama gibi görevleri gerçekleştirmek için bu bilgileri işler. Hız ve doğruluk için tasarlanan Ultralytics YOLO11 gibi gelişmiş modeller, gerçek zamanlı görüntü işlemeyi mümkün kılar.

__wf_reserved_inherit
Şekil 2. Nesne tespiti için Ultralytics YOLO11 kullanımına bir örnek.

Tipik bir bilgisayar görüşü uygulaması, ham görüntüleri faydalı içgörülere dönüştürmek için çeşitli adımlar içerir. İşte dört ana aşama:

  • Görüntü edinimi: Görsel veriler kameralar veya sensörler kullanılarak toplanır ve görüntülerin kalitesi kullanılan sensörün türüne bağlıdır.
  • Görüntü işleme: Toplanan veriler, analizini kolaylaştırmak için gürültüyü azaltma ve kenarları vurgulama gibi ön işleme teknikleriyle geliştirilir.
  • Öznitelik çıkarımı: Şekiller ve dokular gibi önemli detaylar seçilir ve görüntünün en önemli kısımlarına odaklanılır.  
  • Desen tanıma: Belirlenen özellikler, nesneleri algılama, hareketi izleme veya desenleri tanıma gibi görevleri tamamlamak için makine öğrenimi kullanılarak analiz edilir.

Bilgisayarlı görü görevlerini keşfetme

Bilgisayarlı görünün nasıl çalıştığından bahsederken, bilgisayarlı görü görevlerinden bahsettiğimizi fark etmiş olabilirsiniz. Ultralytics YOLO11 gibi modeller, gerçek dünya uygulamaları için hızlı ve doğru çözümler sunarak bu görevleri desteklemek üzere oluşturulmuştur. Nesneleri algılamadan hareketlerini izlemeye kadar YOLO11 bu görevleri verimli bir şekilde yerine getirir. Şimdi, desteklediği temel bilgisayarlı görü görevlerinden bazılarını ve bunların nasıl çalıştığını inceleyelim.

Nesne tespiti

Nesne tespiti önemli bir bilgisayarlı görü görevidir ve bir görüntüdeki ilgi çekici nesneleri tanımlamak için kullanılır. Bir nesne tespiti görevinin çıktısı, sınıf etiketleriyle (her bir nesnenin "araba" veya "kişi" gibi kategorisi veya türü) ve güvenilirlik skorlarıyla (modelin her bir tespit hakkında ne kadar emin olduğunu gösteren sayısal bir değer) birlikte bir dizi sınırlayıcı kutudur (bir görüntüde tespit edilen nesnelerin etrafına çizilen dikdörtgenler). Örneğin, nesne tespiti bir sokaktaki bir yayanın veya trafikteki bir arabanın yerini belirlemek ve tespit etmek için kullanılabilir.

__wf_reserved_inherit
Şekil 3. YOLO11 nesneleri tespit etmek için kullanılıyor.

Görüntü sınıflandırması

Görüntü sınıflandırmasının temel amacı, genel içeriğine göre bir giriş görüntüsüne önceden tanımlanmış bir etiket veya kategori atamaktır. Bu görev genellikle görüntüdeki baskın nesneyi veya özelliği tanımlamayı içerir. Örneğin, görüntü sınıflandırması bir görüntünün bir kedi mi yoksa bir köpek mi içerdiğini belirlemek için kullanılabilir. YOLO11 gibi bilgisayarlı görü modelleri, aşağıda gösterildiği gibi, bireysel kedi veya köpek ırklarını sınıflandırmak için özel olarak eğitilebilir bile.

__wf_reserved_inherit
Şekil 4. YOLO11 kullanılarak farklı kedi ırkları sınıflandırılıyor.

Örnek segmentasyonu

Örnek segmentasyonu, çeşitli uygulamalarda kullanılan bir diğer önemli bilgisayarlı görü görevidir. Bir görüntüyü segmentlere ayırmayı ve aynı türden birden fazla nesne olsa bile her bir nesneyi ayrı ayrı tanımlamayı içerir. Nesne tespitinden farklı olarak, örnek segmentasyonu her bir nesnenin kesin sınırlarını çizerek bir adım daha ileri gider. Örneğin, otomotiv üretimi ve onarımında, örnek segmentasyonu her bir araba parçasını ayrı ayrı tanımlamaya ve etiketlemeye yardımcı olarak süreci daha doğru ve verimli hale getirebilir.

__wf_reserved_inherit
Şekil 5. YOLO11 kullanılarak araba parçaları segmentasyonu.

Poz tahmini

Poz tahmininin amacı, eller, baş ve dirsekler gibi kilit noktaların konumunu tahmin ederek bir kişi veya nesnenin konumunu ve yönünü belirlemektir. Bu, özellikle fiziksel eylemleri gerçek zamanlı olarak anlamanın önemli olduğu uygulamalarda kullanışlıdır. İnsan poz tahmini, genellikle spor analizi, hayvan davranışlarını izleme ve robotik gibi alanlarda kullanılır.

__wf_reserved_inherit
Şekil 6. YOLO11, insan pozu tahmini konusunda yardımcı olabilir.

YOLO11 tarafından desteklenen diğer bilgisayarla görü görevlerini keşfetmek için resmi Ultralytics belgelerine başvurabilirsiniz. YOLO11'in nesne takibi ve yönlendirilmiş sınırlayıcı kutu (OBB) nesne tespiti gibi görevleri nasıl ele aldığı hakkında ayrıntılı bilgi sağlar.

Günümüzün popüler bilgisayarla görü modelleri

Piyasada birçok bilgisayarla görü modeli olmasına rağmen, Ultralytics YOLO serisi güçlü performansı ve çok yönlülüğü ile öne çıkıyor. Zamanla, Ultralytics YOLO modelleri gelişerek daha hızlı, daha doğru ve daha fazla görevi yerine getirebilir hale geldi. Ultralytics YOLOv5 piyasaya sürüldüğünde, modellerin dağıtımı PyTorch gibi Vision AI çerçeveleri ile kolaylaştı. Bu, daha geniş bir kullanıcı yelpazesinin yüksek doğruluğu kullanım kolaylığıyla birleştirerek gelişmiş Vision AI ile çalışmasına olanak tanıdı.

Ardından, Ultralytics YOLOv8, örnek segmentasyonu, poz tahmini ve görüntü sınıflandırması gibi yeni yetenekler ekleyerek işleri daha da ileriye taşıdı. Bu arada, en son sürüm olan YOLO11, birden fazla bilgisayarla görü görevinde en iyi performansı sunar. YOLO11m, YOLOv8m'den %22 daha az parametre ile COCO veri kümesinde daha yüksek bir ortalama hassasiyet (mAP) elde eder, yani nesneleri daha hassas ve verimli bir şekilde tespit edebilir. İster deneyimli bir geliştirici olun ister yapay zekaya yeni başlayın, YOLO11, bilgisayarla görü ihtiyaçlarınız için güçlü bir çözüm sunar.

Bilgisayarla görünün günlük yaşamdaki rolü

Daha önce, YOLO11 gibi bilgisayarla görü modellerinin çok çeşitli sektörlerde nasıl uygulanabileceğinden bahsetmiştik. Şimdi, günlük hayatımızı değiştiren daha fazla kullanım alanını keşfedelim.

Sağlık hizmetlerinde Vision AI

Sağlık hizmetlerinde bilgisayarla görü için çok çeşitli uygulamalar bulunmaktadır. Nesne tespiti ve sınıflandırma gibi görevler, hastalık tespitini daha hızlı ve doğru hale getirmek için tıbbi görüntülemede kullanılır. X-ışını analizinde, bilgisayarla görü insan gözü için çok ince olabilecek desenleri tanımlayabilir. 

Ayrıca kanserli hücreleri sağlıklı hücrelerle karşılaştırmak için kanser tespitinde de kullanılır. Benzer şekilde, BT taramaları ve MR'lar ile ilgili olarak, bilgisayarla görü görüntüleri insan doğruluğuna yakın bir şekilde analiz etmek için kullanılabilir. Doktorların daha iyi kararlar almasına yardımcı olur ve sonuç olarak daha fazla hayat kurtarır.

__wf_reserved_inherit
Şekil 7. YOLO11, tıbbi taramaları analiz etmek için kullanılıyor.

Otomotiv endüstrisinde yapay zeka

Bilgisayarla görü, kendi kendine giden arabalar için kritik öneme sahiptir ve yol işaretleri ve trafik ışıkları gibi nesneleri tespit etmelerine yardımcı olur. Optik karakter tanıma (OCR) gibi teknikler, arabanın yol işaretlerinden metin okumasını sağlar. Ayrıca, nesne tespiti görevlerinin gerçek zamanlı olarak insanları tanımladığı yaya tespiti için de kullanılır. 

Ek olarak, bilgisayarlı görü, yol yüzeylerindeki çatlakları ve çukurları bile tespit ederek değişen yol koşullarının daha iyi izlenmesini sağlayabilir. Genel olarak, bilgisayarlı görü teknolojisi, trafik yönetimini iyileştirmede, ulaşım güvenliğini artırmada ve akıllı şehir planlamasını desteklemede önemli bir rol oynayabilir.

__wf_reserved_inherit
Şekil 8. YOLO11 kullanarak trafiği anlama.

Tarımda bilgisayarlı görü

Diyelim ki çiftçiler, ekinlerini endişelenmeden otomatik olarak zamanında ekebilir, sulayabilir ve hasat edebilirler. İşte bilgisayarlı görünün tarıma getirdiği şey tam olarak budur. Gerçek zamanlı ürün takibini kolaylaştırır, böylece çiftçiler hastalıklar veya besin eksiklikleri gibi sorunları insanlardan daha doğru bir şekilde tespit edebilirler. 

İzlemeye ek olarak, bilgisayarlı görü ile entegre edilmiş yapay zeka destekli otomatik yabani ot temizleme makineleri, yabani otları tanımlayıp temizleyerek işçilik maliyetlerini düşürebilir ve ürün verimini artırabilir. Bu teknoloji kombinasyonu, çiftçilerin kaynaklarını optimize etmelerine, verimliliği artırmalarına ve ürünlerini korumalarına yardımcı olur.

__wf_reserved_inherit
Şekil 9. Tarımda YOLO11 kullanımına bir örnek.

Yapay zeka ile üretim süreçlerini otomatikleştirmek

Üretimde bilgisayarlı görü, üretimi izlemeye, ürün kalitesini kontrol etmeye ve işçileri otomatik olarak takip etmeye yardımcı olur. Görü yapay zekası, hataları azaltırken süreci daha hızlı ve daha doğru hale getirerek maliyetlerin düşmesine yol açar. 

Özellikle kalite güvencesi için nesne tespiti ve örnek segmentasyonu yaygın olarak kullanılmaktadır. Hata tespit sistemleri, bitmiş ürünlerin son kontrolünü yaparak yalnızca en iyilerinin müşterilere ulaşmasını sağlar. Ezik veya çatlak olan herhangi bir ürün otomatik olarak tanımlanır ve reddedilir. Bu sistemler ayrıca ürünleri gerçek zamanlı olarak takip edip sayarak montaj hattında sürekli izleme sağlar.

__wf_reserved_inherit
Şekil 10. Bilgisayarlı görü kullanarak bir montaj hattını izleme.

Bilgisayarlı görü ile daha etkili hale getirilen eğitim

Bilgisayarlı görünün sınıfta kullanılma yollarından biri, jest tanımadır; öğrencilerin hareketlerini algılayarak öğrenmeyi kişiselleştirir. YOLO11 gibi modeller bu görev için harikadır. Gerçek zamanlı olarak kalkan eller veya kafası karışmış ifadeler gibi jestleri doğru bir şekilde tanımlayabilirler. 

Bu tür jestler algılandığında, devam eden bir ders, ek yardım sağlayarak veya içeriği öğrencinin ihtiyaçlarına daha uygun hale getirerek ayarlanabilir. Bu, daha dinamik ve uyarlanabilir bir öğrenme ortamı yaratarak öğretmenlerin öğretmeye odaklanmasına yardımcı olurken, sistem her öğrencinin öğrenme deneyimini destekler.

Bilgisayarlı göründeki son trendler

Çeşitli sektörlerde bilgisayarlı görünün bazı uygulamalarını incelediğimize göre, şimdi de ilerlemesini sağlayan temel trendlere dalalım.

Başlıca trendlerden biri, verileri kaynağına daha yakın işleyen dağıtık bir bilgi işlem çerçevesi olan uç bilişimdir. Örneğin, uç bilişim, kameralar ve sensörler gibi cihazları görsel verileri doğrudan işlemesi için donatarak daha hızlı yanıt süreleri, daha az gecikme ve gelişmiş gizlilik sağlar.

Bilgisayarlı göründeki bir diğer önemli trend ise birleştirilmiş gerçekliğin kullanılmasıdır. Sanal nesnelerin gerçek dünyayla sorunsuz bir şekilde karışmasını sağlamak için bilgisayarlı görü kullanarak fiziksel dünyayı dijital öğelerle birleştirir. Oyun, eğitim ve öğretimde deneyimleri iyileştirmek için kullanılabilir. 

Bilgisayarlı görünün artıları ve eksileri

Bilgisayarlı görü teknolojisinin çeşitli sektörlere sağlayabileceği temel faydalardan bazıları şunlardır:

  • Maliyet tasarrufu: Bilgisayarlı görü ile görevleri otomatikleştirmek, operasyonel maliyetleri düşürmeye, verimliliği artırmaya ve hataları en aza indirmeye yardımcı olur.
  • Ölçeklenebilirlik: Bilgisayarlı görü sistemleri uygulandıktan sonra büyük miktarda veriyi kolayca işleyebilir ve bu da onları büyüyen işletmeler veya büyük ölçekli operasyonlar için uygun hale getirir.
  • Uygulamaya özel özelleştirme: Bilgisayarlı görü modelleri, veri kümeniz kullanılarak ince ayar yapılabilir ve uygulamanızın gereksinimlerini karşılayan son derece özelleşmiş çözümler sunar.

Bu faydalar, bilgisayarlı görünün çeşitli sektörleri nasıl etkileyebileceğini vurgularken, uygulamasında yer alan zorlukları da göz önünde bulundurmak önemlidir. İşte temel zorluklardan bazıları:

  • Veri gizliliği endişeleri: Görsel verilerin kullanımı, özellikle gözetim veya sağlık hizmetleri gibi hassas alanlarda, gizlilik sorunları ve güvenlik endişeleri yaratabilir.
  • Çevresel sınırlamalar: Bilgisayarlı görü sistemleri, yetersiz aydınlatma, düşük kaliteli görüntüler veya karmaşık arka planlar gibi zorlu ortamlarda düzgün çalışmakta zorlanabilir.
  • Yüksek başlangıç maliyeti: Bilgisayarlı görü sistemleri geliştirmek ve uygulamak, özel donanım, yazılım ve uzmanlık ihtiyacı nedeniyle maliyetli olabilir.

Önemli çıkarımlar

Bilgisayarlı görü, makinelerin dünyayı insan gibi görmelerini ve anlamalarını sağlayarak dünyayla etkileşim biçimini yeniden şekillendiriyor. Kendi kendine giden arabalarda güvenliği artırmak, doktorların hastalıkları daha hızlı teşhis etmelerine yardımcı olmak, alışverişi daha kişiselleştirilmiş hale getirmek ve hatta çiftçilere ürün takibinde yardımcı olmak gibi birçok alanda zaten kullanılıyor. 

Teknoloji gelişmeye devam ettikçe, uç bilişim ve birleşik gerçeklik gibi yeni trendler daha da fazla olasılık yaratıyor. Önyargılar ve yüksek maliyetler gibi bazı zorluklar olsa da, bilgisayarlı görü gelecekte birçok sektör üzerinde büyük ve olumlu bir etki yaratma potansiyeline sahip.

Daha fazla bilgi edinmek için GitHub depomuzu ziyaret edin ve topluluğumuzla etkileşim kurun. Çözüm sayfalarımızda kendi kendine giden arabalarda yapay zeka ve tarımda bilgisayarlı görü gibi sektörlerdeki yenilikleri keşfedin. 🚀

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Bağlantı panoya kopyalandı