2025'te bilgisayarlı görü hakkında bilmen gereken her şey
Bilgisayarlı görünün; nesne algılama, görüntü sınıflandırma ve poz tahmini gibi AI destekli görevlerle endüstrileri nasıl dönüştürdüğünü keşfet.

Yirmi yıl önce, makinelerin ve bilgisayarların dünyayı görebilmesi ve anlayabilmesi fikri sadece bilim kurguydu. Bugün, yapay zekadaki (AI) gelişmeler sayesinde bu kavram gerçeğe dönüştü. Özellikle yapay zekanın bir dalı olan bilgisayarlı görü (CV), makinelerin görüntüleri ve videoları anlamasını ve analiz etmesini sağlar. Nesneleri gerçek zamanlı olarak tanımlamak, güvenlik sistemlerini iyileştirmek veya karmaşık görevleri otomatize etmek olsun, potansiyeli mümkün olanın sınırlarını zorluyor.
Bilgisayarlı görü, çeşitli endüstriler benzersiz yeteneklerini benimsemenin farklı yollarını keşfettikçe teknolojinin geleceğini hızla şekillendiriyor. Küresel bilgisayarlı görü pazar büyüklüğü teknolojisi 2024 yılında 19,83 milyar dolara ulaştı ve önümüzdeki yıllarda yıllık %19,8 oranında büyümesi bekleniyor.

Şekil 1. Bilgisayarlı görünün küresel pazar büyüklüğü.
Bu makalede bilgisayarlı görüye daha yakından bakacağız; ne olduğunu, nasıl evrildiğini ve bugün nasıl çalıştığını ele alacağız. Ayrıca en ilginç uygulamalarından bazılarını keşfedeceğiz. Hadi başlayalım!
Link to this sectionBilgisayarlı görü nedir?#
Bilgisayarlı görü, bilgisayarlara görüntüler veya video dosyaları gibi görsel verilerin içeriğini anlamayı öğretmek için makine öğreniminden ve sinir ağlarından yararlanan bir yapay zeka alt dalıdır. İşlenmiş görüntülerden elde edilen içgörüler, daha iyi kararlar almak için kullanılabilir. Örneğin, bilgisayarlı görü perakendede raf görüntülerini analiz ederek envanter seviyelerini takip etmek veya otomatik ödeme sistemleriyle alışveriş deneyimini geliştirmek için kullanılabilir. Birçok işletme, akıllı telefon fotoğraflarına filtre eklemekten üretimde kalite kontrolüne kadar uzanan farklı uygulamalar için bilgisayarlı görü teknolojisini zaten kullanıyor.
Şunu merak ediyor olabilirsin: Neden bilgisayarlı görü çözümlerine bu kadar ihtiyaç var? Kusurları tespit etmek veya desenleri tanımak gibi sürekli dikkat gerektiren görevler insanlar için zor olabilir. Özellikle hızlı tempolu veya karmaşık ortamlarda gözler yorulabilir ve detaylar gözden kaçabilir.
İnsanlar farklı boyutlardaki, renklerdeki, ışıklandırmalardaki veya açılardaki nesneleri tanımada iyi olsalar da, baskı altında tutarlılığı korumakta genellikle zorlanırlar. Öte yandan bilgisayarlı görü çözümleri, durmaksızın çalışır, büyük miktardaki görsel veriyi hızlı ve doğru bir şekilde işler. Örneğin, trafiği gerçek zamanlı olarak analiz ederek sıkışıklığı tespit edebilir, sinyal zamanlamasını optimize edebilir ve hatta kazaları bir insan gözlemciden daha hızlı tanımlayabilir.
Link to this sectionBilgisayarlı görünün tarihçesini anlamak#
Yıllar geçtikçe bilgisayarlı görü, teorik bir kavramdan endüstriler genelinde inovasyonu yönlendiren güvenilir bir teknolojiye dönüştü. Gelişimini tanımlayan önemli dönüm noktalarından bazılarına göz atalım:
-
1950'ler - 1960'lar: Araştırmacılar görsel verileri işlemek ve analiz etmek için algoritmalar geliştirmeye başladılar, ancak sınırlı hesaplama gücü nedeniyle ilerleme yavaştı.
-
1970'ler: Bu on yıl, görüntülerdeki çizgilerin ve geometrik şekillerin tespitini iyileştiren Hough Transform gibi algoritmalarda büyük gelişmelere sahne oldu. Optik Karakter Tanıma (OCR) da ortaya çıkarak makinelerin basılı metinleri okumasını mümkün kıldı.
-
1980'ler - 1990'lar: Makine öğrenimi bilgisayarlı görüde rol oynamaya başlayarak daha gelişmiş yeteneklerin ve gelecekteki buluşların yolunu açtı.
-
2000'ler - 2010'lar: Derin öğrenme, bilgisayarlı görüye yeni bir boyut getirerek makineleri görsel verileri daha etkili bir şekilde yorumlamaları için donattı. Nesne tanımlama, hareket analizi ve karmaşık görev yürütme gibi yetenekleri geliştirdi.
Nowadays, computer vision is advancing quickly and transforming how we solve problems in areas like healthcare, autonomous vehicles, and smart cities. Ultralytics YOLO (You Only Look Once) models, designed for real-time computer vision tasks, make it easier to implement vision AI effectively and accurately across various industries. As AI and hardware continue to improve, these models are helping businesses make smarter decisions and streamline operations by using advanced visual data analysis.
Link to this sectionBilgisayarlı görünün nasıl çalıştığını incelemek#
Bilgisayarlı görü sistemleri, görüntüleri analiz etmek için insan beyninin çalışma biçiminden ilham alan algoritmalar olan sinir ağlarını kullanarak çalışır. Evrişimli Sinir Ağları (CNN'ler) adı verilen özel bir tür, resimlerdeki kenarlar ve şekiller gibi desenleri tanımak için özellikle harikadır.
Görsel verileri basitleştirmek için, havuzlama (pooling) gibi teknikler görüntünün en önemli kısımlarına odaklanırken, ek katmanlar bu bilgiyi özellik belirleme veya nesne tespiti gibi görevleri gerçekleştirmek için işler. Hız ve doğruluk için tasarlanmış Ultralytics YOLO11 gibi gelişmiş modeller, gerçek zamanlı görüntü işlemeyi mümkün kılar.

Şekil 2. Ultralytics YOLO11 ile nesne tespiti kullanımına bir örnek.
Tipik bir bilgisayarlı görü uygulaması, ham görüntüleri faydalı içgörülere dönüştürmek için birkaç adım içerir. İşte dört ana aşama:
-
Görüntü edinimi: Görsel veriler kameralar veya sensörler kullanılarak toplanır ve görüntülerin kalitesi kullanılan sensörün türüne bağlıdır.
-
Görüntü işleme: Toplanan veriler, analizi kolaylaştırmak için gürültüyü azaltma ve kenarları belirginleştirme gibi ön işleme teknikleriyle iyileştirilir.
-
Özellik çıkarımı: Şekiller ve dokular gibi önemli ayrıntılar, görüntünün en önemli kısımlarına odaklanılarak seçilir.
-
Ön örüntü tanıma: Tanımlanan özellikler, nesneleri tespit etme, hareket izleme veya desenleri tanıma gibi görevleri tamamlamak için makine öğrenimi kullanılarak analiz edilir.
Link to this sectionBilgisayarlı görü görevlerini keşfetmek#
Bilgisayarlı görünün nasıl çalıştığından bahsederken bilgisayarlı görü görevlerinden bahsettiğimizi fark etmiş olabilirsin. Ultralytics YOLO11 gibi modeller, gerçek dünya uygulamaları için hızlı ve doğru çözümler sunarak bu görevleri desteklemek üzere üretilmiştir. Nesneleri tespit etmekten hareketlerini izlemeye kadar YOLO11 bu görevleri verimli bir şekilde halleder. Desteklediği temel bilgisayarlı görü görevlerinden bazılarını ve nasıl çalıştıklarını keşfedelim.
Link to this sectionNesne tespiti (Object detection)#
Nesne tespiti, temel bir bilgisayarlı görü görevidir ve görüntüdeki ilgi çekici nesneleri tanımlamak için kullanılır. Nesne tespiti görevinin çıktısı, bir dizi sınırlayıcı kutu (görüntüde tespit edilen nesnelerin etrafına çizilen dikdörtgenler), sınıf etiketleri (her nesnenin kategorisi veya türü, örneğin "araba" veya "insan") ve güven puanlarıdır (modelin her bir tespitten ne kadar emin olduğunu gösteren sayısal bir değer). Örneğin, nesne tespiti, bir yaya veya trafikteki bir arabanın yerini belirlemek ve tespit etmek için kullanılabilir.

Şekil 3. Nesneleri tespit etmek için kullanılan YOLO11.
Link to this sectionGörüntü sınıflandırma (Image classification)#
Görüntü sınıflandırmanın birincil amacı, genel içeriğine dayalı olarak bir giriş görüntüsüne önceden tanımlanmış bir etiket veya kategori atamaktır. Bu görev tipik olarak görüntüdeki baskın nesneyi veya özelliği tanımlamayı içerir. Örneğin, görüntü sınıflandırma, bir görüntünün kedi mi yoksa köpek mi içerdiğini belirlemek için kullanılabilir. YOLO11 gibi bilgisayarlı görü modelleri, aşağıda gösterildiği gibi bireysel kedi veya köpek ırklarını sınıflandırmak için bile özel olarak eğitilebilir.

Şekil 4. YOLO11 kullanarak farklı kedi ırklarını sınıflandırma.
Link to this sectionÖrneklem segmentasyonu (Instance segmentation)#
Örnek bölümleme (Instance segmentation), çeşitli uygulamalarda kullanılan bir diğer kritik bilgisayarlı görü görevidir. Bir görüntüyü parçalara ayırmayı ve aynı türden birden fazla nesne olsa bile her bir nesneyi tanımlamayı içerir. Nesne tespitinden farklı olarak, örnek bölümleme, her nesnenin tam sınırlarını çizerek bir adım daha ileri gider. Örneğin, otomotiv üretimi ve onarımında, örnek bölümleme her araba parçasını ayrı ayrı tanımlamaya ve etiketlemeye yardımcı olarak süreci daha doğru ve verimli hale getirebilir.

Şekil 5. YOLO11 ile araba parçalarının bölümlemesi.
Link to this sectionPoz tahmini (Pose estimation)#
Poz tahmini hedefi, eller, baş ve dirsekler gibi anahtar noktaların konumunu tahmin ederek bir kişinin veya nesnenin pozisyonunu ve yönelimini belirlemektir. Bu, fiziksel eylemleri gerçek zamanlı olarak anlamanın önemli olduğu uygulamalarda özellikle kullanışlıdır. İnsan pozu tahmini genellikle spor analizi, hayvan davranışı izleme ve robotik gibi alanlarda kullanılır.

Şekil 6. YOLO11 insan pozu tahminine yardımcı olabilir.
YOLO11 tarafından desteklenen diğer bilgisayarlı görü görevlerini keşfetmek için resmi Ultralytics dokümantasyonuna başvurabilirsin. YOLO11'in nesne takibi ve yönelimli sınırlayıcı kutu (OBB) nesne tespiti gibi görevleri nasıl ele aldığına dair ayrıntılı bilgi sağlar.
Link to this sectionGünümüzün popüler bilgisayarlı görü modelleri#
Piyasada birçok bilgisayarlı görü modeli olmasına rağmen, Ultralytics YOLO serisi güçlü performansı ve çok yönlülüğü ile öne çıkıyor. Zaman içinde Ultralytics YOLO modelleri gelişerek daha hızlı, daha doğru ve daha fazla görevi yerine getirebilir hale geldi. Ultralytics YOLOv5 tanıtıldığında, modellerin dağıtımı PyTorch gibi vizyon yapay zeka çerçeveleriyle daha kolay hale geldi. Bu, daha geniş bir kullanıcı kitlesinin yüksek doğruluğu kullanım kolaylığıyla birleştirerek gelişmiş vizyon yapay zekasıyla çalışmasını sağladı.
Ardından, Ultralytics YOLOv8 örnek bölümleme, poz tahmini ve görüntü sınıflandırma gibi yeni yetenekler ekleyerek işleri daha da ileriye taşıdı. Bu arada, en son sürüm olan YOLO11, birden fazla bilgisayarlı görü görevinde en iyi performansı sunuyor. YOLO8m'den %22 daha az parametreye sahip olan YOLO11m, COCO veri kümesinde daha yüksek ortalama hassasiyet (mAP) elde ediyor; bu da nesneleri daha hassas ve verimli bir şekilde tespit edebileceği anlamına geliyor. İster deneyimli bir geliştirici ol ister yapay zekada yeni, YOLO11 bilgisayarlı görü ihtiyaçların için güçlü bir çözüm sunar.
Link to this sectionGünlük yaşamda bilgisayarlı görünün rolü#
Daha önce, YOLO11 gibi bilgisayarlı görü modellerinin çok çeşitli endüstrilerde nasıl uygulanabileceğini tartıştık. Şimdi, günlük yaşamımızı değiştiren daha fazla kullanım durumunu keşfedelim.
Link to this sectionSağlık hizmetlerinde vizyon yapay zekası#
Sağlık hizmetlerinde bilgisayarlı görü için çok çeşitli uygulamalar mevcuttur. Nesne tespiti ve sınıflandırma gibi görevler, hastalık tespitini daha hızlı ve doğru hale getirmek için tıbbi görüntülemede kullanılır. Röntgen analizinde, bilgisayarlı görü insan gözü için çok ince olabilecek desenleri tanımlayabilir.
Ayrıca kanserli hücreleri sağlıklı olanlarla karşılaştırmak için kanser tespitinde kullanılır. Benzer şekilde, BT taramaları ve MR'lar söz konusu olduğunda, bilgisayarlı görü görüntüleri insan doğruluğuna yakın şekilde analiz etmek için kullanılabilir. Doktorların daha iyi kararlar almasına yardımcı olur ve nihayetinde daha fazla hayat kurtarır.

Şekil 7. Tıbbi taramaları analiz etmek için kullanılan YOLO11.
Link to this sectionOtomotiv endüstrisinde yapay zeka#
Bilgisayarlı görü, sürücüsüz arabalar için kritik öneme sahiptir ve trafik işaretleri ve trafik ışıkları gibi nesneleri tespit etmelerine yardımcı olur. Optik karakter tanıma (OCR) gibi teknikler, arabanın yol işaretlerindeki metinleri okumasını sağlar. Ayrıca, nesne tespiti görevlerinin insanları gerçek zamanlı olarak tanımladığı yaya tespiti için de kullanılır.
Bunun da ötesinde, bilgisayarlı görü yol yüzeylerindeki çatlakları ve çukurları bile tespit edebilir, bu da değişen yol koşullarının daha iyi izlenmesini sağlar. Genel olarak, bilgisayarlı görü teknolojisi trafik yönetimini iyileştirmede, transit güvenliğini artırmada ve akıllı şehir planlamasını desteklemede kilit bir rol oynayabilir.

Şekil 8. YOLO11 kullanarak trafiği anlamak.
Link to this sectionTarımda bilgisayarlı görü#
Çiftçilerin mahsullerini hiç endişelenmeden zamanında ektiğini, suladığını ve hasat ettiğini hayal edelim. Bilgisayarlı görünün tarıma getirdiği tam olarak budur. Çiftçilerin hastalıklar veya besin eksiklikleri gibi sorunları insanlardan daha doğru bir şekilde tespit edebilmeleri için gerçek zamanlı mahsul izlemeyi kolaylaştırır.
İzlemenin yanı sıra, bilgisayarlı görü ile entegre yapay zeka destekli otomatik yabani ot temizleme makineleri yabani otları tanımlayabilir ve temizleyebilir, böylece işçilik maliyetlerini düşürür ve mahsul verimini artırır. Bu teknoloji kombinasyonu, çiftçilerin kaynaklarını optimize etmelerine, verimliliği artırmalarına ve mahsullerini korumalarına yardımcı olur.

Şekil 9. Tarımda YOLO11 kullanımına bir örnek.
Link to this sectionYapay zeka ile üretim süreçlerini otomatize etmek#
Üretimde bilgisayarlı görü, üretimi izlemeye, ürün kalitesini kontrol etmeye ve çalışanları otomatik olarak takip etmeye yardımcı olur. Vizyon yapay zekası, süreci daha hızlı ve daha doğru hale getirirken hataları azaltır ve bu da maliyetleri düşürür.
Özellikle kalite güvencesi için nesne tespiti ve örnek bölümleme yaygın olarak kullanılır. Kusur tespit sistemleri, sadece en iyilerin müşterilere ulaşmasını sağlamak için bitmiş ürünler üzerinde son bir kontrol gerçekleştirir. Ezik veya çatlak olan herhangi bir ürün otomatik olarak tanımlanır ve reddedilir. Bu sistemler ayrıca ürünleri gerçek zamanlı olarak takip eder ve sayar, montaj hattında sürekli izleme sağlar.

Şekil 10. Bilgisayarlı görü kullanarak montaj hattını izleme.
Link to this sectionBilgisayarlı görü ile eğitim daha etkili hale getirildi#
Bilgisayarlı görünün sınıfta kullanılmasının yollarından biri jest tanımadır - öğrencilerin hareketlerini algılayarak öğrenmeyi kişiselleştirir. YOLO11 gibi modeller bu görev için harikadır. Havaya kaldırılan eller veya kafa karışıklığı ifade eden yüz ifadeleri gibi jestleri gerçek zamanlı olarak doğru bir şekilde tanımlayabilirler.
Bu tür jestler algılandığında, devam eden bir ders ekstra yardım sağlanarak veya içeriği öğrencinin ihtiyaçlarına daha uygun hale getirecek şekilde değiştirilerek ayarlanabilir. Bu, sistem her öğrencinin öğrenme deneyimini desteklerken öğretmenlerin öğretime odaklanmasına yardımcı olarak daha dinamik ve uyarlanabilir bir öğrenme ortamı yaratır.
Link to this sectionBilgisayarlı görünün son trendleri#
Bilgisayarlı görünün çeşitli endüstrilerdeki uygulamalarından bazılarını keşfettiğimize göre, ilerlemesini sağlayan temel trendlere dalalım.
Büyük trendlerden biri, verileri kaynağına daha yakın işleyen dağıtılmış bir bilgi işlem çerçevesi olan uç bilgi işlem'dir. Örneğin, uç bilgi işlem, kameralar ve sensörler gibi cihazları görsel verileri doğrudan işleyecek şekilde donatır, bu da daha hızlı yanıt süreleri, azaltılmış gecikmeler ve iyileştirilmiş gizlilik sağlar.
Bilgisayarlı görünün bir diğer önemli trendi, birleştirilmiş gerçekliğin kullanımıdır. Fiziksel dünyayı dijital öğelerle birleştirir ve sanal nesnelerin gerçek dünyayla sorunsuz bir şekilde bütünleşmesini sağlamak için bilgisayarlı görüyü kullanır. Oyun, eğitim ve öğretimdeki deneyimleri geliştirmek için kullanılabilir.
Link to this sectionBilgisayarlı görünün artıları ve eksileri#
Bilgisayarlı görünün çeşitli endüstrilere getirebileceği temel faydalardan bazıları şunlardır:
-
Maliyet tasarrufu: Görevleri bilgisayarlı görü ile otomatize etmek, operasyonel maliyetleri düşürmeye, üretkenliği artırmaya ve hataları en aza indirmeye yardımcı olur.
-
Ölçeklenebilirlik: Uygulandığında, bilgisayarlı görü sistemleri büyük miktardaki veriyi işlemek için kolayca ölçeklenebilir, bu da onları büyüyen işletmeler veya büyük ölçekli operasyonlar için uygun hale getirir.
-
Uygulamaya özel özelleştirme: Bilgisayarlı görü modelleri, veri kümen kullanılarak ince ayar yapılabilir ve uygulamanın gereksinimlerini karşılayan oldukça özelleşmiş çözümler elde etmeni sağlar.
Bu faydalar, bilgisayarlı görünün çeşitli endüstrileri nasıl etkileyebileceğini vurgulasa da, uygulanmasındaki zorlukları da göz önünde bulundurmak önemlidir. İşte temel zorluklardan bazıları:
-
Veri gizliliği endişeleri: Özellikle gözetim veya sağlık hizmetleri gibi hassas alanlarda görsel verilerin kullanımı gizlilik sorunlarını ve güvenlik endişelerini artırabilir.
-
Çevresel sınırlamalar: Bilgisayarlı görü sistemleri, kötü aydınlatma, düşük kaliteli görüntüler veya karmaşık arka planlar gibi zorlu ortamlarda düzgün çalışmakta zorlanabilir.
-
Yüksek başlangıç maliyeti: Bilgisayarlı görü sistemlerinin geliştirilmesi ve uygulanması, özel donanım, yazılım ve uzmanlık ihtiyacı nedeniyle pahalı olabilir.
Link to this sectionÖne çıkanlar#
Bilgisayarlı görü, makinelerin dünyayı insanlar gibi görmesini ve anlamasını sağlayarak makinelerin dünyayla etkileşim kurma şeklini yeniden icat ediyor. Sürücüsüz arabalarda güvenliği artırmak, doktorların hastalıkları daha hızlı teşhis etmesine yardımcı olmak, alışverişi daha kişisel hale getirmek ve hatta çiftçilere mahsul izlemede yardımcı olmak gibi birçok alanda zaten kullanılıyor.
Teknoloji gelişmeye devam ettikçe, uç bilgi işlem ve birleştirilmiş gerçeklik gibi yeni trendler daha da fazla olasılığın kapısını açıyor. Önyargılar ve yüksek maliyetler gibi bazı zorluklar olsa da, bilgisayarlı görü gelecekte birçok endüstri üzerinde büyük bir olumlu etki yaratma potansiyeline sahiptir.
Daha fazlasını öğrenmek için GitHub depomuzu ziyaret et ve topluluğumuzla etkileşime geç. Çözüm sayfalarımızda sürücüsüz arabalarda yapay zeka ve tarımda bilgisayarlı görü gibi sektörlerdeki yenilikleri keşfet. 🚀






