YOLO Vision 2025'i kaçırmayın!
25 Eylül 2025
10:00 — 18:00 BST
Hibrit etkinlik
Yolo Vision 2024

Bilgisayarlı görü'nün bakış algılama için nasıl kullanılabileceğini keşfetme

Abirami Vina

5 dakikalık okuma

19 Şubat 2025

Nesne tespiti ve poz tahmini gibi Vision AI tekniklerinin, çeşitli uygulamalarda göz takibi ve bakış tespiti için nasıl kullanılabileceğini keşfedin.

Bilgisayarlı görü, makinelerin görsel verileri insanlara benzer bir şekilde analiz etmesini ve yorumlamasını sağlamaya odaklanan bir yapay zeka (AI) dalıdır. Vision AI'nın özellikle büyüleyici bir uygulaması, bir kişinin nereye baktığını izlemeyi ve anlamayı mümkün kılan bakış algılamadır.

İnsanlar olarak, birinin bakışlarını doğal olarak takip edebilir ve neye odaklandığını anlayabiliriz. Örneğin, bir arkadaşınızla konuşuyorsanız ve aniden kapıya doğru bakarsa, içgüdüsel olarak dikkatini çeken şeyi görmek için dönebilirsiniz. Öte yandan, makinelerin bu yerleşik yeteneği yoktur; göz hareketlerini tanımak ve bakış yönünü yorumlamak için bilgisayarlı görme teknikleri kullanılarak eğitilmeleri gerekir. 

Küresel göz takip pazarının 2032'ye kadar 11,9 milyar dolara ulaşması beklenirken, birçok sektör farklı uygulamalar için bu teknolojiyi benimsiyor. Örneğin, arabalarda göz takibi, dikkat seviyelerini izleyerek ve uyuşukluk veya dikkat dağınıklığı belirtilerini tespit ederek sürücü güvenliğini artırmak için kullanılıyor.

Bu makalede, bilgisayarlı görünün göz takibi ve bakış algılama için nasıl kullanıldığını inceleyeceğiz. Ayrıca, çeşitli endüstrilerdeki bazı temel uygulamalarına da bakacağız. Hadi başlayalım!

Göz takibi ve bakış algılama nedir?

Göz takibi ve bakış algılama, göz hareketlerini ve bakış yönünü analiz ederek bir kişinin dikkat odağını belirlemek için kullanılan tekniklerdir. Yapay zeka ve sensör teknolojisindeki gelişmeler sayesinde, artık bir kişinin gözlerini gerçek zamanlı olarak takip etmek mümkün. 

Geleneksel olarak, çoğu göz izleme sistemi, gözleri kızılötesi ışıkla aydınlatarak ve kornea yansımalarını yakalayarak göz bebeği hareketlerini algılayan kızılötesi (IR) kameralara dayanır. Bu sistemler yüksek hassasiyet sağlar. Ancak, genellikle giyilmesi rahatsız olabilen ve kalibrasyon sorunlarına yatkın olan özel başlıklar gerektirirler.

Yapay zekanın yükselişiyle birlikte, araştırmacılar bilgisayarlı görü tabanlı göz izleme yöntemlerini aktif olarak araştırmaktadır. Geleneksel IR tabanlı sistemlerin aksine, bu yaklaşımlar gözler ve göz bebekleri gibi yüz özelliklerini tespit etmek ve kafa pozisyonu tahmini yapmak için bilgisayarlı görü modelleri gibi Ultralytics YOLO11'e dayanır. Bunun ötesinde, NVIDIA'nın GazeNet'i gibi özel derin öğrenme modelleri özellikle göz tahmini için tasarlanmıştır. 

__wf_reserved_inherit
Şekil 1. YOLO11'in bir kişinin gözünü ve göz bebeğini tespit etmek için kullanımına bir örnek.

Hala gelişmekte olan bir alan olmasına rağmen, bilgisayarlı görü tabanlı göz takibi, pazarlama, psikoloji ve sinirbilimdeki uygulamalar için maliyetleri düşürerek ve kullanılabilirliği artırarak göz takibini daha erişilebilir hale getirme potansiyeline sahiptir.

Bakış algılama ve göz izlemenin evrimi

Şimdi de geleneksel kızılötesi tabanlı sistemlerden daha erişilebilir, yazılım odaklı çözümlere geçişi inceleyelim.

Göz takibi ve bakış algılamanın yapay zeka olmadan yapılıp yapılamayacağını merak ediyor olabilirsiniz - peki neden yapay zeka ve bilgisayarlı görüyü bu teknolojilere entegre etme konusunda devam eden araştırmalar var? Geleneksel göz izleme yöntemleri mevcut olsa da, bunlar genellikle pahalı, hantal ve kontrollü aydınlatma koşulları gerektirebilen özel kızılötesi kameralara ve başa monte göz izleme cihazlarına dayanır. Bununla birlikte, yapay zeka odaklı çözümler, maliyetleri düşüren ve erişilebilirliği artıran standart web kameraları ve akıllı telefon kameraları kullanarak göz takibini mümkün kılar. 

__wf_reserved_inherit
Şekil 2. Baş üzerine monte edilmiş bir göz takip cihazı.

İşte göz takibi ve bakış algılama teknolojisinin evriminin ardındaki diğer faktörlerden bazıları:

  • Uygulamalar: Yazılım odaklı yaklaşımlar, bu alanın araştırmanın ötesine geçerek tüketici cihazlarına ve oyun gibi alanlara yayılmasına olanak tanır.
  • Ölçeklenebilirlik: Yapay zeka, bakış algılama çözümlerini bireysel kullanıcılardan büyük ölçekli endüstrilere kadar daha geniş bir kitleye sunmak için devreye girebilir.
  • Kamera teknolojisindeki gelişmeler: Bugün, 20 yıl önce mümkün olmayan bir şey olan göz izleme doğruluğunu artıran daha yüksek çözünürlüklü akıllı telefon ve web kamerası kameralarına erişimimiz var.

Göz takibi ve göz izleme için Ultralytics YOLO11 kullanma

Bilgisayarlı görünün göz takibi ve bakış algılamadaki rolünü tartıştığımıza göre, YOLO11'in burada nasıl kullanılabileceğini inceleyelim.

Ultralytics YOLO11, nesne tespiti ve poz tahmini gibi görevleri destekler. COCO veri kümesi üzerinde önceden eğitilmiş olup, çeşitli nesneleri tespit etmede yüksek doğruluk sağlar. Özellikle, bir bakış algılama çözümü için YOLO11 destekleyici bir rol oynayabilir. 

Doğrudan bakış yönünü tahmin edemese de, daha fazla analiz için önemli olan yüzleri, gözleri ve göz bebeklerini tespit etmek için ince ayar yapılabilir. Bu özellikler tanımlandıktan sonra, ek modeller bakış yönünü tahmin etmek için göz hareketi verilerini işleyebilir. 

Örneğin, doğruluğu artırmak için YOLO11, yüz tanıma için WIDER FACE gibi veri kümeleri üzerinde özel olarak eğitilebilir. Ayrıca, YOLO11'in poz tahmini yetenekleri ile ilgili olarak, bakış algılama doğruluğunu artıran kafa yönünü izlemeye yardımcı olabilir.

__wf_reserved_inherit
Şekil 3. YOLO11 insan yüzlerini tespit etmek için kullanılabilir.

Göz algılama teknolojisinin gerçek dünya uygulamaları

Bilgisayarlı görü ile mümkün kılınan göz algılama, otomotiv sektöründe güvenliği artırmaktan oyunlarda odaklanmayı analiz etmeye kadar çeşitli sektörlerde geniş bir uygulama alanına sahiptir. Farklı alanların bu teknolojiden nasıl yararlandığını keşfedelim.

Oyunlarda göz takibi

Göz takibi, oyuncu odağı, karar verme ve tepki süreleri hakkında gerçek zamanlı bilgiler sağlamak için oyunlarda kullanılıyor. Göz hareketlerini izleyerek, bu teknoloji oyuncuların stratejilerini geliştirmelerine, eğitim programlarını iyileştirmelerine ve oyuncuların önemli anlarda nereye baktıklarını görsel olarak görüntüleyerek izleyici katılımını artırmalarına yardımcı olur.

Bunun ilginç bir örneği, oyuncuların gerçekçi sürüş simülasyonları kullanarak yarıştığı rekabetçi bir sanal motor sporları olan sim yarışıdır. Göz takibi, sürücülerin piste nasıl odaklandıklarını, rakiplere nasıl tepki verdiklerini ve keskin virajlarda nasıl gezindiklerini analiz etmeye yardımcı olur. Bakışlarını gerçek zamanlı olarak izleyerek, eğitmenler kalıpları belirleyebilir, dikkat dağıtıcı unsurları tespit edebilir ve yarış stratejilerini geliştirebilir. 

__wf_reserved_inherit
Şekil 4. Göz takibi, sim yarışçılarını izlemek ve analiz etmek için kullanılabilir. 

Sim yarışlarının ötesinde, göz takibi, oyuncu reflekslerini, tepki sürelerini ve oyun içi temel unsurlara nasıl odaklandıklarını analiz etmek için hızlı tempolu rekabetçi oyunlarda da kullanılmaktadır. Bir oyuncunun hamle yapmadan önce nereye baktığını anlayarak, bu veriler karar almayı iyileştirmeye, hassasiyeti artırmaya ve üst düzey oyun için eğitimi geliştirmeye yardımcı olur.

Psikolojik araştırma için göz kestirimi

Göz takibinin araştırmayla ilgili birçok Vizyon AI uygulaması vardır. Bunun iyi bir örneği, dikkat, bilişsel yük ve sosyal davranışı incelemek için psikolojide kullanılmasıdır. Araştırmacılar, göz hareketlerini analiz ederek algı, karar verme ve otizm ve DEHB gibi zihinsel sağlık koşulları hakkında fikir edinebilirler. 

Özellikle, bilgisayarlı görü kullanarak göz takibi, bilişsel ve duygusal durumları ortaya çıkarabilecek göz hareketi, sabitleme süresi ve görsel dikkatteki kalıpları belirlemeye yardımcı olur. Derin öğrenme ve yapay zeka odaklı göz kestiriminin ilerlemesiyle, bu yöntemler daha doğru ve erişilebilir hale geliyor ve nörolojik araştırmalarda daha geniş uygulamalara olanak tanıyor.

Otomotiv güvenliği

Yıllar içinde araştırmacılar, farklı trafik koşulları sırasında sürücülerin dikkatini ve odaklanmasını incelemek için farklı yöntemler kullandılar. Bu yöntemler arasında, göz takibi çok önemli olmuştur ve sürücünün sürüş sırasında nereye baktığına dair içgörüler sağlayabilir. 

Göz takip modellemesi, bilgisayarlı görü modelleri yardımıyla, göz hareketlerini gerçek zamanlı olarak doğru bir şekilde izleyerek bu analizi daha da geliştirebilir. Bu analiz, sürücü davranışını daha iyi anlamamızı sağlayarak dikkat dağınıklıklarını, yorgunluğu veya dikkat eksikliklerini belirlemeye yardımcı olabilir ve bu da yol güvenliğini artırıp gelişmiş sürücü destek sistemlerinin geliştirilmesine katkıda bulunabilir.

__wf_reserved_inherit
Şekil 5. Yüz tanıma ve göz takibi kullanarak bir sürücüyü izleme örneği.

Örneğin, bir sürücü sık sık telefona bakmak için yoldan uzaklaşıyorsa veya kavşaklarda tepki vermekte yavaş kalıyorsa, sistem bu davranışları algılayabilir ve dikkatlerini yeniden toplamaları için uyarılar vererek potansiyel olarak kazaları önleyebilir.

Göz takibi ve bakış algılamanın artıları ve eksileri

İşte göz takibi ve bakış algılama teknolojilerinin günlük hayatımıza getirebileceği bazı temel faydalar:

  • Artan farkındalık: Göz takibi, insanların çevreleriyle görsel olarak nasıl etkileşimde bulunduklarına dair içgörüler sağlayarak dikkat ve odaklanma kalıplarını daha iyi anlamaya yardımcı olur.
  • Daha iyi karar verme: Göz takibinden toplanan veriler, araştırmacıların ve profesyonellerin nesnel dikkat kalıplarına dayalı olarak bilinçli kararlar almasına yardımcı olur.
  • Geliştirilmiş görsel ergonomi: Göz hareketlerini analiz etmek, göz yorgunluğunu azaltan ve konforu artıran ekranlar, çalışma alanları ve ortamlar tasarlamaya yardımcı olabilir.

Bu faydalar göz algılamanın hayatımızı nasıl olumlu yönde etkileyebileceğini vurgularken, uygulanmasında yer alan zorlukları da dikkate almak önemlidir. İşte akılda tutulması gereken bazı temel sınırlamalar:

  • Gizlilik endişeleri: Sürekli göz takibi, gizlilik sorunlarını gündeme getirebilir ve kullanıcıları rahatsız edebilir. Şeffaflığın sağlanması, kullanıcı onayı alınması ve yerel veri işleme, bu endişeleri azaltmaya yardımcı olabilir.
  • Yüksek hesaplama talebi: Gerçek zamanlı göz takibi, düşük güçlü cihazlarda erişilebilirliği sınırlayan güçlü donanım gerektirebilir. Ancak, optimize edilmiş modeller verimliliği artırmaya yardımcı oluyor.
  • Doğruluk sınırlamaları: Göz takibi, aydınlatma değişiklikleri, baş hareketleri veya gözlük ve saç gibi engeller nedeniyle gerçek dünya ortamlarında daha az güvenilir olabilir. Kamera açıları da performansı etkileyebilir.

Gözünüzü geleceğe dikmek

YOLO11 gibi bilgisayarlı görü modelleri tarafından desteklenen göz takibi ve bakış algılama, dünyayla nasıl etkileşim kurduğumuzu değiştiriyor. Yolları daha güvenli hale getirmekten insan davranışını anlamaya kadar, bu teknoloji günlük yaşamda giderek daha kullanışlı hale geliyor.

Gizlilik endişeleri ve güçlü bilgisayarlara duyulan ihtiyaç gibi zorluklar olsa da, yapay zeka ve bilgisayarlı görüdeki gelişmeler, göz takibini daha doğru ve kullanımı daha kolay hale getiriyor. Gelişmeye devam ettikçe, çeşitli sektörlerde daha büyük bir rol oynayacaktır.

Daha fazla bilgi edinmek için GitHub depomuzu ziyaret edin ve topluluğumuzla etkileşim kurun. Çözüm sayfalarımızda kendi kendine giden arabalarda AI ve tarımda bilgisayarlı görü gibi sektörlerdeki yenilikleri keşfedin. Lisanslama seçeneklerimize göz atın ve Vision AI projelerinizi hayata geçirin. 🚀

Gelin, yapay zekanın geleceğini
birlikte inşa edelim!

Makine öğreniminin geleceği ile yolculuğunuza başlayın

Ücretsiz başlayın
Bağlantı panoya kopyalandı