YOLO Vision 2024'te sunulan SharkEye'ın, gerçek zamanlı nesne algılama ve plaj güvenliği için Ultralytics YOLOv8'i nasıl kullandığını anlayın.

YOLO Vision 2024'te sunulan SharkEye'ın, gerçek zamanlı nesne algılama ve plaj güvenliği için Ultralytics YOLOv8'i nasıl kullandığını anlayın.

İster bir çiftlikte otlayan sığırlar, ister kıyıya yakın hareket eden köpekbalıkları olsun, hayvanları doğal yaşam alanlarında izlemek, güvenlikleri ve refahları için her zaman önemli olmuştur. Ancak, onları manuel olarak gözlemlemek kolay değildir. Gözlemcilerin davranış veya hareketteki herhangi bir değişikliği yakından izlemesi gerektiğinden, genellikle saatlerce sabır ve dikkatli odaklanma gerektirebilir. O zaman bile, ince ama önemli işaretleri kaçırmak kolaydır.
Yapay zekanın (AI) devreye girmesi sayesinde, bu süreç daha hızlı, daha akıllı ve çok daha verimli hale geliyor, insan gözlemciler üzerindeki yükü azaltırken doğruluğu artırıyor. Özellikle, bilgisayarlı görü hayvanları izlemek, tehlikeleri tespit etmek ve gerçek zamanlı kararlar almak için kullanılabilir. Bir zamanlar saatler süren görevler artık dakikalar içinde yapılabiliyor ve bu da hayvan davranışlarını anlamak için yeni yollar açıyor.
Ultralytics'in ev sahipliğinde düzenlenen yıllık bir karma etkinlik olan YOLO Vision 2024'te (YV24), uzmanlar ve yenilikçiler yapay zekanın günlük zorlukların üstesinden nasıl geldiğini keşfetmek için bir araya geldi. Sergilenen konulardan bazıları, gerçek zamanlı nesne tespiti ve hayvan izleme alanındaki gelişmelerdi ve yapay zekanın çeşitli alanlarda güvenliği ve verimliliği nasıl artırdığını gösteriyordu.
Etkinliğin öne çıkan noktalarından biri, AI Master Group'un Kurucusu Jim Griffin'in Görüntü İşleme Yapay Zekasının köpekbalıklarını kıyıya çok yaklaşmadan tespit ederek plajları nasıl daha güvenli hale getirdiğini gösterdiği bir konuşmaydı. Dalgalı dalgalar, parlamalar ve su altı engelleri gibi zorlu koşullarda bile köpekbalıklarını gerçek zamanlı olarak doğru bir şekilde tanımlamak için son teknoloji bir bilgisayarlı görü modeli olan Ultralytics YOLOv8'i nasıl kullandıklarını açıkladı.
Bu makalede, SharkEye projesine daha yakından bakacak ve Jim'in konuşmasından ilginç bilgileri paylaşacağız.
Jim, Kaliforniya'da sörfçülerin ve köpekbalıklarının genellikle aynı suları paylaştığı, iyi bilinen bir sörf merkezi olan Padaro Plajı'nı tanıtarak konuşmasına başladı. Köpekbalığı tespitinin gerçek zorluğunu vurgulayarak, “Elbette, bir köpekbalığı sizi ısırırsa onu tespit etmek kolaydır, bu yüzden yapmak istediğimiz şey köpekbalıklarını önceden tespit etmekti.” dedi.

SharkEye, Kaliforniya Üniversitesi, Santa Barbara'nın desteğiyle bu sorunu çözmek için oluşturuldu. Jim, yüksek çözünürlüklü AI kameralarına sahip dronların suyun yaklaşık 200 feet üzerinde uçarak okyanusu gerçek zamanlı olarak taramak için nasıl kullanıldığını anlattı.
Bir köpekbalığı tespit edilirse, cankurtaranlar, sörf dükkanı sahipleri ve güncellemeler için kaydolan herkes dahil olmak üzere yaklaşık 80 kişiye SMS uyarıları gönderilir. Jim, bu anlık bildirimlerin hızlı yanıt verilmesini nasıl sağladığını ve bir köpekbalığı kıyıya yakın olduğunda plajdaki kişilerin nasıl daha güvende tutulduğunu belirtti.
Jim ayrıca SharkEye'ın, kullanıcıların köpekbalığı tespit istatistiklerini görebileceği canlı bir gösterge paneline sahip olduğunu da belirtti. Örneğin, 12 hafta boyunca sistem iki büyük köpekbalığı ve 15 küçük köpekbalığı tespit etti ve bu da haftada ortalama bir köpekbalığından biraz fazla anlamına geliyor.
Daha sonra, SharkEye'ın arkasındaki çalışmalara liderlik eden bilim insanı Neil Nathan'ı tanıttı. Bilgisayar bilimi yerine çevre çalışmaları alanında bir geçmişe sahip olmasına rağmen, Nathan projeye başarıyla öncülük etti. Jim, SharkEye'da kullanılanlar gibi modern AI araçlarının, teknik olmayan geçmişe sahip kişilerin etkili çözümler geliştirmesini sağlayacak şekilde erişilebilir olacak şekilde tasarlandığını vurguladı.
Ayrıntılara daha fazla inen Jim, SharkEye'ın altında yatanları ve köpekbalığı tespit çözümünün sadece basit bir nesne tespiti görevini içermediğini ayrıntılarıyla anlattı. Kolayca köpekbalığı ile karıştırılabilecek yüzen deniz yosunu gibi dinamik, öngörülemeyen koşullarla başa çıkmak zorundaydı. Sabit bir nesneyi tespit etmekten farklı olarak, bir köpekbalığını tanımlamak hassasiyet ve uyarlanabilirlik gerektirir, bu da YOLOv8'i ideal bir seçim haline getirir.
YOLOv8'in bir diğer avantajı da bulut sunucularına ihtiyaç duymadan bir drone'a konuşlandırılabilmesiydi. Jim, bu yaklaşımın SharkEye'ın anında uyarılar göndermesini nasıl mümkün kıldığını açıkladı - bu, öngörülemeyen okyanus koşullarında zamanında yanıt verilmesini sağlamanın önemli bir parçasıdır.
Jim, SharkEye'ın nasıl çalıştığını ve arkasındaki işbirliğini vurguladıktan sonra canlı bir demo sergiledi.
Jim Griffin, canlı demosuna, izleyicilere aşina gelen bir örnekle başladı: Ultralytics YOLO modelleri için bir "merhaba dünya" kod parçacığı. Sadece altı satırlık Python koduyla, önceden eğitilmiş bir Ultralytics YOLOv8 modelinin bir görüntüdeki otobüsü nasıl zahmetsizce tespit edebileceğini gösterdi.

Demosunda, dronlar gibi düşük güçlü cihazlar için hafif bir sürüm olan YOLOv8 Nano modelini kullandı. Aynı model, gerçek zamanlı köpekbalığı tespiti için SharkEye'da kullanıldı.
Daha fazla bağlam sağlamak için Jim, demoda kullanılan modelin, yaygın olarak kullanılan COCO veri kümesinin daha küçük bir alt kümesi olan COCO128 üzerinde eğitildiğini belirtti. COCO veri kümesi, 80 farklı nesne kategorisinde 20.000'den fazla görüntü içerir. COCO128 hızlı gösterimler için iyi çalışsa da, SharkEye'ın daha sağlam bir şeye ihtiyacı olduğunu belirtti: gerçek dünya senaryolarının karmaşıklıklarını kaldırabilecek uygulamaya özel bir köpekbalığı algılama veri kümesi.
Jim'e göre, SharkEye projesinin en zor kısmı AI modelini eğitmek değil, doğru verileri toplamaktı. Şöyle yorumladı: "Bu projenin ana işi AI değildi. Bu projenin ana işi, o dronları beş yıl boyunca uçurmak, o videolardan görüntüleri ayıklamak ve uygun şekilde etiketlemekti."
Ekibin Padaro Plajı'nda 15.000 görüntü topladığını anlattı. Her görüntünün köpekbalıklarını, deniz yosunlarını ve sudaki diğer nesneleri ayırt etmek için manuel olarak etiketlenmesi gerekiyordu. Süreç yavaş ve zorlu olmasına rağmen, bundan sonraki her şeyin temelini oluşturdu.

Veri kümesi hazır olduğunda, Ultralytics YOLOV8 üzerinde özel eğitim yapıldı. Jim, "Asıl eğitim zor değildi - T4 GPU'larda [Grafik işlem birimleri] sadece 20 saat sürdü" dedi. Ayrıca, A100 GPU'ları gibi daha güçlü donanımlarla bu sürenin beş saate kadar düşürülebileceğini de ekledi.
Daha sonra Jim, SharkEye'ın performansının nasıl değerlendirildiğini tartıştı. Temel ölçütün kesinlik olduğunu - sistemin gerçek köpekbalıklarını ne kadar doğru bir şekilde tanımladığını - gösterdi. SharkEye'ın etkileyici %92'lik bir kesinliğe ulaşmasıyla, modelin karmaşık okyanus ortamında köpekbalıklarını doğru bir şekilde tanımlamada son derece etkili olduğu kanıtlandı.
Hassasiyetin önemine daha derinlemesine inen Jim, bu durumda hassasiyetin neden hatırlamadan daha önemli olduğunu açıkladı. "Çoğu zaman insanlar hatırlama ile ilgilenir, özellikle de pozitif bir vakayı kaçırmanın kritik olabileceği sağlık hizmetleri gibi alanlarda. Ancak bu durumda, dışarıda kaç köpekbalığı olduğunu bilmiyorduk, bu yüzden önemsediğimiz şey hassasiyetti," diye açıkladı. SharkEye, yanlış alarmları en aza indirerek hassasiyete odaklanılmasını sağladı ve cankurtaranların ve diğer müdahale ekiplerinin hızlı bir şekilde harekete geçmesini kolaylaştırdı.

Konuşmasını, AI'yı insan performansıyla karşılaştırarak tamamladı ve SharkEye'ın %92'lik hassasiyetinin, insan uzmanların %60'lık doğruluğunu çok aştığını belirtti. Bu farkı vurgulayarak, "Bunun nedeni insan olmamız. Siz veya ben ne kadar uzman olursak olalım, bütün gün bir ekranın önünde oturup köpekbalıklarını aramak zorundaysak, sonunda zihnimiz başka yerlere gidecek," dedi. İnsanların aksine, AI modelleri yorulmaz veya dikkati dağılmaz, bu da onu sürekli izleme gerektiren görevler için güvenilir bir çözüm haline getirir.
Jim Griffin'in konuşmasından alınan ve yapay zekanın ne kadar gelişmiş ama aynı zamanda erişilebilir hale geldiğini mükemmel bir şekilde yakalayan çarpıcı bir alıntı: "Altı satır kod bir gün hayatınızı kurtarabilir." Ultralytics YOLO modelleri, en son bilgisayarlı görme teknolojisini her büyüklükteki geliştirici ve işletmenin erişimine sunmak amacıyla bu düşünceyle oluşturulmuştur. Ultralytics YOLO11, daha hızlı çıkarımlar ve daha yüksek doğrulukla bunu daha da ileriye taşıyor.
İşte YOLO11'i farklı kılan şeylere hızlı bir bakış:
Bu özellikler, YOLO11'i ister bir çiftlikte ister vahşi doğada olsun, dinamik ortamlarda hayvan davranışlarını izlemek için harika bir seçenek haline getirir.
Görüntü Yapay Zekasındaki gelişmeler, çeşitli alanlar için pratik araçlar sağlayarak gerçek dünya zorluklarının üstesinden gelmeyi kolaylaştırıyor. Örneğin, YOLO11 gibi bilgisayarlı görü modelleri, zorlu koşullarda bile hayvanların gerçek zamanlı olarak izlenmesi ve takibi için kullanılabilir.
Jim Griffin'in YV24'teki açılış konuşması, YOLOv8'in minimum kodlama ile karmaşık sorunları çözmek için nasıl kullanılabileceğini gösterdi. Köpekbalığı tespiti için drone'ları yapay zeka ile birleştiren SharkEye projesi, teknolojinin plaj güvenliğini nasıl artırabileceğini sergiledi.
Bu, erişilebilir yapay zekanın farklı geçmişlere sahip insanların etkili çözümler oluşturmasını nasıl sağladığına dair büyüleyici bir vaka çalışmasıydı. Yapay zeka gelişmeye devam ettikçe, endüstrileri dönüştürüyor ve bireylerin dünyayı daha güvenli, daha akıllı ve daha verimli bir yer haline getirmek için potansiyelinden yararlanmasını mümkün kılıyor.
Topluluğumuzun bir parçası olun ve yapay zekaya daha derinlemesine dalmak için GitHub depomuzu keşfedin. Tarımda bilgisayarlı görüden otonom sürüşlü arabalarda yapay zekaya kadar, bu teknolojilerin inovasyonu nasıl yönlendirdiğini görün. Yapay zeka projelerinize bugün başlamak için lisanslama seçeneklerimize göz atın!