Comprenez comment SharkEye, présenté à YOLO Vision 2024, exploite Ultralytics YOLOv8 pour la détection d'objets en temps réel et la sécurité des plages.

Comprenez comment SharkEye, présenté à YOLO Vision 2024, exploite Ultralytics YOLOv8 pour la détection d'objets en temps réel et la sécurité des plages.

La surveillance des animaux dans leur habitat naturel, qu'il s'agisse de bovins paissant dans une ferme ou de requins se déplaçant près du rivage, a toujours été importante pour leur sécurité et leur bien-être. Cependant, l'observation manuelle n'est pas chose aisée. Elle peut souvent impliquer des heures de patience et une concentration soutenue, car les observateurs doivent surveiller attentivement tout changement de comportement ou de mouvement. Même dans ce cas, il est facile de manquer des signes subtils mais importants.
Grâce à l'intervention de l'intelligence artificielle (IA), ce processus devient plus rapide, plus intelligent et beaucoup plus efficace, réduisant ainsi la pression sur les observateurs humains tout en améliorant la précision. En particulier, la vision par ordinateur peut être utilisée pour suivre les animaux, repérer les dangers et prendre des décisions en temps réel. Des tâches qui prenaient autrefois des heures peuvent désormais être effectuées en quelques minutes, ouvrant ainsi de nouvelles perspectives pour comprendre le comportement animal.
Lors de YOLO Vision 2024 (YV24), un événement hybride annuel organisé par Ultralytics, des experts et des innovateurs se sont réunis pour explorer comment l'IA relève les défis quotidiens. Parmi les sujets présentés, on trouvait les avancées en matière de détection d'objets en temps réel et de surveillance des animaux, démontrant ainsi comment l'IA améliore la sécurité et l'efficacité dans divers domaines.
L'un des points forts de l'événement a été la présentation de Jim Griffin, fondateur d'AI Master Group, où il a démontré comment la Vision IA améliore la sécurité des plages en détectant les requins avant qu'ils ne s'approchent trop près du rivage. Il a expliqué comment ils ont utilisé Ultralytics YOLOv8, un modèle de vision par ordinateur de pointe, pour identifier avec précision les requins en temps réel, même dans des conditions difficiles telles que les vagues agitées, les reflets et les obstacles sous-marins.
Dans cet article, nous examinerons de plus près le projet SharkEye et partagerons des informations intéressantes tirées de la présentation de Jim.
Jim a commencé sa présentation en présentant Padaro Beach, une destination de surf bien connue en Californie où les surfeurs et les requins partagent souvent les mêmes eaux. Soulignant le véritable défi de la détection des requins, il a déclaré : « Bien sûr, il est facile de détecter un requin s'il vous mord, donc ce que nous voulions faire, c'est identifier les requins à l'avance. »

SharkEye a été créé pour résoudre ce problème, avec le soutien de l'Université de Californie, Santa Barbara. Jim a décrit comment des drones équipés de caméras IA haute résolution étaient utilisés pour voler à environ 60 mètres au-dessus de l'eau, scannant l'océan en temps réel.
Si un requin est détecté, des alertes SMS sont envoyées à environ 80 personnes, y compris les sauveteurs, les propriétaires de magasins de surf et toute personne inscrite pour recevoir des mises à jour. Jim a souligné comment ces notifications instantanées permettent des réponses rapides, assurant la sécurité des baigneurs lorsqu'un requin se trouve près du rivage.
Jim a également mentionné que SharkEye dispose d'un tableau de bord en direct où les utilisateurs peuvent consulter les statistiques de détection des requins. Par exemple, sur une période de 12 semaines, le système a identifié deux grands requins et 15 plus petits, soit une moyenne d'un peu plus d'un requin par semaine.
Il a ensuite présenté Neil Nathan, le scientifique qui a dirigé les efforts derrière SharkEye. Bien qu'il ait une formation en études environnementales plutôt qu'en informatique, Nathan a mené à bien le projet. Jim a souligné que les outils d'IA modernes, comme ceux utilisés dans SharkEye, sont conçus pour être accessibles, permettant ainsi à des personnes issues de milieux non techniques de développer des solutions percutantes.
En approfondissant les détails, Jim a expliqué ce qui se cache sous le capot de SharkEye et comment la solution de détection des requins n'impliquait pas seulement une simple tâche de détection d'objets. Elle devait faire face à des conditions dynamiques et imprévisibles, comme les algues flottantes qui pouvaient facilement être confondues avec des requins. Contrairement au repérage d'un objet stationnaire, l'identification d'un requin exige précision et adaptabilité, ce qui fait de YOLOv8 un choix idéal.
Un autre avantage de YOLOv8 était qu'il pouvait être déployé sur un drone sans dépendre de serveurs cloud. Jim a expliqué comment cette approche a permis à SharkEye d'envoyer des alertes immédiates - un élément essentiel pour assurer des réponses rapides dans des conditions océaniques imprévisibles.
Après avoir souligné le fonctionnement de SharkEye et l'effort de collaboration qui le sous-tend, Jim a présenté une démonstration en direct.
Jim Griffin a commencé sa démonstration en direct en présentant au public un exemple familier : un extrait de code « hello world » pour les modèles Ultralytics YOLO. Avec seulement six lignes de code Python, il a montré comment un modèle Ultralytics YOLOv8 pré-entraîné pouvait facilement détecter un bus dans une image.

Sa démonstration utilisait le modèle YOLOv8 Nano, une version légère pour les appareils à faible consommation d'énergie comme les drones. Le même modèle a été utilisé dans SharkEye pour la détection de requins en temps réel.
Pour donner plus de contexte, Jim a mentionné que le modèle de la démonstration était entraîné sur COCO128, un sous-ensemble plus petit du jeu de données COCO largement utilisé. Le jeu de données COCO contient plus de 20 000 images réparties dans 80 catégories d'objets différentes. Bien que COCO128 fonctionne bien pour des démonstrations rapides, il a souligné que SharkEye avait besoin de quelque chose de plus robuste : un jeu de données de détection de requins spécifique à l'application, capable de gérer les complexités des scénarios du monde réel.
Selon Jim, la partie la plus difficile du projet SharkEye n'était pas l'entraînement du modèle d'IA, mais la collecte des bonnes données. Il a commenté : « Le travail principal de ce projet n'était pas l'IA. Le travail principal de ce projet consistait à faire voler ces drones pendant cinq ans, à extraire les images de ces vidéos et à les étiqueter correctement. »
Il a décrit comment l'équipe a collecté 15 000 images à Padaro Beach. Chaque image devait être étiquetée manuellement pour différencier les requins, les algues et les autres objets dans l'eau. Bien que le processus ait été lent et exigeant, il a jeté les bases de tout ce qui a suivi.

Une fois le jeu de données prêt, Ultralytics YOLOV8 a été entraîné sur mesure dessus. Jim a déclaré : « L'entraînement proprement dit n'a pas été la partie difficile : il n'a fallu que 20 heures sur des GPU T4 [unités de traitement graphique]. » Il a également ajouté que le temps aurait pu être réduit à seulement cinq heures avec du matériel plus puissant, tel que des GPU A100.
Ensuite, Jim a discuté de la façon dont les performances de SharkEye ont été évaluées. Il a illustré que la métrique clé était la précision : la façon dont le système identifiait avec exactitude les vrais requins. Avec SharkEye atteignant une précision impressionnante de 92 %, le modèle s'est avéré très efficace pour identifier avec précision les requins dans l'environnement océanique complexe.
En approfondissant l'importance de la précision, Jim a clarifié pourquoi la précision importait plus que le rappel dans ce cas. « La plupart du temps, les gens s'intéressent au rappel, en particulier dans des domaines comme la santé où le fait de manquer un cas positif peut être critique. Mais dans ce cas, nous ne savions pas combien de requins étaient présents, donc ce qui nous importait, c'était la précision », a-t-il expliqué. SharkEye a veillé à ce que les fausses alarmes soient minimisées en se concentrant sur la précision, ce qui a permis aux sauveteurs et aux autres intervenants d'agir rapidement.

Il a conclu son exposé en comparant l'IA aux performances humaines, notant que la précision de 92 % de SharkEye dépassait de loin la précision de 60 % des experts humains. Il a souligné cet écart en disant : « C'est parce que nous sommes humains. Peu importe à quel point vous ou moi pouvons être experts, si nous devons rester assis devant un écran toute la journée à chercher des requins, nous finirons par laisser notre esprit vagabonder. » Contrairement aux humains, les modèles d'IA ne se fatiguent pas et ne se laissent pas distraire, ce qui en fait une solution fiable pour les tâches nécessitant une surveillance continue.
Une citation intéressante de la présentation de Jim Griffin, « Six lignes de code pourraient vous sauver la vie un jour », illustre parfaitement à quel point l'IA est devenue à la fois avancée et accessible. Les modèles Ultralytics YOLO ont été créés dans cet esprit, rendant la technologie de vision par ordinateur de pointe accessible aux développeurs et aux entreprises de toutes tailles. Ultralytics YOLO11 s'appuie sur cela avec des inférences plus rapides et une plus grande précision.
Voici un aperçu rapide de ce qui distingue YOLO11 :
Ces caractéristiques font de YOLO11 un excellent choix pour le suivi du comportement animal dans des environnements dynamiques, que ce soit dans une ferme ou dans la nature.
Les progrès de la vision artificielle facilitent la résolution des défis du monde réel en fournissant des outils pratiques pour divers domaines. Par exemple, les modèles de vision par ordinateur comme YOLO11 peuvent être utilisés pour la surveillance et le suivi en temps réel des animaux, même dans des conditions difficiles.
La présentation de Jim Griffin à YV24 a illustré comment YOLOv8 peut être utilisé pour résoudre des problèmes complexes avec un minimum de codage. Le projet SharkEye, qui combine des drones avec l'IA pour la détection de requins en temps réel, a montré comment la technologie peut améliorer la sécurité des plages.
Il s'agissait d'une étude de cas fascinante sur la manière dont l'IA accessible permet à des personnes d'horizons différents de créer des solutions efficaces. Alors que l'IA continue d'évoluer, elle transforme les industries et permet aux individus d'exploiter son potentiel pour rendre le monde plus sûr, plus intelligent et plus efficace.
Rejoignez notre communauté et explorez notre dépôt GitHub pour approfondir vos connaissances en matière d'IA. De la vision par ordinateur dans l'agriculture à l'IA dans les voitures autonomes, découvrez comment ces technologies stimulent l'innovation. Consultez nos options de licence pour démarrer vos projets d'IA dès aujourd'hui !