Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

SharkEye utilise Ultralytics YOLOv8 pour la détection d'objets

Abirami Vina

5 min de lecture

28 janvier 2025

Comprenez comment SharkEye, présenté à YOLO Vision 2024, s'appuie sur Ultralytics YOLOv8 pour la détection d'objets en temps réel et la sécurité sur les plages.

La surveillance des animaux dans leur habitat naturel, qu'il s'agisse de bovins paissant dans une ferme ou de requins se déplaçant près du rivage, a toujours été importante pour leur sécurité et leur bien-être. Cependant, l'observation manuelle n'est pas chose aisée. Elle peut souvent impliquer des heures de patience et une concentration soutenue, car les observateurs doivent surveiller attentivement tout changement de comportement ou de mouvement. Même dans ce cas, il est facile de manquer des signes subtils mais importants.

Grâce à l'intelligence artificielle (IA), ce processus devient plus rapide, plus intelligent et beaucoup plus efficace, réduisant la pression sur les observateurs humains tout en améliorant la précision. En particulier, la vision par ordinateur peut être utilisée pour track animaux, repérer les dangers et prendre des décisions en temps réel. Des tâches qui prenaient autrefois des heures peuvent désormais être effectuées en quelques minutes, ce qui ouvre de nouvelles voies pour comprendre le comportement des animaux.

Lors de YOLO Vision 2024 (YV24), un événement hybride annuel organisé par Ultralytics, des experts et des innovateurs se sont réunis pour explorer la manière dont l'IA s'attaque aux défis quotidiens. Parmi les sujets présentés figuraient les avancées en matière de détection d'objets en temps réel et de surveillance des animaux, démontrant comment l'IA améliore la sécurité et l'efficacité dans divers domaines.

L'un des temps forts de l'événement a été l'intervention de Jim Griffin, fondateur d'AI Master Group, qui a montré comment Vision AI rend les plages plus sûres en détectant les requins avant qu'ils ne s'approchent trop près du rivage. Il a expliqué comment l'entreprise a utilisé Ultralytics YOLOv8un modèle de vision par ordinateur de pointe, pour identifier avec précision les requins en temps réel, même dans des conditions difficiles telles que des vagues agitées, des reflets et des obstacles sous-marins.

Dans cet article, nous examinerons de plus près le projet SharkEye et partagerons des informations intéressantes tirées de la présentation de Jim.

Découverte de SharkEye : Une application de vision par ordinateur

Jim a commencé son exposé en présentant Padaro Beach, une destination de surf bien connue en Californie où les surfeurs et les requins partagent souvent les mêmes eaux. Soulignant le véritable défi que représente la détection des requins, il a déclaré : "Bien sûr, il est facile de detect un requin s'il vous mord, alors ce que nous voulions faire, c'était identifier les requins à l'avance".

__wf_reserved_inherit
Fig 1. Jim sur scène à YOLO Vision 2024.

SharkEye a été créé pour résoudre ce problème, avec le soutien de l'Université de Californie, Santa Barbara. Jim a décrit comment des drones équipés de caméras IA haute résolution étaient utilisés pour voler à environ 60 mètres au-dessus de l'eau, scannant l'océan en temps réel.

Si un requin est détecté, des alertes SMS sont envoyées à environ 80 personnes, y compris les sauveteurs, les propriétaires de magasins de surf et toute personne inscrite pour recevoir des mises à jour. Jim a souligné comment ces notifications instantanées permettent des réponses rapides, assurant la sécurité des baigneurs lorsqu'un requin se trouve près du rivage.

Jim a également mentionné que SharkEye dispose d'un tableau de bord en direct où les utilisateurs peuvent consulter les statistiques de détection des requins. Par exemple, sur une période de 12 semaines, le système a identifié deux grands requins et 15 plus petits, soit une moyenne d'un peu plus d'un requin par semaine.

Il a ensuite présenté Neil Nathan, le scientifique qui a dirigé les efforts derrière SharkEye. Bien qu'il ait une formation en études environnementales plutôt qu'en informatique, Nathan a mené à bien le projet. Jim a souligné que les outils d'IA modernes, comme ceux utilisés dans SharkEye, sont conçus pour être accessibles, permettant ainsi à des personnes issues de milieux non techniques de développer des solutions percutantes.

Utiliser Ultralytics YOLOv8 pour detect requins

En entrant dans les détails, Jim a expliqué ce qui se cache sous le capot de SharkEye et comment la solution de détection des requins ne se limitait pas à une simple tâche de détection d'objets. Elle devait faire face à des conditions dynamiques et imprévisibles, telles que des algues flottantes pouvant être facilement confondues avec des requins. Contrairement à la détection d'un objet immobile, l'identification d'un requin exige précision et adaptabilité, ce qui fait de YOLOv8 un choix idéal.

Un autre avantage de YOLOv8 est qu'il peut être déployé sur un drone sans dépendre de serveurs en nuage. Jim a expliqué comment cette approche permettait à SharkEye d'envoyer des alertes immédiates - un élément essentiel pour garantir des réponses rapides dans des conditions océaniques imprévisibles.

Détection d'objets avec seulement six lignes de code

Après avoir souligné le fonctionnement de SharkEye et l'effort de collaboration qui le sous-tend, Jim a présenté une démonstration en direct.

Jim Griffin a commencé sa démonstration en direct en présentant au public un exemple familier - un extrait de code "hello world" pour les modèlesYOLO d 'Ultralytics . Avec seulement six lignes de code Python , il a montré comment un modèle Ultralytics YOLOv8 pré-entraîné pouvait detect sans effort un bus dans une image. 

__wf_reserved_inherit
Fig. 2. Démonstration de Jim à YOLO Vision 2024.

Sa démonstration a utilisé le modèle YOLOv8 Nano, une version légère pour les appareils de faible puissance comme les drones. Le même modèle a été utilisé dans SharkEye pour la détection des requins en temps réel. 

Pour préciser le contexte, Jim a indiqué que le modèle de la démonstration était entraîné sur COCO128, un sous-ensemble plus petit de l'ensemble de donnéesCOCO , largement utilisé. L'ensemble de données COCO contient plus de 20 000 images réparties dans 80 catégories d'objets différentes. Bien que COCO128 fonctionne bien pour des démonstrations rapides, il a souligné que SharkEye avait besoin de quelque chose de plus robuste - un ensemble de données de détection de requins spécifique à l'application qui pourrait gérer les complexités des scénarios du monde réel.

Formation personnalisée de YOLOv8 pour SharkEye 

Selon Jim, la partie la plus difficile du projet SharkEye n'était pas l'entraînement du modèle d'IA, mais la collecte des bonnes données. Il a commenté : « Le travail principal de ce projet n'était pas l'IA. Le travail principal de ce projet consistait à faire voler ces drones pendant cinq ans, à extraire les images de ces vidéos et à les étiqueter correctement. »

Il a décrit comment l'équipe a collecté 15 000 images à Padaro Beach. Chaque image devait être étiquetée manuellement pour différencier les requins, les algues et les autres objets dans l'eau. Bien que le processus ait été lent et exigeant, il a jeté les bases de tout ce qui a suivi.

__wf_reserved_inherit
Fig 3. Utilisation de drones pour capturer des images de requins pour la détection d'objets en temps réel.

Une fois l'ensemble de données prêt, Ultralytics YOLOV8 a fait l'objet d'un entraînement personnalisé. Jim a déclaré : "La formation proprement dite n'a pas été la partie la plus difficile - elle n'a pris que 20 heures sur des GPU T4 [unités de traitement graphique]." Il a également ajouté que le temps aurait pu être réduit à cinq heures seulement avec du matériel plus puissant, tel que des GPU A100.

Évaluation de SharkEye : La précision avant le rappel

Ensuite, Jim a discuté de la façon dont les performances de SharkEye ont été évaluées. Il a illustré que la métrique clé était la précision : la façon dont le système identifiait avec exactitude les vrais requins. Avec SharkEye atteignant une précision impressionnante de 92 %, le modèle s'est avéré très efficace pour identifier avec précision les requins dans l'environnement océanique complexe.

En approfondissant l'importance de la précision, Jim a clarifié pourquoi la précision importait plus que le rappel dans ce cas. « La plupart du temps, les gens s'intéressent au rappel, en particulier dans des domaines comme la santé où le fait de manquer un cas positif peut être critique. Mais dans ce cas, nous ne savions pas combien de requins étaient présents, donc ce qui nous importait, c'était la précision », a-t-il expliqué. SharkEye a veillé à ce que les fausses alarmes soient minimisées en se concentrant sur la précision, ce qui a permis aux sauveteurs et aux autres intervenants d'agir rapidement.

__wf_reserved_inherit
Fig. 4. Jim présente SharkEye à YOLO Vision 2024.

Il a conclu son exposé en comparant l'IA aux performances humaines, notant que la précision de 92 % de SharkEye dépassait de loin la précision de 60 % des experts humains. Il a souligné cet écart en disant : « C'est parce que nous sommes humains. Peu importe à quel point vous ou moi pouvons être experts, si nous devons rester assis devant un écran toute la journée à chercher des requins, nous finirons par laisser notre esprit vagabonder. » Contrairement aux humains, les modèles d'IA ne se fatiguent pas et ne se laissent pas distraire, ce qui en fait une solution fiable pour les tâches nécessitant une surveillance continue.

Ultralytics YOLO11: Le dernier YOLO

Une citation intrigante tirée de l'exposé de Jim Griffin, "Six lignes de code pourraient vous sauver la vie un jour", illustre parfaitement à quel point l'IA est devenue à la fois avancée et accessible. Les modèlesYOLO d'Ultralytics ont été créés dans cet esprit, rendant la technologie de pointe de la vision par ordinateur accessible aux développeurs et aux entreprises de toutes tailles. Ultralytics YOLO11 s'appuie sur ce principe en proposant des inférences plus rapides et une plus grande précision. 

Voici un aperçu de ce qui distingue YOLO11 :

  • Architecture repensée : Son architecture dorsale et de cou améliorée permet une meilleure extraction des caractéristiques et une précision améliorée.
  • Facilité d'utilisation: Il est possible d'y accéder en codant avec Python ou avec des outils sans code comme Ultralytics HUB.
  • Flexibilité entre les tâches: YOLO11 prend en charge des tâches de vision artificielle telles que la détection d'objets, la segmentation d'instances, la classification d'images, le suivi, l'estimation de la pose et les boîtes de délimitation orientées (OBB).
  • Précision accrue: YOLO11 atteint une précisionmAP supérieure de 22 % par rapport à YOLOv8m sur l'ensemble de données COCO , ce qui permet d'obtenir des détections plus précises.

Ces caractéristiques font de YOLO11 un outil idéal pour suivre le comportement des animaux dans des environnements dynamiques, que ce soit dans une ferme ou dans la nature.

Principaux points à retenir

Les progrès réalisés dans le domaine de l'IA visionnaire permettent de relever plus facilement les défis du monde réel en fournissant des outils pratiques pour différents domaines. Par exemple, des modèles de vision artificielle comme YOLO11 peuvent être utilisés pour la surveillance et le suivi en temps réel d'animaux, même dans des conditions difficiles. 

La présentation de Jim Griffin à YV24 a illustré la manière dont YOLOv8 peut être utilisé pour résoudre des problèmes complexes avec un minimum de codage. Le projet SharkEye, qui associe des drones à l'intelligence artificielle pour détecter les requins en temps réel, a montré comment la technologie peut améliorer la sécurité sur les plages. 

Il s'agissait d'une étude de cas fascinante sur la manière dont l'IA accessible permet à des personnes d'horizons différents de créer des solutions efficaces. Alors que l'IA continue d'évoluer, elle transforme les industries et permet aux individus d'exploiter son potentiel pour rendre le monde plus sûr, plus intelligent et plus efficace.

Rejoignez notre communauté et explorez notre dépôt GitHub pour approfondir vos connaissances en matière d'IA. De la vision par ordinateur dans l'agriculture à l'IA dans les voitures autonomes, découvrez comment ces technologies stimulent l'innovation. Consultez nos options de licence pour démarrer vos projets d'IA dès aujourd'hui !

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement