Yolo Vision Shenzhen
Shenzhen
Rejoindre maintenant

SharkEye utilise Ultralytics YOLOv8 pour la détection d'objets

Abirami Vina

5 min de lecture

28 janvier 2025

Comprenez comment SharkEye, présenté à YOLO Vision 2024, exploite Ultralytics YOLOv8 pour la détection d'objets en temps réel et la sécurité des plages.

La surveillance des animaux dans leur habitat naturel, qu'il s'agisse de bovins paissant dans une ferme ou de requins se déplaçant près du rivage, a toujours été importante pour leur sécurité et leur bien-être. Cependant, l'observation manuelle n'est pas chose aisée. Elle peut souvent impliquer des heures de patience et une concentration soutenue, car les observateurs doivent surveiller attentivement tout changement de comportement ou de mouvement. Même dans ce cas, il est facile de manquer des signes subtils mais importants.

Grâce à l'intervention de l'intelligence artificielle (IA), ce processus devient plus rapide, plus intelligent et beaucoup plus efficace, réduisant ainsi la pression sur les observateurs humains tout en améliorant la précision. En particulier, la vision par ordinateur peut être utilisée pour suivre les animaux, repérer les dangers et prendre des décisions en temps réel. Des tâches qui prenaient autrefois des heures peuvent désormais être effectuées en quelques minutes, ouvrant ainsi de nouvelles perspectives pour comprendre le comportement animal.

Lors de YOLO Vision 2024 (YV24), un événement hybride annuel organisé par Ultralytics, des experts et des innovateurs se sont réunis pour explorer comment l'IA relève les défis quotidiens. Parmi les sujets présentés, on trouvait les avancées en matière de détection d'objets en temps réel et de surveillance des animaux, démontrant ainsi comment l'IA améliore la sécurité et l'efficacité dans divers domaines.

L'un des points forts de l'événement a été la présentation de Jim Griffin, fondateur d'AI Master Group, où il a démontré comment la Vision IA améliore la sécurité des plages en détectant les requins avant qu'ils ne s'approchent trop près du rivage. Il a expliqué comment ils ont utilisé Ultralytics YOLOv8, un modèle de vision par ordinateur de pointe, pour identifier avec précision les requins en temps réel, même dans des conditions difficiles telles que les vagues agitées, les reflets et les obstacles sous-marins.

Dans cet article, nous examinerons de plus près le projet SharkEye et partagerons des informations intéressantes tirées de la présentation de Jim.

Découverte de SharkEye : Une application de vision par ordinateur

Jim a commencé sa présentation en présentant Padaro Beach, une destination de surf bien connue en Californie où les surfeurs et les requins partagent souvent les mêmes eaux. Soulignant le véritable défi de la détection des requins, il a déclaré : « Bien sûr, il est facile de détecter un requin s'il vous mord, donc ce que nous voulions faire, c'est identifier les requins à l'avance. »

__wf_reserved_inherit
Fig 1. Jim sur scène à YOLO Vision 2024.

SharkEye a été créé pour résoudre ce problème, avec le soutien de l'Université de Californie, Santa Barbara. Jim a décrit comment des drones équipés de caméras IA haute résolution étaient utilisés pour voler à environ 60 mètres au-dessus de l'eau, scannant l'océan en temps réel.

Si un requin est détecté, des alertes SMS sont envoyées à environ 80 personnes, y compris les sauveteurs, les propriétaires de magasins de surf et toute personne inscrite pour recevoir des mises à jour. Jim a souligné comment ces notifications instantanées permettent des réponses rapides, assurant la sécurité des baigneurs lorsqu'un requin se trouve près du rivage.

Jim a également mentionné que SharkEye dispose d'un tableau de bord en direct où les utilisateurs peuvent consulter les statistiques de détection des requins. Par exemple, sur une période de 12 semaines, le système a identifié deux grands requins et 15 plus petits, soit une moyenne d'un peu plus d'un requin par semaine.

Il a ensuite présenté Neil Nathan, le scientifique qui a dirigé les efforts derrière SharkEye. Bien qu'il ait une formation en études environnementales plutôt qu'en informatique, Nathan a mené à bien le projet. Jim a souligné que les outils d'IA modernes, comme ceux utilisés dans SharkEye, sont conçus pour être accessibles, permettant ainsi à des personnes issues de milieux non techniques de développer des solutions percutantes.

Utilisation d'Ultralytics YOLOv8 pour détecter les requins

En approfondissant les détails, Jim a expliqué ce qui se cache sous le capot de SharkEye et comment la solution de détection des requins n'impliquait pas seulement une simple tâche de détection d'objets. Elle devait faire face à des conditions dynamiques et imprévisibles, comme les algues flottantes qui pouvaient facilement être confondues avec des requins. Contrairement au repérage d'un objet stationnaire, l'identification d'un requin exige précision et adaptabilité, ce qui fait de YOLOv8 un choix idéal.

Un autre avantage de YOLOv8 était qu'il pouvait être déployé sur un drone sans dépendre de serveurs cloud. Jim a expliqué comment cette approche a permis à SharkEye d'envoyer des alertes immédiates - un élément essentiel pour assurer des réponses rapides dans des conditions océaniques imprévisibles.

Détection d'objets avec seulement six lignes de code

Après avoir souligné le fonctionnement de SharkEye et l'effort de collaboration qui le sous-tend, Jim a présenté une démonstration en direct.

Jim Griffin a commencé sa démonstration en direct en présentant au public un exemple familier : un extrait de code « hello world » pour les modèles Ultralytics YOLO. Avec seulement six lignes de code Python, il a montré comment un modèle Ultralytics YOLOv8 pré-entraîné pouvait facilement détecter un bus dans une image. 

__wf_reserved_inherit
Fig 2. Démonstration de Jim à YOLO Vision 2024.

Sa démonstration utilisait le modèle YOLOv8 Nano, une version légère pour les appareils à faible consommation d'énergie comme les drones. Le même modèle a été utilisé dans SharkEye pour la détection de requins en temps réel. 

Pour donner plus de contexte, Jim a mentionné que le modèle de la démonstration était entraîné sur COCO128, un sous-ensemble plus petit du jeu de données COCO largement utilisé. Le jeu de données COCO contient plus de 20 000 images réparties dans 80 catégories d'objets différentes. Bien que COCO128 fonctionne bien pour des démonstrations rapides, il a souligné que SharkEye avait besoin de quelque chose de plus robuste : un jeu de données de détection de requins spécifique à l'application, capable de gérer les complexités des scénarios du monde réel.

Entraînement personnalisé de YOLOv8 pour SharkEye 

Selon Jim, la partie la plus difficile du projet SharkEye n'était pas l'entraînement du modèle d'IA, mais la collecte des bonnes données. Il a commenté : « Le travail principal de ce projet n'était pas l'IA. Le travail principal de ce projet consistait à faire voler ces drones pendant cinq ans, à extraire les images de ces vidéos et à les étiqueter correctement. »

Il a décrit comment l'équipe a collecté 15 000 images à Padaro Beach. Chaque image devait être étiquetée manuellement pour différencier les requins, les algues et les autres objets dans l'eau. Bien que le processus ait été lent et exigeant, il a jeté les bases de tout ce qui a suivi.

__wf_reserved_inherit
Fig 3. Utilisation de drones pour capturer des images de requins pour la détection d'objets en temps réel.

Une fois le jeu de données prêt, Ultralytics YOLOV8 a été entraîné sur mesure dessus. Jim a déclaré : « L'entraînement proprement dit n'a pas été la partie difficile : il n'a fallu que 20 heures sur des GPU T4 [unités de traitement graphique]. » Il a également ajouté que le temps aurait pu être réduit à seulement cinq heures avec du matériel plus puissant, tel que des GPU A100.

Évaluation de SharkEye : La précision avant le rappel

Ensuite, Jim a discuté de la façon dont les performances de SharkEye ont été évaluées. Il a illustré que la métrique clé était la précision : la façon dont le système identifiait avec exactitude les vrais requins. Avec SharkEye atteignant une précision impressionnante de 92 %, le modèle s'est avéré très efficace pour identifier avec précision les requins dans l'environnement océanique complexe.

En approfondissant l'importance de la précision, Jim a clarifié pourquoi la précision importait plus que le rappel dans ce cas. « La plupart du temps, les gens s'intéressent au rappel, en particulier dans des domaines comme la santé où le fait de manquer un cas positif peut être critique. Mais dans ce cas, nous ne savions pas combien de requins étaient présents, donc ce qui nous importait, c'était la précision », a-t-il expliqué. SharkEye a veillé à ce que les fausses alarmes soient minimisées en se concentrant sur la précision, ce qui a permis aux sauveteurs et aux autres intervenants d'agir rapidement.

__wf_reserved_inherit
Fig 4. Jim présentant SharkEye à YOLO Vision 2024.

Il a conclu son exposé en comparant l'IA aux performances humaines, notant que la précision de 92 % de SharkEye dépassait de loin la précision de 60 % des experts humains. Il a souligné cet écart en disant : « C'est parce que nous sommes humains. Peu importe à quel point vous ou moi pouvons être experts, si nous devons rester assis devant un écran toute la journée à chercher des requins, nous finirons par laisser notre esprit vagabonder. » Contrairement aux humains, les modèles d'IA ne se fatiguent pas et ne se laissent pas distraire, ce qui en fait une solution fiable pour les tâches nécessitant une surveillance continue.

Ultralytics YOLO11 : Le dernier YOLO

Une citation intéressante de la présentation de Jim Griffin, « Six lignes de code pourraient vous sauver la vie un jour », illustre parfaitement à quel point l'IA est devenue à la fois avancée et accessible. Les modèles Ultralytics YOLO ont été créés dans cet esprit, rendant la technologie de vision par ordinateur de pointe accessible aux développeurs et aux entreprises de toutes tailles. Ultralytics YOLO11 s'appuie sur cela avec des inférences plus rapides et une plus grande précision. 

Voici un aperçu rapide de ce qui distingue YOLO11 :

  • Architecture repensée : Son architecture dorsale et de cou améliorée permet une meilleure extraction des caractéristiques et une précision améliorée.
  • Facilité d'utilisation : Il est accessible via le codage Python ou des outils sans code comme Ultralytics HUB.
  • Flexibilité entre les tâches : YOLO11 prend en charge les tâches de vision par ordinateur telles que la détection d'objets, la segmentation d'instances, la classification d'images, le suivi, l'estimation de pose et les boîtes englobantes orientées (OBB).
  • Précision améliorée : YOLO11 atteint une précision moyenne (mAP) supérieure de 22 % à celle de YOLOv8m sur le jeu de données COCO, offrant des détections plus précises.

Ces caractéristiques font de YOLO11 un excellent choix pour le suivi du comportement animal dans des environnements dynamiques, que ce soit dans une ferme ou dans la nature.

Principaux points à retenir

Les progrès de la vision artificielle facilitent la résolution des défis du monde réel en fournissant des outils pratiques pour divers domaines. Par exemple, les modèles de vision par ordinateur comme YOLO11 peuvent être utilisés pour la surveillance et le suivi en temps réel des animaux, même dans des conditions difficiles. 

La présentation de Jim Griffin à YV24 a illustré comment YOLOv8 peut être utilisé pour résoudre des problèmes complexes avec un minimum de codage. Le projet SharkEye, qui combine des drones avec l'IA pour la détection de requins en temps réel, a montré comment la technologie peut améliorer la sécurité des plages. 

Il s'agissait d'une étude de cas fascinante sur la manière dont l'IA accessible permet à des personnes d'horizons différents de créer des solutions efficaces. Alors que l'IA continue d'évoluer, elle transforme les industries et permet aux individus d'exploiter son potentiel pour rendre le monde plus sûr, plus intelligent et plus efficace.

Rejoignez notre communauté et explorez notre dépôt GitHub pour approfondir vos connaissances en matière d'IA. De la vision par ordinateur dans l'agriculture à l'IA dans les voitures autonomes, découvrez comment ces technologies stimulent l'innovation. Consultez nos options de licence pour démarrer vos projets d'IA dès aujourd'hui !

Construisons ensemble l'avenir
de l'IA !

Commencez votre parcours avec l'avenir de l'apprentissage automatique

Démarrer gratuitement
Lien copié dans le presse-papiers