Comprenez comment SharkEye, présenté à YOLO Vision 2024, s'appuie sur Ultralytics YOLOv8 pour la détection d'objets en temps réel et la sécurité sur les plages.

Comprenez comment SharkEye, présenté à YOLO Vision 2024, s'appuie sur Ultralytics YOLOv8 pour la détection d'objets en temps réel et la sécurité sur les plages.
La surveillance des animaux dans leur habitat naturel, qu'il s'agisse du bétail paissant dans une ferme ou des requins se déplaçant près du rivage, a toujours été importante pour leur sécurité et leur bien-être. Cependant, les observer manuellement n'est pas chose aisée. Il faut souvent des heures de patience et de concentration, car les observateurs doivent être attentifs à tout changement de comportement ou de mouvement. Même dans ce cas, il est facile de manquer des signes subtils mais importants.
Grâce à l'intelligence artificielle (IA), ce processus devient plus rapide, plus intelligent et beaucoup plus efficace, réduisant la pression sur les observateurs humains tout en améliorant la précision. En particulier, la vision par ordinateur peut être utilisée pour suivre les animaux, repérer les dangers et prendre des décisions en temps réel. Des tâches qui prenaient autrefois des heures peuvent désormais être effectuées en quelques minutes, ce qui ouvre de nouvelles voies pour comprendre le comportement des animaux.
Lors de YOLO Vision 2024 (YV24), un événement hybride annuel organisé par Ultralytics, des experts et des innovateurs se sont réunis pour explorer la manière dont l'IA s'attaque aux défis quotidiens. Parmi les sujets présentés figuraient les avancées en matière de détection d'objets en temps réel et de surveillance des animaux, démontrant comment l'IA améliore la sécurité et l'efficacité dans divers domaines.
L'un des temps forts de l'événement a été l'intervention de Jim Griffin, fondateur d'AI Master Group, qui a montré comment Vision AI rend les plages plus sûres en détectant les requins avant qu'ils ne s'approchent trop près du rivage. Il a expliqué comment ils ont utilisé Ultralytics YOLOv8, un modèle de vision par ordinateur de pointe, pour identifier avec précision les requins en temps réel, même dans des conditions difficiles telles que des vagues agitées, des reflets et des obstacles sous-marins.
Dans cet article, nous allons examiner de plus près le projet SharkEye et partager des informations intéressantes tirées de l'intervention de Jim.
Jim a commencé son exposé en présentant Padaro Beach, une destination de surf bien connue en Californie où les surfeurs et les requins partagent souvent les mêmes eaux. Soulignant le véritable défi que représente la détection des requins, il a déclaré : "Bien sûr, il est facile de détecter un requin s'il vous mord, alors ce que nous voulions faire, c'était identifier les requins à l'avance".
SharkEye a été créé pour s'attaquer à ce problème, avec le soutien de l'université de Californie à Santa Barbara. Jim a décrit comment des drones équipés de caméras IA à haute résolution ont été utilisés pour voler à environ 200 pieds au-dessus de l'eau, scannant l'océan en temps réel.
Si un requin est détecté, des alertes SMS sont envoyées à environ 80 personnes, dont les sauveteurs, les propriétaires de magasins de surf et toutes les personnes qui se sont inscrites pour recevoir des mises à jour. Jim a souligné que ces notifications instantanées permettaient de réagir rapidement et d'assurer la sécurité des baigneurs lorsqu'un requin se trouve à proximité du rivage.
Jim a également mentionné que SharkEye dispose d'un tableau de bord en direct où les utilisateurs peuvent voir les statistiques de détection des requins. Par exemple, sur 12 semaines, le système a identifié deux grands requins et 15 plus petits, soit en moyenne un peu plus d'un requin par semaine.
Il a ensuite présenté Neil Nathan, le scientifique à l'origine du projet SharkEye. Bien qu'il ait une formation en études environnementales plutôt qu'en informatique, Nathan a mené le projet avec succès. Jim a souligné que les outils modernes d'intelligence artificielle, comme ceux utilisés dans SharkEye, sont conçus pour être accessibles, ce qui permet à des personnes n'ayant pas de formation technique de mettre au point des solutions efficaces.
En entrant dans les détails, Jim a expliqué ce qui se cache sous le capot de SharkEye et comment la solution de détection des requins ne se limitait pas à une simple tâche de détection d'objets. Elle devait faire face à des conditions dynamiques et imprévisibles, telles que des algues flottantes pouvant être facilement confondues avec des requins. Contrairement à la détection d'un objet immobile, l'identification d'un requin exige précision et adaptabilité, ce qui fait de YOLOv8 un choix idéal.
Un autre avantage de YOLOv8 est qu'il peut être déployé sur un drone sans dépendre de serveurs en nuage. Jim a expliqué comment cette approche permettait à SharkEye d'envoyer des alertes immédiates - un élément essentiel pour garantir des réponses rapides dans des conditions océaniques imprévisibles.
Après avoir expliqué le fonctionnement de SharkEye et l'effort de collaboration qui le sous-tend, Jim a présenté une démonstration en direct.
Jim Griffin a commencé sa démonstration en direct en présentant au public un exemple familier - un extrait de code "hello world" pour les modèles YOLO d'Ultralytics. Avec seulement six lignes de code Python, il a montré comment un modèle Ultralytics YOLOv8 pré-entraîné pouvait détecter sans effort un bus dans une image.
Sa démonstration a utilisé le modèle YOLOv8 Nano, une version légère pour les appareils de faible puissance tels que les drones. Le même modèle a été utilisé dans SharkEye pour la détection des requins en temps réel.
Pour préciser le contexte, Jim a indiqué que le modèle de la démonstration était entraîné sur COCO128, un sous-ensemble plus petit de l'ensemble de données COCO, largement utilisé. L'ensemble de données COCO contient plus de 20 000 images réparties dans 80 catégories d'objets différentes. Bien que COCO128 fonctionne bien pour des démonstrations rapides, il a souligné que SharkEye avait besoin de quelque chose de plus robuste - un ensemble de données de détection de requins spécifique à l'application qui pourrait gérer les complexités des scénarios du monde réel.
Selon Jim, la partie la plus difficile du projet SharkEye n'a pas été d'entraîner le modèle d'IA, mais de recueillir les bonnes données. Il commente : "Le travail principal de ce projet n'était pas l'IA. Le travail principal a consisté à faire voler ces drones pendant cinq ans, à extraire les images de ces vidéos et à les étiqueter de manière appropriée."
Il a décrit comment l'équipe a recueilli 15 000 images sur la plage de Padaro. Chaque image a dû être étiquetée manuellement pour différencier les requins, les algues et les autres objets présents dans l'eau. Bien que le processus ait été lent et exigeant, il a jeté les bases de tout ce qui a suivi.
Une fois l'ensemble de données prêt, Ultralytics YOLOV8 a fait l'objet d'un entraînement personnalisé. Jim a déclaré : "La formation proprement dite n'a pas été la partie la plus difficile - elle n'a pris que 20 heures sur des GPU T4 [unités de traitement graphique]." Il a également ajouté que le temps aurait pu être réduit à cinq heures seulement avec du matériel plus puissant, tel que des GPU A100.
Jim a ensuite expliqué comment les performances de SharkEye étaient évaluées. Il a expliqué que l'indicateur clé était la précision, c'est-à-dire le degré d'exactitude avec lequel le système identifiait les requins. Avec une précision impressionnante de 92 %, le modèle SharkEye s'est avéré très efficace pour identifier avec précision les requins dans l'environnement complexe de l'océan.
En approfondissant l'importance de la précision, Jim a expliqué pourquoi la précision était plus importante que le rappel dans ce cas. "La plupart du temps, les gens s'intéressent au rappel, en particulier dans des domaines tels que la santé, où l'absence d'un cas positif peut s'avérer critique. Mais dans le cas présent, nous ne savions pas combien de requins se trouvaient dans la nature, c'est donc la précision qui nous importait", a-t-il expliqué. SharkEye a permis de minimiser les fausses alertes en se concentrant sur la précision, ce qui a permis aux sauveteurs et aux autres intervenants d'agir plus facilement et plus rapidement.
Il a conclu son intervention en comparant les performances de l'IA à celles de l'homme, notant que la précision de 92 % du SharkEye dépassait de loin celle de 60 % des experts humains. Il a souligné cet écart en déclarant : "C'est parce que nous sommes humains. Quel que soit notre degré d'expertise, si nous devons rester assis devant un écran toute la journée à chercher des requins, nous finirons par laisser notre esprit s'égarer". Contrairement aux humains, les modèles d'IA ne se fatiguent pas et ne se laissent pas distraire, ce qui en fait une solution fiable pour les tâches nécessitant une surveillance continue.
Une citation intrigante tirée de l'exposé de Jim Griffin, "Six lignes de code pourraient vous sauver la vie un jour", illustre parfaitement à quel point l'IA est devenue à la fois avancée et accessible. Les modèles YOLO d'Ultralytics ont été créés dans cet esprit, rendant la technologie de pointe de la vision par ordinateur accessible aux développeurs et aux entreprises de toutes tailles. Ultralytics YOLO11 va encore plus loin en proposant des inférences plus rapides et une plus grande précision.
Voici un aperçu de ce qui distingue YOLO11 :
Ces caractéristiques font de YOLO11 un outil idéal pour suivre le comportement des animaux dans des environnements dynamiques, que ce soit dans une ferme ou dans la nature.
Les progrès réalisés dans le domaine de l'IA visionnaire permettent de relever plus facilement les défis du monde réel en fournissant des outils pratiques pour différents domaines. Par exemple, des modèles de vision artificielle comme YOLO11 peuvent être utilisés pour la surveillance et le suivi en temps réel d'animaux, même dans des conditions difficiles.
La présentation de Jim Griffin à YV24 a illustré la manière dont YOLOv8 peut être utilisé pour résoudre des problèmes complexes avec un minimum de codage. Le projet SharkEye, qui associe des drones à l'intelligence artificielle pour détecter les requins en temps réel, a montré comment la technologie peut améliorer la sécurité sur les plages.
Il s'agissait d'une étude de cas fascinante sur la façon dont l'IA accessible permet à des personnes d'horizons différents de créer des solutions efficaces. Au fur et à mesure de son évolution, l'IA transforme les industries et permet aux individus d'exploiter son potentiel pour rendre le monde plus sûr, plus intelligent et plus efficace.
Faites partie de notre communauté et explorez notre dépôt GitHub pour approfondir vos connaissances en matière d'IA. De la vision par ordinateur dans l'agriculture à l'IA dans les voitures autonomes, découvrez comment ces technologies stimulent l'innovation. Consultez nos options de licence pour commencer vos projets d'IA dès aujourd'hui !