SharkEye utiliza Ultralytics YOLOv8 para la detección de objetos

28 de enero de 2025
Comprenda cómo SharkEye, presentado en YOLO Vision 2024, aprovecha Ultralytics YOLOv8 para la detección de objetos en tiempo real y la seguridad en la playa.


28 de enero de 2025
Comprenda cómo SharkEye, presentado en YOLO Vision 2024, aprovecha Ultralytics YOLOv8 para la detección de objetos en tiempo real y la seguridad en la playa.

La supervisión de los animales en sus hábitats naturales, ya se trate de ganado pastando en una granja o de tiburones moviéndose cerca de la costa, siempre ha sido importante para su seguridad y bienestar. Sin embargo, observarlos manualmente no es fácil. A menudo requiere horas de paciencia y atención, ya que los observadores tienen que vigilar de cerca cualquier cambio en el comportamiento o el movimiento. Incluso entonces, es fácil pasar por alto signos sutiles pero importantes.
Gracias a la inteligencia artificial (IA), este proceso es cada vez más rápido, inteligente y eficaz, lo que reduce la carga de trabajo de los observadores humanos y mejora la precisión. En concreto, la visión por ordenador puede utilizarse para track animales, detectar peligros y tomar decisiones en tiempo real. Tareas que antes llevaban horas pueden hacerse ahora en minutos, lo que abre nuevas vías para comprender el comportamiento animal.
En YOLO Vision 2024 (YV24), un evento híbrido anual organizado por Ultralytics, expertos e innovadores se reunieron para explorar cómo la IA está abordando los retos cotidianos. Algunos de los temas expuestos fueron los avances en la detección de objetos en tiempo real y la vigilancia de animales, demostrando cómo la IA está mejorando la seguridad y la eficiencia en diversos campos.
Uno de los momentos más destacados del evento fue la charla de Jim Griffin, fundador de AI Master Group, en la que demostró cómo Vision AI está haciendo más seguras las playas al detectar tiburones antes de que se acerquen demasiado a la orilla. Explicó cómo utilizan Ultralytics YOLOv8un modelo de visión por ordenador de vanguardia, para identificar tiburones con precisión en tiempo real, incluso en condiciones difíciles como olas agitadas, reflejos y obstáculos submarinos.
En este artículo, analizaremos más de cerca el proyecto SharkEye y compartiremos información interesante de la charla de Jim.
Jim comenzó su charla presentando Padaro Beach, un conocido destino de surf en California donde surfistas y tiburones comparten a menudo las mismas aguas. Destacando el verdadero reto de la detección de tiburones, compartió: "Por supuesto, es fácil detect un tiburón si te muerde, así que lo que queríamos hacer era identificar a los tiburones de antemano."

SharkEye se creó para abordar este problema, con el apoyo de la Universidad de California, Santa Bárbara. Jim describió cómo se utilizaron drones con cámaras de IA de alta resolución para volar a unos 60 metros sobre el agua, escaneando el océano en tiempo real.
Si se detecta un tiburón, las alertas SMS llegan a unas 80 personas, incluidos socorristas, propietarios de tiendas de surf y cualquier persona que se haya suscrito a las actualizaciones. Jim señaló cómo estas notificaciones instantáneas permiten respuestas rápidas, manteniendo a los bañistas más seguros cuando hay un tiburón cerca de la costa.
Jim también mencionó que SharkEye cuenta con un panel de control en vivo donde los usuarios pueden ver las estadísticas de detección de tiburones. Por ejemplo, durante 12 semanas, el sistema identificó dos tiburones grandes y 15 más pequeños, con un promedio de poco más de un tiburón por semana.
A continuación, presentó a Neil Nathan, el científico que dirigió los esfuerzos detrás de SharkEye. A pesar de tener una formación en estudios medioambientales en lugar de en informática, Nathan dirigió con éxito el proyecto. Jim destacó cómo las herramientas modernas de IA, como las utilizadas en SharkEye, están diseñadas para ser accesibles, permitiendo a personas sin conocimientos técnicos desarrollar soluciones impactantes.
Profundizando en los detalles, Jim explicó qué hay bajo el capó de SharkEye y cómo la solución de detección de tiburones no se limitaba a una simple tarea de detección de objetos. Tenía que enfrentarse a condiciones dinámicas e impredecibles, como algas flotantes que podían confundirse fácilmente con tiburones. A diferencia de la detección de un objeto inmóvil, la identificación de un tiburón requiere precisión y adaptabilidad, lo que convierte a YOLOv8 en la opción ideal.
Otra ventaja de YOLOv8 era que podía instalarse en un dron sin depender de servidores en la nube. Jim explicó cómo este enfoque hizo posible que SharkEye enviara alertas inmediatas, una parte esencial para garantizar respuestas oportunas en condiciones oceánicas impredecibles.
Después de destacar cómo funciona SharkEye y el esfuerzo de colaboración que hay detrás, Jim mostró una demostración en vivo.
Jim Griffin comenzó su demostración en directo guiando al público a través de un ejemplo familiar: un fragmento de código "hola mundo" para los modelosYOLO de Ultralytics . Con solo seis líneas de código Python , mostró cómo un modeloYOLOv8 de Ultralytics preentrenado podía detect sin esfuerzo un autobús en una imagen.

En su demostración utilizó el modelo YOLOv8 Nano, una versión ligera para dispositivos de baja potencia como drones. El mismo modelo se utilizó en SharkEye para detectar tiburones en tiempo real.
Para proporcionar más contexto, Jim mencionó que el modelo de la demostración se estaba entrenando en COCO128, un subconjunto más pequeño del conjunto de datosCOCO , ampliamente utilizado . El conjunto de datos COCO contiene más de 20.000 imágenes de 80 categorías de objetos diferentes. Aunque COCO128 funciona bien para demostraciones rápidas, señaló que SharkEye necesitaba algo más robusto, un conjunto de datos de detección de tiburones específico para una aplicación que pudiera manejar las complejidades de los escenarios del mundo real.
Según Jim, la parte más difícil del proyecto SharkEye no fue entrenar el modelo de IA, sino recopilar los datos correctos. Comentó: "El trabajo principal de este proyecto no fue la IA. El trabajo principal de este proyecto fue volar esos drones durante cinco años, seleccionar las imágenes de esos videos y etiquetarlas adecuadamente".
Describió cómo el equipo recogió 15.000 imágenes en Padaro Beach. Cada imagen tuvo que ser etiquetada manualmente para diferenciar entre tiburones, algas y otros objetos en el agua. Aunque el proceso fue lento y exigente, sentó las bases de todo lo que siguió.

Una vez que el conjunto de datos estuvo listo, Ultralytics YOLOV8 se entrenó a medida con él. Jim afirma: "El entrenamiento en sí no fue lo más difícil: sólo llevó 20 horas en GPU T4 [unidades de procesamiento gráfico]". También añade que el tiempo podría haberse reducido a tan sólo cinco horas con hardware más potente, como las GPU A100.
Luego, Jim discutió cómo se evaluó el rendimiento de SharkEye. Ilustró que la métrica clave era la precisión: con qué exactitud el sistema identificaba a los tiburones reales. Con SharkEye logrando una impresionante precisión del 92%, el modelo demostró ser altamente efectivo para identificar con precisión a los tiburones en medio del complejo entorno oceánico.
Profundizando en la importancia de la precisión, Jim aclaró por qué la precisión importaba más que la exhaustividad en este caso. “La mayoría de las veces, la gente está interesada en la exhaustividad, especialmente en áreas como la atención médica, donde pasar por alto un caso positivo puede ser crítico. Pero en este caso, no sabíamos cuántos tiburones había por ahí, así que lo que nos importaba era la precisión”, explicó. SharkEye garantizaba que las falsas alarmas se minimizaban centrándose en la precisión, lo que facilitaba que los socorristas y otros equipos de respuesta actuaran con rapidez.

Concluyó su charla comparando el rendimiento de la IA con el rendimiento humano, señalando que la precisión del 92% de SharkEye superaba con creces la exactitud del 60% de los expertos humanos. Destacó esta diferencia, diciendo: "Es porque somos humanos. No importa lo experto que seas tú o yo, si tenemos que sentarnos frente a una pantalla todo el día buscando tiburones, al final, dejaremos que nuestra mente divague". A diferencia de las personas, los modelos de IA no se cansan ni se distraen, lo que los convierte en una solución fiable para tareas que requieren una supervisión continua.
Una intrigante cita de la charla de Jim Griffin, "Seis líneas de código podrían salvarte la vida algún día", capta perfectamente lo avanzada que se ha vuelto la IA, pero a la vez accesible. Los modelosYOLO de Ultralytics se han creado con esta idea en mente, haciendo accesible la tecnología de visión por ordenador más avanzada a desarrolladores y empresas de todos los tamaños. Ultralytics YOLO11 se basa en esto con inferencias más rápidas y una mayor precisión.
He aquí un rápido vistazo a lo que distingue a YOLO11 :
Estas características hacen que YOLO11 sea ideal para el seguimiento del comportamiento animal en entornos dinámicos, ya sea en una granja o en la naturaleza.
Los avances en la IA de visión están facilitando la resolución de retos del mundo real al proporcionar herramientas prácticas para diversos campos. Por ejemplo, modelos de visión por ordenador como YOLO11 pueden utilizarse para la vigilancia y el seguimiento de animales en tiempo real, incluso en condiciones difíciles.
La ponencia de Jim Griffin en YV24 ilustró cómo puede utilizarse YOLOv8 para resolver problemas complejos con una codificación mínima. El proyecto SharkEye, que combina drones con inteligencia artificial para detectar tiburones en tiempo real, mostró cómo la tecnología puede mejorar la seguridad en las playas.
Fue un caso de estudio fascinante de cómo la IA accesible empodera a personas de diferentes orígenes para crear soluciones eficaces. A medida que la IA continúa evolucionando, está transformando industrias y permitiendo a las personas aprovechar su potencial para hacer del mundo un lugar más seguro, inteligente y eficiente.
Forme parte de nuestra comunidad y explore nuestro repositorio de GitHub para profundizar en la IA. Desde la visión artificial en la agricultura hasta la IA en los coches autónomos, vea cómo estas tecnologías están impulsando la innovación. Consulte nuestras opciones de licencia para comenzar hoy mismo sus proyectos de IA.