SharkEye utiliza Ultralytics YOLOv8 para la detección de objetos

28 de enero de 2025
Comprenda cómo SharkEye, presentado en YOLO Vision 2024, aprovecha Ultralytics YOLOv8 para la detección de objetos en tiempo real y la seguridad en la playa.

28 de enero de 2025
Comprenda cómo SharkEye, presentado en YOLO Vision 2024, aprovecha Ultralytics YOLOv8 para la detección de objetos en tiempo real y la seguridad en la playa.
Vigilar a los animales en su hábitat natural, ya sea el ganado pastando en una granja o los tiburones moviéndose cerca de la costa, siempre ha sido importante para su seguridad y bienestar. Sin embargo, observarlos manualmente no es fácil. A menudo requiere horas de paciencia y atención, ya que los observadores tienen que estar atentos a cualquier cambio de comportamiento o movimiento. Incluso así, es fácil pasar por alto señales sutiles pero importantes.
Gracias a la inteligencia artificial (IA), este proceso es cada vez más rápido, inteligente y eficaz, lo que reduce la carga de trabajo de los observadores humanos y mejora la precisión. En concreto, la visión por ordenador puede utilizarse para rastrear animales, detectar peligros y tomar decisiones en tiempo real. Tareas que antes llevaban horas pueden hacerse ahora en minutos, lo que abre nuevas vías para comprender el comportamiento animal.
En YOLO Vision 2024 (YV24), un evento híbrido anual organizado por Ultralytics, expertos e innovadores se reunieron para explorar cómo la IA está abordando los retos cotidianos. Algunos de los temas expuestos fueron los avances en la detección de objetos en tiempo real y la vigilancia de animales, demostrando cómo la IA está mejorando la seguridad y la eficiencia en diversos campos.
Uno de los aspectos más destacados del evento fue la charla de Jim Griffin, fundador de AI Master Group, en la que demostró cómo Vision AI está haciendo más seguras las playas al detectar tiburones antes de que se acerquen demasiado a la orilla. Explicó cómo utilizaron Ultralytics YOLOv8, un modelo de visión por ordenador de vanguardia, para identificar tiburones con precisión en tiempo real, incluso en condiciones difíciles como olas agitadas, deslumbramiento y obstáculos submarinos.
En este artículo, examinaremos más de cerca el proyecto SharkEye y compartiremos datos interesantes de la charla de Jim.
Jim comenzó su charla presentando Padaro Beach, un conocido destino de surf en California donde surfistas y tiburones comparten a menudo las mismas aguas. Destacando el verdadero reto de la detección de tiburones, compartió: "Por supuesto, es fácil detectar a un tiburón si te muerde, así que lo que queríamos hacer era identificar a los tiburones de antemano."
SharkEye se creó para abordar este problema, con el apoyo de la Universidad de California en Santa Bárbara. Jim describió cómo se utilizaron drones con cámaras de IA de alta resolución para volar a unos 60 metros sobre el agua, escaneando el océano en tiempo real.
Si se detecta un tiburón, las alertas por SMS llegan a unas 80 personas, incluidos socorristas, propietarios de tiendas de surf y cualquiera que se haya inscrito para recibir actualizaciones. Jim señaló que estas notificaciones instantáneas permiten una respuesta rápida, manteniendo a los bañistas más seguros cuando hay un tiburón cerca de la orilla.
Jim también mencionó que SharkEye cuenta con un panel de control en el que los usuarios pueden ver las estadísticas de detección de tiburones. Por ejemplo, en 12 semanas, el sistema identificó dos tiburones grandes y 15 más pequeños, con una media de poco más de un tiburón por semana.
A continuación, presentó a Neil Nathan, el científico que dirigió los esfuerzos de SharkEye. A pesar de su formación en estudios medioambientales y no en informática, Nathan dirigió con éxito el proyecto. Jim hizo hincapié en que las herramientas modernas de IA, como las utilizadas en SharkEye, están diseñadas para ser accesibles y permitir que personas sin formación técnica desarrollen soluciones eficaces.
Profundizando en los detalles, Jim explicó qué hay bajo el capó de SharkEye y cómo la solución de detección de tiburones no se limitaba a una simple tarea de detección de objetos. Tenía que enfrentarse a condiciones dinámicas e impredecibles, como algas flotantes que podían confundirse fácilmente con tiburones. A diferencia de la detección de un objeto inmóvil, la identificación de un tiburón requiere precisión y adaptabilidad, lo que convierte a YOLOv8 en la opción ideal.
Otra ventaja de YOLOv8 era que podía instalarse en un dron sin depender de servidores en la nube. Jim explicó cómo este enfoque hizo posible que SharkEye enviara alertas inmediatas, una parte esencial para garantizar respuestas oportunas en condiciones oceánicas impredecibles.
Tras explicar cómo funciona SharkEye y el esfuerzo de colaboración que hay detrás, Jim mostró una demostración en directo.
Jim Griffin comenzó su demostración en directo guiando al público a través de un ejemplo familiar: un fragmento de código "hola mundo" para los modelos YOLO de Ultralytics. Con solo seis líneas de código Python, mostró cómo un modelo YOLOv8 de Ultralytics preentrenado podía detectar sin esfuerzo un autobús en una imagen.
En su demostración utilizó el modelo YOLOv8 Nano, una versión ligera para dispositivos de baja potencia como drones. El mismo modelo se utilizó en SharkEye para detectar tiburones en tiempo real.
Para proporcionar más contexto, Jim mencionó que el modelo de la demostración se estaba entrenando en COCO128, un subconjunto más pequeño del conjunto de datos COCO, ampliamente utilizado . El conjunto de datos COCO contiene más de 20.000 imágenes de 80 categorías de objetos diferentes. Aunque COCO128 funciona bien para demostraciones rápidas, señaló que SharkEye necesitaba algo más robusto, un conjunto de datos de detección de tiburones específico para una aplicación que pudiera manejar las complejidades de los escenarios del mundo real.
Según Jim, lo más difícil del proyecto SharkEye no fue entrenar el modelo de IA, sino reunir los datos adecuados. El principal trabajo de este proyecto no fue la inteligencia artificial. El principal trabajo de este proyecto fue sobrevolar esos drones durante cinco años, seleccionar las imágenes de esos vídeos y etiquetarlas adecuadamente".
Describió cómo el equipo recogió 15.000 imágenes en la playa de Padaro. Cada imagen tuvo que etiquetarse manualmente para diferenciar entre tiburones, algas y otros objetos en el agua. Aunque el proceso fue lento y exigente, sentó las bases de todo lo que vino después.
Una vez que el conjunto de datos estuvo listo, Ultralytics YOLOV8 se entrenó a medida con él. Jim afirma: "El entrenamiento en sí no fue lo más difícil: sólo llevó 20 horas en GPU T4 [unidades de procesamiento gráfico]". También añade que el tiempo podría haberse reducido a tan sólo cinco horas con hardware más potente, como las GPU A100.
A continuación, Jim explicó cómo se evaluaba el rendimiento de SharkEye. Explicó que el parámetro clave era la precisión, es decir, la exactitud con la que el sistema identificaba a los tiburones reales. SharkEye alcanzó una impresionante precisión del 92%, lo que demuestra que el modelo es muy eficaz a la hora de identificar tiburones en el complejo entorno oceánico.
Profundizando en la importancia de la precisión, Jim aclaró por qué la precisión importaba más que la recuperación en este caso. "La mayoría de las veces, la gente está interesada en la recuperación, especialmente en áreas como la sanidad, donde omitir un caso positivo puede ser crítico. Pero en este caso, no sabíamos cuántos tiburones había ahí fuera, así que lo que nos importaba era la precisión", explicó. SharkEye redujo al mínimo las falsas alarmas centrándose en la precisión, lo que facilitó la rápida actuación de los socorristas y otros equipos de respuesta.
Concluyó su charla comparando la IA con el rendimiento humano, señalando que la precisión del 92% de SharkEye superaba con creces la precisión del 60% de los expertos humanos. Y subrayó esta diferencia: "Es porque somos humanos. Por muy expertos que seamos, si tenemos que sentarnos frente a una pantalla todo el día a buscar tiburones, al final se nos va a ir la cabeza". A diferencia de las personas, los modelos de IA no se cansan ni se distraen, lo que los convierte en una solución fiable para tareas que requieren una vigilancia continua.
Una intrigante cita de la charla de Jim Griffin, "Seis líneas de código podrían salvarte la vida algún día", capta perfectamente lo avanzada que se ha vuelto la IA, pero a la vez accesible. Los modelos Ultralytics YOLO se han creado con esta idea en mente, haciendo accesible la tecnología de visión por ordenador más avanzada a desarrolladores y empresas de todos los tamaños. Ultralytics YOLO11 se basa en esto con inferencias más rápidas y una mayor precisión.
He aquí un rápido vistazo a lo que distingue a YOLO11:
Estas características hacen que YOLO11 sea ideal para el seguimiento del comportamiento animal en entornos dinámicos, ya sea en una granja o en la naturaleza.
Los avances en la IA de visión están facilitando la resolución de retos del mundo real al proporcionar herramientas prácticas para diversos campos. Por ejemplo, modelos de visión por ordenador como YOLO11 pueden utilizarse para la vigilancia y el seguimiento de animales en tiempo real, incluso en condiciones difíciles.
La ponencia de Jim Griffin en YV24 ilustró cómo puede utilizarse YOLOv8 para resolver problemas complejos con una codificación mínima. El proyecto SharkEye, que combina drones con inteligencia artificial para detectar tiburones en tiempo real, mostró cómo la tecnología puede mejorar la seguridad en las playas.
Fue un estudio de caso fascinante sobre cómo la IA accesible permite a personas de distintos orígenes crear soluciones eficaces. A medida que la IA sigue evolucionando, está transformando sectores y haciendo posible que las personas aprovechen su potencial para hacer del mundo un lugar más seguro, inteligente y eficiente.
Forme parte de nuestra comunidad y explore nuestro repositorio de GitHub para profundizar en la IA. Desde la visión por ordenador en la agricultura hasta la IA en los coches autoconducidos, vea cómo estas tecnologías están impulsando la innovación. Consulte nuestras opciones de licencia para comenzar sus proyectos de IA hoy mismo.