SharkEye utiliza Ultralytics YOLOv8 para la detección de objetos
Comprende cómo SharkEye, presentado en YOLO Vision 2024, aprovecha Ultralytics YOLOv8 para la detección de objetos en tiempo real y la seguridad en playas.

Monitorear animales en sus hábitats naturales, ya sea ganado pastando en una granja o tiburones moviéndose cerca de la costa, siempre ha sido importante para su seguridad y bienestar. Sin embargo, observarlos manualmente no es fácil. A menudo puede implicar horas de paciencia y atención cuidadosa, ya que los observadores deben vigilar de cerca cualquier cambio en el comportamiento o el movimiento. Incluso entonces, es fácil pasar por alto señales sutiles pero importantes.
Gracias a que la inteligencia artificial (IA) interviene, este proceso se vuelve más rápido, más inteligente y mucho más eficiente, reduciendo la carga sobre los observadores humanos y mejorando la precisión. En particular, la visión artificial puede usarse para rastrear animales, detectar peligros y tomar decisiones en tiempo real. Tareas que antes tomaban horas ahora pueden hacerse en minutos, abriendo nuevas formas de entender el comportamiento animal.
En YOLO Vision 2024 (YV24), un evento híbrido anual organizado por Ultralytics, expertos e innovadores se reunieron para explorar cómo la IA está abordando los desafíos cotidianos. Algunos de los temas presentados incluyeron avances en la detección de objetos en tiempo real y monitoreo de animales, demostrando cómo la IA está mejorando la seguridad y la eficiencia en diversos campos.
Uno de los puntos destacados del evento fue una charla de Jim Griffin, fundador de AI Master Group, donde demostró cómo la IA de visión está haciendo que las playas sean más seguras al detectar tiburones antes de que se acerquen demasiado a la costa. Explicó cómo utilizaron Ultralytics YOLOv8, un modelo de visión artificial de vanguardia, para identificar con precisión tiburones en tiempo real, incluso en condiciones desafiantes como olas agitadas, resplandor y obstáculos submarinos.
En este artículo, analizaremos más de cerca el proyecto SharkEye y compartiremos ideas interesantes de la charla de Jim.
Link to this sectionConociendo SharkEye: Una aplicación de visión artificial#
Jim comenzó su charla presentando Padaro Beach, un destino de surf muy conocido en California donde los surfistas y los tiburones a menudo comparten las mismas aguas. Al resaltar el verdadero desafío de la detección de tiburones, compartió: “Por supuesto, es fácil detectar un tiburón si te muerde, así que lo que queríamos hacer era identificar a los tiburones de antemano”.

Fig 1. Jim en el escenario en YOLO Vision 2024.
SharkEye fue creado para abordar este problema, con el apoyo de la Universidad de California, Santa Bárbara. Jim describió cómo se utilizaron drones con cámaras de IA de alta resolución para volar a unos 60 metros sobre el agua, escaneando el océano en tiempo real.
Si se detecta un tiburón, las alertas por SMS llegan a unas 80 personas, incluidos socorristas, propietarios de tiendas de surf y cualquier persona que se haya registrado para recibir actualizaciones. Jim señaló cómo estas notificaciones instantáneas permiten respuestas rápidas, manteniendo a los bañistas más seguros cuando hay un tiburón cerca de la costa.
Jim también mencionó que SharkEye cuenta con un panel en vivo donde los usuarios pueden ver estadísticas de detección de tiburones. Por ejemplo, durante 12 semanas, el sistema identificó dos tiburones grandes y 15 más pequeños, un promedio de poco más de un tiburón por semana.
Luego presentó a Neil Nathan, el científico que lideró los esfuerzos detrás de SharkEye. A pesar de tener experiencia en estudios ambientales en lugar de ciencias de la computación, Nathan encabezó con éxito el proyecto. Jim enfatizó cómo las herramientas de IA modernas, como las utilizadas en SharkEye, están diseñadas para ser accesibles, permitiendo que personas con perfiles no técnicos desarrollen soluciones impactantes.
Link to this sectionUsando Ultralytics YOLOv8 para detectar tiburones#
Profundizando en los detalles, Jim explicó qué hay debajo del capó de SharkEye y cómo la solución de detección de tiburones no solo implicó una simple tarea de detección de objetos. Tuvo que lidiar con condiciones dinámicas e impredecibles, como algas flotantes que fácilmente podrían confundirse con tiburones. A diferencia de detectar un objeto estacionario, identificar un tiburón requiere precisión y adaptabilidad, lo que convierte a YOLOv8 en la opción ideal.
Otra ventaja de YOLOv8 fue que pudo desplegarse en un dron sin depender de servidores en la nube. Jim explicó cómo este enfoque permitió a SharkEye enviar alertas inmediatas, una parte esencial para garantizar respuestas oportunas en condiciones oceánicas impredecibles.
Link to this sectionDetección de objetos con solo seis líneas de código#
Después de destacar cómo funciona SharkEye y el esfuerzo colaborativo detrás de él, Jim realizó una demostración en vivo.
Jim Griffin comenzó su demostración en vivo guiando a la audiencia a través de un ejemplo familiar: un fragmento de código "hola mundo" para los modelos Ultralytics YOLO. Con solo seis líneas de código en Python, exhibió cómo un modelo preentrenado de Ultralytics YOLOv8 podía detectar sin esfuerzo un autobús en una imagen.

Fig 2. Una demostración de Jim en YOLO Vision 2024.
Su demostración utilizó el modelo YOLOv8 Nano, una versión ligera para dispositivos de baja potencia como drones. El mismo modelo se utilizó en SharkEye para la detección de tiburones en tiempo real.
Para proporcionar más contexto, Jim mencionó que el modelo en la demostración estaba siendo entrenado en COCO128, un subconjunto más pequeño del ampliamente utilizado conjunto de datos COCO. El conjunto de datos COCO contiene más de 20,000 imágenes en 80 categorías de objetos diferentes. Si bien COCO128 funciona bien para demostraciones rápidas, señaló que SharkEye necesitaba algo más robusto: un conjunto de datos de detección de tiburones específico para la aplicación que pudiera manejar las complejidades de escenarios del mundo real.
Link to this sectionEntrenamiento personalizado de YOLOv8 para SharkEye#
Según Jim, la parte más difícil del proyecto SharkEye no fue entrenar el modelo de IA, sino recopilar los datos correctos. Comentó: “El trabajo principal de este proyecto no fue la IA. El trabajo principal de este proyecto fue volar esos drones durante cinco años, extraer las imágenes de esos videos y etiquetarlas adecuadamente”.
Describió cómo el equipo recopiló 15,000 imágenes en Padaro Beach. Cada imagen tuvo que ser etiquetada manualmente para diferenciar entre tiburones, algas y otros objetos en el agua. Si bien el proceso fue lento y exigente, sentó las bases para todo lo que siguió.

Fig 3. Uso de drones para capturar imágenes de tiburones para la detección de objetos en tiempo real.
Una vez que el conjunto de datos estuvo listo, Ultralytics YOLOv8 fue entrenado de forma personalizada en él. Jim dijo: “El entrenamiento real no fue la parte difícil, solo tomó 20 horas en GPUs T4 [Unidades de procesamiento gráfico]”. También agregó que el tiempo podría haberse reducido a solo cinco horas con hardware más potente, como GPUs A100.
Link to this sectionEvaluación de SharkEye: Precisión sobre recuperación#
Luego, Jim discutió cómo se evaluó el rendimiento de SharkEye. Ilustró que la métrica clave era la precisión: qué tan precisamente identificaba el sistema a los tiburones reales. Con SharkEye logrando una impresionante precisión del 92%, el modelo demostró ser altamente eficaz para identificar con exactitud a los tiburones en medio del complejo entorno oceánico.
Profundizando en la importancia de la precisión, Jim aclaró por qué la precisión importaba más que la recuperación en este caso. “La mayor parte del tiempo, la gente está interesada en la recuperación, especialmente en áreas como la atención médica donde pasar por alto un caso positivo puede ser crítico. Pero en este caso, no sabíamos cuántos tiburones había allí fuera, así que lo que nos importaba era la precisión”, explicó. SharkEye aseguró que las falsas alarmas se minimizaran al centrarse en la precisión, facilitando que los socorristas y otros equipos de respuesta actúen rápidamente.

Fig 4. Jim mostrando SharkEye en YOLO Vision 2024.
Concluyó su charla comparando la IA con el rendimiento humano, señalando que la precisión del 92% de SharkEye superó con creces la precisión del 60% de los expertos humanos. Enfatizó esta brecha diciendo: “Es porque somos humanos. No importa cuán experto puedas ser tú o yo, si tenemos que sentarnos frente a una pantalla todo el día buscando tiburones, eventualmente dejaremos que nuestras mentes divaguen”. A diferencia de las personas, los modelos de IA no se cansan ni se distraen, lo que la convierte en una solución confiable para tareas que requieren monitoreo continuo.
Link to this sectionUltralytics YOLO11: El YOLO más reciente#
Una cita intrigante de la charla de Jim Griffin, “Seis líneas de código podrían salvar tu vida algún día”, captura perfectamente lo avanzada pero accesible que se ha vuelto la IA. Los modelos Ultralytics YOLO han sido creados con esto en mente, haciendo que la tecnología de visión artificial de vanguardia sea accesible para desarrolladores y empresas de todos los tamaños. Ultralytics YOLO11 se basa en esto con inferencias más rápidas y una mayor precisión.
Aquí tienes un vistazo rápido a lo que distingue a YOLO11:
- Arquitectura rediseñada: Su arquitectura mejorada de backbone y cuello permite una mejor extracción de características y una mayor precisión.
- Facilidad de uso: Se puede acceder a ella a través de código Python o herramientas sin código como Ultralytics HUB.
- Flexibilidad en tareas: YOLO11 admite tareas de visión artificial como detección de objetos, segmentación de instancias, clasificación de imágenes, seguimiento, estimación de poses y cajas delimitadoras orientadas (OBB).
- Precisión mejorada: YOLO11 logra un 22% más de precisión media promedio (mAP) en comparación con YOLOv8m en el conjunto de datos COCO, ofreciendo detecciones más precisas.
Estas características hacen que YOLO11 sea muy adecuado para el seguimiento del comportamiento animal en entornos dinámicos, ya sea en una granja o en la naturaleza.
Link to this sectionConclusiones clave#
Los avances en la IA de visión están facilitando la resolución de desafíos del mundo real al proporcionar herramientas prácticas para diversos campos. Por ejemplo, los modelos de visión artificial como YOLO11 pueden utilizarse para el monitoreo y seguimiento de animales en tiempo real, incluso en condiciones difíciles.
La ponencia de Jim Griffin en YV24 ilustró cómo YOLOv8 puede utilizarse para resolver problemas complejos con una codificación mínima. El proyecto SharkEye, que combina drones con IA para la detección de tiburones en tiempo real, mostró cómo la tecnología puede mejorar la seguridad en las playas.
Fue un estudio de caso fascinante sobre cómo la IA accesible empodera a personas de diferentes perfiles para crear soluciones efectivas. A medida que la IA continúa evolucionando, está transformando industrias y haciendo posible que las personas aprovechen su potencial para hacer del mundo un lugar más seguro, inteligente y eficiente.
Únete a nuestra comunidad y explora nuestro repositorio de GitHub para profundizar en la IA. Desde visión artificial en agricultura hasta IA en coches autónomos, observa cómo estas tecnologías están impulsando la innovación. ¡Echa un vistazo a nuestras opciones de licencia para comenzar tus proyectos de IA hoy mismo!






