Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Configuración de cookies
Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Únete a nosotros mientras revisamos la conferencia magistral de David Scott en YOLO Vision 2024 sobre el análisis del comportamiento impulsado por la IA y sus aplicaciones en el mundo real en sectores como la cría de animales.
Durante muchos años, las innovaciones en visión artificial se han centrado en tareas como la detección de objetos: identificar objetos como un perro o un coche en imágenes y vídeos. Estos enfoques han permitido aplicaciones en áreas como los vehículos autónomos, la fabricación y la atención sanitaria.
Sin embargo, estas tareas a menudo se centran solo en identificar qué es un objeto. ¿Qué pasaría si los sistemas de Visión Artificial pudieran ir un paso más allá? Por ejemplo, en lugar de simplemente detectar un perro, digamos que podría entender que el perro está persiguiendo una pelota o que un coche está frenando repentinamente porque un peatón está cruzando. Este cambio del reconocimiento básico a la comprensión contextual representa un cambio importante hacia una IA de comportamiento más inteligente y consciente del contexto.
En YOLO Vision 2024 (YV24), el evento híbrido anual de Ultralytics que celebra los avances en Vision AI, el concepto de análisis del comportamiento impulsado por la IA ocupó un lugar central durante una interesante charla de David Scott, CEO de The Main Branch.
En su charla, David exploró la transición de las tareas básicas de visión artificial al seguimiento del comportamiento. Con más de 25 años de experiencia en la creación de aplicaciones tecnológicas de vanguardia, mostró el impacto de este salto. Enfatizó cómo la decodificación de patrones y comportamientos está transformando industrias como la agricultura y el bienestar animal.
En este artículo, repasaremos los aspectos más destacados de la charla de David y exploraremos cómo el seguimiento del comportamiento hace que la IA sea más práctica.
Comprensión de los desafíos de la adopción de la IA
David Scott comenzó su discurso de apertura con una audaz comprobación de la realidad y dijo: “Un colega mío suele decir: ‘La ciencia no vende’, lo que ofende a muchos de nosotros porque nos gusta mucho la ciencia. La IA es realmente genial, ¿por qué la gente no la compraría? Pero la realidad es que la gente no quiere comprarla solo porque pensemos que es genial; necesitan una razón para comprarla”.
Continuó explicando que en su empresa, The Main Branch, el objetivo es siempre resolver problemas reales con la IA, no sólo mostrar sus capacidades. Muchos clientes vienen queriendo hablar de cómo pueden utilizar la IA en general, pero él lo ve como un enfoque al revés: es como tener una solución sin un problema. En cambio, trabajan con clientes que plantean retos específicos para poder crear soluciones de IA que realmente marquen la diferencia.
Fig. 1. David Scott en el escenario de YV24.
David también compartió que su trabajo a menudo va más allá del simple reconocimiento de objetos en una escena. Detectar lo que hay es solo el primer paso. El verdadero valor reside en averiguar qué hacer con esa información y hacerla útil dentro de la cadena de valor más amplia.
Tecnología de seguimiento del comportamiento: la clave para una IA práctica
Un paso vital para que la IA sea realmente útil es ir más allá de las tareas básicas de visión artificial como la detección de objetos y utilizar esos conocimientos para el seguimiento del comportamiento. David destacó que la IA del comportamiento se centra en comprender las acciones y los patrones, no solo en identificar objetos. Esto hace que la IA sea capaz de reconocer eventos significativos y proporcionar información útil.
Puso el ejemplo de un animal rodando por el suelo, lo que podría indicar una enfermedad. Aunque las personas no pueden vigilar a un animal las 24 horas del día, los sistemas de vigilancia impulsados por IA con capacidades de seguimiento del comportamiento sí pueden. Estas soluciones pueden supervisar objetos de forma continua, detectar comportamientos específicos, enviar una alerta y permitir una actuación oportuna. Esto convierte los datos brutos en algo práctico y valioso.
David también demostró que este enfoque hace que la IA no solo sea interesante, sino realmente impactante. Al abordar problemas reales, como el seguimiento de comportamientos y la actuación sobre ellos, el seguimiento del comportamiento puede convertirse en una parte clave de las soluciones de IA eficaces en diversos sectores.
Dando vida a la IA conductual
David Scott ilustró entonces cómo Ultralytics YOLOv8, un modelo de visión artificial, supuso un gran avance para los proyectos de seguimiento del comportamiento de su equipo. Les proporcionó una base sólida para detectar, clasificar y rastrear objetos. Su equipo también fue un paso más allá y entrenó de forma personalizada YOLOv8 para centrarse en el seguimiento de los comportamientos a lo largo del tiempo, haciéndolo más práctico y útil para situaciones del mundo real.
Curiosamente, con el lanzamiento de Ultralytics YOLO11, soluciones como las creadas por The Main Branch pueden volverse aún más confiables y precisas. Este último modelo ofrece características como una precisión mejorada y un procesamiento más rápido que mejoran su capacidad para rastrear comportamientos. Discutiremos esto con más detalle después de comprender mejor las aplicaciones para las que se puede utilizar la IA conductual.
A continuación, exploremos las soluciones de las que habló David y cómo se está utilizando la tecnología de seguimiento del comportamiento en aplicaciones del mundo real para resolver los retos cotidianos y tener un impacto significativo.
HerdSense con análisis de comportamiento impulsado por IA
En primer lugar, David compartió un reto apasionante que abordaron con un proyecto llamado HerdSense, que consistía en supervisar la salud de miles de vacas en un cebadero masivo. El objetivo era rastrear el comportamiento de cada vaca para identificar posibles problemas de salud. Esto significaba vigilar a decenas de miles de animales al mismo tiempo, y no era una tarea sencilla.
Fig 2. HerdSense se centró en la monitorización e identificación de vacas mediante IA conductual.
Para comenzar a resolver el problema de identificar a cada vaca y rastrear sus comportamientos, el equipo de David realizó un taller de dos días para delinear cada posible comportamiento que necesitaban monitorear. Identificaron más de 200 comportamientos en total.
Cada uno de los 200 comportamientos dependía de la capacidad de reconocer con precisión a cada vaca, ya que todos los datos debían estar vinculados a animales específicos. Una de las principales preocupaciones era el seguimiento de las vacas cuando se agrupaban en manadas, lo que dificultaba la visión de los animales individuales.
El equipo de David desarrolló un sistema de visión artificial para garantizar que cada vaca fuera identificada de forma coherente, incluso en situaciones difíciles. Pudieron confirmar que a la misma vaca siempre se le asignaría el mismo ID, incluso si desaparecía de la vista, se mezclaba con otras o reaparecía más tarde.
Supervisión de la salud de los caballos mediante visión artificial
Pasando a otro tema, David presentó otro proyecto fascinante en el que aplicaron técnicas similares de seguimiento del comportamiento para monitorear caballos. En este proyecto, el equipo de David no necesitó rastrear los ID de caballos individuales tan de cerca como lo hicieron con las vacas. En cambio, se centraron en comportamientos específicos y rastrearon detalles como los patrones de alimentación y los niveles de actividad general para detectar cualquier problema de salud de forma temprana. La identificación de pequeños cambios en el comportamiento podría conducir a intervenciones más rápidas para brindar una mejor atención y prevenir problemas antes de que se agraven.
Fig. 3. Monitorización de caballos con la ayuda de la IA conductual.
¿Por qué la IA conductual no es tan simple como parece?
David también habló de la complejidad del seguimiento del comportamiento a través de un ejemplo intrigante. Mientras investigaban formas de mejorar el análisis del comportamiento, su equipo se encontró con una empresa que afirmaba detectar robos en tiendas analizando posturas específicas, como alguien con la mano en el bolsillo. Al principio, esto parecía una buena idea: ciertos movimientos podrían sugerir un comportamiento sospechoso, ¿verdad?
Fig 4. Entendiendo los desafíos de la tecnología de seguimiento del comportamiento.
Sin embargo, a medida que David exploraba más a fondo, se dio cuenta de las limitaciones de este método. Una sola pose, como una mano en el bolsillo, no significa necesariamente que alguien esté robando en una tienda. Podría indicar simplemente que está relajado, pensando o incluso pasando frío. El problema de centrarse en poses aisladas es que ignora el contexto más amplio. El comportamiento no es solo una acción aislada, sino un patrón de acciones a lo largo del tiempo, moldeado por el contexto y la intención.
David destacó que el verdadero seguimiento del comportamiento es mucho más complejo y requiere un enfoque holístico. Se trata de analizar secuencias de acciones y comprender lo que significan en el panorama general. Aunque la industria de la IA está avanzando, señaló que aún queda trabajo por hacer para mejorar el seguimiento del comportamiento con el fin de ofrecer información significativa y precisa.
Creación de modelos de visión artificial más inteligentes que comprendan las acciones
Posteriormente, David llevó al público entre bastidores para mostrarles cómo su equipo construyó una solución de visión artificial para monitorizar la salud de las vacas con la ayuda de YOLOv8 y sus capacidades de estimación de pose.
Comenzaron creando un conjunto de datos personalizado para la estimación de la pose de una vaca, aumentando el número estándar de puntos clave de 17 a 145 para que el modelo fuera mejor en el análisis del movimiento. Luego, el modelo se entrenó con un conjunto de datos masivo de más de 2 millones de imágenes y 110 millones de ejemplos de comportamiento.
Utilizando una infraestructura de hardware avanzada, el equipo de David pudo entrenar el modelo en solo dos días en lugar de las semanas que habría tardado con hardware convencional. El modelo entrenado se integró entonces con un rastreador de comportamiento personalizado que analizaba múltiples fotogramas de vídeo simultáneamente para detectar patrones en las acciones de las vacas.
El resultado fue una solución impulsada por la IA de visión que puede detectar y rastrear ocho comportamientos diferentes de las vacas, como comer, beber y tumbarse, para detectar cambios menores en el comportamiento que podrían indicar problemas de salud. Esto permite a los agricultores actuar rápidamente y mejora la gestión del rebaño.
El camino a seguir para la IA conductual
David concluyó su charla compartiendo una importante lección con el público: "Si no le das a la IA margen para fallar, te estás preparando para el fracaso porque, al fin y al cabo, es estadística". Señaló que la IA, a pesar de sus puntos fuertes, no es perfecta. Es una herramienta que aprende de los patrones, y siempre habrá momentos en los que no acierte. En lugar de temer esos errores, la clave es construir sistemas que puedan gestionarlos y seguir mejorando con el tiempo.
Esto también es cierto cuando se trata de los propios modelos de visión artificial. Por ejemplo, Ultralytics YOLO11, la última versión de los modelos Ultralytics YOLO, se ha construido teniendo en cuenta la necesidad de llevar las cosas al siguiente nivel en comparación con YOLOv8.
Fig 5. Tareas de visión artificial soportadas por YOLO11.
En particular, YOLO11 ofrece un mejor rendimiento, especialmente con respecto a las aplicaciones en tiempo real donde la precisión es clave, como la agricultura y la atención sanitaria. Con sus características avanzadas, YOLO11 está redefiniendo cómo las industrias utilizan la IA al proporcionar información innovadora en tiempo real y ayudarles a abordar los desafíos de manera más eficaz.
Conclusiones clave
El discurso de apertura de David en YV24 fue un recordatorio de que la IA es algo más que una innovación genial: es una herramienta poderosa para resolver problemas reales y mejorar nuestra forma de vivir y trabajar. Al centrarse en el comportamiento, la IA ya está teniendo un impacto en áreas como el seguimiento de la salud animal y el reconocimiento de patrones significativos en las acciones cotidianas.
El potencial de la IA conductual es emocionante, y solo estamos al principio. Al transformar los datos brutos en conocimientos prácticos, la IA conductual pasa de la supervisión pasiva a la resolución activa de problemas. A medida que se desarrolla aún más, la IA conductual está destinada a impulsar decisiones más inteligentes, agilizar los procesos y aportar mejoras significativas a nuestras vidas.