Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
IA de visión

Futuras tendencias de detección de objetos: 7 aspectos clave a tener en cuenta

Conoce las siete futuras tendencias de detección de objetos que impulsan los avances en visión artificial, permitiendo sistemas más rápidos, inteligentes y fiables potenciados por IA.

ABAbirami Vina
5 min read
Futuras tendencias de detección de objetos en visión artificial

Los robotaxis ya circulan por las calles de San Francisco, y la gente ha pasado de buscar respuestas en internet a chatear con la IA como parte de sus rutinas diarias. Estos cambios dejan claro que la inteligencia artificial (IA) avanza más rápido que nunca y se está convirtiendo en parte de la vida cotidiana.

Por ejemplo, una de las áreas que avanza a un ritmo increíble es la tecnología de visión artificial. También conocida como visión por IA, es un subcampo de la IA que se centra en ayudar a las máquinas a interpretar y comprender los datos visuales.

La visión artificial ya aparece en todas partes, desde cajas de pago automáticas hasta drones que inspeccionan líneas eléctricas. En el corazón de muchos de estos sistemas se encuentra la detección de objetos, una tarea fundamental de visión artificial que permite a las máquinas reconocer y localizar objetos específicos dentro de imágenes y vídeos.

A medida que se acelera la adopción de la IA, aumenta la demanda de una detección de objetos que sea a la vez rápida y precisa. Modelos de visión por IA como Ultralytics YOLO11 y el próximo Ultralytics YOLO26 se han creado con esto en mente, haciendo que la detección de objetos en tiempo real sea más fiable y accesible que nunca.

Uso de YOLO11 para la detección de objetos

Fig 1. Ejemplo de uso de YOLO11 para la detección de objetos.

Con este rápido progreso, el campo evoluciona rápidamente y varias tendencias emergentes están dando forma al aspecto que tendrá la próxima generación de detección de objetos. En este artículo, exploraremos siete tendencias clave que están definiendo el futuro de la detección de objetos.

Link to this sectionComprender cómo funciona la detección de objetos#

Antes de sumergirnos en las tendencias futuras de la detección de objetos, demos un paso atrás y veamos qué es la detección de objetos, cómo funciona entre bastidores y cómo ha evolucionado a lo largo de los años.

La detección de objetos es una parte clave de la visión artificial que hace posible que los sistemas de IA identifiquen qué hay en una imagen y determinen exactamente dónde aparece cada elemento. Para aprender esto, los modelos se entrenan con grandes conjuntos de datos etiquetados que muestran objetos en condiciones muy diferentes, como diversos ángulos, iluminaciones, tamaños y disposiciones.

Con el tiempo, el modelo capta los patrones y señales visuales que separan un objeto de otro. Una vez entrenados, los modelos de visión por IA como Ultralytics YOLO pueden escanear una imagen completa en una sola pasada, dibujando instantáneamente cuadros delimitadores y asignando etiquetas. Esta velocidad y precisión son las que hacen que la detección de objetos tenga un impacto en aplicaciones del mundo real.

Detección de una radiografía usando un modelo YOLO11

Fig 2. Detección de una radiografía usando un modelo YOLO11. (Fuente)

Link to this sectionUn caso de uso real de la detección de objetos en acción#

Por ejemplo, en el análisis de documentos, empresas como Prezent utilizan la detección de objetos para automatizar la difícil tarea de rediseñar las diapositivas de presentaciones. Tradicionalmente, este proceso requería horas de ajustes manuales: identificar títulos, reposicionar cuadros de texto, alinear imágenes y reconstruir gráficos, todo ello mientras se intentaba mantener un diseño limpio y coherente.

Al convertir cada diapositiva en una imagen, los modelos Ultralytics YOLO pueden detectar títulos, cuadros de texto, imágenes y gráficos conservando la estructura original. Esto proporciona al sistema una comprensión precisa de cómo está organizado cada elemento. Con esa información, todo el proceso de rediseño, antes lento y tedioso, puede automatizarse ahora en pocos segundos.

Link to this sectionEvolución de la detección de objetos en la visión artificial#

Aquí tienes un rápido vistazo a cómo ha evolucionado la detección de objetos a lo largo de los años:

  • Los primeros días (décadas de 1960 y 1970): Las primeras metodologías en detección de objetos provenían del procesamiento de imágenes tradicional y a menudo se basaban en la comparación de plantillas. En este enfoque, los ordenadores comparaban partes de una imagen (píxeles) con patrones de referencia predefinidos, o plantillas, para buscar similitudes. Debido a que estas plantillas eran fijas y no podían adaptarse a los cambios, el método solo funcionaba en condiciones ideales. Incluso pequeñas variaciones en la iluminación, la escala, la rotación o la apariencia del objeto eran suficientes para que fallara.

  • Detección basada en características (décadas de 1990 y 2000): Los investigadores cambiaron entonces a la idea de las características hechas a mano y la extracción de características, donde los humanos definían manualmente las pistas visuales que debía buscar un ordenador, tales como bordes, esquinas, formas o cambios de brillo. Técnicas como las cascadas de Haar (un método que escanea patrones visuales simples, a menudo utilizado para la detección de rostros) y HOG (una técnica que captura la dirección de los bordes y contornos en una imagen), que a menudo se emparejaban con clasificadores SVM (un modelo de aprendizaje automático que separa los objetos en categorías), hicieron que el reconocimiento de objetos fuera más preciso y rápido. A pesar de estas mejoras, los sistemas seguían teniendo dificultades para funcionar lo suficientemente rápido para un uso en tiempo real.

  • La revolución de los modelos de aprendizaje profundo (década de 2010): El aprendizaje profundo y las redes neuronales convolucionales (CNN), que son modelos diseñados para aprender patrones visuales escaneando imágenes en pequeñas regiones a la vez, redefinieron la detección de objetos. Modelos como R-CNN, Fast R-CNN y Faster R-CNN aprendieron patrones visuales directamente de grandes cantidades de datos. Esto dio lugar a resultados de gran precisión, pero estos modelos seguían enfrentándose a problemas de latencia.

  • Detección en tiempo real con YOLO (mediados de la década de 2010): YOLO (You Only Look Once) marcó un gran avance en la detección de objetos al predecir todos los cuadros delimitadores y etiquetas de clase en una sola pasada a través de la red. Este enfoque unificado aumentó drásticamente la velocidad de detección y allanó el camino para las aplicaciones en tiempo real. Aproximadamente al mismo tiempo, otros modelos de un solo disparo como SSD (Single Shot Detector) también mejoraron el rendimiento al eliminar los pasos de propuesta de región, haciendo que la detección de objetos fuera más rápida y eficiente.

  • Avances recientes (década de 2020): Gracias a importantes mejoras en el diseño y la optimización de los modelos, la década de 2020 ha traído sistemas y marcos de trabajo de detección de objetos de última generación más rápidos y precisos. Ultralytics YOLO11 introdujo mejoras arquitectónicas que aumentaron la velocidad de procesamiento, la precisión y el rendimiento general en tiempo real. Basándose en este impulso, el próximo YOLO26 presenta un diseño aún más eficiente y ligero, lo que lo hace muy adecuado para una amplia gama de aplicaciones prácticas.

Link to this section7 tendencias de detección de objetos que están dando forma al futuro#

A continuación, vamos a explorar siete tendencias emergentes en detección de objetos que están ganando atención y causando revuelo en el espacio de la visión artificial.

Link to this sectionTareas de detección de objetos más inteligentes con computación de borde (edge computing)#

Las comprobaciones manuales tradicionales pueden ralentizar las líneas de producción y dejar margen para pasar por alto defectos. Para gestionar esto, muchas empresas están recurriendo a sistemas de control de calidad basados en IA y potenciados por la detección de objetos.

De hecho, los estudios demuestran que la inspección visual basada en IA puede aumentar significativamente la productividad, a veces hasta en un 50%, y elevar las tasas de detección de defectos hasta en un 90% en comparación con la inspección manual. Curiosamente, la nueva tendencia que está causando sensación en este espacio y en otras aplicaciones de visión por IA es cómo este análisis se realiza ahora directamente en los propios dispositivos mediante computación de borde (edge computing).

Con la computación de borde, la inteligencia se traslada a donde se capturan los datos. Las cámaras y los sensores pueden ejecutar modelos de detección de objetos en el mismo lugar, identificando instantáneamente los objetos y determinando su ubicación sin depender del procesamiento en la nube. Esto les permite analizar fotogramas en tiempo real.

También reduce los retrasos de la red, disminuye el uso del ancho de banda y garantiza que los sistemas sigan funcionando incluso si la conexión a internet es inestable o no está disponible. Para entornos de ritmo rápido como la fabricación, este cambio al procesamiento en el propio dispositivo ofrece respuestas más rápidas, operaciones más fluidas y resultados mucho más fiables.

Link to this sectionDiagnóstico asistido por visión en el sector sanitario#

Los médicos suelen pasar mucho tiempo revisando imágenes médicas para asegurarse de que no se pasa nada por alto. Hoy en día, muchos hospitales empiezan a explorar tecnología de detección de objetos de vanguardia para ayudar a acelerar los procesos. Esto refleja una tendencia más amplia en la atención sanitaria, donde la visión por IA se utiliza cada vez más para apoyar una detección más temprana, un diagnóstico más rápido y un análisis de imágenes más coherente.

La detección de objetos puede utilizarse para resaltar rápidamente las áreas que pueden requerir atención, mejorando la toma de decisiones y los resultados de los pacientes. Por ejemplo, modelos como YOLO11 pueden ayudar a los médicos a detectar tumores cerebrales en resonancias magnéticas.

Detección y localización de tumores cerebrales en resonancias magnéticas con YOLO11

Fig 3. Detección y localización de tumores cerebrales en resonancias magnéticas con la ayuda de YOLO11. (Fuente)

Dado que YOLO11 puede reconocer patrones sutiles en las resonancias magnéticas, puede ayudar a identificar tumores pequeños o en fase inicial con mayor precisión. Aunque los médicos realizan el diagnóstico final, herramientas como YOLO11 pueden ayudar a optimizar su revisión al señalar posibles preocupaciones antes y ayudar a garantizar que no se pase nada importante por alto.

Link to this sectionVehículos autónomos y visión en tiempo real para una movilidad más segura#

En las concurridas calles de las ciudades, los coches autoconducidos dependen de cámaras y sensores para vigilar continuamente su entorno. Estos sistemas detectan peatones, vehículos, carriles y señales de tráfico en tiempo real. Con la ayuda de algoritmos de visión artificial y detección de objetos, un coche autónomo puede interpretar lo que ocurre a su alrededor y tomar decisiones de conducción autónoma más seguras.

En regiones con patrones de tráfico diversos y una mezcla de vehículos, estos sistemas se enfrentan a una mayor complejidad. Por ejemplo, un estudio reciente evaluó modelos de Ultralytics YOLOv8 con datos de tráfico recopilados en Hyderabad y Bangalore, donde una variedad de vehículos, tales como coches, autobuses, motocicletas, bicicletas y auto-rickshaws, comparten la carretera de formas dinámicas y a menudo impredecibles.

Los resultados mostraron que YOLOv8 tuvo un buen rendimiento en estos escenarios difíciles, detectando con precisión una amplia gama de objetos incluso en condiciones de tráfico denso y desestructurado. Esto destaca una tendencia creciente en la movilidad autónoma: los modelos de visión por IA son cada vez más capaces de manejar entornos complejos del mundo real que antes planteaban grandes retos para los sistemas automatizados.

Link to this sectionAutomatización inteligente y robótica mediante visión artificial#

Manipular objetos pequeños, clasificar objetos y materiales detectados o navegar por espacios abarrotados siempre ha sido un reto para los robots. Estas tareas requieren una adaptación rápida y un movimiento preciso, algo con lo que los sistemas de automatización tradicionales a menudo tienen dificultades en entornos impredecibles.

Una tendencia creciente en robótica es el uso de la visión por IA para dotar a los robots de la capacidad de percibir y responder a su entorno en tiempo real. Para explorar este cambio, un grupo de investigadores desarrolló recientemente un robot doméstico capaz de reconocer y clasificar objetos mientras se movía por espacios interiores.

Utilizando modelos como YOLO11 para la detección de objetos, junto con una cámara de profundidad y una pinza flexible, el robot fue capaz de identificar artículos de diferentes formas y tamaños y colocarlos en los lugares correctos por sí mismo. Este experimento muestra cómo la combinación de visión artificial con sistemas robóticos puede mejorar la conciencia espacial y la capacidad de respuesta.

Un robot que utiliza YOLO11 y sensores de profundidad para la toma de decisiones inteligente

Fig 4. Un robot que utiliza YOLO11 y sensores de profundidad para la toma de decisiones inteligente. (Fuente)

También demuestra cómo las técnicas de IA de vanguardia ayudan a los robots a adaptarse a entornos desconocidos aprendiendo de patrones visuales con el paso del tiempo. Con estos avances, los robots son cada vez más capaces y están más integrados en las tareas cotidianas, desde la asistencia doméstica hasta la logística en almacenes y el apoyo sanitario.

Link to this sectionSistemas de vigilancia y seguridad proactivos#

Los sistemas de vigilancia inteligentes adoptan rápidamente la inteligencia artificial para detectar actividades inusuales o peligrosas. Con los modelos de detección de objetos, las cámaras pueden reconocer posibles problemas en tiempo real y alertar a los equipos de seguridad de inmediato, ayudando a mejorar tanto la prevención como la respuesta.

Por ejemplo, en instalaciones de fabricación donde el uso de teléfonos inteligentes está restringido por motivos de seguridad, los sistemas de IA pueden detectar automáticamente los teléfonos en el momento en que aparecen y rastrear su movimiento utilizando YOLO y otros modelos de visión. Esto refleja una tendencia más amplia en seguridad, donde la visión por IA se utiliza para vigilar los entornos de forma más proactiva y responder con mayor rapidez a posibles riesgos.

Más allá de la detección, estos sistemas se combinan cada vez más con otras tecnologías para crear una solución de seguridad más completa. Los dispositivos de borde permiten que las imágenes se procesen localmente, lo que reduce los retrasos y mantiene la fiabilidad del rendimiento, mientras que herramientas como los sistemas de control de acceso o el reconocimiento facial pueden añadir una capa adicional de verificación. Juntas, estas tecnologías trabajan para crear redes de vigilancia más inteligentes y conectadas que pueden responder de forma rápida y eficaz a situaciones del mundo real.

Link to this sectionRealidad aumentada y detección de objetos en la vida cotidiana#

En almacenes concurridos y grandes espacios comerciales, los trabajadores suelen tener que gestionar muchas tareas al mismo tiempo. La realidad aumentada ayuda colocando orientación digital directamente en el mundo real. Cuando se combina con la detección de objetos, los sistemas de AR pueden identificar artículos, rastrear dónde se encuentran y mostrar información útil en tiempo real. Esto hace que las tareas diarias sean más fáciles, rápidas e intuitivas para las personas que las realizan.

Una tendencia creciente en este espacio es el uso de la visión por IA para convertir los dispositivos cotidianos en asistentes inteligentes capaces de comprender su entorno. A medida que la AR y la detección de objetos siguen fusionándose, los lugares de trabajo están empezando a adoptar herramientas inmersivas que admiten la orientación manos libres y flujos de trabajo más eficientes.

Un buen ejemplo son las gafas de AR impulsadas por IA de Amazon, que actualmente se están desarrollando y probando. Estas gafas utilizan la detección de objetos y la clasificación de imágenes para reconocer paquetes, guiar a los trabajadores por la ruta correcta y registrar la prueba de entrega. Esto crea una experiencia más segura y manos libres que ayuda a los trabajadores a mantenerse concentrados y eficientes durante todo el día.

Link to this sectionDispositivos inteligentes impulsados por IoT para sistemas de visión en tiempo real#

Los dispositivos inteligentes se han convertido en sistemas inteligentes capaces de ver, comprender y reaccionar a su entorno. El Internet de las cosas (IoT) impulsa este cambio conectando cámaras, sensores, máquinas y aplicaciones inteligentes en redes que recopilan y realizan el procesamiento de datos en tiempo real.

Cuando el IoT funciona junto con la detección de objetos y la computación de borde, los dispositivos pueden interpretar información visual, detectar anomalías y responder instantáneamente sin intervención humana. Esto crea sistemas adaptables y eficientes que impulsan hogares, industrias y ciudades enteras inteligentes.

Por ejemplo, un estudio reciente mostró cómo un sistema de protección de la vida silvestre basado en IoT utiliza YOLOv8 para detectar animales que se acercan a las tierras de cultivo. Una vez detectados, el sistema utiliza la toma de decisiones asistida por IA para activar disuasorios suaves como luces o sonidos, guiando a los animales lejos de forma segura. Esto ayuda a evitar daños a los cultivos mientras se apoya la coexistencia pacífica con la vida silvestre local, mostrando cómo el IoT y la visión artificial pueden hacer que la agricultura sea más sostenible.

Link to this sectionOtras tendencias interesantes en visión por IA#

Además de estas siete tendencias de detección de objetos, aquí hay algunos desarrollos notables que están dando forma al futuro de la visión por IA:

  • Investigación en aprendizaje autosupervisado: Los nuevos métodos basados en aprendizaje profundo permiten a los modelos aprender características visuales útiles a partir de grandes conjuntos de imágenes no etiquetadas, lo que ayuda a que los sistemas de detección de objetos mejoren sin depender en gran medida de las anotaciones manuales.
  • Auge de la detección de objetos basada en Transformers: Los Transformers son cada vez más comunes porque capturan relaciones de largo alcance dentro de las imágenes, proporcionando a los modelos una mejor comprensión contextual y mejorando la precisión de la detección.
  • Integración de detección y rango de luz (LiDAR) para una percepción 3D más rica: La combinación de LiDAR con la detección de objetos basada en cámaras proporciona información de profundidad precisa, fortaleciendo la percepción 3D para aplicaciones tales como la navegación, la robótica y la conducción autónoma.

Link to this sectionConclusiones clave#

La detección de objetos ha crecido mucho más allá del reconocimiento básico de imágenes y ahora se utiliza para potenciar sistemas inteligentes capaces de tomar decisiones en tiempo real. De cara al futuro, es probable que los modelos futuros alcancen una precisión aún mayor y una comprensión más profunda del contexto, lo que permitirá que la visión por IA sea aún más fiable y versátil en todos los sectores. A medida que estas tecnologías sigan avanzando, darán forma a una nueva generación de sistemas de visión artificial más inteligentes y adaptables.

¿Quieres aprender más? Únete a nuestra comunidad y explora el repositorio de GitHub para conectar con otros en el espacio de la IA. Visita nuestras páginas de soluciones sobre IA en robótica y visión artificial para la agricultura, y explora nuestras opciones de licencia para empezar con la visión por IA hoy mismo.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático