Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
IA de visión

Un resumen rápido de la IA visual y cómo funciona

Explora cómo la IA visual transforma imágenes y vídeos en conocimientos en tiempo real usando modelos de vanguardia, datasets y flujos de trabajo de extremo a extremo en todas las industrias.

ABAbirami Vina
4 min read
IA visual detectando objetos en datos visuales del mundo real

Cada día, las cámaras de fábricas, hospitales, ciudades, vehículos y dispositivos de consumo capturan enormes cantidades de imágenes y vídeo. Este flujo constante de datos visuales crea nuevas posibilidades, pero también dificulta entender lo que está ocurriendo y actuar con rapidez.

Por ejemplo, las intersecciones concurridas o los espacios públicos llenos de gente pueden cambiar de un momento a otro. Supervisar estos entornos manualmente es lento y a menudo impreciso, especialmente cuando se necesitan decisiones rápidas y fiables.

Para manejar situaciones como estas, los sistemas necesitan una forma de entender la información visual tal como aparece y responder en tiempo real. La visión artificial lo hace posible al permitir que las máquinas analicen imágenes y vídeo, reconozcan patrones y extraigan información útil.

Los sistemas de visión artificial anteriores dependían de reglas fijas, que funcionaban en entornos controlados pero que a menudo fallaban cuando cambiaban condiciones como la iluminación o los ángulos de la cámara. La IA de visión moderna mejora este enfoque mediante el uso de inteligencia artificial y aprendizaje automático.

En lugar de solo capturar o almacenar imágenes, estos sistemas analizan datos visuales en tiempo real, aprenden de ejemplos y se adaptan a entornos cambiantes. Esto hace que la IA de visión sea más eficaz en situaciones del mundo real y permite que mejore con el tiempo a medida que se utiliza en más aplicaciones.

En este artículo, analizaremos más de cerca qué es la IA de visión y cómo se puede utilizar para crear flujos de trabajo inteligentes de extremo a extremo. ¡Empecemos!

Link to this section¿Qué es la IA de visión?#

La IA de visión es una rama de la inteligencia artificial que permite a las máquinas entender e interpretar imágenes y vídeo. En otras palabras, los sistemas de IA de visión analizan lo que ven y utilizan esa información para respaldar acciones, optimizar predicciones o tomar decisiones como parte de un flujo de trabajo más amplio. A diferencia de la IA generativa, que crea nuevo contenido, la IA de visión se centra en comprender y extraer información de datos visuales existentes.

Por ejemplo, supervisar la actividad en una planta de fábrica o en un espacio público durante largos períodos requiere una velocidad y consistencia que pueden ser difíciles de mantener manualmente. Los sistemas de IA de visión pueden gestionar este desafío aplicando técnicas de aprendizaje automático y aprendizaje profundo para reconocer patrones, identificar detalles relevantes y responder a medida que aparece nueva información visual.

Vision AI detectando objetos en una imagen

Fig 1. Un ejemplo del uso de la IA de visión para detectar objetos en una imagen (Fuente)

Dado que las imágenes y el vídeo se generan a menudo en grandes volúmenes y a gran velocidad, los sistemas de IA de visión pueden procesar datos visuales continuamente y aplicar las mismas reglas a cada fotograma. Esto hace que los resultados sean más consistentes y ayuda a los equipos a mejorar las operaciones mientras mantienen la precisión a medida que cambian las condiciones.

En el uso en el mundo real, la IA de visión suele ser parte de un sistema de IA de extremo a extremo. Conecta modelos de IA de visión con lógica de decisión y otras herramientas que actúan sobre los resultados. Al convertir la entrada visual en información útil, la IA de visión puede automatizar tareas rutinarias y respaldar una toma de decisiones más rápida y segura en muchas aplicaciones de visión artificial.

Link to this sectionCómo funciona la IA de visión: pasando de datos visuales a información práctica#

Entonces, ¿cómo pasa un sistema o máquina de ver una imagen o vídeo a entender lo que está sucediendo y decidir qué hacer después?

El proceso comienza con la entrada visual del mundo real, como fotos, clips de vídeo, transmisiones de cámara en directo o flujos de sensores. Debido a que estos datos pueden variar ampliamente en calidad, iluminación y ángulo de cámara, normalmente necesitan ser preparados antes del análisis.

Esta preparación puede incluir cambiar el tamaño de las imágenes, ajustar la iluminación y organizar los fotogramas de vídeo en un formato consistente. A menudo se incluye contexto adicional, como marcas de tiempo o la ubicación de la cámara, para respaldar un análisis más preciso.

Los datos preparados se utilizan entonces dentro de un marco de aprendizaje que permite al sistema reconocer patrones visuales. Al entrenarse con imágenes y vídeos etiquetados, un modelo de IA de visión aprende cómo aparecen los objetos, los patrones y los eventos en diferentes condiciones.

Esta comprensión aprendida forma la base de muchas tareas comunes de visión artificial como la detección de objetos (identificar y localizar objetos dentro de una imagen) y la segmentación de instancias (separar y etiquetar objetos individuales a nivel de píxel). Los modelos de IA de visión de vanguardia, como Ultralytics YOLO26, están diseñados para respaldar estas tareas mientras siguen siendo rápidos y precisos en entornos del mundo real.

YOLO realizando segmentación de instancias en objetos

Fig 2. Un vistazo al uso de YOLO para la segmentación de instancias (Fuente)

Una vez desplegado el sistema, las entradas visuales se procesan continuamente como parte de un flujo de trabajo de extremo a extremo. El modelo analiza las imágenes y vídeos y envía sus resultados a paneles, herramientas de automatización u otros sistemas de IA. En algunos casos, los agentes de IA de visión utilizan estos resultados para activar acciones o respaldar la toma de decisiones, convirtiendo la comprensión visual en información práctica y accionable.

Link to this sectionLa evolución de los modelos y arquitecturas de visión#

A medida que aprendas más sobre la IA de visión, puede que te preguntes por qué importan los modelos y las arquitecturas y cómo afectan al rendimiento del sistema. Los modelos de IA de visión son cruciales para las innovaciones actuales en visión artificial.

La mayoría de los sistemas de IA de visión están construidos en torno a un modelo que determina cómo se analizan las imágenes y los vídeos. El modelo define lo que el sistema puede reconocer en una escena y qué tan bien rinde bajo diferentes condiciones.

A medida que las aplicaciones de IA de visión se han vuelto más variadas y complejas, los modelos de IA de visión y sus arquitecturas subyacentes han seguido evolucionando para mantenerse al día y ser fáciles de usar. Los primeros sistemas de visión artificial requerían que los ingenieros definieran manualmente lo que el sistema debía buscar, como bordes, colores o formas específicos.

Estos enfoques basados en reglas funcionaban bien en entornos controlados, pero a menudo fallaban cuando cambiaba la iluminación, variaba la calidad de la cámara o las escenas se volvían más complejas. Los modelos modernos de IA de visión adoptan un enfoque diferente.

Muchos modelos de código abierto aprenden patrones visuales directamente de los datos, lo que los hace más flexibles y mejor adaptados a entornos del mundo real donde las condiciones son impredecibles. Los avances en la arquitectura de modelos también han simplificado la forma en que se procesan las imágenes y el vídeo, haciendo que estos sistemas sean más fáciles de desplegar e integrar en plataformas prácticas de IA de visión.

Los modelos Ultralytics YOLO son un buen ejemplo de este cambio. Modelos como YOLO26 son ampliamente utilizados para tareas de detección de objetos que requieren velocidad y consistencia, especialmente en aplicaciones de vídeo en directo.

Link to this sectionExplorando las tareas principales de la IA de visión#

Aquí tienes algunas de las tareas de visión artificial principales en las que se basan los sistemas de visión impulsados por IA para entender la información visual y optimizar entornos del mundo real:

  • Detección de objetos: Esta tarea permite a un sistema identificar qué objetos están presentes en una imagen o vídeo y determinar dónde se encuentran, normalmente dibujando cajas delimitadoras alrededor de cada objeto.
  • Clasificación de imágenes: Con este enfoque, se analiza toda una imagen y se le asigna una o más etiquetas basadas en su contenido general, lo que ayuda a organizar elementos visuales e informar decisiones.
  • Segmentación de instancias: Para tareas que requieren mayor precisión, esta tarea desglosa una imagen a nivel de píxel para separar objetos o regiones dentro de una escena.
  • Seguimiento de objetos: En aplicaciones basadas en vídeo, esta capacidad permite seguir objetos a través de fotogramas mientras se preserva su identidad y movimiento a lo largo del tiempo.
  • Estimación de postura: Identifica puntos clave en personas u objetos, como articulaciones o puntos de referencia, para determinar su posición, postura y movimiento en entornos dinámicos.

Detección y seguimiento de vehículos en una carretera usando YOLO

Fig 3. Detección y seguimiento de vehículos usando YOLO (Fuente)

Link to this sectionEl papel de los conjuntos de datos en la IA de visión#

Detrás de cada sistema eficaz de IA de visión hay un conjunto de datos bien seleccionado. Estos conjuntos de datos de IA de visión proporcionan las imágenes y vídeos de los que aprenden los modelos de IA de visión, ayudándoles a reconocer objetos, patrones y escenas en entornos del mundo real.

La calidad de los datos afecta directamente a la precisión y fiabilidad del sistema. Para que los datos visuales sean impactantes, los conjuntos de datos se anotan. Esto significa que se añaden detalles importantes a cada imagen o vídeo, como etiquetar objetos, resaltar áreas específicas o asignar categorías.

Junto con las etiquetas, se puede incluir metadatos adicionales como la hora, la ubicación o el tipo de escena para ayudar a organizar los datos y mejorar la comprensión. Los conjuntos de datos también suelen dividirse en conjuntos de entrenamiento, validación y prueba para que los sistemas puedan evaluarse con imágenes que no han visto antes.

Conjuntos de datos populares como ImageNet, COCO y Open Images han desempeñado un papel importante en el avance de la IA de visión al proporcionar grandes y diversas colecciones de imágenes etiquetadas. Aun así, recopilar datos del mundo real sigue siendo difícil.

El sesgo, las lagunas en la cobertura y los entornos en constante cambio hacen difícil crear conjuntos de datos que reflejen verdaderamente las condiciones reales. Obtener el equilibrio adecuado de datos a escala es clave para construir sistemas de IA de visión fiables.

Link to this sectionUn vistazo a varios casos de uso de la IA de visión#

Ahora que entendemos mejor cómo funciona la IA de visión, veamos cómo se utiliza en aplicaciones del mundo real. En muchas industrias, la IA de visión ayuda a los equipos a manejar tareas visuales a escala, lo que lleva a respuestas más rápidas y operaciones más eficientes.

Aquí tienes algunas formas comunes en las que se utiliza la IA de visión en diferentes sectores:

  • Fabricación: En la planta de la fábrica, la IA de visión se puede utilizar para supervisar los productos a medida que pasan por cada etapa de la producción. Puede detectar defectos, piezas faltantes o inconsistencias desde el principio, ayudando a los equipos a reducir el retrabajo, mantener la calidad y evitar tiempos de inactividad inesperados.
  • Venta al por menor: En espacios comerciales, las soluciones de IA de visión pueden hacer un seguimiento del inventario, comprobar el estado de los estantes y reducir pérdidas. Al analizar los elementos visuales de la tienda, estos sistemas pueden facilitar que el personal entienda lo que ocurre en el establecimiento y realizar ajustes más rápidos para mantener las operaciones funcionando sin problemas.
  • Atención sanitaria: La IA de visión puede apoyar a los profesionales sanitarios ayudando en la revisión de imágenes médicas, como escáneres o resultados de pruebas. Puede señalar áreas que pueden requerir una atención más cercana, permitiendo a los médicos trabajar de manera más eficiente mientras mantienen las decisiones finales en manos humanas.
  • Transporte y ciudades inteligentes: En carreteras y espacios públicos, la IA de visión ayuda a las ciudades a supervisar el flujo de tráfico, detectar incidentes y mejorar la seguridad a otro nivel. El análisis en tiempo real de los flujos de cámara permite respuestas más rápidas a las condiciones cambiantes y respalda una mejor gestión de la infraestructura urbana.

Monitorización automatizada de productos con visión artificial en la fabricación

Fig 4. Supervisión automatizada de productos utilizando IA de visión en la fabricación (Fuente)

Link to this sectionPros y contras de las herramientas de IA de visión#

Aquí tienes algunos de los beneficios clave de utilizar la IA de visión en aplicaciones del mundo real:

  • Escala en diversos casos de uso: Una vez entrenados, los sistemas de IA de visión pueden desplegarse en múltiples ubicaciones o aplicaciones con cambios mínimos.
  • Asistencia de IA más rápida: Al analizar imágenes y vídeo a medida que se capturan, los sistemas impulsados por IA de visión pueden ofrecer información en tiempo real que respalda respuestas más rápidas y una mejor toma de decisiones.
  • Se integra fácilmente en los flujos de trabajo existentes: Las salidas de la IA de visión se pueden conectar a sistemas descendentes, paneles o tuberías de automatización.

A pesar de estas ventajas, existen limitaciones que pueden afectar el rendimiento de los sistemas de IA de visión. Aquí tienes algunos factores a tener en cuenta:

  • Dependencia de la calidad y disponibilidad de los datos: Los sistemas de IA de visión dependen en gran medida de conjuntos de datos grandes y bien preparados. Recopilar y mantener datos visuales de alta calidad puede llevar tiempo y ser costoso.
  • Sensibilidad a los cambios ambientales: El rendimiento puede disminuir cuando las cámaras se mueven, la iluminación cambia o las escenas varían significativamente sin reentrenamiento o ajuste.
  • Requisitos de computación e infraestructura: Ejecutar modelos de IA de visión, especialmente en tiempo real o a escala, puede requerir importantes recursos de computación y hardware especializado.

Link to this sectionConclusiones clave#

La IA de visión convierte las imágenes y los vídeos en información significativa que los sistemas pueden entender y utilizar. Esto ayuda a automatizar las tareas visuales y respalda una toma de decisiones más rápida y fiable. Su eficacia depende de la combinación de modelos capaces, conjuntos de datos de alta calidad y flujos de trabajo bien diseñados trabajando juntos.

¿Te interesa la IA de visión? Únete a nuestra comunidad y aprende sobre visión artificial en la agricultura y IA de visión en la industria automotriz. Echa un vistazo a nuestras opciones de licencia para empezar con la visión artificial. Visita nuestro repositorio de GitHub para seguir explorando la IA.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático