Glosario

Visión artificial

¿Qué es la visión artificial? Descubra cómo esta disciplina de la IA permite la automatización industrial, el control de calidad y la robótica. Descubra sus principales diferencias con la visión por ordenador.

La visión artificial es un campo tecnológico que permite a las máquinas "ver" e interpretar automáticamente el mundo visual. Combina cámaras, iluminación y software para capturar y analizar imágenes, lo que permite a los sistemas tomar decisiones o realizar tareas basándose en esa información visual. Utilizada principalmente en entornos industriales y automatizados, el objetivo principal de la visión artificial es realizar tareas específicas, a menudo repetitivas, de inspección y orientación con mayor rapidez, precisión y coherencia que los operadores humanos. Es un componente clave que impulsa la automatización en sectores como la fabricación, la logística y la robótica.

Cómo funciona la visión artificial

Un sistema de visión artificial típico integra varios componentes de hardware y software para funcionar. El proceso comienza con cámaras de alta velocidad e iluminación especializada diseñadas para capturar imágenes claras y coherentes de un objeto o escena. Este paso, conocido como adquisición de imágenes, es fundamental para un rendimiento fiable. A continuación, la imagen capturada se procesa mediante un software que utiliza algoritmos para analizar los datos visuales. Tradicionalmente, estos sistemas se basaban en técnicas de procesamiento de imágenes basadas en reglas. Sin embargo, los sistemas modernos de visión artificial incorporan cada vez más Machine Learning (ML) y Deep Learning (DL) para manejar tareas más complejas y variables. El paso final implica que el sistema tome una decisión, como aprobar o rechazar una pieza, o guiar un brazo robótico. Todo el flujo de trabajo se ejecuta a menudo en tiempo real en hardware de procesamiento que va desde PC industriales a dispositivos de borde.

Visión artificial frente a visión por ordenador

Aunque los términos Visión Artificial y Visión por Ordenador (V CI) se utilizan a menudo indistintamente, tienen enfoques distintos. La visión por ordenador es un campo científico más amplio que estudia cómo los ordenadores pueden obtener información de alto nivel a partir de imágenes digitales o vídeos. Abarca una amplia gama de aplicaciones, desde el reconocimiento facial a los vehículos autónomos.

La visión artificial, por el contrario, suele considerarse una disciplina de ingeniería y un subconjunto de la visión por ordenador centrado en aplicaciones prácticas, especialmente en la automatización industrial. Sus aplicaciones suelen ser específicas de una tarea y se realizan en entornos muy controlados. Mientras que la visión por ordenador trata de comprender una imagen en un sentido general, la visión artificial trata de extraer información específica de una imagen para realizar una tarea. Para más detalles sobre las diferencias, puede explorar esta comparación entre visión por ordenador y procesamiento de imágenes.

Aplicaciones reales

La visión artificial es una piedra angular de la automatización industrial moderna. Su capacidad para realizar tareas visuales de alta velocidad y precisión la convierten en una herramienta inestimable en muchos sectores.

  • Control de calidad en la fabricación: Uno de los usos más comunes de la visión artificial es la inspección de calidad automatizada. Por ejemplo, en una línea de embotellado, un sistema de visión artificial puede inspeccionar miles de botellas por minuto para comprobar si hay grietas, asegurarse de que los niveles de llenado son correctos y verificar que los tapones están bien sellados. Los sistemas basados en modelos como Ultralytics YOLO11 pueden realizar complejas detecciones de objetos para identificar incluso los defectos más pequeños. Esto no sólo mejora la calidad del producto, sino que también reduce los residuos y los costes operativos. La Association for Advancing Automation (A3) ofrece amplios recursos sobre este tema.
  • Guiado para robótica: Los sistemas de visión artificial proporcionan los "ojos" a los robots, permitiéndoles realizar tareas complejas con precisión. En un almacén logístico basado en IA, la visión artificial guía a los robots para identificar, recoger y colocar artículos para su clasificación y embalaje. Esto implica el seguimiento de objetos y la estimación de la postura para comprender la posición y orientación del objeto. Estos sistemas son cruciales para las operaciones de alta velocidad que exigen los centros de cumplimiento de comercio electrónico y son una parte importante de la robótica y la automatización.

El papel del aprendizaje profundo

La integración del aprendizaje profundo ha revolucionado la visión artificial. Mientras que los sistemas tradicionales estaban limitados por algoritmos basados en reglas, los modelos de aprendizaje profundo, en particular las redes neuronales convolucionales (CNN), pueden aprender de grandes cantidades de datos. Esto les permite identificar defectos y características con un nivel de matiz y flexibilidad que antes era imposible. Modelos como YOLOv8 y YOLO11 pueden entrenarse en conjuntos de datos personalizados para reconocer una amplia variedad de objetos y anomalías, lo que los hace ideales para tareas como la segmentación de instancias en líneas de producción. Plataformas como Ultralytics HUB agilizan el proceso de formación y despliegue de estos modelos avanzados. Frameworks como PyTorch y TensorFlow proporcionan la base para construir estos sofisticados sistemas, permitiendo soluciones de visión artificial más robustas e inteligentes.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles