¿Qué es la visión artificial? Aprenda cómo esta disciplina de la IA permite la automatización industrial, el control de calidad y la robótica. Descubra sus diferencias clave con la visión por computador.
La visión artificial es la disciplina y la tecnología de ingeniería que permite la inspección automática, el control de procesos y el guiado de robots mediante el análisis de imágenes. control de procesos y guiado de robots mediante el análisis de imágenes. Funciona como los "ojos" de la automatización industrial, combinando hardware óptico con software sofisticado para interpretar la información visual y activar acciones físicas. hardware óptico con un sofisticado software para interpretar la información visual y desencadenar acciones físicas. Aunque se basa en los principios teóricos de la Visión por Computador (VC), la visión artificial se distingue se centra en la aplicación práctica y real en entornos estructurados. Esta tecnología es la piedra angular de la Industria 4.0, que permite a las fábricas inteligentes funcionar con mayor velocidad, precisión y coherencia de lo que pueden lograr los operadores humanos.
Un sistema de visión artificial típico integra varios componentes críticos para realizar una tarea específica de forma fiable. El proceso proceso comienza con la adquisición de imágenes cámaras industriales de alta calidad y objetivos datos visuales. Estos sistemas utilizan técnicas de iluminación técnicas de iluminación para resaltar las características relevantes, como las texturas de la superficie o los bordes, al tiempo que se suprime el ruido.
Una vez capturada la imagen, la procesa una unidad informática -a menudo un o una cámara inteligente, que ejecuta algoritmos avanzados. algoritmos avanzados. Históricamente, se trataba de sistemas basados en reglas (por ejemplo, recuento de píxeles), pero las aplicaciones modernas se basan cada vez más en Inteligencia Artificial (IA) y Aprendizaje profundo (AD). Modelos como Ultralytics YOLO11 analizan las imágenes para identificar patrones, detect defectos o medir dimensiones. A continuación, el sistema toma una decisión -como aceptar un producto o guiar un brazo robótico, y lo comunica a un controlador lógico programable (PLC).
Aunque los términos se utilizan a menudo indistintamente, es importante distinguir la visión artificial del campo más amplio de la visión por ordenador. de la visión por ordenador. La visión por ordenador es un campo científico centrado en permitir que los ordenadores "entiendan" imágenes en general, a menudo con datos no estructurados como fotos de redes sociales o grabaciones de vigilancia. En abarca tareas que van desde la clasificación de imágenes a la IA generativa.
En cambio, la visión artificial es la aplicación de estas tecnologías para resolver problemas industriales. Los sistemas de visión artificial suelen funcionar en entornos controlados con una iluminación y una posición de la cámara constantes para garantizar una alta fiabilidad. garantizar una alta fiabilidad. Por ejemplo, mientras que un modelo Por ejemplo, mientras que un modelo de visión por ordenador puede tratar de reconocer a un perro en un parque, un sistema de visión artificial está diseñado para detect un arañazo microscópico en un anillo de pistón que se mueve a gran velocidad. microscópico en un anillo de pistón que se mueve a gran velocidad en una cinta transportadora.
La visión artificial impulsa la eficiencia en numerosos sectores mediante la automatización de tareas visuales.
La visión artificial moderna suele utilizar redes neuronales de última generación para obtener un rendimiento robusto. El siguiente ejemplo
muestra cómo utilizar la ultralytics paquete Python para cargar un
Modelo YOLO11 y realizar inferencias, un paso habitual en
verificación de piezas en una línea de producción.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model (or a custom-trained industrial model)
model = YOLO("yolo11n.pt")
# Run inference on an image of a manufactured component
# This step identifies objects and checks for defects based on training
results = model("production_part.jpg")
# Display the results to visualize detections and confidence scores
results[0].show()
Este sencillo flujo de trabajo sustenta sistemas complejos en los que inferencia en tiempo real determina el destino de los productos en una línea de producción rápida, minimizando minimizando la latencia de la inferencia de producción.