Exploración del procesamiento de imágenes, la visión por ordenador y la visión artificial

Abirami Vina

5 minutos de lectura

26 de septiembre de 2024

Descubra las diferencias entre procesamiento de imágenes, visión por ordenador y visión artificial y cómo se utilizan estas tecnologías para tareas como el análisis de datos visuales.

La IA puede utilizarse para analizar todo tipo de datos, y cuando se trata de datos visuales como imágenes y vídeos, esto entra dentro del dominio del análisis de imágenes, que implica diferentes tecnologías. El procesamiento de imágenes, la visión por ordenador y la visión artificial permiten a los ordenadores ver y comprender el mundo mediante el análisis de imágenes y fotogramas de vídeo. Aunque estas tres tecnologías parecen similares, existen diferencias clave que las hacen útiles para diversas aplicaciones. El procesamiento de imágenes se centra en manipular y mejorar imágenes y fotogramas de vídeo, mientras que la visión por ordenador va un paso más allá al utilizar estas imágenes procesadas para ayudar a los ordenadores a interpretar y comprender su contenido. La visión artificial, por su parte, aplica técnicas de visión por ordenador específicamente a entornos industriales, como inspecciones y tareas de control de calidad.

__wf_reserved_inherit
Fig. 1. Tecnologías clave para el análisis de datos visuales.

Estos tres campos permiten diversas aplicaciones en muchos sectores, como la sanidad, la fabricación y la agricultura. En este artículo analizaremos el procesamiento de imágenes, la visión por ordenador y la visión artificial, así como sus diferencias. También veremos cómo funcionan y cómo se utilizan en distintos sectores. Empecemos por el principio.

¿Qué es el tratamiento de imágenes?

Empecemos por la técnica fundamental que subyace tanto a la visión por ordenador como a la visión artificial: el procesamiento de imágenes. Consiste en utilizar algoritmos para manipular y mejorar las imágenes digitales, ajustando parámetros como el brillo, el contraste, el balance de color o el filtrado del ruido, con el fin de prepararlas para análisis e interpretaciones más avanzados. 

Veamos cómo funciona. El procesamiento de imágenes se realiza descomponiendo las imágenes en píxeles individuales y manipulando estos píxeles para conseguir los efectos deseados. Por ejemplo, para dar más brillo a una imagen, el algoritmo puede aumentar la intensidad de cada píxel. Del mismo modo, para detectar bordes, puede buscar cambios repentinos en los valores de los píxeles. Aplicando operaciones matemáticas y algoritmos a estos píxeles, el procesamiento de imágenes puede utilizarse para mejorar la calidad de la imagen, extraer información o crear imágenes nuevas. 

Las técnicas de procesamiento de imágenes también son esenciales para el tratamiento de datos y la creación de conjuntos de datos visuales con imágenes claras y de alta calidad, y ayudan a los sistemas de visión por ordenador y visión artificial a analizarlas con precisión. Bibliotecas como OpenCV y MATLAB proporcionan sólidos marcos que ponen estas técnicas de procesamiento de imágenes al alcance de desarrolladores e investigadores de diversos campos. 

Éstas son algunas de las técnicas más populares de tratamiento de imágenes: 

  • Filtrado: El filtrado se aplica para reducir los niveles de ruido de una imagen suavizando las variaciones y distorsiones. Algunos filtros comunes son los filtros gaussianos para difuminar y los filtros de mediana para eliminar el ruido de sal y pimienta, que aparecen como píxeles blancos y negros aleatorios.
  • Detección de bordes: Se utiliza para identificar los límites de los objetos de una imagen detectando cambios bruscos en la intensidad de los píxeles. Aplicaciones como las imágenes médicas utilizan la detección de bordes para delinear la estructura de órganos y tumores.
  • Umbralización: El umbral en el tratamiento de imágenes consiste en convertir una imagen en escala de grises en una imagen binaria fijando un valor umbral. Los píxeles que están por encima del umbral se vuelven blancos (1) y los que están por debajo se vuelven negros (0). 
__wf_reserved_inherit
Fig. 2. Una imagen en escala de grises antes y después del umbralizado.

Exploración de una aplicación del tratamiento de imágenes

La restauración de imágenes es un buen ejemplo de aplicación del tratamiento de imágenes. Consiste en recuperar una imagen que se ha degradado con el tiempo. Se utilizan técnicas como el filtrado y la reducción de ruido para eliminar marcas, arañazos, manchas, desgaste y desgarros y devolver a la imagen degradada su calidad original. La restauración de imágenes es especialmente útil en situaciones en las que las imágenes son de baja calidad o están dañadas, como las fotografías antiguas.

__wf_reserved_inherit
Fig. 3. El procesamiento de imágenes puede utilizarse para restaurar imágenes antiguas dañadas.

¿Qué es la visión por ordenador?

A diferencia del procesamiento de imágenes, que se centra en alterarlas y mejorarlas, la visión por ordenador confiere a los ordenadores la capacidad de ver y comprender el mundo real. Muchas aplicaciones utilizan la visión por ordenador para identificar y comprender objetos y personas en imágenes o fotogramas de vídeo. Replica la visión humana e intenta reproducir cómo damos sentido a lo que vemos a nuestro alrededor. 

La visión por ordenador puede utilizarse para automatizar tareas como la vigilancia. También tiene una amplia gama de aplicaciones prácticas como el reconocimiento facial, las imágenes médicas y los vehículos autónomos. Los modelos de visión por ordenador se entrenan mediante técnicas de aprendizaje profundo para extraer e identificar características y patrones complejos a partir de conjuntos de datos de imágenes a gran escala. Diversas industrias utilizan estos modelos entrenados, como Ultralytics YOLOv8, para diferentes tareas como la detección y el seguimiento de objetos.

__wf_reserved_inherit
Fig. 4. Ejemplo de utilización de Ultralytics YOLOv8 para la detección de objetos.

Por ejemplo, los coches autoconducidos como Tesla utilizan la visión por ordenador para navegar por el mundo real. Las imágenes captadas por las cámaras del coche se procesan mediante visión por ordenador. Tareas de visión por ordenador como la detección, el seguimiento y la segmentación de objetos son vitales para comprender las situaciones del tráfico y el entorno que les rodea. Otra aplicación interesante es el reconocimiento facial. La visión por ordenador puede utilizarse para analizar y reconocer rasgos faciales en imágenes capturando el rostro de una persona a partir de una imagen o un vídeo, identificando los rasgos clave y comparándolos con una base de datos de datos faciales almacenados.

¿Qué es la visión artificial?

La visión artificial se utiliza en entornos industriales como grandes fábricas o instalaciones de producción para aplicaciones como garantizar la calidad de los productos y comprobar que las etiquetas y los códigos de barras de los productos acabados son correctos. La visión artificial es una rama especializada de la visión por ordenador que se basa en hardware duradero para funcionar eficazmente en condiciones difíciles. Dado que estos sistemas están integrados en aplicaciones industriales, son esenciales la alta velocidad y la precisión en tiempo real. 

Veamos cómo funciona. En primer lugar, los datos se recogen mediante una o varias cámaras de alta resolución. Estas cámaras también pueden incluir funciones especializadas como imágenes infrarrojas o térmicas. A continuación, los datos recogidos se analizan mediante técnicas de visión por ordenador para extraer la información necesaria. La información extraída suele incluir detalles como la identificación de objetos, formas, tamaños, movimientos, patrones y cualquier anomalía presente en la escena, dependiendo de la aplicación específica.

Comprender una aplicación de visión artificial

El control de calidad en las líneas de producción garantiza que sólo lleguen a los clientes productos de alta calidad, lo que se traduce en una mayor satisfacción de los clientes y un aumento de los beneficios. Los métodos tradicionales suelen basarse en la inspección manual, que puede llevar mucho tiempo y ser propensa a errores humanos. Un control de calidad deficiente también puede provocar retrasos en la producción, pérdidas económicas y afectar a la reputación de la empresa. Una gran solución es automatizar tareas como la inspección de superficies, la verificación de etiquetas y el posicionamiento de objetos con la ayuda de la visión artificial.

Por ejemplo, en la industria farmacéutica, la calidad del producto es crucial y se aplican estrictas normativas para mantener altos estándares. La visión artificial puede utilizarse para asegurarse de que los envases blíster contienen el número correcto de pastillas, verificando que cada envase contiene exactamente la cantidad correcta, como diez pastillas en un envase de 10 pastillas. Se puede utilizar un modelo de visión artificial como YOLOv8 para identificar y contar las pastillas mediante la detección de objetos

__wf_reserved_inherit
Fig. 5. La visión artificial puede utilizarse para el control de calidad en la industria farmacéutica.

Sin embargo, es importante ser consciente de que hay que tener en cuenta algunas limitaciones al trabajar con visión artificial. Los sistemas de visión artificial suelen necesitar unas condiciones de iluminación excelentes para iluminar los productos en entornos industriales. También se necesitan cámaras, procesadores y aceleradores de hardware de alta calidad para capturar datos y acelerar el proceso de análisis. Una consecuencia directa de que estos sistemas se hayan diseñado específicamente para tareas prácticas en entornos industriales es que su instalación puede resultar costosa.

Diferencias clave entre procesamiento de imágenes, visión por ordenador y visión artificial

Ahora que ya hemos hablado de las tres tecnologías por separado y hemos visto algunas de sus aplicaciones, vamos a verlas una al lado de la otra. 

__wf_reserved_inherit
Fig. 6. Comparación entre el tratamiento de imágenes, la visión por ordenador y la visión artificial.

El procesamiento de imágenes es mejor para tareas como el ajuste del brillo o el filtrado de ruido, que requieren menos potencia de cálculo y no la capacidad de comprender información visual compleja. Por otro lado, la visión por ordenador es excelente para extraer información significativa de las imágenes y manejar escenas complejas, pero requiere más recursos informáticos y complejidad. Mientras tanto, la visión artificial se adapta a usos industriales, como la inspección automatizada, y a menudo se apoya en sistemas especializados y costosos.

Visión de conjunto

Aunque el procesamiento de imágenes, la visión por ordenador y la visión artificial están estrechamente relacionados, cada uno de ellos tiene fines distintos. El procesamiento de imágenes mejora y manipula las imágenes a nivel de píxel, lo que lo hace muy útil para tareas como la reconstrucción de imágenes. 

La visión por ordenador, por su parte, va un poco más allá al dotar a los ordenadores de la capacidad de comprender y dar sentido a los datos visuales. Es fundamental para casos de uso como el reconocimiento facial y los coches autoconducidos. Además, la visión artificial se utiliza específicamente para aplicaciones industriales. Automatiza procesos industriales como las inspecciones y el control de calidad. 

Si conoce estas tecnologías y sus diferencias, podrá elegir la más adecuada para sus aplicaciones, lo que redundará en una mayor eficacia y mejores resultados.

¡Aprendamos y exploremos juntos! Visite nuestro repositorio de GitHub para ver nuestras contribuciones a la IA y no olvide colaborar con nuestra comunidad. Descubra cómo estamos redefiniendo sectores como la fabricación y la sanidad con tecnología de IA de vanguardia.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles