Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Guías

¿Qué es la informática de imágenes? Una introducción rápida

Aprende qué es la informática de imágenes, cómo funciona y cómo se aplica en la sanidad, la conducción autónoma y otros sistemas inteligentes modernos.

ABAbirami Vina
7 min read
Máquinas interpretando datos visuales a través de la informática de imágenes

Cuando caminas por un centro comercial o una calle concurrida, las cámaras instaladas sobre las entradas y los pasillos registran la actividad. Generan datos visuales a cada segundo y, la mayoría de las veces, ni siquiera nos damos cuenta.

Este flujo constante de datos alimenta los modernos sistemas basados en IA, desde sistemas de seguridad inteligentes hasta coches autónomos. Estas innovaciones son impulsadas por la computación de imágenes, un campo versátil que reúne la informática, las matemáticas y la física.

La computación de imágenes ayuda a las máquinas a entender lo que ven en una imagen. Permite a los sistemas reconocer lo que sucede en una escena y decidir cómo funcionar o responder, como detener un coche autónomo cuando aparece un obstáculo.

En este artículo, exploraremos qué es la computación de imágenes y cómo se utiliza en sistemas de inteligencia artificial (IA) de vanguardia. ¡Empecemos!

Link to this sectionEntender la computación de imágenes#

La computación de imágenes es el proceso de captura, procesamiento y análisis de imágenes mediante algoritmos avanzados. Trata las imágenes como datos que las máquinas pueden entender y con los que pueden trabajar.

En otras palabras, cada imagen se procesa como una cuadrícula de números. Esto se logra convirtiendo los píxeles, las unidades más pequeñas de una imagen, en una matriz compuesta por filas y columnas. Cada píxel tiene un valor numérico que indica a la máquina qué tan brillante u oscura es un área específica de la imagen.

La forma en que se organizan estos valores depende de si la imagen es en escala de grises o basada en color. En las imágenes en escala de grises, los valores de los píxeles suelen oscilar entre 0 (negro) y 255 (blanco). En las imágenes en color, se utilizan múltiples matrices para representar diferentes canales de color, como Rojo, Verde y Azul (RGB) o Tono, Saturación y Valor (HSV).

Representaciones matriciales de imágenes digitales

Fig 1. Representaciones matriciales de imágenes (Fuente)

Además de las matrices de píxeles, una imagen suele contener información contextual oculta, conocida como metadatos. Los metadatos proporcionan detalles importantes como la resolución de la imagen, la profundidad de bits, los ajustes de la cámara o el sensor, y la hora exacta en que se capturó la imagen. Las imágenes se almacenan en formatos de archivo específicos para preservar tanto los datos visuales como los metadatos.

Por ejemplo, en la computación de imágenes biomédicas, las imágenes suelen almacenarse utilizando el formato DICOM (Imágenes Digitales y Comunicación en Medicina). DICOM combina datos de imágenes visuales con información del paciente, como detalles de identificación y ajustes del equipo, lo que garantiza que el análisis de imágenes médicas sea preciso, coherente y seguro.

Link to this sectionCómo funciona la computación de imágenes#

Ahora que tenemos una mejor comprensión de qué es la computación de imágenes, veamos los pasos utilizados para convertir una fuente de cámara en información útil.

Aunque el flujo de trabajo exacto puede variar según la aplicación, la mayoría de los sistemas de computación de imágenes siguen estas etapas principales:

  • Adquisición de imágenes: Primero, los datos visuales se capturan utilizando cámaras y sensores, o se recopilan a partir de conjuntos de datos de imágenes de código abierto.
  • Preprocesamiento de imágenes: Luego, las imágenes adquiridas se redimensionan, se eliminan los ruidos, se mejoran y se convierten a un espacio de color específico para estandarizar las entradas.
  • Extracción de características: Se utilizan algoritmos de aprendizaje profundo (deep learning) para aprender patrones importantes en la imagen, como bordes, formas y texturas.
  • Interpretación: Las características extraídas se analizan para realizar tareas como la detección de objetos, la segmentación de imágenes y el seguimiento de objetos.
  • Salida: Finalmente, el sistema genera salidas estructuradas, como etiquetas de clase o cajas delimitadoras (bounding boxes), y las presenta de una manera que sea fácil de entender y utilizar para las personas u otros sistemas para su visualización.

Link to this sectionComputación de imágenes vs. visión por ordenador vs. procesamiento de imágenes#

Cuando te encuentres con el término computación de imágenes, es posible que también veas términos como procesamiento de imágenes y visión por ordenador. Aunque estos términos se utilizan a menudo indistintamente, describen diferentes formas en que los sistemas de IA interactúan con los datos visuales.

Por ejemplo, el procesamiento de imágenes se centra en mejorar las imágenes o la calidad de las entradas mediante operaciones básicas como la eliminación de ruido, el redimensionamiento y el ajuste de contraste. Por otro lado, la visión por ordenador, que es una rama de la IA, se basa en el procesamiento de imágenes al permitir que las máquinas reconozcan objetos, interpreten escenas y comprendan lo que está sucediendo en imágenes o vídeos.

La computación de imágenes combina el procesamiento de imágenes y la visión por ordenador para transformar datos visuales en resultados significativos y utilizables para sistemas inteligentes.

Comparativa de procesamiento de imágenes, visión artificial e informática de imágenes

Fig 2. Procesamiento de imágenes vs. visión por ordenador vs. computación de imágenes. Imagen del autor.

Link to this sectionCómo se implementa la computación de imágenes hoy en día#

A continuación, echemos un vistazo a cómo se implementa la computación de imágenes en la actualidad.

En las primeras etapas de la computación de imágenes, características como bordes, esquinas y texturas se definían manualmente utilizando algoritmos basados en reglas y creados a mano. Si bien estas metodologías funcionaban bastante bien en entornos controlados, tenían dificultades para escalar y adaptarse a condiciones complejas del mundo real.

Los sistemas modernos de computación de imágenes abordan estas limitaciones mediante el uso de enfoques basados en aprendizaje profundo. Modelos como las redes neuronales convolucionales (CNNs) y los vision transformers aprenden automáticamente características relevantes de grandes conjuntos de datos de imágenes. Esto les permite realizar tareas como la detección de objetos, la segmentación de instancias y el seguimiento de objetos con mayor precisión y robustez.

Hoy en día, los flujos de trabajo de computación de imágenes a menudo dependen de modelos de visión en tiempo real diseñados para su despliegue en sistemas de IA de vanguardia. Por ejemplo, los modelos de visión por IA como Ultralytics YOLO26 permiten capacidades de visión por ordenador rápidas y eficientes, como la detección de objetos y la segmentación de instancias, tanto en dispositivos edge como en entornos de nube.

YOLO26 detectando y segmentando objetos en una imagen

Fig 3. Un ejemplo de uso de YOLO26 para detectar y segmentar objetos en una imagen

Link to this sectionAplicaciones en el mundo real de la computación de imágenes#

La computación de imágenes se está utilizando ampliamente en aplicaciones del mundo real para comprender y actuar sobre datos visuales. Exploremos cómo se aplica la computación de imágenes en diferentes ámbitos.

Link to this sectionComputación de imágenes médicas para la detección temprana de enfermedades#

La computación de imágenes puede ayudar a médicos y clínicos a detectar enfermedades antes y a analizar escaneos médicos de manera más eficiente. Estos innovadores sistemas de salud pueden procesar rápidamente datos de imágenes médicas, como radiografías y resonancias magnéticas (MRI), y a menudo proporcionan resultados más coherentes que una revisión manual.

Por ejemplo, modelos como Ultralytics YOLO26 se pueden entrenar con grandes conjuntos de imágenes de radiografías de tórax para aprender patrones vinculados a infecciones y anomalías. Una vez entrenados, estos modelos pueden ayudar a identificar si un escaneo parece normal o muestra signos de condiciones como neumonía o COVID-19.

Link to this sectionComputación de imágenes para la conducción autónoma#

Los vehículos autónomos utilizan la computación de imágenes para comprender lo que sucede a su alrededor y tomar decisiones de conducción. La tecnología convierte las grabaciones de vídeo sin procesar en información en tiempo real que ayuda al vehículo a moverse de forma segura y fluida.

La computación de imágenes se utiliza habitualmente en los sistemas avanzados de asistencia al conductor (ADAS). En lugar de solo grabar vídeo, estos módulos analizan cada fotograma para detectar marcas de carril, otros vehículos, peatones y obstáculos. Esto hace posible que el coche reaccione a las condiciones cambiantes de la carretera con poca intervención humana.

Otro caso de uso común es la combinación de imágenes de múltiples cámaras para crear una vista de 360 grados del entorno del vehículo. La computación de imágenes ayuda a corregir la distorsión de la lente, mejorar la claridad de la imagen y equilibrar el brillo y el color en todas las fuentes de las cámaras. El resultado es una vista clara y fluida que permite al vehículo navegar con seguridad, incluso en condiciones de mal tiempo o baja luminosidad.

Composición de imágenes mediante aprendizaje profundo

Fig 4. Unión de imágenes (image stitching) mediante aprendizaje profundo (Fuente)

Link to this sectionVentajas y desventajas de la computación de imágenes#

Estas son algunas de las ventajas de la computación de imágenes:

  • Escalabilidad: Una vez entrenados, los sistemas de computación de imágenes pueden analizar grandes volúmenes de datos visuales de forma continua y a escala.
  • Toma de decisiones: Es compatible con aplicaciones críticas en cuanto a tiempo, como la conducción autónoma, el cribado médico y la monitorización industrial.
  • Eficiencia de costes a largo plazo: Aunque la configuración inicial puede ser costosa, el análisis visual automatizado puede reducir los costes operativos a largo plazo.

Si bien hay muchos beneficios relacionados con la computación de imágenes, también existen algunas limitaciones. Aquí hay algunos factores a considerar:

  • Calidad de los datos: Los métodos de computación de imágenes dependen en gran medida de un etiquetado preciso y de conjuntos de datos de alta calidad, cuya creación puede resultar costosa y llevar mucho tiempo.
  • Sensibilidad a las condiciones: Los cambios en la iluminación, la oclusión, el desenfoque de movimiento, el clima o los ángulos de cámara pueden afectar negativamente al rendimiento del modelo.
  • Explicabilidad limitada: Los modelos de imágenes basados en aprendizaje profundo pueden actuar como cajas negras, lo que dificulta explicar cómo se toman las decisiones.

Link to this sectionConclusiones clave#

La computación de imágenes ha evolucionado desde el procesamiento básico de imágenes hacia una tecnología que permite a los sistemas de IA percibir y comprender el mundo real en tiempo real. A medida que el aprendizaje profundo sigue avanzando, la computación de imágenes se está convirtiendo en una parte esencial de la construcción de kits de herramientas y aplicaciones más inteligentes y prácticos.

Únete a nuestra comunidad y echa un vistazo a nuestro repositorio de GitHub para aprender sobre IA. Explora nuestras páginas de soluciones para leer sobre aplicaciones de IA en la agricultura y visión por ordenador en la logística. Descubre nuestras opciones de licencia y empieza a construir modelos de visión por IA.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático