¿Qué es el umbral en el tratamiento de imágenes?

5 minutos de lectura

12 de agosto de 2025

Explore el umbralaje en el procesamiento de imágenes con esta guía. Aprenda qué es la umbralización, diferentes técnicas de umbralización de imágenes, incluida la umbralización de Otsu.

Como humanos, vemos las imágenes como cuadros coherentes y con sentido, mientras que los ordenadores las ven como cuadrículas de diminutos píxeles, los componentes más pequeños de una imagen digital. En un proceso llamado procesamiento de imágenes, estos píxeles pueden ajustarse o analizarse para mejorar la imagen y extraer información útil.

Una técnica habitual de procesamiento de imágenes es la llamada umbralización de imágenes. Este método convierte las imágenes en escala de grises (donde cada píxel representa un tono de gris) en imágenes en blanco y negro comparando cada píxel con un valor establecido. Crea una separación clara entre las regiones importantes y el fondo.

El umbral se utiliza a menudo en la segmentación de imágenes, una técnica que divide una imagen en regiones significativas para facilitar su análisis. Suele ser uno de los primeros pasos para ayudar a las máquinas a interpretar datos visuales. En este artículo veremos qué es el umbral, cómo funciona y dónde se aplica en situaciones reales. Pongámonos manos a la obra.

Terminología básica sobre umbralización de imágenes

Antes de adentrarnos en el funcionamiento del umbral, veamos primero las ideas básicas que lo sustentan y cómo se utiliza en el procesamiento de imágenes.

Umbral de imagen binaria

Supongamos que trabajas con una imagen y quieres separar los objetos del fondo. Una forma de hacerlo es mediante umbralización. Simplifica la imagen para que cada píxel sea completamente negro o completamente blanco. El resultado es una imagen binaria, en la que cada píxel tiene un valor de 0 (negro) o 255 (blanco). Este paso suele ser útil en el tratamiento de imágenes porque hace que las partes importantes de la imagen destaquen claramente.

Fig. 1. Una imagen en escala de grises y su salida binaria tras la umbralización. (Fuente) 

Histograma

Del mismo modo, si quieres entender cómo se distribuyen los valores de brillo en una imagen, un histograma puede ayudarte. Es un gráfico que muestra con qué frecuencia aparece la intensidad de cada píxel, desde el negro (0) hasta el blanco (255). 

Mirando el histograma, puedes ver si la imagen es oscura, brillante o intermedia. Esto facilita la elección de un buen valor umbral al convertir la imagen en blanco y negro, ya que puedes detectar patrones y niveles de contraste de un vistazo.

Primer plano y fondo

Una vez que una imagen ha sido umbralizada, se divide en dos partes: el primer plano y el fondo. El primer plano, que suele aparecer en blanco, resalta los elementos importantes, como el texto, las formas o los objetos que desea detectar. El fondo, en negro, es todo lo demás. Esta separación ayuda a las máquinas a centrarse en lo que importa de la imagen.

Segmentación

Como ya se ha mencionado, la segmentación divide una imagen en regiones significativas en función de características como el brillo o la textura. El umbral es una forma sencilla de hacerlo y suele ser uno de los primeros pasos en un proceso de visión por ordenador. 

La visión por ordenador es una rama de la IA que permite a las máquinas procesar e interpretar datos visuales, de forma muy similar a como lo hacen los humanos. Al utilizar el umbral al principio del proceso, los sistemas de visión por ordenador pueden separar los objetos de su fondo, lo que facilita que los pasos posteriores, como la detección o el reconocimiento, funcionen con precisión.

Umbral global

Ahora que entendemos mejor qué es el umbralizado, vamos a ver cómo umbralizar una imagen y los distintos tipos de umbralizado en el procesamiento de imágenes.

Por ejemplo, la umbralización global es una de las formas más sencillas de crear una imagen binaria. Aplica un único valor de intensidad a toda la imagen. Los píxeles más brillantes que este umbral se vuelven blancos, mientras que los más oscuros se vuelven negros. Esto ayuda a separar el objeto del fondo.

Funciona mejor cuando la imagen tiene una iluminación uniforme y un fuerte contraste. Pero con una iluminación irregular o en zonas de bajo contraste, un único umbral puede pasar por alto detalles o difuminar los bordes.

Para ello, se utilizan métodos como el umbral de Otsu. En lugar de fijar un valor manualmente, el método de umbralización de Otsu analiza el histograma de la imagen y elige el umbral que mejor separa las intensidades de los píxeles en primer plano y fondo. 

Fig. 2. Una imagen de Saturno antes y después de aplicar el umbral de Otsu. (Fuente.)

Umbral local (adaptativo)

A diferencia de la umbralización global, la umbralización adaptativa o local calcula el valor umbral por separado para las distintas partes de la imagen. Esto lo hace más eficaz para imágenes con iluminación desigual, como documentos escaneados con sombras o superficies texturadas.

Funciona dividiendo la imagen en pequeñas regiones y calculando un umbral local para cada bloque, lo que ayuda a mantener el contraste entre el primer plano y el fondo. Este método se utiliza mucho en tareas como el reconocimiento de textos, las imágenes médicas y la inspección de superficies, en las que la iluminación varía en la imagen.

Algunos enfoques comunes de umbralización adaptativa en el procesamiento de imágenes incluyen la umbralización media adaptativa y la umbralización gaussiana adaptativa. En la umbralización media adaptativa, la intensidad media del píxel en un vecindario local se utiliza como umbral para el píxel central. La umbralización gaussiana adaptativa, por otro lado, utiliza una media ponderada con una ventana gaussiana, dando más importancia a los píxeles más cercanos al centro.

Aplicaciones reales de la umbralización en el tratamiento de imágenes

A continuación, vamos a explorar dónde se utiliza el umbral de imagen en aplicaciones del mundo real.

Umbralización de imágenes para binarización de documentos y OCR

Los libros antiguos y las cartas manuscritas suelen escanearse para conservarlos o convertirlos en texto digital mediante OCR (Reconocimiento Óptico de Caracteres), una tecnología que lee caracteres impresos o manuscritos. Antes de extraer el texto, el documento suele necesitar una limpieza o un tratamiento previo. Las imágenes escaneadas suelen tener sombras, tinta difuminada o una iluminación desigual, lo que puede dificultar el reconocimiento de los caracteres.

Para mejorar la claridad, se utiliza la umbralización para convertir las imágenes en escala de grises a formato binario, lo que ayuda a aislar el texto del fondo. Las zonas más oscuras, como las letras, se vuelven negras, mientras que el fondo más claro se vuelve blanco, lo que facilita mucho la lectura del texto a los sistemas de reconocimiento óptico de caracteres.

Fig. 3. Un ejemplo de documento histórico y su imagen umbralizada. (Fuente)

Uso del umbral en el procesamiento de imágenes médicas 

Del mismo modo, en el tratamiento de imágenes médicas, el umbral se utiliza habitualmente para aislar estructuras específicas en las exploraciones, como los huesos o los pulmones en las imágenes de rayos X. Al convertir las imágenes en escala de grises a formato binario, resulta más fácil separar las regiones de interés del tejido circundante y preparar la imagen para su posterior análisis. En casos más complejos, puede aplicarse la umbralización multinivel para dividir la imagen en varias regiones distintas, lo que permite identificar diferentes tipos de tejido o estructuras al mismo tiempo.

Fig. 4. Utilización de métodos de umbralización multinivel en radiografías de tórax. (Fuente)

Ventajas e inconvenientes de la umbralización en el tratamiento de imágenes

Estas son algunas de las principales ventajas de utilizar el umbral en el procesamiento de imágenes:

  • Poco consumo de recursos: Thresholding funciona bien en dispositivos de bajo consumo y no necesita acceso a la nube ni hardware de gama alta, por lo que es adecuado para sistemas integrados y configuraciones offline.
  • Fácil de interpretar: su lógica sencilla hace que los resultados de umbralización sean fáciles de entender y depurar, lo que resulta crucial en campos como la sanidad o el procesamiento de documentos, donde la transparencia es importante.
  • Pruebas rápidas: El umbral permite a los equipos explorar rápidamente ideas de segmentación en proyectos en fase inicial antes de pasar a modelos más complejos.

Aunque el umbralizado de imágenes es útil en muchos casos, también tiene ciertas limitaciones. He aquí algunos retos relacionados con la umbralización que hay que tener en cuenta:

  • Carece de adaptabilidad: El umbral sigue reglas fijas y no se adapta a nuevas condiciones de iluminación o variaciones en los datos sin ajustes manuales.
  • Sensible al ruido: Los pequeños cambios de brillo debidos a sombras o reflejos pueden alterar los resultados, especialmente cuando se trabaja con imágenes detalladas o texturizadas.
  • Estática y basada en reglas: A diferencia de los modelos de IA, el umbral no aprende de los datos ni mejora con el tiempo. Solo funciona dentro de las estrechas condiciones para las que fue diseñado.

Más allá del umbral de imagen: Cuando la visión por ordenador es la herramienta adecuada

El umbral funciona bien para tareas de segmentación sencillas en entornos controlados. Sin embargo, a menudo tiene dificultades cuando se trata de imágenes complejas con múltiples objetos o ruido de fondo. Al basarse en reglas fijas, el umbral carece de la flexibilidad necesaria para la mayoría de las aplicaciones del mundo real.

Para ir más allá de estos límites, muchos sistemas de vanguardia utilizan ahora la visión por ordenador. A diferencia del umbral, los modelos de IA de visión se entrenan para detectar patrones y características complejas, lo que los hace mucho más precisos y adaptables.

Por ejemplo, los modelos de visión por ordenador como Ultralytics YOLO11 pueden detectar objetos y segmentar imágenes en tiempo real. Esto los hace ideales para tareas como detectar señales de tráfico en vehículos autónomos o identificar problemas en cultivos agrícolas. 

En concreto, YOLO11 admite una serie de tareas de visión por ordenador, como la segmentación de instancias, en la que cada objeto de una imagen se segmenta por separado. También puede realizar otras tareas basadas en la visión, como la estimación de la pose (determinar la posición o postura de un objeto) y el seguimiento de objetos (seguir un objeto a medida que se desplaza por los fotogramas de vídeo).

Fig. 5. YOLO11 facilita la detección y segmentación de objetos(Fuente)

Mientras que la umbralización funciona bien para tareas sencillas o para probar las primeras ideas, las aplicaciones que necesitan velocidad, precisión y flexibilidad suelen manejarse mejor con la visión por ordenador.

Principales conclusiones

El umbral es una herramienta crucial en el procesamiento de imágenes porque es rápida y fácil de usar para separar objetos del fondo. Funciona bien con documentos escaneados, imágenes médicas y comprobación de defectos de productos en fábricas. 

Sin embargo, a medida que las imágenes y los vídeos se hacen más complejos, los métodos básicos de procesamiento de imágenes, como el umbral de imagen, pueden resultar difíciles. Ahí es donde pueden intervenir los modelos avanzados de visión por ordenador. Modelos como YOLO11 pueden comprender y realizar más tareas, detectar muchos objetos a la vez y trabajar en tiempo real, lo que los hace útiles para muchos casos de uso.

¿Quieres saber más sobre IA? Visite nuestra comunidad y el repositorio de GitHub. Explore nuestras páginas de soluciones para conocer la IA en robótica y la visión por ordenador en agricultura. Descubra nuestras opciones de licencia y empiece a construir con visión por ordenador hoy mismo.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles