¿Qué es el umbralizado en el procesamiento de imágenes?
Explora el umbralizado (thresholding) en procesamiento de imágenes con esta guía. Aprende qué es el umbralizado y diferentes técnicas, incluido el umbralizado de Otsu.

Para un recorrido visual de los conceptos cubiertos en este artículo, mira el vídeo a continuación.
Como humanos, vemos las imágenes como cuadros coherentes y significativos, mientras que las computadoras las ven como rejillas de píxeles diminutos, los componentes más pequeños de una imagen digital. En un proceso llamado procesamiento de imágenes, estos píxeles pueden ajustarse o analizarse para mejorar la imagen y extraer información útil.
Una técnica común de procesamiento de imágenes se denomina umbralización. Este método convierte las imágenes en escala de grises (donde cada píxel representa un tono de gris) en imágenes en blanco y negro comparando cada píxel con un valor establecido. Crea una separación clara entre las regiones importantes y el fondo.
La umbralización se utiliza a menudo en la segmentación de imágenes, una técnica que divide una imagen en regiones significativas para facilitar su análisis. Por lo general, es uno de los primeros pasos para ayudar a las máquinas a interpretar datos visuales. En este artículo, veremos qué es la umbralización, cómo funciona y dónde se aplica en escenarios del mundo real. ¡Comencemos!
Link to this sectionTerminología básica en la umbralización de imágenes#
Antes de sumergirnos en cómo funciona la umbralización, analicemos primero las ideas básicas detrás de ella y cómo se utiliza en el procesamiento de imágenes.
Link to this sectionUmbral de imagen binaria#
Supongamos que trabajas con una imagen y quieres separar los objetos del fondo. Una forma de hacerlo es mediante la umbralización. Simplifica la imagen para que cada píxel sea completamente negro o completamente blanco. El resultado es una imagen binaria, donde cada píxel tiene un valor de 0 (negro) o 255 (blanco). Este paso suele ser útil en el procesamiento de imágenes porque hace que las partes importantes de la imagen resalten claramente.

Fig 1. Una imagen en escala de grises y su salida binaria tras la umbralización. (Fuente: blog.devops.dev)
Link to this sectionHistograma#
Del mismo modo, si quieres comprender cómo se distribuyen los valores de brillo en una imagen, un histograma puede ayudarte. Es un gráfico que muestra con qué frecuencia aparece cada intensidad de píxel, desde el negro (0) hasta el blanco (255).
Al observar el histograma, puedes ver si la imagen es oscura, brillante o intermedia. Esto facilita la elección de un buen valor de umbral al convertir la imagen a blanco y negro, ya que puedes detectar patrones y niveles de contraste de un vistazo.
Link to this sectionPrimer plano y fondo#
Una vez que una imagen ha sido umbralizada, se divide en dos partes: el primer plano y el fondo. El primer plano, que normalmente se muestra en blanco, resalta los elementos importantes, como texto, formas u objetos que deseas detectar. El fondo, que se muestra en negro, es todo lo demás. Esta separación ayuda a las máquinas a centrarse en lo que importa en la imagen.
Link to this sectionSegmentación#
Como se mencionó anteriormente, la segmentación divide una imagen en regiones significativas basadas en características como el brillo o la textura. La umbralización es una forma sencilla de hacerlo y suele ser uno de los primeros pasos en un proceso de visión artificial.
La visión artificial es una rama de la IA que permite a las máquinas procesar e interpretar datos visuales, al igual que los humanos. Al utilizar la umbralización al principio del proceso, los sistemas de visión artificial pueden separar los objetos de su fondo, lo que facilita que los pasos posteriores, como la detección o el reconocimiento, funcionen con precisión.
Link to this sectionUmbralización global#
Ahora que entendemos mejor qué es la umbralización, veamos cómo umbralizar una imagen y los diferentes tipos de umbralización en el procesamiento de imágenes.
Por ejemplo, la umbralización global es una de las formas más fáciles de crear una imagen binaria. Aplica un único valor de intensidad a toda la imagen. Los píxeles más brillantes que este umbral se vuelven blancos, mientras que los más oscuros se vuelven negros. Esto ayuda a separar el objeto del fondo.
Funciona mejor cuando la imagen tiene una iluminación uniforme y un contraste fuerte. Pero en zonas con iluminación irregular o poco contraste, un único umbral puede perder detalles o difuminar los bordes.
Para manejar esto, se utilizan métodos como la umbralización de Otsu. En lugar de establecer un valor manualmente, el método de Otsu para la umbralización analiza el histograma de la imagen y elige un umbral que separa mejor las intensidades de los píxeles en primer plano y fondo.

Fig 2. Una imagen de Saturno antes y después de aplicar la umbralización de Otsu. (Fuente)
Link to this sectionUmbralización local (adaptativa)#
A diferencia de la umbralización global, la umbralización adaptativa o local calcula el valor del umbral por separado para diferentes partes de la imagen. Esto la hace más eficaz para imágenes con iluminación desigual, como documentos escaneados con sombras o superficies texturizadas.
Funciona dividiendo la imagen en pequeñas regiones y calculando un umbral local para cada bloque, lo que ayuda a mantener el contraste entre el primer plano y el fondo. Este enfoque se utiliza ampliamente en tareas como el reconocimiento de texto, imágenes médicas e inspección de superficies, donde la iluminación varía a lo largo de la imagen.
Algunos enfoques comunes para la umbralización adaptativa en el procesamiento de imágenes incluyen la umbralización media adaptativa y la umbralización gaussiana adaptativa. En la umbralización media adaptativa, la intensidad media de los píxeles en un vecindario local se utiliza como umbral para el píxel central. La umbralización gaussiana adaptativa, por otro lado, utiliza un promedio ponderado con una ventana gaussiana, dando más importancia a los píxeles más cercanos al centro.
Link to this sectionAplicaciones reales de la umbralización en el procesamiento de imágenes#
A continuación, exploremos dónde se utiliza la umbralización de imágenes en aplicaciones reales.
Link to this sectionUmbralización de imágenes para la binarización de documentos y OCR#
Los libros antiguos y las cartas escritas a mano a menudo se escanean para preservarlos o convertirlos en texto digital utilizando OCR (Reconocimiento Óptico de Caracteres), una tecnología que lee caracteres impresos o escritos a mano. Antes de extraer el texto, el documento suele necesitar limpieza o preprocesamiento. Las imágenes escaneadas a menudo tienen sombras, tinta descolorida o iluminación desigual, lo que puede dificultar el reconocimiento de caracteres.
Para mejorar la claridad, se utiliza la umbralización para convertir imágenes en escala de grises a formato binario, ayudando a aislar el texto del fondo. Las áreas más oscuras, como las letras, se vuelven negras, mientras que el fondo más claro se vuelve blanco, lo que facilita mucho la lectura del texto para los sistemas OCR.

Fig 3. Un ejemplo de un documento histórico y su imagen umbralizada. (Fuente)
Link to this sectionUso de la umbralización en el procesamiento de imágenes médicas#
Del mismo modo, en imágenes médicas, la umbralización se utiliza habitualmente para aislar estructuras específicas en escaneos, como huesos o pulmones en radiografías. Al convertir imágenes en escala de grises a formato binario, resulta más fácil separar las regiones de interés del tejido circundante y preparar la imagen para un análisis posterior. En casos más complejos, se puede aplicar la umbralización multinivel para dividir la imagen en varias regiones distintas, lo que permite identificar diferentes tipos de tejido o estructuras al mismo tiempo.

Fig 4. Uso de métodos de umbralización multinivel en radiografías de tórax. (Fuente: sciencedirect.com)
Link to this sectionPros y contras de la umbralización en el procesamiento de imágenes#
Estos son algunos de los beneficios clave de usar la umbralización en el procesamiento de imágenes:
- Ligero en recursos: La umbralización funciona bien en dispositivos de baja potencia y no necesita acceso a la nube ni hardware de gama alta, lo que la hace adecuada para sistemas integrados y configuraciones sin conexión.
- Fácil de interpretar: Su lógica sencilla hace que los resultados de la umbralización sean fáciles de entender y depurar, lo cual es crucial en campos como la atención sanitaria o el procesamiento de documentos donde la transparencia es importante.
- Pruebas rápidas: La umbralización permite a los equipos explorar rápidamente ideas de segmentación en proyectos de etapa inicial antes de pasar a modelos más complejos.
Si bien la umbralización de imágenes es útil en muchos escenarios, también tiene ciertas limitaciones. Aquí hay algunos desafíos relacionados con la umbralización a considerar:
- Falta de adaptabilidad: La umbralización sigue reglas fijas y no se ajusta a nuevas condiciones de iluminación o variaciones en los datos sin ajustes manuales.
- Sensible al ruido: Pequeños cambios en el brillo debidos a sombras o reflejos pueden estropear los resultados, especialmente cuando se trabaja con imágenes detalladas o texturizadas.
- Estática y basada en reglas: A diferencia de los modelos de IA, la umbralización no aprende de los datos ni mejora con el tiempo. Solo funciona dentro de las condiciones limitadas para las que fue diseñada.
Link to this sectionMás allá de la umbralización de imágenes: cuándo la visión artificial es la herramienta adecuada#
La umbralización funciona bien para tareas de segmentación simples en entornos controlados. Sin embargo, a menudo tiene dificultades al manejar imágenes complejas que tienen múltiples objetos o ruido de fondo. Dado que se basa en reglas fijas, a la umbralización le falta la flexibilidad necesaria para la mayoría de las aplicaciones del mundo real.
Para ir más allá de estos límites, muchos sistemas de vanguardia utilizan ahora visión artificial. A diferencia de la umbralización, los modelos de IA de visión están entrenados para detectar patrones y características complejos, lo que los hace mucho más precisos y adaptables.
Por ejemplo, modelos de visión artificial como Ultralytics YOLO11 pueden detectar objetos y segmentar imágenes en tiempo real. Esto los hace ideales para tareas como detectar señales de tráfico en vehículos autónomos o identificar problemas en cultivos en la agricultura.
En particular, YOLO11 admite una variedad de tareas de visión artificial, como la segmentación de instancias, donde cada objeto en una imagen se segmenta por separado. También puede realizar otras tareas basadas en visión, incluida la estimación de poses (determinar la posición o postura de un objeto) y el seguimiento de objetos (seguir un objeto mientras se mueve a través de los fotogramas de un vídeo).

Fig 5. YOLO11 facilita la detección y segmentación de objetos. (Fuente)
Si bien la umbralización funciona bien para tareas simples o para probar ideas iniciales, las aplicaciones que requieren velocidad, precisión y flexibilidad suelen gestionarse mejor con visión artificial.
Link to this sectionConclusiones clave#
La umbralización es una herramienta crucial en el procesamiento de imágenes porque es rápida y fácil de usar para separar objetos del fondo. Funciona bien con documentos escaneados, imágenes médicas y la comprobación de defectos de productos en fábricas.
Sin embargo, a medida que las imágenes y los vídeos se vuelven más complejos, los métodos básicos de procesamiento de imágenes como la umbralización pueden tener dificultades. Ahí es donde pueden intervenir los modelos avanzados de visión artificial. Modelos como YOLO11 pueden comprender y realizar más tareas, detectar muchos objetos a la vez y trabajar en tiempo real, lo que los hace útiles para muchos casos de uso.
¿Quieres saber más sobre IA? Consulta nuestra comunidad y nuestro repositorio de GitHub. Explora nuestras páginas de soluciones para aprender sobre IA en robótica y visión artificial en agricultura. ¡Descubre nuestras opciones de licencia y empieza hoy mismo a construir con visión artificial!






