Usando el aprendizaje autosupervisado para eliminar el ruido de las imágenes
Descubre cómo el aprendizaje autosupervisado elimina el ruido de las imágenes, suprime el ruido y mejora la claridad usando técnicas de IA para fotografía, sistemas médicos y de visión.

Las imágenes forman parte de nuestra vida cotidiana, desde las fotos que tomamos hasta los vídeos grabados por cámaras en lugares públicos. Contienen información valiosa y la tecnología de vanguardia permite analizar e interpretar estos datos.
En particular, la visión artificial, una rama de la inteligencia artificial (IA), permite a las máquinas procesar información visual y entender lo que ven, de forma muy parecida a como lo hacen los humanos. Sin embargo, en aplicaciones del mundo real, las imágenes a menudo están lejos de ser perfectas.
El ruido en las imágenes causado por la lluvia, el polvo, la poca luz o las limitaciones de los sensores puede ocultar detalles importantes, lo que dificulta que los modelos de Vision AI detecten objetos o interpreten escenas con precisión. La eliminación de ruido en las imágenes ayuda a reducir este ruido, permitiendo que los modelos de Vision AI vean los detalles con mayor claridad y realicen mejores predicciones.

Fig 1. Un ejemplo de eliminación de ruido en una imagen. (Fuente)
Tradicionalmente, la eliminación de ruido en las imágenes se ha basado en el aprendizaje supervisado, donde los modelos se entrenan utilizando pares de imágenes con ruido y limpias para aprender a eliminar el ruido. Sin embargo, recopilar imágenes de referencia perfectamente limpias no siempre es práctico.
Para abordar este desafío, los investigadores han desarrollado eliminadores de ruido de imágenes autosupervisados. Su objetivo es entrenar modelos de IA para que aprendan directamente de los datos, creando sus propias señales de aprendizaje para eliminar el ruido y conservar detalles importantes sin necesidad de imágenes de referencia limpias.
En este artículo, analizaremos más de cerca los eliminadores de ruido de imágenes autosupervisados, cómo funcionan, las técnicas clave detrás de ellos y sus aplicaciones en el mundo real. ¡Empecemos!
Link to this section¿Qué es la eliminación de ruido de imágenes autosupervisada?#
Las imágenes con ruido pueden dificultar que los modelos de Vision AI interpreten lo que hay en una fotografía. Una foto tomada en condiciones de poca luz, por ejemplo, puede aparecer granulada o borrosa, ocultando rasgos sutiles que ayudan a un modelo a identificar objetos con precisión.
En la eliminación de ruido basada en aprendizaje supervisado, los modelos se entrenan utilizando pares de imágenes, una con ruido y otra limpia, para aprender a eliminar el ruido no deseado. Aunque este enfoque funciona bien, recopilar datos de referencia perfectamente limpios suele llevar mucho tiempo y es difícil en escenarios del mundo real.
Es por eso que los investigadores han recurrido a la eliminación de ruido de imágenes autosupervisada. La eliminación de ruido de imágenes autosupervisada se basa en el concepto de aprendizaje autosupervisado, donde los modelos aprenden por sí mismos creando sus propias señales de aprendizaje a partir de los datos.
Dado que este método no depende de grandes conjuntos de datos etiquetados, la eliminación de ruido autosupervisada es más rápida, más escalable y más fácil de aplicar en dominios como la fotografía con poca luz, el diagnóstico por imagen y el análisis de imágenes por satélite, donde a menudo no se dispone de imágenes de referencia limpias.
En lugar de depender de imágenes de referencia limpias, este enfoque se entrena directamente con datos con ruido prediciendo píxeles enmascarados o reconstruyendo partes faltantes. A través de este proceso, el modelo aprende a distinguir entre detalles significativos de la imagen y ruido aleatorio, lo que conduce a resultados más claros y precisos.
Aunque puede parecer similar al aprendizaje no supervisado, el aprendizaje autosupervisado es en realidad un caso especial de este. La distinción clave es que, en el aprendizaje autosupervisado, el modelo crea sus propias etiquetas o señales de entrenamiento a partir de los datos para aprender una tarea específica. Por el contrario, el aprendizaje no supervisado se centra en encontrar patrones o estructuras ocultos en los datos sin ninguna tarea explícita o objetivo predefinido.
Link to this sectionEstrategias de aprendizaje en la eliminación de ruido autosupervisada#
Con respecto a la eliminación de ruido autosupervisada, existen varias formas en las que ocurre el aprendizaje. Algunos modelos de eliminación de ruido autosupervisados rellenan píxeles enmascarados o faltantes, mientras que otros comparan múltiples versiones con ruido de la misma imagen para encontrar detalles consistentes.
Por ejemplo, un método popular conocido como aprendizaje de punto ciego (blind-spot learning) se centra en entrenar el modelo eliminador de ruido para que ignore el píxel que está reconstruyendo y dependa del contexto circundante en su lugar. Con el tiempo, el modelo reconstruye imágenes de alta calidad mientras preserva texturas, bordes y colores esenciales.
Link to this sectionCómo funciona el aprendizaje autosupervisado para eliminar el ruido#
A continuación, exploraremos el proceso detrás de cómo el aprendizaje autosupervisado elimina el ruido.
El proceso de eliminación de ruido autosupervisada suele comenzar alimentando al modelo con imágenes con ruido. El modelo analiza los píxeles cercanos para estimar cómo debería verse cada píxel poco claro o enmascarado, aprendiendo gradualmente a distinguir entre el ruido y los detalles visuales reales.
Considera una imagen de un cielo oscuro y granulado. El modelo observa las estrellas cercanas y los patrones circundantes para predecir cómo debería verse cada parche con ruido sin el ruido. Al repetir este proceso en toda la imagen, aprende a separar el ruido aleatorio de las características significativas, produciendo un resultado más claro y preciso.
En otras palabras, el modelo predice una versión más limpia de la imagen basada en el contexto, sin necesidad de una referencia perfectamente limpia. Este proceso se puede implementar utilizando diferentes tipos de modelos, cada uno con fortalezas únicas en el manejo del ruido.
Link to this sectionTipos de modelos utilizados para la reducción de ruido de imágenes autosupervisada#
Aquí tienes un vistazo rápido a los tipos de modelos que se utilizan comúnmente para la eliminación de ruido de imágenes autosupervisada:
- Redes neuronales convolucionales (CNNs): Las CNN son modelos de aprendizaje profundo diseñados para reconocer patrones en pequeñas regiones de una imagen. Escanean las imágenes utilizando filtros para detectar bordes, formas y texturas. En la eliminación de ruido autosupervisada, a menudo utilizan técnicas de punto ciego, donde el píxel objetivo se excluye de la entrada para que el modelo prediga su valor basándose únicamente en los píxeles circundantes. Esto ayuda al modelo a evitar copiar el ruido y, en cambio, inferir detalles más limpios.
- Autoencoders: Los autoencoders son redes neuronales que aprenden a comprimir y reconstruir datos. Primero reducen una imagen a una representación más pequeña (codificación) y luego la reconstruyen (decodificación). En el proceso, aprenden a capturar características visuales importantes como formas y texturas mientras filtran el ruido aleatorio y los detalles irrelevantes.
- Modelos basados en Transformer: Los Transformers son modelos desarrollados originalmente para el procesamiento del lenguaje natural, pero ahora se utilizan ampliamente para tareas de visión. Procesan la imagen completa de una vez, aprendiendo cómo se relacionan las diferentes regiones entre sí. Esta perspectiva global les permite preservar detalles finos y la consistencia estructural, incluso en imágenes complejas o de alta resolución.

Fig 2. Un vistazo a una arquitectura basada en CNN utilizada para la eliminación de ruido de imágenes autosupervisada. (Fuente)
Entrenar estos modelos con imágenes tomadas con diferentes configuraciones de iluminación e ISO les ayuda a funcionar bien en muchas situaciones del mundo real. En las cámaras digitales, los ajustes ISO controlan cuánto aclara la cámara la imagen al amplificar la señal que recibe.
Un ISO más alto hace que las fotos sean más brillantes en lugares oscuros, pero también aumenta el ruido y reduce el detalle. Al aprender de imágenes tomadas a diferentes niveles de ISO, los modelos mejoran al distinguir los detalles reales del ruido, lo que conduce a resultados más claros y precisos.
Link to this section¿Cómo aprende un eliminador de ruido qué es ruido y qué es real?#
Los eliminadores de ruido aprenden a distinguir el ruido de los detalles reales de la imagen mediante diferentes técnicas de entrenamiento, que son independientes de los tipos de modelos utilizados para la eliminación de ruido. Los tipos de modelos como las CNN, los autoencoders y los transformers describen la estructura de la red y cómo procesa la información visual.
Las técnicas de entrenamiento, por otro lado, definen cómo aprende el modelo. Algunos métodos utilizan la predicción basada en el contexto, donde el modelo rellena los píxeles faltantes o enmascarados utilizando información de áreas cercanas.
Otros utilizan el aprendizaje basado en la reconstrucción, donde el modelo comprime una imagen en una forma más simple y luego la reconstruye, ayudándole a reconocer estructuras significativas como bordes y texturas mientras filtra el ruido aleatorio.
Juntos, el tipo de modelo y la técnica de entrenamiento determinan la eficacia con la que un eliminador de ruido puede limpiar las imágenes. Al combinar la arquitectura correcta con el enfoque de aprendizaje adecuado, los eliminadores de ruido autosupervisados pueden adaptarse a muchos tipos de ruido y producir imágenes más claras y precisas incluso sin datos de referencia limpios.
Link to this sectionTécnicas clave en la eliminación de ruido de imágenes por IA autosupervisada#
Aquí hay algunas de las técnicas de entrenamiento más utilizadas que permiten una eliminación de ruido de imágenes autosupervisada eficaz:
- Noise2Noise: Este método entrena a un modelo utilizando dos versiones con ruido de la misma imagen. Dado que el ruido en cada versión es aleatorio, el modelo aprende a centrarse en los detalles consistentes que representan la imagen real y a ignorar el ruido. Funciona mejor cuando hay disponibles múltiples capturas con ruido de la misma escena, como en la fotografía de ráfaga o en la imagen médica y científica.
- Noise2Void o Noise2Self: Estas técnicas se entrenan con una sola imagen con ruido ocultando (enmascarando) un píxel y pidiendo al modelo que prediga su valor basándose en los píxeles circundantes. Esto evita que el modelo simplemente copie datos con ruido y le ayuda a aprender la estructura natural de las imágenes. Son especialmente útiles cuando solo se dispone de una imagen con ruido, como en microscopía, astronomía o fotografía con poca luz.
- Redes de punto ciego: Están especialmente diseñadas para que el modelo no pueda ver el píxel que está reconstruyendo. En su lugar, depende de la información del área circundante para estimar cómo debería ser ese píxel. Esto hace que la eliminación de ruido sea más precisa e imparcial, y a menudo se combinan con los métodos Noise2Void o Noise2Self en tareas de eliminación de ruido píxel a píxel.
- Autoencoders enmascarados (MAE): En este enfoque, partes de una imagen se ocultan y el modelo aprende a reconstruir las áreas faltantes. Al hacer esto, aprende tanto detalles finos como la estructura general, ayudándole a distinguir el contenido real del ruido. Los autoencoders enmascarados son especialmente eficaces para imágenes de alta resolución o complejas donde comprender el contexto más amplio mejora la restauración.
Link to this sectionEvaluación de sistemas de eliminación de ruido de imágenes#
La eliminación de ruido en imágenes es un cuidadoso equilibrio entre dos objetivos: reducir el ruido y mantener intactos los detalles finos. Demasiada eliminación de ruido puede hacer que una imagen parezca suave o borrosa, mientras que muy poca puede dejar granos o artefactos no deseados.
Para entender qué tan bien logra un modelo este equilibrio, los investigadores utilizan métricas de evaluación que miden tanto la claridad de la imagen como la preservación de los detalles. Estas métricas muestran qué tan bien limpia un modelo una imagen sin perder información visual importante.
Aquí hay métricas de evaluación comunes que ayudan a medir la calidad de la imagen y el rendimiento de la eliminación de ruido:
- Error cuadrático medio (MSE): Mide la diferencia cuadrática promedio entre la imagen original y la imagen sin ruido. Destaca qué tan cerca está la salida del original a nivel de píxel. Valores de MSE más bajos significan menos errores y un resultado más preciso.
- Relación señal-ruido máxima (PSNR): Esta métrica compara la fuerza de la señal de la imagen original con el ruido restante, expresada en decibelios. Se utiliza para ver cuánto detalle original se ha conservado después de la eliminación de ruido. Valores de PSNR más altos significan imágenes más claras y de mayor calidad.
- Índice de similitud estructural (SSIM): SSIM evalúa la estructura, el brillo y el contraste para evaluar la similitud entre la imagen sin ruido y la original. Se centra en cómo los humanos ven las imágenes, no solo en números brutos. Puntuaciones de SSIM más altas significan que la imagen parece más natural y fiel a la original.
- Métricas perceptivas: Estas métricas utilizan modelos de aprendizaje profundo para juzgar qué tan realista y natural parece una imagen. En lugar de comparar píxeles individuales, se centran en la apariencia general, la textura y la similitud visual. En la mayoría de los casos, las puntuaciones más bajas significan que la imagen parece más cercana a la original y es visualmente más agradable para los humanos.
Link to this sectionAplicaciones de la eliminación de ruido autosupervisada#
Ahora que tenemos una mejor comprensión de qué es la eliminación de ruido, exploremos cómo se aplica la eliminación de ruido de imágenes autosupervisada en escenarios del mundo real.
Link to this sectionUso de la eliminación de ruido autosupervisada en astrofotografía#
Tomar fotos claras de estrellas y galaxias no es fácil. El cielo nocturno está oscuro, por lo que las cámaras a menudo requieren largos tiempos de exposición, lo que puede introducir ruido no deseado. Este ruido puede difuminar detalles cósmicos finos y hacer que las señales débiles sean más difíciles de detectar.
Las herramientas tradicionales de eliminación de ruido pueden ayudar a reducir el ruido, pero a menudo eliminan detalles importantes junto con él. La eliminación de ruido autosupervisada ofrece una alternativa más inteligente. Al aprender directamente de las imágenes con ruido, el modelo de IA puede reconocer patrones que representan características reales y separarlos del ruido aleatorio.
El resultado son imágenes mucho más claras de objetos celestes como estrellas, galaxias y el Sol, revelando detalles débiles que de otro modo podrían pasar desapercibidos. También puede mejorar características astronómicas sutiles, mejorando la claridad de la imagen y haciendo que los datos sean más útiles para la investigación científica.

Fig 3. La eliminación de ruido de imágenes puede mejorar las imágenes de astrofotografía. (Fuente)
Link to this sectionEliminación de ruido autosupervisada para imágenes médicas#
Las exploraciones médicas como las resonancias magnéticas, las tomografías computarizadas y las imágenes de microscopía a menudo captan ruido que puede hacer que los pequeños detalles sean más difíciles de ver. Esto puede ser un problema cuando los médicos necesitan detectar signos tempranos de enfermedad o realizar un seguimiento de los cambios a lo largo del tiempo.
El ruido en la imagen puede provenir del movimiento del paciente, de la baja intensidad de la señal o de los límites en la cantidad de radiación que se puede utilizar. Para hacer que las exploraciones médicas sean más claras, los investigadores han explorado métodos de eliminación de ruido autosupervisados como Noise2Self y otros enfoques similares.
Estos modelos se entrenan directamente con imágenes de resonancia magnética cerebral con ruido, aprendiendo los patrones de ruido por sí mismos y limpiándolos sin necesidad de ejemplos perfectamente claros. Las imágenes procesadas mostraron texturas más nítidas y un mejor contraste, lo que facilitó la identificación de estructuras finas. Dichos eliminadores de ruido impulsados por IA agilizan el flujo de trabajo en el diagnóstico por imagen y mejoran la eficiencia del análisis en tiempo real.

Fig 4. Uso de diferentes técnicas de eliminación de ruido autosupervisada en resonancias magnéticas cerebrales. (Fuente)
Link to this sectionMejora de los sistemas de visión con eliminación de ruido autosupervisada#
En la mayoría de los casos, la eliminación de ruido tiene un impacto significativo en una amplia gama de aplicaciones de visión artificial. Al eliminar el ruido y las distorsiones no deseados, se producen datos de entrada más limpios y consistentes para que los procesen los modelos de Vision AI.
Las imágenes más claras conducen a un mejor rendimiento en tareas de visión artificial como la detección de objetos, la segmentación de instancias y el reconocimiento de imágenes. Aquí hay algunos ejemplos de aplicaciones donde los modelos de Vision AI, como Ultralytics YOLO11 y Ultralytics YOLO26, pueden beneficiarse de la eliminación de ruido:
- Inspección industrial: La eliminación de ruido impulsa una detección más precisa de defectos o anomalías superficiales en entornos de fabricación, lo que conduce a un mejor control de calidad.
- Conducción y navegación autónomas: Mejora la detección de objetos y obstáculos en condiciones difíciles como poca luz, lluvia o niebla, mejorando la seguridad y la fiabilidad generales.
- Vigilancia y seguridad: La eliminación de ruido mejora la calidad de la imagen en transmisiones de video con poca luz o alta compresión, lo que permite una mejor identificación y seguimiento de objetos o personas.
- Imagen submarina: La eliminación de ruido reduce la dispersión y la distorsión de la luz, mejorando la visibilidad y el reconocimiento de objetos en condiciones submarinas turbias.
Link to this sectionPros y contras de la eliminación de ruido autosupervisada#
Aquí tienes algunos beneficios clave de usar la eliminación de ruido autosupervisada en sistemas de imagen:
- Adaptabilidad al ruido: Los métodos de eliminación de ruido autosupervisados pueden aprender directamente de datos con ruido sin requerir referencias limpias emparejadas. Esto los hace altamente adaptables a una amplia gama de niveles y tipos de ruido del mundo real, como el ruido del sensor, el desenfoque de movimiento o la interferencia ambiental.
- Preservación de detalles: Cuando están bien diseñados, estos modelos preservan texturas finas y bordes que son esenciales para una interpretación precisa de la imagen. Enfoques como las redes de punto ciego y el aprendizaje basado en enmascaramiento ayudan a mantener la información estructural mientras se reduce el ruido.
- Menos preprocesamiento: Al aprender a mapear entradas con ruido a representaciones limpias utilizando solo los datos disponibles, el modelo minimiza la necesidad de filtrado manual, algoritmos de eliminación de ruido hechos a mano o conjuntos de datos de entrenamiento seleccionados.
A pesar de sus beneficios, la eliminación de ruido autosupervisada también conlleva ciertas limitaciones. Aquí hay algunos factores a considerar:
- Requisitos computacionales: Las arquitecturas neuronales profundas utilizadas para la eliminación de ruido autosupervisada, especialmente los modelos basados en Transformer, pueden requerir una potencia computacional y recursos de memoria sustanciales en comparación con las técnicas de filtrado tradicionales.
- Complejidad del diseño del modelo: Lograr resultados óptimos requiere una selección cuidadosa de la configuración del modelo, como la estrategia de enmascaramiento y la función de pérdida, que pueden variar según los diferentes tipos de ruido.
- Desafíos de evaluación: Las métricas comunes de calidad de imagen no siempre coinciden con el aspecto natural o realista de una imagen sin ruido, por lo que a menudo son necesarias comprobaciones visuales o específicas de la tarea.
Link to this sectionConclusiones clave#
La eliminación de ruido autosupervisada ayuda a los modelos de IA a aprender directamente de las imágenes con ruido, produciendo resultados más claros mientras se preservan los detalles finos. Funciona eficazmente en una variedad de escenarios desafiantes, como imágenes con poca luz, ISO alto y detalles. A medida que la IA continúa evolucionando, es probable que estas técnicas desempeñen un papel esencial en diversas aplicaciones de visión artificial.
Únete a nuestra comunidad y explora nuestro repositorio de GitHub para descubrir más sobre la IA. Si buscas crear tu propio proyecto de Vision AI, consulta nuestras opciones de licencia. Descubre más sobre aplicaciones como la IA en el cuidado de la salud y la Vision AI en el comercio minorista visitando nuestras páginas de soluciones.






