Al hacer clic en "Aceptar todas las cookies", usted acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación por el sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información en
Configuración de cookies
Al hacer clic en "Aceptar todas las cookies", usted acepta el almacenamiento de cookies en su dispositivo para mejorar la navegación por el sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información en
Explore cómo se utilizan los datos sintéticos para el entrenamiento de modelos de IA en aplicaciones de visión por ordenador en una serie de sectores como la sanidad y la robótica.
Los datos siempre han sido un factor impulsor en campos como la analítica y la inteligencia artificial (IA). De hecho, la forma en que recopilamos, generamos y utilizamos los datos está configurando el futuro de los sistemas inteligentes. Por ejemplo, los coches autónomos dependen de millones de imágenes etiquetadas y lecturas de sensores, desde señales de tráfico hasta movimientos de peatones, para aprender a circular por las carreteras de forma segura.
Uno de los tipos de datos más importantes que impulsan este progreso, especialmente en ámbitos como los vehículos autónomos y la seguridad, son los datos visuales, como imágenes y vídeos.
En concreto, el campo de la IA que permite a las máquinas interpretar esta información visual se denomina visión por ordenador. Ayuda a los sistemas a comprender y analizar la información visual de forma muy parecida a como lo hacen los humanos, lo que permite realizar tareas como el reconocimiento facial, la detección de señales de tráfico y el análisis de imágenes médicas.
Sin embargo, recopilar conjuntos de datos visuales a gran escala y de alta calidad del mundo real puede llevar mucho tiempo, ser costoso y, a menudo, plantear problemas de privacidad. Por eso, los investigadores están explorando activamente el concepto de aprovechar los datos sintéticos.
Los datos sintéticos son imágenes generadas artificialmente que imitan fielmente las imágenes y vídeos del mundo real. Se crean utilizando técnicas como el modelado 3D, las simulaciones por ordenador y métodos de IA generativa como las redes generativas adversariales (GAN), que aprenden patrones de datos reales para producir nuevos ejemplos realistas.
Se espera que los datos sintéticos desempeñen pronto un papel fundamental en el desarrollo de la IA , y Gartner predice que para 2030 serán más esenciales que los datos del mundo real. En este artículo, exploraremos qué son los datos sintéticos en el contexto de la visión por ordenador, cómo se generan y dónde se están aplicando en escenarios del mundo real. Empecemos.
¿Qué son los datos sintéticos en visión por ordenador?
Supongamos que desea entrenar un modelo de IA de visión para detectar objetos en diversos entornos y condiciones. Basarse únicamente en datos del mundo real puede resultar difícil y, a veces, limitado.
Mientras tanto, pueden utilizarse datos sintéticos para crear el conjunto de datos adecuado, que contenga objetos en diversas condiciones creadas artificialmente. Con herramientas como el modelado 3D y las simulaciones, los desarrolladores pueden generar imágenes con un control preciso de factores como la iluminación, los ángulos y la colocación de los objetos. Esto, a su vez, ofrece más flexibilidad para el entrenamiento de modelos que los datos del mundo real.
Los datos sintéticos son especialmente útiles cuando es difícil o imposible recopilar datos del mundo real. Por ejemplo, entrenar a un modelo para que reconozca a personas en una amplia gama de poses, como corriendo, agachado o tumbado, requeriría capturar miles de fotos en muchos escenarios, ángulos y condiciones de iluminación diferentes.
Por otro lado, con los datos sintéticos, los desarrolladores pueden generar fácilmente estas variaciones con etiquetas precisas, lo que ahorra tiempo y esfuerzo a la vez que mejora el rendimiento del modelo.
Fig. 1. Un conjunto de datos sintéticos con diferentes poses humanas y variaciones de iluminación(fuente).
Datos sintéticos frente a datos reales en la IA
A continuación, analicemos las diferencias entre los datos sintéticos y los datos reales. Ambos tienen sus pros y sus contras a la hora de entrenar modelos de IA.
Por ejemplo, los datos sintéticos son útiles cuando es difícil recopilar datos reales, pero pueden no captar todos los detalles de la vida real. Al mismo tiempo, los datos reales son más auténticos, pero pueden ser difíciles de obtener, llevar mucho tiempo etiquetarlos y no abarcar todas las situaciones.
Al combinar datos sintéticos y reales, los desarrolladores pueden obtener lo mejor de ambos mundos. Este equilibrio ayuda a los modelos de IA a aprender con mayor precisión, generalizar mejor en diferentes escenarios y reducir los sesgos.
Fig. 2. Datos sintéticos frente a datos reales en la IA. Imagen del autor.
Generación de datos para modelos de visión por ordenador
Desde la construcción de mundos virtuales con herramientas 3D hasta la generación de imágenes mediante IA generativa, he aquí algunos métodos habituales utilizados para crear datos sintéticos de entrenamiento para modelos de visión por ordenador:
Modelado 3D: Los desarrolladores utilizan software 3D para crear objetos y escenas digitales. Esto permite un control total sobre aspectos como la iluminación, los ángulos de cámara y la colocación de objetos, y resulta útil para generar imágenes realistas de personas, vehículos y entornos.
Simulaciones: Recrean situaciones del mundo real, como el tráfico o el entorno de una fábrica, utilizando motores basados en la física. Las simulaciones son útiles para generar con seguridad datos de entrenamiento en campos como la robótica y los coches autoconducidos.
Redes generativas adversariales: Las GAN son un tipo de modelo de aprendizaje profundo compuesto por dos redes: una que crea imágenes y otra que las evalúa. Juntas, generan imágenes muy realistas, como rostros humanos o vistas de calles, aprendiendo de ejemplos reales.
Generación por procedimientos: Esta técnica utiliza reglas predefinidas o modelos matemáticos para generar automáticamente estructuras visuales complejas como terrenos, edificios o texturas. Suele emplearse en plataformas de juegos y simulación y puede producir conjuntos de datos diversos y a gran escala con una intervención humana mínima.
Aleatorización de dominios: Puede cambiar aleatoriamente elementos como la iluminación, los colores y las formas de los objetos en escenas sintéticas. El objetivo de esta técnica es ayudar a los modelos a centrarse en lo que realmente importa, haciéndolos más adaptables a los entornos del mundo real.
Fig. 3. Ejemplos de datos: (a) basados en modelos 3D, (b) escenas sintéticas multiobjeto, y (c) imágenes de conjuntos de datos reales(fuente).
Entrenamiento de modelos de IA de visión con datos sintéticos
Ahora que ya hemos hablado de algunos de los diferentes métodos utilizados para crear datos sintéticos, vamos a ver cómo se utilizan para entrenar modelos de IA.
Una vez generados, los datos sintéticos pueden integrarse directamente en el proceso de formación del mismo modo que los datos reales. Suelen incluir las anotaciones necesarias, como etiquetas de objetos, cuadros delimitadores o máscaras de segmentación, lo que significa que pueden utilizarse para tareas de aprendizaje supervisado, en las que los modelos aprenden a partir de pares de entrada-salida etiquetados, sin necesidad de etiquetado manual.
Durante el entrenamiento, el modelo procesa imágenes sintéticas para aprender a detectar características, reconocer patrones y clasificar objetos. Estos datos pueden utilizarse para crear una versión inicial del modelo a partir de cero o para enriquecer un conjunto de datos existente, lo que ayuda a mejorar el rendimiento del modelo.
En muchos flujos de trabajo, los datos sintéticos también se utilizan para el preentrenamiento, proporcionando a los modelos una amplia comprensión básica antes de ser afinados con ejemplos del mundo real. Del mismo modo, se utilizan para aumentar los conjuntos de datos introduciendo variaciones controladas, como diferentes condiciones de iluminación, ángulos o clases de objetos poco comunes, para mejorar la generalización y reducir el sobreajuste.
Combinando datos sintéticos y reales, los equipos pueden entrenar modelos más sólidos que funcionen bien en una amplia gama de condiciones, al tiempo que reducen la dependencia de las laboriosas y costosas tareas de recopilación manual de datos.
Aplicaciones reales de los datos sintéticos en visión por ordenador
A medida que los datos sintéticos se vuelven más prácticos y accesibles, empezamos a ver cómo se adoptan en una gran variedad de casos de uso de la IA de visión en el mundo real. Exploremos algunas de las aplicaciones de visión por ordenador más impactantes en las que se está utilizando.
Uso de datos sintéticos para la detección de objetos en vehículos autónomos
Enseñar a los coches autoconducidos a conducir de forma segura requiere entrenar los modelos en una amplia gama de escenarios, incluidas situaciones raras o peligrosas. Sin embargo, recopilar datos del mundo real para estos casos extremos puede resultar complicado y, en ocasiones, inseguro. Los datos sintéticos pueden ayudar a crear escenas en las que los modelos aprendan a detectar objetos en situaciones difíciles. También pueden imitar distintas configuraciones de sensores, lo que resulta útil porque no todos los coches autoconducidos utilizan el mismo hardware.
La plataforma DRIVE Sim de NVIDIA es un buen ejemplo de ello. Crea datos sintéticos de alta calidad utilizando modelos 3D fotorrealistas, entornos virtuales y simulaciones de sensores. También puede generar imágenes de múltiples ángulos de conducción a partir de una sola imagen. El uso de datos sintéticos de este tipo ayuda a reducir la necesidad de costosas pruebas en el mundo real, al tiempo que proporciona al modelo la variedad que necesita para aprender con eficacia.
Fig. 4. Creación de varias vistas de conducción a partir de una imagen(fuente).
Reducción del sesgo en la IA de imágenes médicas con datos sintéticos
Los modelos de visión artificial como Ultralytics YOLO11, que admiten tareas como la detección de objetos y la segmentación de instancias, pueden entrenarse a medida para aplicaciones de imágenes médicas. Sin embargo, los datos de entrenamiento del mundo real suelen contener sesgos, ya que pueden no representar adecuadamente a pacientes de todos los grupos demográficos.
Por ejemplo, el cáncer de piel se diagnostica con menos frecuencia en individuos con tonos de piel más oscuros, lo que da lugar a datos limitados para esas poblaciones. Este desequilibrio puede contribuir a diagnósticos erróneos y a resultados sanitarios desiguales, sobre todo en campos como la histopatología, las radiografías de tórax y la dermatología.
Las imágenes sintéticas pueden contribuir a colmar esta laguna de datos. Al generar ejemplos adicionales y diversos, como anomalías tisulares variadas, una amplia gama de afecciones pulmonares y tonos de piel con distintos tipos de lesiones, los datos sintéticos pueden ayudar a mejorar el rendimiento de los modelos en los grupos infrarrepresentados.
Los investigadores trabajan actualmente en el desarrollo y validación de conjuntos de datos sintéticos para apoyar estos objetivos. También están estudiando cómo pueden utilizarse los datos sintéticos para probar herramientas médicas y estrategias de tratamiento sin depender de historiales de pacientes reales, lo que ayuda a acelerar la investigación al tiempo que se protege la intimidad del paciente. Gracias a este trabajo, los datos sintéticos están allanando el camino hacia sistemas de IA médica más inclusivos, precisos y éticos.
Avance de la IA agrícola con datos sintéticos para la agricultura de precisión
La creación de sistemas de IA de visión para aplicaciones agrícolas depende del acceso a grandes cantidades de datos etiquetados. Sin embargo, recopilar y etiquetar imágenes de cultivos, enfermedades y condiciones del campo es lento, caro y a menudo limitado por factores como el clima, las estaciones de crecimiento o la dificultad para llegar a determinadas zonas.
Estos retos dificultan el entrenamiento de modelos de visión artificial para tareas como la detección de enfermedades de las plantas, la vigilancia de los cultivos o la predicción de rendimientos. Ahí es donde los datos sintéticos pueden ayudar, imitando distintos entornos agrícolas para generar ejemplos de entrenamiento útiles.
Fig. 5. Uso de imágenes sintéticas para mejorar la detección de enfermedades(fuente).
Principales conclusiones
El uso de datos sintéticos representa un importante paso adelante en el entrenamiento de modelos de IA, especialmente para los sistemas de visión por ordenador en áreas en las que los datos del mundo real son limitados o difíciles de obtener. En lugar de depender únicamente de fotos o vídeos reales, que pueden ser caros, llevar mucho tiempo o plantear problemas de privacidad, los datos sintéticos nos permiten generar imágenes realistas y etiquetadas a la carta.
Facilita el entrenamiento de modelos de IA de visión para tareas como la conducción autónoma, la detección de enfermedades o la supervisión de cultivos. A medida que la IA siga evolucionando, los datos sintéticos desempeñarán un papel aún más importante en la aceleración de la innovación y la mejora de la accesibilidad en todos los sectores.