Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Configuración de cookies
Al hacer clic en “Aceptar todas las cookies”, aceptas el almacenamiento de cookies en tu dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y ayudar en nuestros esfuerzos de marketing. Más información
Explore cómo los datos sintéticos para el entrenamiento de modelos de IA se utilizan en aplicaciones de visión artificial en una variedad de industrias como la atención médica y la robótica.
Los datos siempre han sido un factor impulsor en campos como el análisis y la inteligencia artificial (IA). De hecho, la forma en que recopilamos, generamos y utilizamos los datos está configurando el futuro de los sistemas inteligentes. Por ejemplo, los coches autónomos dependen de millones de imágenes etiquetadas y lecturas de sensores, desde señales de tráfico hasta movimientos de peatones, para aprender a circular por las carreteras de forma segura.
Uno de los tipos de datos más importantes que impulsan este progreso, especialmente en áreas como los vehículos autónomos y la seguridad, son los datos visuales como imágenes y vídeos.
En particular, el campo de la IA que permite a las máquinas interpretar esta información visual se llama visión artificial. Ayuda a los sistemas a comprender y analizar las entradas visuales de forma muy parecida a como lo hacen los humanos, lo que respalda tareas como el reconocimiento facial, la detección de señales de tráfico y el análisis de imágenes médicas.
Sin embargo, recopilar conjuntos de datos visuales a gran escala y de alta calidad del mundo real puede llevar mucho tiempo, ser costoso y, a menudo, plantear problemas de privacidad. Es por eso que los investigadores están explorando activamente el concepto de aprovechar los datos sintéticos.
Los datos sintéticos se refieren a visualizaciones generadas artificialmente que imitan fielmente imágenes y vídeos del mundo real. Se crean utilizando técnicas como el modelado 3D, simulaciones por ordenador y métodos de IA generativa como las Redes Generativas Antagónicas (GANs), que aprenden patrones de datos reales para producir nuevos ejemplos realistas.
Se espera que los datos sintéticos desempeñen un papel fundamental en el desarrollo de la IA en el futuro cercano; Gartner predice que para 2030, se volverán más esenciales que los datos del mundo real. En este artículo, exploraremos qué son los datos sintéticos en el contexto de la visión artificial, cómo se generan y dónde se están aplicando en escenarios del mundo real. ¡Empecemos!
¿Qué son los datos sintéticos en la visión artificial?
Supongamos que desea entrenar un modelo de IA de visión para detectar objetos en diversos entornos y condiciones. Depender únicamente de datos del mundo real puede ser difícil y, a veces, limitante.
Mientras tanto, los datos sintéticos se pueden utilizar para crear el conjunto de datos adecuado, que contenga objetos en diversas condiciones creadas artificialmente. Utilizando herramientas como el modelado 3D y las simulaciones, los desarrolladores pueden generar imágenes con un control preciso sobre factores como la iluminación, los ángulos y la colocación de los objetos. Esto, a su vez, ofrece más flexibilidad para el entrenamiento del modelo que los datos del mundo real.
Los datos sintéticos son especialmente útiles cuando la recopilación de datos del mundo real es difícil o imposible. Por ejemplo, entrenar un modelo para reconocer a personas en una amplia gama de poses, como correr, agacharse o estar acostado, requeriría capturar miles de fotos en muchos entornos, ángulos y condiciones de iluminación diferentes.
Por otro lado, con los datos sintéticos, los desarrolladores pueden generar fácilmente estas variaciones con etiquetas precisas, ahorrando tiempo y esfuerzo a la vez que mejoran el rendimiento del modelo.
Fig 1. Un conjunto de datos sintéticos con diferentes poses humanas y variaciones de iluminación (fuente).
Datos sintéticos vs. datos reales en la IA
A continuación, analicemos más de cerca las diferencias entre los datos sintéticos y los datos reales. Ambos tienen sus pros y sus contras a la hora de entrenar modelos de IA.
Por ejemplo, los datos sintéticos son útiles cuando los datos reales son difíciles de recopilar, pero es posible que no capturen cada pequeño detalle que se encuentra en la vida real. Al mismo tiempo, los datos reales son más auténticos, pero puede ser difícil obtenerlos, lleva mucho tiempo etiquetarlos y es posible que no cubran todas las situaciones.
Al combinar datos sintéticos y reales, los desarrolladores pueden obtener lo mejor de ambos mundos. Este equilibrio ayuda a los modelos de IA a aprender con mayor precisión, a generalizar mejor en diferentes escenarios y a reducir el sesgo.
Fig. 2. Datos sintéticos vs. datos reales en IA. Imagen del autor.
Una mirada a la generación de datos para modelos de visión artificial
Desde la construcción de mundos virtuales con herramientas 3D hasta la generación de imágenes utilizando IA generativa, estos son algunos métodos comunes utilizados para crear datos de entrenamiento sintéticos para modelos de visión artificial:
Modelado 3D: Los desarrolladores utilizan software 3D para crear objetos y escenas digitales. Esto permite un control total sobre aspectos como la iluminación, los ángulos de cámara y la colocación de objetos, y es útil para generar imágenes realistas de personas, vehículos y entornos.
Simulaciones: Recrean situaciones del mundo real, como el tráfico o los entornos de fábrica, utilizando motores basados en la física. Las simulaciones son útiles para generar de forma segura datos de entrenamiento en campos como la robótica y los coches autónomos.
Redes generativas antagónicas: Las GAN son un tipo de modelo de aprendizaje profundo formado por dos redes: una que crea imágenes y otra que las evalúa. Juntas, generan imágenes muy realistas, como rostros humanos o vistas de calles, aprendiendo de ejemplos reales.
Generación procedimental: Esta técnica utiliza reglas predefinidas o modelos matemáticos para generar automáticamente estructuras visuales complejas como terrenos, edificios o texturas. Se utiliza a menudo en plataformas de juegos y simulación y puede producir conjuntos de datos diversos a gran escala con una mínima intervención humana.
Aleatorización de dominio: Puede cambiar aleatoriamente cosas como la iluminación, los colores y las formas de los objetos en escenas sintéticas. El objetivo detrás de esta técnica es ayudar a los modelos a centrarse en lo que realmente importa, haciéndolos más adaptables a los entornos del mundo real.
Fig. 3. Ejemplos de datos: (a) basado en modelos 3D, (b) escenas sintéticas de múltiples objetos y (c) imágenes de conjuntos de datos reales (fuente).
Entrenamiento de modelos de IA de visión con datos sintéticos
Ahora que hemos hablado de algunos de los diferentes métodos utilizados para crear datos sintéticos, veamos cómo se utilizan para entrenar modelos de IA.
Una vez generados, los datos sintéticos normalmente se pueden integrar directamente en el pipeline de entrenamiento de la misma forma que los datos del mundo real. Normalmente incluye las anotaciones necesarias, como etiquetas de objetos, bounding boxes o máscaras de segmentación, lo que significa que se puede utilizar para tareas de aprendizaje supervisado, donde los modelos aprenden de pares entrada-salida etiquetados, sin necesidad de etiquetado manual.
Durante el entrenamiento, el modelo procesa imágenes sintéticas para aprender a detectar características, reconocer patrones y clasificar objetos. Estos datos pueden utilizarse para construir una versión inicial del modelo desde cero o para enriquecer un conjunto de datos existente, lo que ayuda a mejorar el rendimiento del modelo.
En muchos flujos de trabajo, los datos sintéticos también se utilizan para el preentrenamiento, lo que proporciona a los modelos una amplia comprensión fundamental antes de ser ajustados con ejemplos del mundo real. Del mismo modo, se utiliza para aumentar los conjuntos de datos mediante la introducción de variaciones controladas, como diferentes condiciones de iluminación, ángulos o clases de objetos raros, para mejorar la generalización y reducir el sobreajuste.
Al combinar datos sintéticos y reales, los equipos pueden entrenar modelos más robustos que funcionen bien en una amplia gama de condiciones, a la vez que reducen la dependencia de los esfuerzos de recopilación manual de datos, que requieren mucho tiempo y son costosos.
Aplicaciones reales de los datos sintéticos en la visión artificial
A medida que los datos sintéticos se vuelven más prácticos y accesibles, estamos comenzando a ver que se adoptan en una variedad de casos de uso de Vision AI del mundo real. Exploremos algunas de las aplicaciones en visión artificial más impactantes donde se está utilizando.
Uso de datos sintéticos para la detección de objetos en vehículos autónomos
Enseñar a los coches autónomos a conducir de forma segura requiere entrenar modelos en una amplia gama de escenarios, incluyendo situaciones raras o peligrosas. Sin embargo, la recopilación de datos del mundo real para estos casos extremos puede ser un desafío y, a veces, insegura. Los datos sintéticos pueden ayudar a crear escenas donde los modelos puedan aprender a detectar objetos en situaciones difíciles. También puede imitar diferentes configuraciones de sensores, lo que ayuda porque no todos los coches autónomos utilizan el mismo hardware.
La plataforma DRIVE Sim de NVIDIA es un gran ejemplo de esto. Crea datos sintéticos de alta calidad utilizando modelos 3D fotorrealistas, entornos virtuales y simulaciones de sensores. También puede generar imágenes de múltiples ángulos de conducción a partir de una sola imagen. El uso de datos sintéticos como este ayuda a reducir la necesidad de costosas pruebas en el mundo real, a la vez que proporciona al modelo la variedad que necesita para aprender eficazmente.
Fig. 4. Creación de múltiples vistas de conducción a partir de una imagen (fuente).
Reducción del sesgo en la IA de imágenes médicas con datos sintéticos
Los modelos de visión artificial como Ultralytics YOLO11 que admiten tareas como la detección de objetos y la segmentación de instancias pueden entrenarse a medida para aplicaciones de imágenes médicas. Sin embargo, los datos de entrenamiento del mundo real a menudo contienen sesgos, ya que pueden no representar adecuadamente a pacientes de todos los grupos demográficos.
Por ejemplo, el cáncer de piel se diagnostica con menos frecuencia en personas con tonos de piel más oscuros, lo que lleva a datos limitados para esas poblaciones. Este desequilibrio puede contribuir a diagnósticos erróneos y a resultados sanitarios desiguales, especialmente en campos como la histopatología, las radiografías de tórax y la dermatología.
Las imágenes sintéticas pueden desempeñar un papel para dar un paso hacia el cierre de esta brecha en los datos. Al generar ejemplos adicionales y diversos, como anomalías tisulares variadas, una amplia gama de afecciones pulmonares y tonos de piel con diferentes tipos de lesiones, los datos sintéticos pueden ayudar a mejorar el rendimiento del modelo en grupos subrepresentados.
Actualmente, los investigadores están trabajando en el desarrollo y la validación de conjuntos de datos sintéticos para respaldar estos objetivos. También están explorando cómo se pueden utilizar los datos sintéticos para probar herramientas médicas y estrategias de tratamiento sin depender de registros reales de pacientes, lo que ayuda a acelerar la investigación al tiempo que se protege la privacidad del paciente. A través de este trabajo, los datos sintéticos están allanando el camino para sistemas de IA médica más inclusivos, precisos y éticos.
Avance de la IA agrícola con datos sintéticos para la agricultura de precisión
La construcción de sistemas de Visión Artificial para aplicaciones agrícolas depende del acceso a grandes cantidades de datos etiquetados. Sin embargo, la recopilación y el etiquetado de imágenes de cultivos, enfermedades y condiciones de campo es lento, costoso y, a menudo, limitado por factores como el clima, las estaciones de crecimiento o la dificultad para llegar a ciertas áreas.
Estos desafíos dificultan el entrenamiento de modelos de visión artificial para manejar tareas como la detección de enfermedades de las plantas, el monitoreo de cultivos o la predicción de rendimientos. Ahí es donde los datos sintéticos pueden ayudar, imitando diferentes entornos agrícolas para generar ejemplos de entrenamiento útiles.
Fig. 5. Uso de imágenes sintéticas para mejorar la detección de enfermedades (fuente).
Conclusiones clave
El uso de datos sintéticos representa un importante paso adelante en el entrenamiento de modelos de IA, especialmente para los sistemas de visión artificial en áreas donde los datos del mundo real son limitados o difíciles de obtener. En lugar de depender únicamente de fotos o vídeos reales, que pueden ser caros, consumir mucho tiempo o plantear problemas de privacidad, los datos sintéticos nos permiten generar imágenes realistas y etiquetadas bajo demanda.
Facilita el entrenamiento de modelos de Visión Artificial para tareas como la conducción autónoma, la detección de enfermedades o el monitoreo de cultivos. A medida que la IA continúa evolucionando, los datos sintéticos están destinados a desempeñar un papel aún mayor en la aceleración de la innovación y la mejora de la accesibilidad en todas las industrias.