¡Libera el poder de los datos sintéticos para la IA/ML! Supera la escasez de datos, los problemas de privacidad y los costes, a la vez que impulsas el entrenamiento de modelos y la innovación.
Los datos sintéticos se refieren a la información generada artificialmente que imita las propiedades estadísticas de los datos del mundo real, en lugar de recogerse directamente de hechos o mediciones reales. En los campos de la Inteligencia Artificial (IA) y el Aprendizaje Automático (AM), los datos sintéticos sirven como alternativa o complemento crucial a los datos de entrenamiento reales. Son especialmente valiosos cuando recopilar suficientes datos del mundo real es difícil, caro, lleva mucho tiempo(Guía de Recopilación y Anotación de Datos), o plantea problemas de privacidad de los datos. Esta información creada artificialmente ayuda a entrenar modelos como Ultralytics YOLOprobar sistemas y explorar escenarios que podrían ser raros o peligrosos en la realidad, impulsando en última instancia la innovación y el rendimiento de los modelos.
La generación de datos sintéticos emplea diversas técnicas, según la complejidad y fidelidad requeridas. Algunos enfoques habituales son
Los datos sintéticos ofrecen varias ventajas significativas para el desarrollo de la IA y la visión por ordenador:
En visión por ordenador, las imágenes sintéticas se utilizan con frecuencia para entrenar modelos para tareas como la detección de objetos, la segmentación de imágenes y la estimación de poses en condiciones diversas (por ejemplo, iluminación variable, condiciones meteorológicas, puntos de vista) que pueden ser difíciles de encontrar en los conjuntos de datos disponibles.
Los datos sintéticos se aplican en numerosos sectores:
Otras aplicaciones son la modelización financiera(AI in Finance), el comercio minorista(AI for Smarter Retail) y la formación en robótica.
Aunque tanto los datos sintéticos como el aumento de datos pretenden mejorar los conjuntos de datos, son conceptos distintos:
En esencia, el aumento de datos amplía la varianza en torno a los datos existentes, mientras que los datos sintéticos pueden crear puntos de datos y escenarios totalmente novedosos, ofreciendo una potente forma de complementar o incluso sustituir los datos reales en el entrenamiento de modelos de IA gestionados a través de plataformas como Ultralytics HUB.