¡Desbloquea el poder de los datos sintéticos para la IA/ML! Supera la escasez de datos, los problemas de privacidad y los costes, al tiempo que impulsas el entrenamiento y la innovación de los modelos.
Los datos sintéticos son información generada artificialmente que imita las propiedades estadísticas y los patrones de los datos del mundo real. de los datos reales. En los campos del aprendizaje automático (AM) y visión por ordenador (CV), constituyen un potente para desarrollar modelos de alto rendimiento cuando la obtención de datos auténticos es difícil, cara o está restringida por cuestiones de privacidad. por motivos de privacidad. A diferencia de los conjuntos de datos tradicionales recogidos a partir de eventos físicos, los datos sintéticos se programan o simulan, lo que permite a los desarrolladores crear grandes volúmenes de datos. sintéticos se programan o simulan, lo que permite a los desarrolladores crear vastos repositorios de datos de perfectamente etiquetados. Los analistas del sector de Gartner predicen Gartner predicen que, para 2030, los datos sintéticos eclipsarán a los reales en los modelos de IA, impulsando un cambio importante en la forma en que se construyen los sistemas inteligentes. inteligentes.
La creación de conjuntos de datos sintéticos de alta calidad requiere técnicas sofisticadas que van desde la infografía clásica a la IA generativa moderna. Estos métodos garantizan que los datos artificiales sean lo suficientemente diversos como para ayudar a los modelos a generalizar bien en escenarios nuevos y desconocidos.
Los datos sintéticos están revolucionando los sectores en los que la recopilación de datos es un cuello de botella.
Es importante distinguir entre datos sintéticos y aumento de datos, ya que ambos se utilizan para mejorar conjuntos de datos.
Los conjuntos de datos sintéticos tienen el mismo formato que los reales, normalmente con imágenes y los correspondientes archivos de anotaciones. En puede entrenar sin problemas modelos de última generación como YOLO11 en para mejorar el rendimiento en tareas específicas.
El siguiente ejemplo muestra cómo generar una imagen sintética sencilla utilizando código y ejecutar inferencia sobre ella utilizando
el sitio ultralytics paquete.
import cv2
import numpy as np
from ultralytics import YOLO
# 1. Generate a synthetic image (black background, white rectangle)
# This mimics a simple object generation process
synthetic_img = np.zeros((640, 640, 3), dtype=np.uint8)
cv2.rectangle(synthetic_img, (100, 100), (400, 400), (255, 255, 255), -1)
# 2. Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# 3. Run inference on the synthetic data
# The model attempts to detect objects within the generated image
results = model.predict(synthetic_img)
# Display result count
print(f"Detected {len(results[0].boxes)} objects in synthetic image.")