Glosario

Conjunto de datos de referencia

Descubre cómo los conjuntos de datos de referencia impulsan la innovación en IA al permitir la evaluación justa de modelos, la reproducibilidad y el progreso en el aprendizaje automático.

Un conjunto de datos de referencia es una colección estandarizada de datos utilizados para evaluar y comparar el rendimiento de los modelos de aprendizaje automático (AM). Estos conjuntos de datos son cruciales en el desarrollo de la inteligencia artificial (IA), ya que proporcionan una línea de base coherente y objetiva para medir el rendimiento de diferentes algoritmos en tareas específicas. Los investigadores y desarrolladores utilizan ampliamente los conjuntos de datos de referencia para probar nuevos modelos, validar las mejoras de los existentes, garantizar que los modelos cumplen las normas reconocidas y realizar un seguimiento de los avances dentro de la comunidad de la IA, especialmente en campos como la visión por ordenador (VC).

Importancia de los conjuntos de datos de referencia

Los conjuntos de datos de referencia son fundamentales porque establecen la igualdad de condiciones para la evaluación de modelos. Al utilizar exactamente los mismos datos y criterios de evaluación, los investigadores pueden comparar directa y equitativamente los puntos fuertes y débiles de distintos modelos en condiciones idénticas. Esta práctica promueve la reproducibilidad en la investigación, facilitando que otros verifiquen los resultados y se basen en el trabajo existente. Los puntos de referencia ayudan a identificar las áreas en las que los modelos destacan o tienen dificultades, orientando las futuras direcciones de investigación y los esfuerzos de desarrollo hacia la creación de sistemas de IA más sólidos y fiables. Sirven como hitos, permitiendo a la comunidad medir el progreso a lo largo del tiempo.

Características principales de los conjuntos de datos de referencia

Los conjuntos de datos de referencia de alta calidad suelen compartir varias características clave:

Representatividad: Los datos deben reflejar fielmente los escenarios del mundo real o el dominio del problema específico al que se destina el modelo.
Tamaño y diversidad: Tienen que ser lo suficientemente grandes y diversos para permitir una evaluación significativa y evitar que los modelos se limiten a memorizar los datos(sobreajuste). Los conjuntos de datos de visión por ordenador de alta calidad son esenciales.
Anotaciones claras: Los datos deben estar etiquetados de forma precisa y coherente(etiquetado de datos) según unas directrices bien definidas.
Métricas de evaluación estandarizadas: Los puntos de referencia suelen venir con métricas específicas (por ejemplo, precisión, mAP, IoU) y protocolos de evaluación para garantizar comparaciones coherentes.
Accesibilidad: Deben estar fácilmente disponibles para la comunidad investigadora, a menudo a través de repositorios o retos públicos.

Aplicaciones de los conjuntos de datos de referencia

Los conjuntos de datos de referencia se utilizan ampliamente en diversas tareas de IA y aprendizaje profundo (AD), entre ellas:

Detección de objetos: Los conjuntos de datos como COCO, PASCAL VOC y Open Images V7 son estándar para evaluar modelos que localizan y clasifican objetos en imágenes.
Clasificación de imágenes: ImageNet es quizás el punto de referencia más famoso, que ha impulsado avances significativos en la clasificación de imágenes en categorías predefinidas. Otros son CIFAR-10 y MNIST.
Segmentación de instancias: Las tareas que requieren contornos de objetos a nivel de píxel suelen utilizar puntos de referencia como COCO o LVIS.
Estimación de la pose: Los conjuntos de datos como COCO-Pose se utilizan para evaluar modelos que detectan puntos clave humanos o de objetos.
Tareas específicas de dominio: Existen puntos de referencia especializados para campos como el análisis de imágenes médicas (por ejemplo, el conjunto de datos de detección de tumores cerebrales), la conducción autónoma(Argoverse, nuScenes) y las imágenes aéreas(VisDrone). El conjunto de datosRoboflow 100 proporciona un punto de referencia diverso en múltiples dominios.

Ejemplos reales

Comparación de modelos de detección de objetos: Cuando Ultralytics desarrolla un nuevo modelo como Ultralytics YOLO11su rendimiento se prueba rigurosamente en conjuntos de datos de referencia estándar como COCO. Los resultados (como las puntuaciones mAP) se comparan con versiones anteriores (YOLOv8 YOLOv10) y otros modelos de vanguardia. Estas comparaciones de modelos ayudan a los usuarios a elegir el mejor modelo para sus necesidades específicas, ya sea para la investigación académica o para aplicaciones comerciales. Plataformas como Ultralytics HUB permiten a los usuarios entrenar modelos y, potencialmente, compararlos con datos personalizados.
Avanzar en la conducción autónoma: Las empresas que desarrollan tecnología para vehículos autónomos dependen en gran medida de puntos de referencia como Argoverse o nuScenes. Estos conjuntos de datos contienen complejos escenarios de conducción urbana con anotaciones detalladas de coches, peatones, ciclistas, etc. Al evaluar sus modelos de percepción en estos puntos de referencia, las empresas pueden medir las mejoras en la precisión de la detección, la fiabilidad del seguimiento y la solidez general del sistema, lo que es fundamental para garantizar la seguridad en la IA de los coches autoconducidos.

Comparación con otros conjuntos de datos

Es importante distinguir los conjuntos de datos de referencia de otras divisiones de datos utilizadas en el ciclo de vida del ML:

Datos de entrenamiento: Se utilizan para enseñar el modelo ajustando sus parámetros a partir de los ejemplos de entrada y sus etiquetas correspondientes. Suele ser la mayor parte de los datos. Aquí suelen aplicarse técnicas como el aumento de datos.
Datos de validación: Se utilizan durante el entrenamiento para ajustar los hiperparámetros del modelo (como la velocidad de aprendizaje o las opciones de arquitectura) y proporcionan una estimación no sesgada de la habilidad del modelo mientras se ajusta. Ayuda a evitar el ajuste excesivo a los datos de entrenamiento.
Datos de prueba: Se utilizan una vez que el modelo está totalmente entrenado para proporcionar una evaluación final e imparcial de su rendimiento en datos no vistos. Los conjuntos de datos de referencia suelen servir como conjuntos de pruebas estandarizados para comparar diferentes modelos desarrollados de forma independiente.

Aunque un conjunto de datos de referencia puede utilizarse como conjunto de pruebas, su finalidad principal es más amplia: proporcionar un estándar común para la comparación entre toda la comunidad investigadora, a menudo facilitada por tablas de clasificación públicas asociadas a retos como el Reto de Reconocimiento Visual a Gran Escala de ImageNet (ILSVRC).

Conjunto de datos de referencia

Entrena los modelos YOLO simplemente
con Ultralytics HUB

Solución flexible de licencias empresariales para impulsar tu innovación

Entrena modelos de IA en segundos con Ultralytics YOLO

Entrena modelos YOLO de forma sencilla con Ultralytics HUB

Importancia de los conjuntos de datos de referencia

Características principales de los conjuntos de datos de referencia

Aplicaciones de los conjuntos de datos de referencia

Ejemplos reales

Comparación con otros conjuntos de datos

Leer más blogs

Únete a la comunidad Ultralytics

Conjunto de datos de referencia

Entrena los modelos YOLO simplementecon Ultralytics HUB

Solución flexible de licencias empresariales para impulsar tu innovación

Entrena modelos de IA en segundos con Ultralytics YOLO

Entrena modelos YOLO de forma sencilla con Ultralytics HUB

Importancia de los conjuntos de datos de referencia

Características principales de los conjuntos de datos de referencia

Aplicaciones de los conjuntos de datos de referencia

Ejemplos reales

Comparación con otros conjuntos de datos

Leer más blogs

Únete a la comunidad Ultralytics

Entrena los modelos YOLO simplemente
con Ultralytics HUB