Glosario

Conjunto de datos de referencia

Descubra cómo los conjuntos de datos de referencia impulsan la innovación en IA al permitir la evaluación justa de modelos, la reproducibilidad y el progreso en el aprendizaje automático.

Un conjunto de datos de referencia es un conjunto de datos estandarizado y de alta calidad que se utiliza en el aprendizaje automático (AM) para evaluar y comparar el rendimiento de diferentes algoritmos y modelos de una manera justa y reproducible. Estos conjuntos de datos, cuidadosamente seleccionados y ampliamente aceptados por la comunidad investigadora, sirven de base común para medir el progreso en tareas específicas como la detección de objetos o la clasificación de imágenes. Al probar los modelos con los mismos datos y métricas de evaluación, los investigadores y desarrolladores pueden determinar objetivamente qué enfoques son más eficaces, más rápidos o más eficientes. El uso de puntos de referencia es fundamental para avanzar en el estado del arte de la inteligencia artificial (IA).

La importancia de la evaluación comparativa

En el campo de la visión por ordenador (VC), en rápida evolución, los conjuntos de datos de referencia son indispensables. Proporcionan una base estable para evaluar las mejoras e innovaciones de los modelos. Sin ellos, sería difícil saber si una nueva arquitectura de modelo o técnica de entrenamiento representa realmente un avance o si su rendimiento se debe simplemente a que se ha probado en un conjunto de datos diferente y potencialmente más fácil. Las tablas de clasificación públicas, a menudo asociadas a retos como el ImageNet Large Scale Visual Recognition Challenge (ILSVRC), utilizan estos conjuntos de datos para fomentar una competencia sana y realizar un seguimiento transparente de los progresos. Este proceso fomenta el desarrollo de modelos más sólidos y generalizables, lo que resulta crucial para la implantación de modelos en el mundo real.

Ejemplos reales

  1. Comparación de modelos de detección de objetos: Cuando Ultralytics desarrolla un nuevo modelo como YOLO11, su rendimiento se prueba rigurosamente en conjuntos de datos de referencia estándar como COCO. Los resultados, medidos por parámetros como la precisión media (mAP), se comparan con las versiones anteriores(YOLOv8, YOLOv10) y con otros modelos de última generación. Estas comparaciones de modelos ayudan a los usuarios a elegir el que mejor se adapta a sus necesidades. Plataformas como Ultralytics HUB permiten a los usuarios entrenar modelos y compararlos con datos personalizados.
  2. Avance de la conducción autónoma: Las empresas que desarrollan tecnología para vehículos autónomos dependen en gran medida de referencias como Argoverse o nuScenes. Estos conjuntos de datos contienen escenarios complejos de conducción urbana con anotaciones detalladas de coches, peatones y ciclistas. Al evaluar sus modelos de percepción con estas pruebas de referencia, las empresas pueden medir las mejoras en la precisión de la detección, la fiabilidad del seguimiento y la solidez general del sistema, lo que es fundamental para garantizar la seguridad en la IA de los coches autónomos.

Comparación con otros conjuntos de datos

Es importante distinguir los conjuntos de datos de referencia de otras divisiones de datos utilizadas en el ciclo de vida de ML:

  • Datos de formación: Se utilizan para enseñar el modelo ajustando sus parámetros en función de los ejemplos de entrada y sus etiquetas correspondientes. Suele ser la mayor parte de los datos. Aquí suelen aplicarse técnicas como el aumento de datos.
  • Datos de validación: Se utilizan durante el entrenamiento para ajustar los hiperparámetros del modelo (como la tasa de aprendizaje o las opciones de arquitectura) y proporcionar una estimación no sesgada de la habilidad del modelo. Ayuda a evitar el sobreajuste de los datos de entrenamiento.
  • Datos de prueba: Se utilizan una vez que el modelo está completamente entrenado para proporcionar una evaluación final e imparcial de su rendimiento en datos no vistos.

Aunque un conjunto de datos de referencia suele servir como conjunto de pruebas estandarizado, su objetivo principal es más amplio: proporcionar un estándar común para la comparación entre toda la comunidad investigadora. Muchos conjuntos de datos de referencia se enumeran y rastrean en plataformas como Papers with Code, que alberga tablas de clasificación para diversas tareas de ML. Otros conjuntos de datos destacados son Open Images V7 de Google y el desafío Pascal VOC. El acceso a estos conjuntos de datos de visión por ordenador de alta calidad es esencial para cualquier persona que cree sistemas de IA fiables.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles