¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glosario

Conjunto de datos de referencia

Descubra cómo los conjuntos de datos de referencia impulsan la innovación en la IA al permitir una evaluación justa de los modelos, la reproducibilidad y el progreso en el aprendizaje automático.

Un conjunto de datos de referencia es un conjunto de datos estandarizado y de alta calidad utilizado en el aprendizaje automático (ML) para evaluar y comparar el rendimiento de diferentes algoritmos y modelos de una manera justa y reproducible. Estos conjuntos de datos están cuidadosamente seleccionados y ampliamente aceptados por la comunidad investigadora, sirviendo como un terreno común para medir el progreso en tareas específicas como la detección de objetos o la clasificación de imágenes. Al probar los modelos con los mismos datos y métricas de evaluación, los investigadores y desarrolladores pueden determinar objetivamente qué enfoques son más efectivos, rápidos o eficientes. El uso de benchmarks es fundamental para avanzar en el estado del arte de la inteligencia artificial (IA).

La importancia del "Benchmarking"

En el campo de la visión artificial (CV), que evoluciona rápidamente, los conjuntos de datos de referencia son indispensables. Proporcionan una línea de base estable para evaluar las mejoras e innovaciones del modelo. Sin ellos, sería difícil saber si una nueva arquitectura de modelo o técnica de entrenamiento realmente representa un avance o si su rendimiento se debe simplemente a que se probó en un conjunto de datos diferente, potencialmente más fácil. Las tablas de clasificación públicas, a menudo asociadas con desafíos como el ImageNet Large Scale Visual Recognition Challenge (ILSVRC), utilizan estos conjuntos de datos para fomentar una competencia sana y realizar un seguimiento transparente del progreso. Este proceso fomenta el desarrollo de modelos más robustos y generalizables, lo cual es crucial para el despliegue de modelos en el mundo real.

Ejemplos del mundo real

  1. Comparación de Modelos de Detección de Objetos: Cuando Ultralytics desarrolla un nuevo modelo como YOLO11, su rendimiento se prueba rigurosamente en conjuntos de datos de referencia estándar como COCO. Los resultados, medidos por métricas como la precisión media promedio (mAP), se comparan con versiones anteriores (YOLOv8, YOLOv10) y otros modelos de última generación. Estas comparaciones de modelos ayudan a los usuarios a elegir el mejor modelo para sus necesidades. Plataformas como Ultralytics HUB permiten a los usuarios entrenar modelos y compararlos con datos personalizados.
  2. Avance de la conducción autónoma: Las empresas que desarrollan tecnología para vehículos autónomos dependen en gran medida de benchmarks como Argoverse o nuScenes. Estos conjuntos de datos contienen escenarios complejos de conducción urbana con anotaciones detalladas para coches, peatones y ciclistas. Al evaluar sus modelos de percepción en estos benchmarks, las empresas pueden medir las mejoras en la precisión de la detección, la fiabilidad del seguimiento y la robustez general del sistema, lo cual es fundamental para garantizar la seguridad en la IA para coches autónomos.

Benchmark vs. Otros conjuntos de datos

Es importante distinguir los conjuntos de datos de referencia de otras divisiones de datos utilizadas en el ciclo de vida del ML:

  • Datos de Entrenamiento: Se utilizan para enseñar al modelo ajustando sus parámetros en función de ejemplos de entrada y sus etiquetas correspondientes. Esta es típicamente la porción más grande de los datos. Técnicas como el aumento de datos se aplican a menudo aquí.
  • Datos de Validación: Se utilizan durante el entrenamiento para ajustar los hiperparámetros del modelo (como la tasa de aprendizaje o las opciones de arquitectura) y proporcionar una estimación imparcial de la habilidad del modelo. Ayuda a prevenir el sobreajuste a los datos de entrenamiento.
  • Datos de Prueba: Se utilizan después de que el modelo esté completamente entrenado para proporcionar una evaluación final e imparcial de su rendimiento en datos no vistos.

Si bien un conjunto de datos de referencia a menudo sirve como un conjunto de pruebas estandarizado, su propósito principal es más amplio: proporcionar un estándar común para la comparación en toda la comunidad de investigación. Muchos conjuntos de datos de referencia se enumeran y rastrean en plataformas como Papers with Code, que alberga tablas de clasificación para diversas tareas de ML. Otros conjuntos de datos notables incluyen Open Images V7 de Google y el desafío Pascal VOC. El acceso a este tipo de conjuntos de datos de visión artificial de alta calidad es esencial para cualquiera que construya sistemas de IA fiables.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles