La importancia de los conjuntos de datos de visión por ordenador de alta calidad

Abirami Vina

4 min leer

16 de diciembre de 2024

Únase a nosotros para explorar la necesidad de datos de alta calidad a la hora de crear modelos de visión por ordenador. Descubra cómo la calidad de los datos puede afectar al rendimiento del modelo.

En 2019, la adopción de la inteligencia artificial (IA) en las empresas había aumentado un 270% en los cuatro años anteriores. Este crecimiento ha impulsado la rápida integración de aplicaciones de visión por ordenador (CV), sistemas de IA que permiten a las máquinas interpretar y analizar datos visuales del mundo que les rodea. Estas aplicaciones impulsan una amplia gama de tecnologías, desde la detección de enfermedades en imágenes médicas y la habilitación de vehículos autónomos hasta la optimización del flujo de tráfico en el transporte y la mejora de la vigilancia en los sistemas de seguridad. 

La notable precisión y el inigualable rendimiento de modelos de visión por ordenador de última generación como Ultralytics YOLO11 han impulsado en gran medida este crecimiento exponencial. Sin embargo, el rendimiento de estos modelos depende en gran medida de la calidad y la cantidad de los datos utilizados para entrenar, validar y probar los modelos. 

Sin suficientes datos de alta calidad, los modelos de visión por ordenador pueden ser difíciles de entrenar y ajustar con eficacia para cumplir los estándares de la industria. En este artículo, exploraremos el papel vital de los datos en la creación de modelos de visión por ordenador y por qué los datos de alta calidad son tan importantes en la visión por ordenador. También daremos algunos consejos para ayudarle a crear conjuntos de datos de alta calidad mientras trabaja en el entrenamiento de modelos de visión por ordenador personalizados. Empecemos.

El papel de los datos en la creación de modelos de visión por ordenador

Los modelos de visión por ordenador pueden entrenarse con grandes conjuntos de datos de imágenes y vídeos para reconocer patrones y hacer predicciones precisas. Por ejemplo, un modelo de detección de objetos puede entrenarse con cientos, o incluso miles, de imágenes y vídeos etiquetados para identificar objetos con precisión. 

La calidad y la cantidad de estos datos de entrenamiento influyen en el rendimiento del modelo

Dado que los modelos de visión por ordenador sólo pueden aprender de los datos a los que están expuestos, proporcionar datos de alta calidad y ejemplos diversos es crucial para su éxito. Sin conjuntos de datos suficientes y diversos, estos modelos pueden no analizar con precisión escenarios del mundo real y producir resultados sesgados o inexactos. 

Por eso es importante entender claramente el papel de los datos en el entrenamiento de modelos . Antes de repasar las características de los datos de alta calidad, conozcamos los tipos de conjuntos de datos que podemos encontrarnos al entrenar modelos de visión por ordenador.

Tipos de conjuntos de datos de visión por ordenador

En visión por ordenador, los datos utilizados en el proceso de formación se clasifican en tres tipos, cada uno de los cuales tiene una finalidad específica. He aquí un rápido vistazo a cada tipo:

  • Datos de formación: Se trata del principal conjunto de datos utilizado para entrenar el modelo desde cero. Consiste en imágenes y vídeos con etiquetas predefinidas, que permiten al modelo aprender patrones y reconocer objetos.
  • Datos de validación: Se trata de un conjunto de datos utilizados para comprobar el rendimiento de un modelo mientras se entrena. Ayuda a garantizar que el modelo funciona correctamente con datos nuevos y desconocidos.
  • Datos de prueba: Conjunto independiente de datos que se utiliza para evaluar el rendimiento final de un modelo entrenado. Comprueba hasta qué punto el modelo puede hacer predicciones con datos completamente nuevos y desconocidos.
__wf_reserved_inherit
Fig. 1. Cómo se clasifican los datos en visión por ordenador.

Las 5 características principales de los conjuntos de datos de visión por ordenador de alta calidad

Independientemente del tipo de conjunto de datos, los datos de alta calidad son esenciales para crear modelos de visión por ordenador satisfactorios. Estas son algunas de las características clave que hacen que un conjunto de datos sea de alta calidad:

  • Precisión: Lo ideal es que los datos reflejen fielmente situaciones del mundo real e incluyan etiquetas correctas. Por ejemplo, cuando se trata de la IA de visión en la sanidad, las imágenes de radiografías o escáneres deben estar etiquetadas con precisión para ayudar al modelo a aprender correctamente.
  • Diversidad: Un buen conjunto de datos incluye una variedad de ejemplos para ayudar al modelo a funcionar bien en diferentes situaciones. Por ejemplo, si un modelo está aprendiendo a detectar coches, el conjunto de datos debe incluir coches de diferentes formas, tamaños y colores en varios escenarios (día, noche, lluvia, etc.).
  • Coherencia: Los conjuntos de datos de alta calidad siguen un formato y unas normas de calidad uniformes. Por ejemplo, las imágenes deben tener resoluciones similares (no unas borrosas y otras nítidas) y pasar por los mismos pasos de preprocesamiento, como el cambio de tamaño o los ajustes de color, para que el modelo aprenda a partir de información coherente.
  • Puntualidad: Los conjuntos de datos que se actualizan periódicamente pueden seguir el ritmo de los cambios del mundo real. Supongamos que se está entrenando un modelo para detectar todo tipo de vehículos. Si se introducen otros nuevos, como los patinetes eléctricos, deben añadirse al conjunto de datos para asegurarse de que el modelo sigue siendo preciso y está actualizado.
  • Privacidad: Si un conjunto de datos incluye información sensible, como fotos de personas, debe respetar las normas de privacidad. Técnicas como la anonimización (supresión de detalles identificables) y el enmascaramiento de datos (ocultación de partes sensibles) pueden proteger la privacidad al tiempo que permiten utilizar los datos de forma segura.

Dificultades causadas por datos de baja calidad

Si bien es importante conocer las características de los datos de alta calidad, también es fundamental tener en cuenta cómo los datos de baja calidad pueden afectar a los modelos de visión por ordenador.

Problemas como la sobreadaptación o la inadaptación pueden afectar gravemente al rendimiento del modelo. El sobreajuste se produce cuando un modelo funciona bien con datos de entrenamiento, pero tiene dificultades con datos nuevos o desconocidos, a menudo porque el conjunto de datos carece de variedad. Por otro lado, el infraajuste se produce cuando el conjunto de datos no proporciona suficientes ejemplos o calidad para que el modelo aprenda patrones significativos. Para evitar estos problemas, es esencial mantener conjuntos de datos diversos, imparciales y de alta calidad, que garanticen un rendimiento fiable tanto en el entrenamiento como en las aplicaciones del mundo real.

__wf_reserved_inherit
Fig. 2. Infraajuste Vs. sobreajuste.

Los datos de baja calidad también pueden dificultar que los modelos extraigan y aprendan patrones significativos de los datos brutos, un proceso conocido como extracción de características. Si el conjunto de datos está incompleto, es irrelevante o carece de diversidad, el modelo puede tener dificultades para funcionar con eficacia. 

A veces, los datos de baja calidad pueden ser el resultado de simplificarlos. Simplificar los datos puede ayudar a ahorrar espacio de almacenamiento y reducir los costes de procesamiento, pero una simplificación excesiva puede eliminar detalles importantes que el modelo necesita para funcionar bien. Por eso es tan importante mantener datos de alta calidad a lo largo de todo el proceso de visión por ordenador, desde la recopilación hasta la implementación. Como regla general, los conjuntos de datos deben incluir características esenciales y, al mismo tiempo, ser diversos y precisos para garantizar predicciones fiables del modelo.

__wf_reserved_inherit
Fig. 3. Comprensión de la extracción de características.

Consejos para mantener la calidad de su conjunto de datos de visión por ordenador

Ahora que hemos comprendido la importancia de los datos de alta calidad y el impacto de los datos de baja calidad, vamos a explorar cómo asegurarse de que su conjunto de datos cumple con altos estándares.

Todo comienza con una recopilación de datos fiable. El uso de diversas fuentes, como el crowdsourcing, los datos de distintas regiones geográficas y la generación de datos sintéticos , reduce el sesgo y ayuda a los modelos a manejar escenarios del mundo real. Una vez recopilados los datos, el preprocesamiento es fundamental. Técnicas como la normalización, que escala los valores de los píxeles a un rango coherente, y el aumento, que aplica transformaciones como la rotación, el giro y el zoom, mejoran el conjunto de datos. Estos pasos ayudan a que el modelo se generalice mejor y sea más robusto, reduciendo el riesgo de sobreajuste.

La división adecuada de los conjuntos de datos es otro paso clave. Un enfoque común consiste en asignar el 70% de los datos a la formación, el 15% a la validación y el 15% a las pruebas. Comprobar dos veces que no hay solapamiento entre estos conjuntos evita la fuga de datos y garantiza una evaluación precisa del modelo.

__wf_reserved_inherit
Fig. 4. Una división común de datos entre entrenamiento, validación y prueba.

También puede utilizar modelos preentrenados como YOLO11 para ahorrar tiempo y recursos informáticos. YOLO11, entrenado en grandes conjuntos de datos y diseñado para diversas tareas de visión por ordenador, puede ajustarse en su conjunto de datos específico para satisfacer sus necesidades. Al ajustar el modelo a sus datos, puede evitar el sobreajuste y mantener un rendimiento sólido. 

El futuro de los conjuntos de datos de visión por ordenador

La comunidad de la IA se ha centrado tradicionalmente en mejorar el rendimiento construyendo modelos más profundos con más capas. Sin embargo, a medida que la IA sigue evolucionando, la atención está pasando de la optimización de los modelos a la mejora de la calidad de los conjuntos de datos. Andrew Ng, a menudo conocido como el "padre de la IA", cree que "el cambio más importante que debe experimentar el mundo de la IA en esta década será el paso a una IA centrada en los datos". 

Este enfoque hace hincapié en refinar los conjuntos de datos mejorando la precisión de las etiquetas, eliminando los ejemplos ruidosos y garantizando la diversidad. En el caso de la visión por ordenador, estos principios son fundamentales para resolver problemas como los sesgos y los datos de baja calidad, lo que permite que los modelos funcionen de forma fiable en situaciones reales.

De cara al futuro, el avance de la visión por ordenador dependerá de la creación de conjuntos de datos más pequeños y de alta calidad, en lugar de recopilar grandes cantidades de datos. Según Andrew Ng, "la mejora de los datos no es un paso único de preprocesamiento; es una parte fundamental del proceso iterativo de desarrollo de modelos de aprendizaje automático ". Al centrarse en los principios centrados en los datos, la visión por ordenador seguirá siendo más accesible, eficiente e impactante en diversas industrias.

Principales conclusiones

Los datos desempeñan un papel fundamental a lo largo del ciclo de vida de un modelo de visión. Desde la recopilación de datos hasta el preprocesamiento, el entrenamiento, la validación y las pruebas, la calidad de los datos influye directamente en el rendimiento y la fiabilidad del modelo. Si damos prioridad a los datos de alta calidad y al etiquetado preciso, podemos crear modelos de visión por ordenador robustos que ofrezcan resultados fiables y precisos. 

A medida que avanzamos hacia un futuro basado en los datos, es esencial abordar las consideraciones éticas para mitigar los riesgos relacionados con la parcialidad y la normativa sobre privacidad. En última instancia, garantizar la integridad e imparcialidad de los datos es clave para liberar todo el potencial de las tecnologías de visión computerizada.

Únase a nuestra comunidad y consulte nuestro repositorio de GitHub para obtener más información sobre la IA. Consulte nuestras páginas de soluciones para explorar más aplicaciones de IA en sectores como la agricultura y la fabricación.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles