Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Análisis de datos

Descubra cómo el análisis de datos impulsa el éxito de la IA y el ML al optimizar la calidad de los datos, descubrir información valiosa y permitir la toma de decisiones inteligente.

El análisis de datos es el proceso sistemático de inspeccionar, limpiar, transformar y modelar datos para descubrir información útil , sugerir conclusiones y respaldar la toma de decisiones. En el contexto de la tecnología moderna, sirve como columna vertebral para los sistemas de inteligencia artificial (IA) y aprendizaje automático (ML). Al convertir los números sin procesar y las entradas no estructuradas en conocimientos prácticos, el análisis permite a los desarrolladores comprender la calidad de sus datos de entrenamiento antes de que un modelo los vea. Este riguroso examen ayuda a identificar patrones ocultos, mitigar el sesgo de los conjuntos de datos y garantizar que algoritmos como YOLO26 se construyan sobre una base de información de alta integridad .

El ciclo de vida analítico en la IA

El camino desde un conjunto de datos sin procesar hasta un sistema inteligente implementado implica varias etapas analíticas distintas. Por lo general, comienza con el análisis descriptivo, que examina los datos históricos para responder a la pregunta «¿qué ha pasado?». En el caso de la visión artificial, esto puede implicar el uso de herramientas de visualización de datos para representar gráficamente las distribuciones de clases o comprobar si hay desequilibrio entre ellas.

A continuación, el análisis diagnóstico profundiza para comprender «por qué» existen ciertas tendencias, como diagnosticar por qué un modelo sufre sobreajuste en texturas de fondo específicas. Esta etapa se basa en gran medida en técnicas de preprocesamiento de datos para limpiar el ruido y manejar los valores perdidos, a menudo utilizando bibliotecas como Pandas para la manipulación de datos estructurados . Por último, el análisis predictivo utiliza modelos estadísticos para pronosticar resultados futuros, mientras que el análisis prescriptivo sugiere acciones específicas que se deben tomar basándose en esas predicciones.

Aplicaciones en el mundo real

El análisis de datos impulsa la innovación en prácticamente todos los sectores, ya que contribuye al desarrollo de aplicaciones de inteligencia artificial más inteligentes :

  • Diagnóstico sanitario: En el ámbito médico, el análisis es crucial para procesar conjuntos de datos complejos, como el conjunto de datos sobre tumores cerebrales. Mediante el análisis de las correlaciones entre las características de las imágenes y el historial del paciente, los investigadores pueden entrenar YOLO11 para realizar la detección de tumores con una alta sensibilidad. Organizaciones como los Institutos Nacionales de Salud (NIH) confían en estos análisis para avanzar en la medicina de precisión.
  • Optimización minorista: los minoristas aprovechan los análisis para optimizar las cadenas de suministro y personalizar la experiencia del comprador. Al aplicar la detección de objetos a las transmisiones de vídeo de las tiendas, las empresas pueden analizar los patrones de tráfico peatonal y track en tiempo real. Plataformas como Google Retail integran esta información para predecir la demanda, reducir el desperdicio y mejorar la eficiencia operativa.

Análisis del rendimiento de modelos con Python

En el Ultralytics , el análisis se suele realizar durante la fase de validación para comprender en qué medida un modelo se generaliza a nuevos datos. El siguiente ejemplo muestra cómo realizar análisis de diagnóstico mediante la validación de un modelo YOLO26, extrayendo métricas clave como la precisión media (mAP).

from ultralytics import YOLO

# Load a pre-trained YOLO26 model
model = YOLO("yolo26n.pt")

# Run validation on the COCO8 dataset to gather performance analytics
# This generates diagnostic metrics regarding precision, recall, and mAP
metrics = model.val(data="coco8.yaml")

# Print the mAP50-95 metric to analyze overall detection accuracy
print(f"Mean Average Precision (mAP 50-95): {metrics.box.map}")

Distinguir conceptos relacionados

  • Minería de datos: Aunque a menudo se utilizan de forma intercambiable, la minería de datos es un subconjunto específico de la analítica centrado en el descubrimiento automatizado de patrones en conjuntos de datos masivos. Según la definición de Oracle, la minería utiliza algoritmos para examinar el «Big Data», mientras que la analítica general abarca la interpretación y comunicación más amplia de esos hallazgos.
  • Visualización de datos: El análisis es el proceso de encontrar información valiosa; la visualización es el método para presentarla. Herramientas como Tableau o Matplotlib se utilizan dentro del flujo de trabajo analítico para crear gráficos y paneles de control, lo que facilita a las partes interesadas la comprensión de métricas complejas .
  • Aprendizaje automático: los modelos de aprendizaje automático son los motores que aprenden de los datos, mientras que la analítica proporciona el combustible. La analítica se centra en interpretar los datos históricos para obtener información, mientras que el aprendizaje automático se centra en utilizar esos datos para realizar predicciones autónomas. A menudo, para que los modelos de aprendizaje automático tengan éxito, se requiere una ingeniería de características eficaz, una tarea de analítica.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora