Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Minería de Datos

¡Descubra cómo la minería de datos transforma los datos brutos en información valiosa y práctica, impulsando la IA, el ML y las aplicaciones del mundo real en la atención médica, el comercio minorista y más!

La minería de datos es el proceso informático de exploración y análisis de grandes conjuntos de datos para descubrir patrones significativos, tendencias y relaciones que no son evidentes a primera vista. Al transformar la información bruta en conocimiento Esta disciplina sirve de puente fundamental entre el análisis estadístico y la inteligencia artificial. inteligencia artificial (IA). Las organizaciones aprovechan la minería de datos para predecir comportamientos futuros, identificar anomalías y respaldar la toma de decisiones estratégicas. estratégica. Aunque a menudo se asocia con la gestión de bases de datos estructuradas, la minería de datos moderna utiliza en gran medida algoritmos de aprendizaje automático para procesar algoritmos de aprendizaje automático (ML) para procesar datos no estructurados, como texto, vídeo y registros de sensores. Big Data en un valioso activo organizativo.

Componentes básicos del proceso

El flujo de trabajo para la extracción de datos suele seguir el estándar Proceso Estándar Intersectorial para la Extracción de Datos (CRISP-DM), que guía a los profesionales desde la comprensión de los objetivos empresariales hasta el despliegue de los modelos.

  • Recogida y anotación de datos: El proceso comienza con la recopilación de información en bruto de diversas fuentes, como bases de datos transaccionales, sensores IoT, o repositorios de imágenes.
  • Preprocesamiento de datos: Los datos brutos rara vez están listos para el análisis. Esta etapa implica limpieza de los datos para eliminar el ruido y a menudo utilizando bibliotecas como Pandas para una manipulación eficaz.
  • Descubrimiento de patrones: Se aplican algoritmos para extraer estructuras ocultas. Esto puede implicar extracción de características para aislar las variables más relevantes para el análisis.
  • Interpretación: Los patrones extraídos se validan para garantizar que representan conocimientos útiles y no correlaciones aleatorias. correlaciones aleatorias, a menudo con la ayuda de herramientas de visualización de datos.

Técnicas y métodos clave

La minería de datos emplea diversas técnicas estadísticas y de ML para resolver problemas específicos.

  • Clasificación: Esta técnica clasifica los datos en clases predefinidas. Por ejemplo, los proveedores de correo electrónico utilizan la clasificación para filtrar los mensajes en "spam" o "bandeja de entrada".
  • Análisis de conglomerados: A diferencia de clasificación, el clustering agrupa puntos de datos similares sin etiquetas predefinidas. Es un método básico en el aprendizaje no supervisado, utilizado con segmentación de mercados.
  • Aprendizaje de reglas de asociación: Este método identifica relaciones entre variables de un conjunto de datos. Es famoso su uso en el análisis de la cesta de la compra para descubrir que los clientes que compran pan también suelen comprar mantequilla.
  • Detección de anomalías: Este se centra en la identificación de valores atípicos que se desvían significativamente de la norma, lo que es crucial para la detección de fraudes y la seguridad de la red. seguridad de la red.

Aplicaciones en el mundo real

La minería de datos impulsa los sistemas inteligentes que impulsan la eficiencia en las principales industrias.

  • La IA en el comercio minorista: Los minoristas historiales de transacciones para optimizar las cadenas de suministro y personalizar las experiencias de compra. Mediante el análisis de de compra, las empresas crean sistemas de recomendación que sugieren productos que los usuarios tienen más probabilidades de comprar, lo que aumenta significativamente los ingresos. Plataformas como Google Cloud Retail integran estas capacidades para predecir la demanda.
  • Análisis de imágenes médicas: En sanidad, la minería de datos se aplica a los historiales de los pacientes y a las imágenes de diagnóstico. Modelos avanzados como YOLO11 pueden "extraer" datos visuales para localizar y localizar y classify anomalías, como tumores cerebrales en resonancias magnéticas. Esto ayuda a los radiólogos destacando posibles problemas que requieren una inspección más minuciosa, como señalan los Institutos Nacionales de Salud (NIH).

Ejemplo de código: Extracción de datos visuales

En visión por ordenador, el término "minería" suele referirse a la extracción de información estructurada (etiquetas de clase y recuentos) de datos de imagen no estructurados. El siguiente ejemplo muestra cómo utilizar la función ultralytics para detect objetos y extraer sus nombres de clase y puntuaciones de confianza.

from ultralytics import YOLO

# Load a pre-trained YOLO11 model to mine object data from images
model = YOLO("yolo11n.pt")

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract and display mined insights: detected classes and confidence
for result in results:
    for box in result.boxes:
        cls_id = int(box.cls[0])
        print(f"Detected: {model.names[cls_id]} | Confidence: {box.conf.item():.2f}")

Distinguir conceptos relacionados

Es importante diferenciar la minería de datos de términos similares en el panorama de la ciencia de datos.

  • Análisis de datos: Mientras que la minería de datos se centra en el descubrimiento automatizado de patrones, la analítica es un término más amplio que abarca la interpretación, comunicación y aplicación de esos patrones para respaldar las decisiones empresariales.
  • Aprendizaje profundo (AD): DL es un subconjunto especializado del aprendizaje automático inspirado en las redes neuronales. La minería de datos utiliza a menudo algoritmos de herramientas para llevar a cabo el proceso de descubrimiento, en particular cuando se trata de tareas complejas como la detección de objetos o el procesamiento del lenguaje natural. la detección de objetos o el procesamiento del lenguaje natural.
  • Modelización predictiva: Se trata de un resultado específico que suele derivarse de la minería de datos. Mientras que la minería explora los datos para encontrar el patrón, el modelado predictivo utiliza ese patrón para predecir eventos futuros. el modelado predictivo utiliza ese patrón para predecir eventos futuros, una distinción destacada por SAS Analytics.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora