Glosario

Extracción de características

Descubra el poder de la extracción de características en el aprendizaje automático con Ultralytics YOLO11. Aprenda técnicas de detección y análisis eficaces.

La extracción de características es un proceso vital en el aprendizaje automático (machine learning, ML) y la visión por ordenador (computer vision, CV), ya que constituye un paso fundamental para convertir datos brutos, a menudo complejos, en un formato que los algoritmos puedan procesar con eficacia. Consiste en transformar datos no estructurados o de alta dimensionalidad, como imágenes, audio o texto, en un conjunto estructurado de características numéricas, normalmente representadas como un vector de características. Estas características pretenden captar las características esenciales de los datos originales descartando al mismo tiempo el ruido y la redundancia. Los objetivos principales son reducir la complejidad de los datos mediante la reducción de la dimensionalidad, resaltar los patrones relevantes y hacer que los datos sean más adecuados para los modelos de ML. Esto a menudo conduce a una mayor precisión del modelo, un entrenamiento más rápido del modelo y una mejor generalización a datos no vistos.

Cómo funciona la extracción de características

Las técnicas específicas de extracción de características dependen en gran medida del tipo de datos que se procesen.

Extracción de características frente a ingeniería de características

A menudo se confunde la extracción de características con la ingeniería de características, pero son conceptos distintos.

  • Extracción de características: Se centra específicamente en transformar los datos brutos en un conjunto de características derivadas, a menudo utilizando algoritmos automatizados (como las capas CNN) o técnicas matemáticas establecidas (como las transformadas PCA o Fourier). El objetivo suele ser reducir la dimensionalidad y crear una representación más manejable.
  • Ingeniería de características: Es una práctica más amplia que incluye la extracción de características, pero también implica la creación de nuevas características a partir de las existentes (por ejemplo, el cálculo de la relación de dos mediciones), la selección de las características más relevantes para un modelo, el tratamiento de los valores que faltan y la transformación de características basadas en el conocimiento del dominio y los requisitos específicos del modelo(como el preprocesamiento de datos). Suele requerir más esfuerzo manual y experiencia.

Aunque los modelos de aprendizaje profundo automatizan gran parte del proceso de extracción de características para tareas como el reconocimiento de imágenes y la detección de objetos, los principios de ingeniería de características, como el aumento adecuado de los datos o la normalización de la entrada, siguen siendo cruciales para lograr un rendimiento óptimo.

Aplicaciones reales

La extracción de características es fundamental para innumerables aplicaciones de IA y ML:

  1. Análisis de imágenes médicas: En el análisis de exploraciones médicas como radiografías, TAC o resonancias magnéticas para detectar enfermedades como el cáncer, se extraen características específicas de las imágenes. Por ejemplo, patrones de textura de los tejidos, forma y tamaño de posibles anomalías (como los tumores del conjunto de datos sobre tumores cerebrales) o variaciones de intensidad. Estas características extraídas se introducen en un clasificador (como una SVM o una red neuronal) para predecir la presencia o el estadio de una enfermedad. Esto ayuda a los radiólogos en el diagnóstico, como se explica en publicaciones como Radiology: Artificial Intelligence. Los sistemas modernos pueden utilizar Ultralytics YOLO11, que extrae implícitamente características para tareas como el análisis de imágenes médicas.

  2. Análisis del sentimiento: Para determinar el sentimiento (positivo, negativo, neutro) expresado en datos de texto como las opiniones de los clientes o las publicaciones en redes sociales, hay que extraer características del texto en bruto. Esto puede implicar el recuento de la frecuencia de palabras positivas frente a las negativas(bolsa de palabras), el uso de puntuaciones TF-IDF o la generación de sofisticadas incrustaciones de frases utilizando modelos lingüísticos preformados como los disponibles a través de Hugging Face. Estas características cuantifican el tono emocional del texto, lo que permite a un modelo ML clasificar el sentimiento general, que es crucial para entender los comentarios de los clientes.

Extracción de características en los modelos YOLO de Ultralytics

Los modelos más avanzados de detección de objetos, como Ultralytics YOLOv8 y YOLO11, realizan la extracción de características de forma implícita en su arquitectura de red neuronal (NN). Las capas iniciales (a menudo parte de la columna vertebral) actúan como potentes extractores de características aprendidas. A medida que los datos de entrada pasan por estas capas, las características jerárquicas se identifican automáticamente y se representan en los mapas de características. Aunque el proceso está automatizado en gran medida, comprender la extracción de características ayuda a diseñar pasos eficaces de preprocesamiento de datos, realizar el ajuste de hiperparámetros e interpretar el comportamiento del modelo, utilizando potencialmente herramientas disponibles en la documentación de Ultralytics o plataformas como Ultralytics HUB para gestionar conjuntos de datos y experimentos. Las técnicas también se utilizan en tareas posteriores, como el seguimiento de objetos, en las que pueden extraerse características de apariencia para mantener la identidad de los objetos en los distintos fotogramas. Frameworks como PyTorch y TensorFlow proporcionan la infraestructura subyacente para construir y entrenar estos modelos.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles