Descubra el poder de la extracción de características en el aprendizaje automático con Ultralytics YOLO11. Aprenda técnicas de detección y análisis eficaces.
La extracción de características es un proceso transformador en el aprendizaje automático (ML) que convierte datos sin procesar y de alta dimensión en un conjunto refinado de atributos informativos o «características». Los datos de entrada sin procesar, como imágenes de alta resolución, flujos de audio o texto no estructurado, suelen ser demasiado voluminosos y redundantes para que los algoritmos los procesen de manera eficaz. La extracción de características aborda este problema destilando la entrada hasta sus componentes más esenciales, conservando la información crítica necesaria para el modelado predictivo y descartando el ruido y los detalles de fondo irrelevantes. Esta reducción es vital para mitigar la maldición de la dimensionalidad, garantizando que los modelos sigan siendo computacionalmente eficientes y capaces de generalizar bien a datos nuevos y desconocidos.
En la era de la visión artificial tradicional, los expertos se basaban en técnicas manuales como la transformación de características invariante a escala (SIFT) para identificar puntos clave en las imágenes. Sin embargo, el moderno aprendizaje profundo (DL) ha revolucionado este flujo de trabajo al automatizar el descubrimiento de características.
Las redes neuronales, concretamente las redes neuronales convolucionales (CNN), emplean un componente arquitectónico especializado conocido como backbone para realizar la extracción de características de forma jerárquica. A medida que los datos atraviesan las capas de la red, aumenta la complejidad de las características extraídas:
Estas representaciones aprendidas se almacenan en mapas de características, que posteriormente se pasan a un cabezal de detección para realizar tareas como la detección de objetos o la clasificación de imágenes.
La extracción de características sirve como motor detrás de muchas capacidades avanzadas de IA, traduciendo entradas sensoriales sin procesar en conocimientos prácticos en diversas industrias.
Las arquitecturas de última generación, como Ultralytics , integran potentes estructuras de extracción de características directamente en su diseño. Cuando se ejecuta la inferencia, el modelo procesa automáticamente la imagen para extraer las características relevantes antes de predecir los cuadros delimitadores y las etiquetas de clase.
El siguiente ejemplo muestra cómo utilizar un modelo preentrenado para procesar una imagen. Aunque el código es sencillo, el modelo realiza internamente una extracción de características compleja para localizar objetos:
from ultralytics import YOLO
# Load a pretrained YOLO26 model, which includes a learned feature extraction backbone
model = YOLO("yolo26n.pt")
# Perform inference on an image
# The model internally extracts features to locate and classify objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting bounding boxes
results[0].show()
Para los equipos que buscan gestionar los conjuntos de datos utilizados para entrenar estos extractores de características, la Ultralytics ofrece una solución integral para la anotación, el entrenamiento y la implementación.
Para comprender plenamente el proceso de la ciencia de datos, es útil distinguir la extracción de características de conceptos similares.
Al dominar la extracción de características, los desarrolladores pueden aprovechar marcos como PyTorch y TensorFlow para crear modelos que no solo sean precisos , sino también lo suficientemente eficientes como para su implementación en el borde.