Descubra cómo la búsqueda vectorial utiliza incrustaciones para encontrar datos similares. Aprenda a generar vectores de alta calidad con Ultralytics para obtener una recuperación de información precisa.
La búsqueda vectorial es un método sofisticado de recuperación de información que identifica elementos similares dentro de un conjunto de datos basándose en sus características matemáticas, en lugar de en coincidencias exactas de palabras clave. A diferencia de la búsqueda tradicional por palabras clave, que se basa en encontrar cadenas de caracteres específicas , la búsqueda vectorial analiza el significado semántico subyacente de los datos. Esta técnica es fundamental para las aplicaciones modernas de inteligencia artificial (IA) , ya que permite a los ordenadores comprender las relaciones entre conceptos abstractos, procesando datos no estructurados como imágenes, archivos de audio y texto en lenguaje natural con una precisión notable.
El núcleo de la búsqueda vectorial consiste en transformar datos sin procesar en vectores numéricos de alta dimensión conocidos como incrustaciones. Este proceso asigna elementos a puntos en un espacio multidimensional en el que los elementos conceptualmente similares se encuentran cerca unos de otros.
Para implementar la búsqueda vectorial, primero debe convertir sus datos en vectores. El siguiente fragmento de código muestra cómo
generar mapas de características y encajes de una imagen
utilizando el ultralytics paquete y un modelo YOLO26 preentrenado.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
La búsqueda vectorial es el motor que impulsa muchas de las funciones intuitivas del ecosistema de software actual, y que acorta la distancia entre la visión artificial (CV) y la intención del usuario.
Es útil diferenciar la búsqueda vectorial de términos similares para comprender todo el proceso del aprendizaje automático (ML).
Para los equipos que crean sistemas de búsqueda por similitud, la gestión de conjuntos de datos y el entrenamiento de modelos de incrustación son un primer paso crucial. Ultralytics simplifica este flujo de trabajo al proporcionar herramientas para la gestión de datos, el entrenamiento en la nube y la implementación de modelos. Al garantizar que sus modelos base, ya sean para la detección o la clasificación de objetos, tengan un alto rendimiento, se asegura de que los vectores resultantes proporcionen resultados de búsqueda precisos y significativos.
Comience su viaje con el futuro del aprendizaje automático