Explore como a pesquisa vetorial usa embeddings para encontrar dados semelhantes. Aprenda a gerar vetores de alta qualidade com Ultralytics para uma recuperação precisa de informações.
A pesquisa vetorial é um método sofisticado de recuperação de informações que identifica itens semelhantes dentro de um conjunto de dados com base nas suas características matemáticas, em vez de correspondências exatas de palavras-chave. Ao contrário da pesquisa tradicional por palavras-chave, que depende da localização de sequências de caracteres específicas , a pesquisa vetorial analisa o significado semântico subjacente dos dados. Essa técnica é fundamental para as aplicações modernas de inteligência artificial (IA) , pois permite que os computadores compreendam as relações entre conceitos abstratos, processando dados não estruturados, como imagens, ficheiros de áudio e texto em linguagem natural, com notável precisão.
O núcleo da pesquisa vetorial envolve a transformação de dados brutos em vetores numéricos de alta dimensão, conhecidos como embeddings. Esse processo mapeia itens para pontos em um espaço multidimensional, onde itens conceitualmente semelhantes estão localizados próximos uns dos outros.
Para implementar a pesquisa vetorial, primeiro deve converter os seus dados em vetores. O seguinte trecho de código demonstra como
gerar mapas de características e incorporações a partir de uma imagem
usando o ultralytics pacote e um modelo YOLO26 pré-treinado.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
A pesquisa vetorial é o motor por trás de muitos recursos intuitivos no ecossistema de software atual, preenchendo a lacuna entre a visão computacional (CV) e a intenção do utilizador.
É útil diferenciar a pesquisa vetorial de termos semelhantes para compreender todo o pipeline de aprendizado de máquina (ML).
Para equipas que desenvolvem sistemas de pesquisa por similaridade, gerir conjuntos de dados e treinar modelos de incorporação é um primeiro passo crucial. Ultralytics simplifica esse fluxo de trabalho, fornecendo ferramentas para gestão de dados, treino em nuvem e implementação de modelos. Ao garantir que os seus modelos básicos — sejam eles para detecção ou classificação de objetos — tenham alto desempenho, você garante que os vetores resultantes forneçam resultados de pesquisa precisos e significativos.