Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Pesquisa Vetorial

Explore como a pesquisa vetorial usa embeddings para encontrar dados semelhantes. Aprenda a gerar vetores de alta qualidade com Ultralytics para uma recuperação precisa de informações.

A pesquisa vetorial é um método sofisticado de recuperação de informações que identifica itens semelhantes dentro de um conjunto de dados com base nas suas características matemáticas, em vez de correspondências exatas de palavras-chave. Ao contrário da pesquisa tradicional por palavras-chave, que depende da localização de sequências de caracteres específicas , a pesquisa vetorial analisa o significado semântico subjacente dos dados. Essa técnica é fundamental para as aplicações modernas de inteligência artificial (IA) , pois permite que os computadores compreendam as relações entre conceitos abstratos, processando dados não estruturados, como imagens, ficheiros de áudio e texto em linguagem natural, com notável precisão.

Como funciona a pesquisa vetorial

O núcleo da pesquisa vetorial envolve a transformação de dados brutos em vetores numéricos de alta dimensão, conhecidos como embeddings. Esse processo mapeia itens para pontos em um espaço multidimensional, onde itens conceitualmente semelhantes estão localizados próximos uns dos outros.

  1. Vetorização: Um modelo de aprendizagem profunda (DL) processa os dados de entrada — por exemplo, uma imagem de um cão — e gera um vetor de características. Modelos avançados como o YOLO26 são frequentemente usados para gerar essas representações ricas de características de forma eficiente.
  2. Indexação: Para realizar pesquisas rapidamente, esses vetores são organizados usando algoritmos especializados, frequentemente armazenados em um banco de dados de vetores dedicado.
  3. Cálculo de similaridade: quando um utilizador envia uma consulta, o sistema converte essa consulta num vetor e mede a distância até aos vetores armazenados utilizando métricas como similaridade coseno ou distância euclidiana.
  4. Recuperação: O sistema retorna os «vizinhos mais próximos», que representam os resultados mais relevantes contextualmente.

Exemplo Python : Geração de Embeddings

Para implementar a pesquisa vetorial, primeiro deve converter os seus dados em vetores. O seguinte trecho de código demonstra como gerar mapas de características e incorporações a partir de uma imagem usando o ultralytics pacote e um modelo YOLO26 pré-treinado.

from ultralytics import YOLO

# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")

# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

Aplicações no Mundo Real

A pesquisa vetorial é o motor por trás de muitos recursos intuitivos no ecossistema de software atual, preenchendo a lacuna entre a visão computacional (CV) e a intenção do utilizador.

  • Sistemas de recomendação visual: No setor de IA no retalho, a pesquisa vetorial alimenta os recursos de "comprar o look". Se um cliente gosta de uma bolsa específica, o sistema encontra itens com vetores visuais semelhantes — combinando forma, textura e estilo — criando um sistema de recomendação personalizado .
  • Geração aumentada por recuperação (RAG): para aprimorar os grandes modelos de linguagem (LLMs), os desenvolvedores usam a pesquisa vetorial para recuperar documentos relevantes de uma base de conhecimento. Isso fornece contexto para a IA, reduzindo alucinações e melhorando a precisão nas interações do chatbot.
  • Detecção de anomalias: Ao agrupar vetores de operações "normais", os sistemas podem identificar valores atípicos que se afastam muito do agrupamento. Isso é fundamental para a detecção de anomalias no controlo de qualidade da produção e na segurança de dados.

Distinguir conceitos relacionados

É útil diferenciar a pesquisa vetorial de termos semelhantes para compreender todo o pipeline de aprendizado de máquina (ML).

  • Pesquisa vetorial vs. pesquisa semântica: a pesquisa semântica é a aplicação mais ampla da compreensão da intenção do utilizador (o «o quê»). A pesquisa vetorial é o método algorítmico específico utilizado para alcançar isso, calculando a proximidade vetorial (o «como»).
  • Pesquisa vetorial vs. Base de dados vetorial: Uma base de dados vetorial é a infraestrutura concebida para armazenar e gerir incorporações em escala. A pesquisa vetorial é o processo de consultar essa base de dados para recuperar informações.
  • Pesquisa vetorial vs. Pesquisa por palavra-chave: a pesquisa por palavra-chave corresponde a sequências de texto exatas (por exemplo, «maçã» corresponde a «maçã»). A pesquisa vetorial corresponde ao significado, portanto «maçã» pode corresponder a «fruta» ou «vermelho», mesmo que as palavras sejam diferentes.

Integração com a Ultralytics

Para equipas que desenvolvem sistemas de pesquisa por similaridade, gerir conjuntos de dados e treinar modelos de incorporação é um primeiro passo crucial. Ultralytics simplifica esse fluxo de trabalho, fornecendo ferramentas para gestão de dados, treino em nuvem e implementação de modelos. Ao garantir que os seus modelos básicos — sejam eles para detecção ou classificação de objetos — tenham alto desempenho, você garante que os vetores resultantes forneçam resultados de pesquisa precisos e significativos.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora