Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Pesquisa Vetorial

Descubra como a pesquisa vetorial revoluciona a IA, permitindo a similaridade semântica na recuperação de dados para PNL, pesquisa visual, sistemas de recomendação e muito mais!

A pesquisa vetorial é uma técnica sofisticada de recuperação de informação que identifica itens semelhantes num conjunto de dados com base nas suas caraterísticas matemáticas e não em correspondências exactas de palavras-chave. Ao representar dados - tais como texto, imagens ou áudio - como vectores numéricos de alta dimensão, conhecidos como vectores numéricos de alta dimensão, conhecidos como "embeddings", este método permite aos computadores compreender o contexto e o significado semântico por detrás de uma consulta. Ao contrário da tradicional tradicional por palavra-chave, que se baseia na correspondência de palavras específicas, a pesquisa vetorial calcula a proximidade entre itens num espaço multidimensional, o que lhe permite devolver resultados resultados relevantes mesmo quando a fraseologia é diferente. Esta capacidade é fundamental para a moderna modernos de inteligência artificial (IA) e modernos de inteligência artificial ( IA ) e de aprendizagem automática (ML), nomeadamente no lidar com dados não estruturados, como feeds de vídeo e linguagem natural.

Como funciona a pesquisa vetorial

O mecanismo central da pesquisa vetorial envolve a transformação de dados brutos num formato numérico pesquisável. Este processo baseia-se em modelos de aprendizagem profunda para efetuar extração de caraterísticas, convertendo as entradas em incorporação de vectores.

  1. Vectorização: Um modelo de ML, como o mais avançado YOLO11processa uma imagem ou texto e produz um vetor - uma uma longa lista de números que representa as caraterísticas do item (por exemplo, formas, cores ou conceitos semânticos).
  2. Indexação: Estes vectores são organizados de forma eficiente, muitas vezes numa base de dados de vectores, para permitir uma recuperação rápida.
  3. Cálculo da semelhança: Quando um utilizador submete uma consulta, o sistema converte a consulta num vetor e mede a sua distância em relação aos vectores armazenados utilizando métricas como semelhança de cosseno ou distância euclidiana.
  4. Recuperação: O sistema identifica e devolve os "vizinhos mais próximos", ou os vectores que são matematicamente mais próximos da consulta, utilizando frequentemente algoritmos ANN (Approximate Nearest Neighbor) para escalabilidade em grandes conjuntos de dados.

Aplicações no Mundo Real

A pesquisa de vectores impulsiona muitas das funcionalidades inteligentes com que os utilizadores interagem diariamente, abrangendo vários sectores, desde o comércio eletrónico à segurança.

  • Descoberta visual no retalho: Em IA no retalho, a pesquisa vetorial potencia as funcionalidades de "comprar o look". Se um utilizador carregar uma fotografia de uma sapatilha, o sistema utiliza visão computacional para gerar uma incorporação e encontra produtos visualmente semelhantes no catálogo, funcionando efetivamente como um sistema de recomendação baseado no estilo estilo e não nos nomes dos produtos.
  • Moderação de conteúdos e segurança: As plataformas utilizam a pesquisa vetorial para deteção de anomalias, comparando os novos carregamentos com uma base de dados de conteúdos ilícitos conhecidos ou de ameaças à segurança. Ao fazer corresponder as caraterísticas semânticas de uma imagem ou vídeo, o sistema pode assinalar conteúdos potencialmente nocivos, mesmo que tenham sido ligeiramente alterados, reforçando segurança dos dados.

Exemplo Python : Geração de Embeddings

O primeiro passo em qualquer pipeline de pesquisa de vectores é gerar os embeddings. O trecho de código a seguir demonstra como produzir vectores de caraterísticas a partir de uma imagem utilizando o Ultralytics Python e um modelo pré-treinado.

from ultralytics import YOLO

# Load the official YOLO11 model
model = YOLO("yolo11n.pt")

# Generate embeddings for an image file or URL
# The 'embed' method returns the high-dimensional feature vector
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")

Pesquisa Vetorial vs. Conceitos Relacionados

Para implementar eficazmente estes sistemas, é útil distinguir a pesquisa vetorial de termos estreitamente relacionados no ciência dos dados.

  • Pesquisa vetorial vs. pesquisa semântica: A pesquisa semântica é o conceito mais amplo de compreensão da intenção e do significado do utilizador. A pesquisa vetorial é o método específico é o método específico utilizado para o conseguir, calculando a proximidade matemática dos vectores. Enquanto a pesquisa semântica descreve o "quê" (encontrar o significado), a pesquisa vetorial descreve o "como" (utilizando métricas de distância).
  • Pesquisa de vectores vs. Base de dados de vectores: Uma base de dados vetorial é a infraestrutura especializada utilizada para armazenar e indexar embeddings. A pesquisa de vectores é a ação ou processo de consultar essa base de dados para encontrar itens semelhantes. Utiliza-se um banco de dados vetorial para realizar uma pesquisa vetorial de forma eficiente.
  • Pesquisa vetorial vs. Processamento de linguagem natural (PNL): A PNL centra-se na interação entre os computadores e a linguagem humana. Enquanto os modelos de PNL (como os Transformers) são são muitas vezes utilizados para criar os encaixes para o texto, a pesquisa vetorial é o mecanismo de recuperação que actua sobre esses incorporação.

Ao tirar partido da velocidade da inferência em tempo real e a profundidade da extração de extração de recursos de aprendizagem profunda, a pesquisa vetorial permite que os aplicativos ultrapassem as bases de dados rígidas e ofereçam experiências de descoberta intuitivas, experiências de descoberta intuitivas e semelhantes às humanas. Seja implementando deteção de objectos para inventário ou a criação de um chatbot com contexto melhorado, a pesquisa vetorial é uma ferramenta fundamental no conjunto de ferramentas do programador de IA moderno.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora