Glossário

Pesquisa semântica

Descubra o poder da pesquisa semântica! Saiba como a IA, a PNL e o ML melhoram a precisão da pesquisa ao compreender a intenção e o contexto do utilizador.

A pesquisa semântica é uma técnica avançada de recuperação de informação que visa compreender a intenção e o significado contextual subjacente à consulta de um utilizador, em vez de se limitar a corresponder a palavras-chave. Ao contrário dos motores de pesquisa tradicionais, que se baseiam na correspondência literal de termos, a pesquisa semântica utiliza o Processamento de Linguagem Natural (PLN) e a Aprendizagem Automática (AM) para apresentar resultados mais relevantes e precisos. O objetivo é colmatar a lacuna entre a linguagem humana e os dados estruturados que os computadores podem facilmente processar, conduzindo a uma experiência de pesquisa mais intuitiva e eficaz.

Esta tecnologia é alimentada pela conversão de dados não estruturados, como texto ou imagens, em representações numéricas denominadas " embeddings". Modelos como o CLIP (Contrastive Language-Image Pre-Training) da OpenAI ou o BERT da Google são treinados para gerar estes embeddings, que captam a essência semântica do conteúdo. Quando os dados são representados como vectores, uma base de dados vetorial como a Milvus ou a Weaviate utiliza algoritmos especializados como o FAISS da Meta para efetuar uma pesquisa de semelhanças rápida e eficiente.

Aplicações no mundo real

A pesquisa semântica transformou a forma como interagimos com a informação digital em vários domínios. Dois exemplos proeminentes incluem:

  1. Pesquisa semântica de imagens: Em áreas criativas ou para gerir grandes conjuntos de dados de imagens, os utilizadores necessitam frequentemente de encontrar imagens com base em conceitos abstractos. Por exemplo, um designer gráfico pode procurar "uma praia tranquila e isolada ao pôr do sol". Um sistema tradicional teria dificuldades com esta consulta, a não ser que as imagens fossem meticulosamente etiquetadas. Um sistema de pesquisa semântica, como o oferecido pela Ultralytics, analisa o conteúdo das próprias imagens, devolvendo imagens que correspondem à disposição e aos elementos descritos sem depender de nomes de ficheiros ou etiquetas. Pode saber mais sobre a implementação deste sistema no nosso guia de pesquisa por semelhança.
  2. Descoberta de produtos no comércio eletrónico: Os retalhistas em linha utilizam a pesquisa semântica para melhorar a experiência de compra. Um cliente pode procurar "botas quentes para um inverno com neve" em vez de um nome de produto específico. O motor de busca pode compreender os conceitos de "quente" e "neve" e recomendar produtos como botas isoladas e impermeáveis, mesmo que essas palavras-chave exactas não estejam na descrição do produto. Isto leva a uma maior satisfação do cliente e a melhores vendas, como explicam os especialistas do sector na Forbes.

Pesquisa semântica vs. conceitos relacionados

É importante distinguir a pesquisa semântica de vários termos relacionados com a IA e a ciência dos dados:

  • Pesquisa por palavra-chave: Este é o método tradicional de correspondência entre as palavras literais de uma consulta e os documentos. Não consegue compreender sinónimos, contexto ou intenção do utilizador, que são os principais pontos fortes da pesquisa semântica.
  • Pesquisa vetorial: Refere-se ao método de encontrar itens semelhantes calculando a proximidade das suas incorporações vectoriais. Embora a pesquisa vetorial seja um componente essencial da maioria dos sistemas de pesquisa semântica modernos, a pesquisa semântica é o conceito mais amplo que também inclui a etapa inicial de compreensão do significado através de modelos sofisticados de PNL de empresas como a Cohere.
  • Gráfico de conhecimento: Um gráfico de conhecimento estrutura a informação como entidades e as suas relações. Pode melhorar significativamente a pesquisa semântica, fornecendo contexto estruturado, como se vê no Google Knowledge Graph. No entanto, a pesquisa semântica também pode funcionar diretamente em dados não estruturados utilizando apenas as incorporações, o que torna as duas tecnologias complementares.
  • Reconhecimento de entidades nomeadas (NER): O NER é uma subtarefa da PNL que identifica entidades específicas como nomes, locais e organizações no texto. Pode ser utilizado como uma etapa de pré-processamento num pipeline de PLN para alimentar conceitos-chave num sistema de pesquisa semântica, mas não é o próprio processo de pesquisa.

A pesquisa semântica é uma pedra angular das soluções modernas de IA, permitindo sistemas mais inteligentes e fáceis de usar. Esta tecnologia potencia tudo, desde pesquisas quotidianas na Web a aplicações especializadas de IA, incluindo a pesquisa visual criada com modelos Ultralytics YOLO e gerida através de plataformas como o Ultralytics HUB.

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Ligue-se, colabore e cresça com inovadores globais

Aderir agora
Ligação copiada para a área de transferência