Glossário

Pesquisa semântica

Descobre o poder da pesquisa semântica! Aprende como a IA, a PNL e o ML melhoram a precisão da pesquisa ao compreender a intenção e o contexto do utilizador.

A pesquisa semântica representa um avanço significativo na recuperação de informações, indo além da simples correspondência de palavras-chave para compreender a intenção e o significado contextual por trás das consultas dos utilizadores. Em vez de se limitar a procurar ocorrências literais de palavras, a pesquisa semântica utiliza técnicas de Inteligência Artificial (IA), particularmente do Processamento de Linguagem Natural (PLN), para compreender as nuances da linguagem, as relações entre palavras e o objetivo subjacente do utilizador. Isto permite que os sistemas de pesquisa forneçam resultados mais relevantes e precisos, interpretando o que o utilizador pretende encontrar, em vez de apenas os termos específicos que escreveu. É um componente essencial para tornar as interações com os sistemas de informação, desde a pesquisa na Web às bases de dados de conhecimento internas, mais naturais e intuitivas, melhorando fundamentalmente a eficácia da recuperação de informações.

Como funciona a pesquisa semântica

Na sua essência, a pesquisa semântica utiliza conceitos de PNL e aprendizagem automática (ML) para decifrar o significado incorporado no texto ou noutros tipos de dados. O processo envolve frequentemente a conversão de dados (como palavras, frases, documentos ou mesmo imagens) em representações numéricas denominadas " embeddings". Estas incorporações, normalmente vectores de elevada dimensão, captam a essência semântica dos dados. Os itens com significados, conceitos ou contextos semelhantes são posicionados mais próximos uns dos outros neste espaço vetorial.

Quando um utilizador efectua uma pesquisa, a sua consulta (que pode ser um texto em linguagem natural, uma imagem, etc.) é também convertida num embedding utilizando o mesmo modelo de ML. O sistema emprega então técnicas de pesquisa vetorial, muitas vezes alimentadas por bases de dados vectoriais especializadas como Pinecone ou Milvus, para encontrar eficientemente itens no seu índice cujas incorporações são mais próximas (mais semelhantes) à incorporação da consulta. Esta semelhança é normalmente medida utilizando métricas de distância como a semelhança cosseno ou a distância euclidiana. Os modelos avançados de aprendizagem profunda (DL), incluindo arquitecturas como transformadores (por exemplo, BERT), são frequentemente utilizados para gerar estas poderosas incorporações sensíveis ao contexto. Os principais motores de pesquisa, como a PesquisaGoogle , incorporaram a compreensão semântica durante anos para melhorar a qualidade dos resultados para além da simples frequência de palavras-chave.

Aplicações da pesquisa semântica

A pesquisa semântica melhora várias aplicações em que é crucial compreender a intenção do utilizador ou o contexto dos dados:

Pesquisa Web melhorada: Ir além das palavras-chave para compreender o tópico e a intenção por detrás de uma pesquisa (por exemplo, pesquisar "melhor local para ver as luzes do norte no inverno" produz resultados sobre locais específicos e horas ideais, e não apenas páginas que contêm essas palavras exactas).
Descoberta de produtos no comércio eletrónico: Permitir que os utilizadores procurem produtos utilizando linguagem descritiva e natural (por exemplo, encontrar "sapatos confortáveis para estar de pé todo o dia" em vez de precisarem de conhecer marcas ou nomes de produtos específicos). Integra-se frequentemente com sistemas de recomendação.
Gestão do conhecimento interno: Permite que os funcionários de uma organização encontrem documentos, relatórios ou conhecimentos relevantes através de pesquisas baseadas em conceitos e significados, melhorando o acesso à informação em ferramentas como o Ultralytics HUB.
Chatbots de apoio ao cliente: Potencializa os chatbots e os assistentes virtuais para compreenderem melhor as perguntas dos utilizadores e fornecerem respostas mais precisas ou artigos de ajuda relevantes, muitas vezes tirando partido de grandes modelos de linguagem (LLMs).
Recomendação de conteúdo: Sugerir artigos, vídeos ou música com base na semelhança semântica com o conteúdo com o qual o utilizador interagiu anteriormente. Plataformas como o Spotify utilizam conceitos semelhantes.
Exploração de dados: Ferramentas como o Ultralytics Explorer Dashboard podem utilizar a semelhança semântica para ajudar os utilizadores a navegar e a compreender grandes conjuntos de dados, incluindo conjuntos de dados de imagens utilizados na visão computacional (CV). Por exemplo, encontrar imagens semanticamente semelhantes a uma imagem selecionada num conjunto de dados como o COCO.