Glossário

Reranker

Aumenta a precisão da pesquisa com rerankers! Descobre como os modelos avançados refinam os resultados iniciais para uma relevância ideal e satisfação do utilizador.

Treina os modelos YOLO simplesmente
com Ultralytics HUB

Aprende mais

Um reranker é um componente utilizado em sistemas de aprendizagem automática (ML), especialmente em domínios como a recuperação de informação (IR), motores de pesquisa e sistemas de recomendação. A sua função principal é melhorar a ordem de relevância de uma lista inicial de itens candidatos. Pensa nisto como um processo de refinamento de segunda fase: pega numa lista classificada gerada por um método de recuperação inicial rápido e reordena os principais itens utilizando um modelo mais sofisticado e computacionalmente intensivo. Isto aumenta a precisão da classificação final e a satisfação geral do utilizador.

Como funcionam os Rerankers

A razão fundamental para utilizar um reranker envolve o equilíbrio entre velocidade e precisão. Os sistemas de recuperação iniciais, como a pesquisa baseada em palavras-chave ou a pesquisa aproximada do vizinho mais próximo (ANN) em embeddings, têm de analisar rapidamente conjuntos de dados potencialmente maciços (como documentos Web, catálogos de produtos ou bases de dados de imagens) para identificar itens potencialmente relevantes. Estes sistemas de primeira fase dão prioridade à velocidade e a uma elevada recuperação, o que significa que pretendem recuperar todos os itens potencialmente relevantes, mesmo que isso signifique incluir alguns menos relevantes. Muitas vezes, devolve um conjunto maior de candidatos do que o necessário.

Um reranker pega então num subconjunto mais pequeno destes candidatos de topo (por exemplo, os 100 melhores resultados da pesquisa inicial) e aplica um modelo mais poderoso e computacionalmente exigente. Este modelo pode efetuar uma análise mais profunda da relação entre a consulta do utilizador e cada item candidato. As técnicas comuns envolvem a utilização de modelos complexos de aprendizagem profunda (DL), como os Transformers, em particular as variantes conhecidas como codificadores cruzados. Os codificadores cruzados avaliam a consulta e um item candidato em conjunto, permitindo uma compreensão rica da relevância contextual, muitas vezes superior à fase de recuperação inicial que pode avaliar separadamente a consulta e as incorporações de itens. O reranker produz uma pontuação de relevância nova e refinada para cada candidato, permitindo que o sistema apresente primeiro os itens mais relevantes, melhorando assim a precisão dos resultados finais.

Reranking vs. Recuperação inicial

É crucial distinguir os rerankers da fase inicial de recuperação ou classificação:

  • Recuperação inicial (primeira fase):
    • Objetivo: Encontra rapidamente um vasto conjunto de candidatos potencialmente relevantes a partir de um grande corpus. Dá prioridade à velocidade e à recordação.
    • Métodos: Utiliza frequentemente técnicas como índices invertidos(Apache Lucene, Elasticsearch), pesquisa ANN em embeddings ou funções de pontuação mais simples.
    • Complexidade: Computacionalmente mais barato por item, escalável para milhares de milhões de itens.
  • Reranking (segunda fase):
    • Objetivo: Reordena com precisão um conjunto mais pequeno de candidatos de topo fornecidos pela primeira fase. Dá prioridade à precisão e à relevância.
    • Utiliza métodos: Utiliza modelos mais complexos, como codificadores cruzados baseados em BERT, Transformers ou outras interações de caraterísticas sofisticadas. As técnicas envolvem frequentemente a afinação de hiperparâmetros para um desempenho ótimo.
    • Complexidade: Computacionalmente mais caro por item, mas aplica-se apenas a um número limitado de candidatos (por exemplo, os 50-200 melhores).

Aplicações e exemplos

Os reposicionadores são vitais em muitas aplicações modernas de IA:

  • Motores de pesquisa na Web: Empresas como Google e oMicrosoft Bing utilizam sistemas de classificação em várias fases, em que os rerankers desempenham um papel crucial no refinamento dos principais resultados de pesquisa apresentados aos utilizadores, tendo em conta factores matizados para além da simples correspondência de palavras-chave. Esta é uma parte essencial da investigação sobre recuperação de informação.
  • Plataformas de comércio eletrónico: Sites como a Amazon utilizam os rerankers para refinar as recomendações de produtos e os resultados de pesquisa, mostrando aos utilizadores itens que têm maior probabilidade de comprar com base em padrões complexos de comportamento do utilizador e caraterísticas do item. Isto é detalhado em pesquisas de sítios como a Amazon Science.
  • Geração Aumentada por Recuperação (RAG): Nos sistemas que utilizam grandes modelos linguísticos (LLM), a RAG começa por recuperar documentos relevantes para fornecer contexto. Um reranker pode então refinar esses documentos recuperados, garantindo que o contexto mais relevante seja passado ao LLM para gerar uma resposta mais precisa e informada. Serviços como a API Cohere Rerank foram especificamente concebidos para este fim.
  • Pós-processamento de visão por computador: Embora não sejam tradicionalmente designadas por "rerankers", técnicas como a Supressão Não Máxima (NMS), utilizadas em modelos de deteção de objectos como o Ultralytics YOLO partilham uma filosofia semelhante. O NMS refina um conjunto inicial de caixas delimitadoras previstas com base em pontuações de confiança e sobreposição(IoU), mantendo as detecções mais prováveis e suprimindo as redundantes, semelhante ao refinamento de candidatos iniciais. Pode encontrar sugestões de formação de modelos e explorar referências de desempenho para esses modelos. O treino destes modelos utiliza frequentemente plataformas como o Ultralytics HUB para gerir conjuntos de dados e experiências.
Lê tudo