리랭커
리랭커(Reranker)로 검색 정확도를 향상시키세요! 고급 모델이 초기 검색 결과를 개선하여 최적의 관련성과 사용자 만족도를 제공하는 방법을 알아보세요.
재랭커는 다단계 정보 시스템에서 초기 후보 목록의 순서를 개선하기 위해 사용되는 정교한 모델로
순서를 개선하는 데 사용되는 정교한 모델입니다. 리트리버라고 하는 기본 시스템은 잠재적으로 관련성이 있는 광범위한 항목을 빠르게 수집하지만
리랭커는 이보다 더 작은 규모의
더 상세하고 계산 집약적인 분석을 수행합니다. 리랭커의 목표는 이러한 항목을 재분류하여 가장 관련성이 높은 항목을 맨 위에 배치함으로써 최종 결과물의
최종 결과물의 정확도와 회수율을 높이는 것입니다. 이
2단계 프로세스를 통해 시스템은 속도와 정확성의 균형을 유지하여 고품질의 결과를 효율적으로 제공할 수 있습니다.
리랭커 작동 방식
재랭킹은 일반적으로 최신 시맨틱 검색 및 추천 시스템에서 일반적으로 사용되는 2단계 아키텍처를 포함합니다.
시맨틱 검색 및 추천 시스템에서 흔히 볼 수 있습니다:
-
1단계 검색: 빠르지만 정확도가 떨어지는 모델(리트리버)이 방대한 데이터베이스를 검색하여
대량의 후보 항목 세트를 빠르게 찾습니다. 컴퓨터 비전에서는
컴퓨터 비전에서 이것은 초기
객체에 대한 수많은 잠재적
바운딩 박스를 생성하는 초기 모델일 수 있습니다. 여기서 우선 순위는 다음과 같습니다.
높은 회상률로 관련 항목을 놓치지 않도록 하는 것입니다.
-
2단계 재랭킹: 초기 후보자 세트가 재순위 결정자에게 전달됩니다. 이는 종종
더 복잡하고 강력한 모델, 예를 들어
트랜스포머 기반 신경망과 같은 더 복잡하고 강력한 모델입니다. 재랭커
는 미묘한 문맥, 의미 관계, 복잡한 특징 등을 고려하여 후보를 더 자세히 검토합니다.
미묘한 문맥, 의미 관계, 복잡한 특징 등을 고려하여 후보를 더 자세히 검토합니다. 그런 다음 각 항목에 대해 새롭고 더 정확한 관련성 점수를 계산하고
항목에 대해 보다 정확한 새 관련성 점수를 계산하고 그에 따라 목록을 다시 정렬합니다.
이 접근 방식은 비용이 많이 드는 재랭크 모델이 전체 데이터의 작은 하위 집합만 처리하기 때문에 계산적으로 효율적입니다.
전체 데이터의 일부만 처리하기 때문에 계산 효율적입니다.
Reranker vs. 1단계 검색기
리랭커와 1단계 검색기를 구별하는 것이 중요합니다.
-
1단계 리트리버: 속도와 리콜에 최적화되어 있습니다. 방대한 양의 데이터를 빠르게 선별하고
방대한 양의 데이터를 빠르게 선별하여 광범위하고 포괄적인 후보 목록을 생성하는 것입니다. 키워드 검색이나 기본 임베딩과 같은 간단한 점수 매기기 방법을 사용합니다.
키워드 매칭 또는 기본 임베딩과 같은 간단한 채점 방법을 사용합니다.
-
리랭크: 정확성과 관련성을 위해 최적화되었습니다. 리트리버에서 관리 가능한 목록을 가져와서
에서 관리 가능한 목록을 가져와 심층적인 문맥 인식 분석을 적용하여 정확도 높은 최종 순위를 산출합니다. 속도가 느리고
리소스 집약적이지만 훨씬 작은 데이터 세트에서 작동합니다.
본질적으로 리트리버는 넓은 그물을 던지고, 리랭커는 어획물을 주의 깊게 검사하여 가장 가치 있는 아이템을 찾습니다.
아이템을 찾습니다.
응용 분야 및 예시
리랭커는 많은 첨단 기술에서 중요한 구성 요소입니다.
인공 지능(AI)
애플리케이션의 중요한 구성 요소입니다:
-
웹 검색 엔진: 다음과 같은 회사 Google 과
Microsoft Bing과 같은 회사는 다단계 순위 시스템을 사용하며, 여기서 재랭커가 중요한
역할을 합니다. 초기 검색에서 수천 개의 페이지를 가져온 후 정교한 재랭커가 사용자의 검색 의도, 콘텐츠 품질 등의 요소를 분석하여
의도 및 콘텐츠 품질과 같은 요소를 분석하여 가장 관련성이 높은 결과를 제시합니다. 이는 최신
정보 검색 연구의 핵심 부분입니다.
-
전자상거래 플랫폼: 아마존과 같은 사이트에서는 리랭커를 사용하여
제품 검색 결과를 세분화합니다. 초기 검색에서는 모든 '운동화'가 표시될 수 있지만, 리랭커는 다음을 수행합니다.
사용자 리뷰, 구매 내역, 브랜드 인기도를 분석하여 사용자가 구매할 가능성이 가장 높은 품목을 표시합니다.
아마존 사이언스에서 자세히 살펴봅니다.
-
검색 증강 세대(RAG): 다음을 사용하는 시스템에서
대규모 언어 모델(LLM)을 사용하는 시스템에서,
RAG는 먼저 지식창고에서 관련
문서를 검색합니다. 그런 다음 재랭커가 이러한 문서를 선별하여 사실적으로 가장 정확하고
가장 사실적이고 맥락에 맞는 정보가
LLM으로 전달하여 생성된 응답의 품질을
품질을 크게 향상시킵니다. Cohere 리랭크 API와 같은 서비스는
이러한 목적을 위해 특별히 설계되었습니다.
-
컴퓨터 비전의 비유: 다음과 같은 포스트 프로세싱 기술
비 최대 억제(NMS) 와 같은 후처리 기술은
다음과 같은 객체 감지 모델의
Ultralytics YOLO11 는 동일한 핵심 철학을 공유합니다. 객체 감지기는
객체 감지기가 먼저 많은 잠재적 바운딩 박스를 제안합니다. 그런 다음 NMS 이러한 후보를 평가하여 순위를 재조정합니다.
후보를 평가하고 신뢰도 점수와 중첩(IoU)을 기준으로 평가하여 중복된 박스를 제거하여 최상의 박스만 유지합니다. 이러한 세분화는 정확한 예측을 위해 매우 중요합니다.
성능 벤치마크를 탐색하고 이러한 모델에 대한
모델 트레이닝 팁을 확인할 수 있습니다.
다음 코드는 추론 중에 바운딩 박스에 대한 재랭커 역할을 하는 NMS 어떻게 구성할 수 있는지 보여줍니다.
를 사용하여 ultralytics 모델입니다.
from ultralytics import YOLO
# Load an official YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image with custom NMS settings
# The 'iou' threshold filters out boxes with high overlap, similar to how a
# reranker removes less relevant, redundant items from a list.
results = model.predict("path/to/image.jpg", iou=0.5, conf=0.25)
# Print the results
results[0].show()