Yolo 비전 선전
선전
지금 참여하기
용어집

리랭커

[재순위 지정기](ultralytics)가 검색 및 탐지 결과를 정밀도를 극대화하기 위해 어떻게 개선하는지 알아보세요. [YOLO26](ultralytics) 워크플로우와 RAG 파이프라인을 최적화하는 방법을 지금 바로 배워보세요.

재순위 지정기는 특정 쿼리나 컨텍스트에 대한 관련성을 극대화하기 위해 후보 항목 목록(예: 검색 결과, 문서 구절, 객체 탐지)을 정제하고 재정렬하도록 설계된 정교한 머신러닝 모델입니다. 다단계 시스템에서 초기 "검색기"는 먼저 방대한 데이터셋에서 잠재적으로 유용한 항목들의 광범위한 집합을 신속하게 수집합니다. 리랭커는 두 번째 단계로 개입하여 이 축소된 후보 목록에 대해 심층적이고 계산 집약적인 분석을 수행하여 가장 적합한 항목을 식별합니다. 소수의 선택된 후보에만 집중적인 계산을 수행함으로써 시스템은 실시간 애플리케이션에 필요한 속도를 희생하지 않으면서도 높은 정확도를 달성할 수 있습니다.

재순위 지정기의 작동 방식

재순위 지정은 일반적으로 현대적 의미론적 검색 및 추천 엔진에서 흔히 사용되는 2단계 파이프라인 내에서 작동합니다.

  • 1단계 검색: 경량 모델이 전체 데이터베이스를 스캔하여 대규모 후보 집합(예: 상위 100개 문서)을 추출합니다. 이 단계는 관련 항목이 누락되지 않도록 리콜을 우선시하며, 대개 근사 근접 이웃 검색과 같은 고속 알고리즘을 사용합니다.
  • 2단계 재정렬: 재정렬기는 검색된 후보 항목들을 처리합니다. 단순 벡터 유사도를 사용할 수 있는 검색기와 달리, 재정렬기는 종종 크로스 인코더나 강력한 트랜스포머 아키텍처를 활용합니다. 이는 쿼리와 후보 항목 간의 전체 상호작용을 분석하여 단순한 모델이 놓치는 미묘한 뉘앙스와 맥락을 포착합니다. 출력은 가장 관련성 높은 항목이 상단에 표시되는 재정렬된 목록이다.

재순위화자 대 검색자

두 구성 요소 모두 관련 데이터를 찾는 것을 목표로 하지만, 머신 러닝(ML) 워크플로에서 각각 다른 목적을 수행합니다.

  • 리트리버는 확장성을 위해 설계되었습니다. 데이터를 고정 크기의 임베딩으로 압축하여 수백만 개의 항목을 밀리초 단위로 검색할 수 있습니다. 그러나 이러한 압축 과정에서는 세부적인 정보가 손실될 수 있습니다.
  • 재순위 지정기는 정밀성을 위해 설계되었습니다. 전체 데이터베이스에 적용하기에는 속도가 너무 느리지만, 소규모 부분 집합에서는 매우 효과적입니다. 빠른 검색 단계에서 발생한 오류를 수정하는 "두 번째 의견"을 제공합니다.

실제 애플리케이션

재순위 지정기는 광범위한 검색과 정밀한 이해 사이의 간극을 메우는 역할을 하며, 다양한 고성능 AI 시스템에서 필수적입니다.

검색 강화 생성(RAG)

검색 강화 생성(RAG)에서 대규모 언어 모델(LLM) 은 외부 데이터를 기반으로 질문에 답합니다. 검색 단계에서 관련 없는 문서를 LLM에 전달하면 모델이 허위 정보를 생성하거나 잘못된 답변을 제공할 수 있습니다. 재정렬기는 품질 필터 역할을 하여 생성기에 가장 관련성 높은 텍스트 조각만 전달되도록 보장합니다. 이는 응답의 사실적 정확성을 향상시키고 컨텍스트 윈도우 사용량을 줄입니다.

물체 탐지 및 비최대 억제

컴퓨터 비전 분야에서 추론 단계에서는 재순위 지정과 유사한 개념이 사용됩니다. YOLO26과 같은 모델은 이미지 내 객체에 대해 수천 개의 후보 경계 상자를 생성합니다. 비최대 억제(NMS) 라는 과정이 재순위화 역할을 수행합니다. 이는 박스들을 신뢰도 점수로 정렬하고 교집합 대비 합집합(IoU)을 활용해 중복되고 겹치는 예측을 제거합니다. 이를 통해 최종 출력에는 각 객체에 대해 단 하나의 최상의 탐지 결과만 포함되도록 보장합니다.

다음 Python 추론 과정에서 NMS 재정렬 필터로 기능하는 방식을 보여줍니다. ultralytics.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference with NMS settings acting as the 'reranker'
# 'iou' controls the overlap threshold for suppressing duplicate candidates
# 'conf' sets the minimum confidence score required to be considered
results = model.predict("https://ultralytics.com/images/bus.jpg", iou=0.5, conf=0.25)

# Show the filtered, high-relevance detections
results[0].show()

전자상거래 개인화

아마존과 같은 주요 온라인 소매업체들은 검색 결과를 맞춤화하기 위해 재정렬기를 사용합니다. 사용자가 "스니커즈"를 검색하면 검색 엔진이 수천 개의 신발을 찾아냅니다. 이후 재정렬기는 사용자의 과거 구매 내역, 최신 트렌드, 이익률을 기준으로 이를 정렬하여 사용자가 가장 구매할 가능성이 높은 상품을 페이지 상단에 배치합니다.

재순위 지정 워크플로 최적화

재순위 지정기 구현에는 정확도 향상과 계산 비용 간의 균형이 필요합니다. 모델 훈련 및 배포를 위해 Ultralytics 사용하는 개발자에게는 모델 복잡도와 추론 속도 간의 상충 관계를 이해하는 것이 핵심입니다. 고성능 재순위 지정기는 결과를 개선하지만 지연 시간을 증가시킵니다. 모델 양자화나 지식 증류와 같은 기법은 에지 디바이스에 배포하기 위한 재순위 지정 모델의 속도 향상에 도움이 될 수 있습니다.

추론 파이프라인 최적화에 대한 심층적인 탐구를 원하시면, 최대 성능을 위한 하이퍼파라미터 튜닝모델 내보내기 가이드를 참조하십시오.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기