Reranker

리랭커(Reranker)가 검색 결과와 객체 탐지 결과를 정밀하게 조정하는 방법을 알아보십시오. Ultralytics YOLO26이 어떻게 이러한 모델을 사용하여 AI 정확도를 최적화하는지 확인해 보십시오.

Reranker는 검색 결과, 문서 구절 또는 객체 탐지와 같은 후보 항목 목록을 세밀하게 조정하고 재정렬하여 특정 쿼리나 컨텍스트에 대한 관련성을 극대화하도록 설계된 정교한 머신러닝 모델입니다. 다단계 시스템에서 초기 "retriever"는 먼저 방대한 데이터 세트에서 잠재적으로 유용한 항목들을 광범위하게 수집합니다. 그런 다음 reranker가 2단계로 개입하여 이 더 작은 후보 목록에 대해 심층적이고 계산 집약적인 분석을 수행함으로써 가장 정확한 일치 항목을 식별합니다. 소수의 선택된 후보에게만 많은 계산 자원을 집중함으로써, 시스템은 실시간 애플리케이션에 필요한 속도를 희생하지 않고도 높은 accuracy를 달성할 수 있습니다.

Link to this sectionReranker의 작동 방식#

Reranking은 일반적으로 현대의 semantic search 및 추천 엔진에서 공통적으로 사용되는 2단계 파이프라인 내에서 작동합니다.

1단계 검색(Retrieval): 가벼운 모델이 전체 데이터베이스를 스캔하여 대규모 후보군(예: 상위 100개 문서)을 검색합니다. 이 단계에서는 관련 항목을 놓치지 않기 위해 recall을 우선시하며, 종종 approximate nearest neighbor search와 같은 빠른 알고리즘을 사용합니다.
2단계 재순위 지정(Reranking): Reranker가 검색된 후보들을 처리합니다. 단순한 벡터 유사성을 사용할 수 있는 retriever와 달리, reranker는 종종 cross-encoder 또는 강력한 Transformer 아키텍처를 사용합니다. 이는 쿼리와 후보 항목 간의 전체적인 상호작용을 검사하여 단순한 모델이 놓치는 미묘한 뉘앙스와 맥락을 포착합니다. 결과물은 가장 관련성이 높은 항목이 상단에 나타나는 재정렬된 목록입니다.

Link to this sectionReranker와 Retriever 비교#

두 구성 요소 모두 관련 데이터를 찾는 것을 목표로 하지만, machine learning (ML) 워크플로에서 각기 다른 목적을 수행합니다.

Retriever는 scalability를 위해 구축되었습니다. 데이터를 고정 크기의 embeddings로 압축하여 수백만 개의 항목을 밀리초 단위로 검색할 수 있게 합니다. 하지만 이러한 압축 과정에서 세밀한 정보가 손실될 수 있습니다.
Reranker는 precision을 위해 구축되었습니다. 전체 데이터베이스에서 실행하기에는 너무 느리지만, 작은 하위 집합에서는 매우 효과적입니다. 이는 빠른 검색 단계에서 발생한 오류를 수정하는 "제2의 의견"을 제공합니다.

Link to this section실제 애플리케이션 사례#

Reranker는 광범위한 검색과 정밀한 이해 사이의 간극을 메우며, 다양한 고성능 AI 시스템에서 필수적인 역할을 합니다.

Link to this section검색 증강 생성(RAG)#

외부 데이터를 기반으로 질문에 답하는 Retrieval-Augmented Generation (RAG)에서 LLM은 중요한 역할을 합니다. 만약 검색 단계에서 관련 없는 문서를 LLM에 전달하면, 모델이 환각(hallucination)을 일으키거나 잘못된 답변을 제공할 수 있습니다. Reranker는 품질 필터 역할을 하여 가장 적절한 텍스트 청크만 생성기로 전달되도록 보장합니다. 이는 응답의 사실적 정확도를 향상시키고 context window 사용량을 줄여줍니다.

Link to this section객체 탐지 및 비최대 억제#

computer vision에서는 추론 중에 reranking과 유사한 개념이 사용됩니다. YOLO26과 같은 모델은 이미지 내 객체에 대해 수천 개의 후보 bounding boxes를 생성합니다. 이때 Non-Maximum Suppression (NMS)라는 프로세스가 reranker 역할을 합니다. 이는 confidence 점수를 기준으로 박스를 정렬하고 Intersection over Union (IoU)를 사용하여 중복되거나 겹치는 예측을 제거합니다. 이를 통해 최종 출력에는 각 객체에 대해 가장 적합한 단 하나의 탐지 결과만 포함됩니다.

다음 Python 예제는 ultralytics를 사용한 추론 시 NMS 파라미터가 어떻게 reranking 필터로 작동하는지 보여줍니다.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference with NMS settings acting as the 'reranker'
# 'iou' controls the overlap threshold for suppressing duplicate candidates
# 'conf' sets the minimum confidence score required to be considered
results = model.predict("https://ultralytics.com/images/bus.jpg", iou=0.5, conf=0.25)

# Show the filtered, high-relevance detections
results[0].show()

Link to this section전자상거래 개인화#

Amazon과 같은 주요 온라인 소매업체는 검색 결과를 맞춤화하기 위해 reranker를 사용합니다. 사용자가 "운동화"를 검색하면 retriever는 수천 개의 신발을 찾습니다. 그 후 reranker가 사용자의 과거 구매 이력, 현재 트렌드, 이익 마진 등을 기준으로 이들을 정렬하여 사용자가 구매할 가능성이 가장 높은 항목을 페이지 상단에 배치합니다.

Link to this sectionReranking 워크플로 최적화#

Reranker를 구현하려면 정확도 향상과 계산 비용 사이의 균형을 맞춰야 합니다. Ultralytics Platform을 사용하여 모델을 학습 및 배포하는 개발자에게 모델 복잡성과 추론 속도 간의 절충안을 이해하는 것은 매우 중요합니다. 무거운 reranker는 결과를 개선하지만 지연 시간을 추가합니다. model quantization이나 knowledge distillation과 같은 기법은 에지 장치 배포를 위해 reranking 모델의 속도를 높이는 데 도움이 될 수 있습니다.

추론 파이프라인 최적화에 대한 자세한 내용은 hyperparameter tuning 및 최대 성능을 위한 exporting models 가이드를 참조하십시오.

Explore solutions

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

Reranker

Link to this sectionReranker의 작동 방식#

Link to this sectionReranker와 Retriever 비교#

Link to this section실제 애플리케이션 사례#

Link to this section검색 증강 생성(RAG)#

Link to this section객체 탐지 및 비최대 억제#

Link to this section전자상거래 개인화#

Link to this sectionReranking 워크플로 최적화#

Explore solutions

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

로봇 공학에서의 AI

물류 분야의 AI

소매업에서의 AI

의료 분야의 AI

제조 분야의 AI

자동차 분야의 AI

농업 분야의 AI

미래의 AI를 함께 구축합시다!