Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Reranker

Khám phá cách [reranker](https://www. ultralytics [YOLO26](https://docs.com/glossary/reranker) tinh chỉnh kết quả tìm kiếm và phát hiện để đạt độ chính xác tối đa. Tìm hiểu cách tối ưu hóa [YOLO26](https://docs. ultralytics (.com/models/yolo26/) quy trình làm việc và đường dẫn RAG hiện nay.

Bộ sắp xếp lại thứ hạng là một mô hình học máy phức tạp được thiết kế để tinh chỉnh và sắp xếp lại danh sách các mục ứng cử viên—chẳng hạn như kết quả tìm kiếm, đoạn văn bản hoặc phát hiện đối tượng—nhằm tối đa hóa mức độ liên quan của chúng đến một truy vấn hoặc ngữ cảnh cụ thể. Trong các hệ thống đa giai đoạn, "bộ truy xuất" ban đầu nhanh chóng thu thập một tập hợp rộng các mục có khả năng hữu ích từ một tập dữ liệu khổng lồ. Sau đó, bộ sắp xếp lại thứ hạng sẽ tham gia như một giai đoạn thứ hai, thực hiện phân tích chuyên sâu, đòi hỏi nhiều tính toán trên danh sách rút gọn nhỏ hơn này để xác định các kết quả phù hợp nhất. Bằng cách tập trung tính toán nặng nề chỉ vào một số ít ứng cử viên được chọn, hệ thống có thể đạt được độ chính xác cao mà không làm giảm tốc độ cần thiết cho các ứng dụng thời gian thực.

Cách thức hoạt động của hệ thống xếp hạng lại

Việc sắp xếp lại thứ hạng thường hoạt động theo quy trình hai giai đoạn, phổ biến trong các công cụ tìm kiếm ngữ nghĩa và đề xuất hiện đại.

  • Giai đoạn truy xuất đầu tiên: Một mô hình đơn giản sẽ quét toàn bộ cơ sở dữ liệu để truy xuất một tập hợp lớn các ứng viên (ví dụ: 100 tài liệu hàng đầu). Giai đoạn này ưu tiên khả năng thu hồi để đảm bảo không bỏ sót bất kỳ mục nào có liên quan, thường sử dụng các thuật toán nhanh như tìm kiếm lân cận gần đúng .
  • Giai đoạn sắp xếp lại thứ hạng thứ hai: Bộ sắp xếp lại thứ hạng xử lý các ứng viên đã được truy xuất. Không giống như bộ truy xuất, có thể sử dụng độ tương đồng vectơ đơn giản, bộ sắp xếp lại thứ hạng thường sử dụng bộ mã hóa chéo hoặc kiến ​​trúc Transformer mạnh mẽ. Nó kiểm tra toàn bộ tương tác giữa truy vấn và mục ứng viên, nắm bắt những sắc thái tinh tế và ngữ cảnh mà các mô hình đơn giản hơn bỏ sót. Kết quả đầu ra là một danh sách được sắp xếp lại, trong đó các mục liên quan nhất xuất hiện ở đầu.

Người sắp xếp lại thứ hạng so với người truy xuất

Mặc dù cả hai thành phần đều nhằm mục đích tìm kiếm dữ liệu liên quan, nhưng chúng phục vụ các mục đích riêng biệt trong quy trình làm việc của học máy (ML) .

  • Các hệ thống truy xuất dữ liệu được xây dựng để có khả năng mở rộng . Chúng nén dữ liệu thành các phần tử nhúng có kích thước cố định, cho phép chúng tìm kiếm hàng triệu mục trong vài mili giây. Tuy nhiên, việc nén này có thể làm mất đi các chi tiết nhỏ.
  • Các thuật toán sắp xếp lại thứ hạng được xây dựng để đạt độ chính xác cao . Chúng quá chậm để chạy trên toàn bộ cơ sở dữ liệu nhưng lại rất hiệu quả trên các tập con nhỏ. Chúng cung cấp "ý kiến ​​thứ hai" giúp sửa chữa các lỗi do bước truy xuất nhanh gây ra.

Các Ứng dụng Thực tế

Các thuật toán sắp xếp lại thứ hạng đóng vai trò thiết yếu trong nhiều hệ thống AI hiệu năng cao, giúp thu hẹp khoảng cách giữa tìm kiếm tổng quát và hiểu biết chính xác.

Thế hệ tăng cường truy xuất (RAG)

Trong mô hình Tạo câu dựa trên truy xuất (Retrieval-Augmented Generation - RAG) , mô hình ngôn ngữ logic (LLM) trả lời các câu hỏi dựa trên dữ liệu bên ngoài. Nếu bước truy xuất chuyển các tài liệu không liên quan đến LLM, mô hình có thể tạo ra câu trả lời sai hoặc không chính xác. Bộ sắp xếp lại thứ hạng (reranker) hoạt động như một bộ lọc chất lượng, đảm bảo chỉ những đoạn văn bản phù hợp nhất được gửi đến bộ tạo câu. Điều này cải thiện tính chính xác về mặt thực tế của câu trả lời và giảm việc sử dụng cửa sổ ngữ cảnh .

Phát hiện đối tượng và loại bỏ cực đại cục bộ

Trong thị giác máy tính , một khái niệm tương tự như sắp xếp lại thứ hạng được sử dụng trong quá trình suy luận. Các mô hình như YOLO26 tạo ra hàng ngàn hộp giới hạn ứng cử viên cho các đối tượng trong ảnh. Một quy trình gọi là Loại bỏ cực đại không tương thích (Non-Maximum Suppression - NMS ) hoạt động như một bộ sắp xếp lại thứ hạng. Nó sắp xếp các hộp theo điểm tin cậy của chúng và loại bỏ các dự đoán dư thừa, chồng chéo bằng cách sử dụng Giao điểm trên Hợp nhất (Intersection over Union - IoU ) . Điều này đảm bảo đầu ra cuối cùng chỉ chứa một phát hiện tốt nhất duy nhất cho mỗi đối tượng.

Sau đây Python Ví dụ này minh họa cách thức thực hiện. NMS Các tham số hoạt động như một bộ lọc xếp hạng lại trong quá trình suy luận với ultralytics.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Run inference with NMS settings acting as the 'reranker'
# 'iou' controls the overlap threshold for suppressing duplicate candidates
# 'conf' sets the minimum confidence score required to be considered
results = model.predict("https://ultralytics.com/images/bus.jpg", iou=0.5, conf=0.25)

# Show the filtered, high-relevance detections
results[0].show()

Cá nhân hóa thương mại điện tử

Các nhà bán lẻ trực tuyến lớn như Amazon sử dụng công cụ sắp xếp lại kết quả tìm kiếm để điều chỉnh kết quả. Nếu người dùng tìm kiếm "giày thể thao", công cụ sẽ tìm thấy hàng nghìn đôi giày. Sau đó, công cụ sắp xếp lại sẽ phân loại chúng dựa trên lịch sử mua hàng trước đây của người dùng, xu hướng hiện tại và biên lợi nhuận, đưa những mặt hàng mà người dùng có nhiều khả năng mua nhất lên đầu trang.

Tối ưu hóa quy trình sắp xếp lại thứ hạng

Việc triển khai một thuật toán xếp hạng lại (reranker) đòi hỏi phải cân bằng giữa lợi ích về độ chính xác và chi phí tính toán. Đối với các nhà phát triển sử dụng Nền tảng Ultralytics để huấn luyện và triển khai mô hình, việc hiểu rõ sự đánh đổi giữa độ phức tạp của mô hình và tốc độ suy luận là rất quan trọng. Mặc dù một thuật toán xếp hạng lại phức tạp sẽ cải thiện kết quả, nhưng nó lại làm tăng độ trễ. Các kỹ thuật như lượng tử hóa mô hình hoặc chưng cất tri thức có thể giúp tăng tốc độ xếp hạng lại các mô hình để triển khai trên các thiết bị biên.

Để tìm hiểu sâu hơn về tối ưu hóa quy trình suy luận, hãy đọc các hướng dẫn của chúng tôi về điều chỉnh siêu tham sốxuất mô hình để đạt hiệu suất tối đa.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay