Thuật ngữ

Xếp hạng lại

Nâng cao độ chính xác của tìm kiếm với công cụ xếp hạng lại! Khám phá cách các mô hình tiên tiến tinh chỉnh kết quả ban đầu để có mức độ liên quan tối ưu và sự hài lòng của người dùng.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Reranker là một thành phần được sử dụng trong các hệ thống học máy (ML) , đặc biệt là trong các lĩnh vực như truy xuất thông tin (IR) , công cụ tìm kiếm và hệ thống đề xuất . Chức năng chính của nó là cải thiện thứ tự liên quan của danh sách ban đầu các mục ứng viên. Hãy coi nó như một quy trình tinh chỉnh giai đoạn thứ hai: nó lấy danh sách được xếp hạng được tạo bởi phương pháp truy xuất ban đầu nhanh và sắp xếp lại các mục hàng đầu bằng cách sử dụng một mô hình tinh vi hơn, chuyên sâu về tính toán. Điều này nâng cao độ chính xác của thứ hạng cuối cùng và sự hài lòng chung của người dùng.

Rerankers hoạt động như thế nào

Lý do cơ bản để sử dụng trình xếp hạng lại liên quan đến việc cân bằng tốc độ và độ chính xác. Các hệ thống truy xuất ban đầu, chẳng hạn như tìm kiếm dựa trên từ khóa hoặc tìm kiếm lân cận gần nhất (ANN) trên các nhúng , phải nhanh chóng quét các tập dữ liệu có khả năng lớn (như tài liệu web, danh mục sản phẩm hoặc cơ sở dữ liệu hình ảnh) để xác định các mục có khả năng liên quan. Các hệ thống giai đoạn đầu này ưu tiên tốc độ và khả năng thu hồi cao, nghĩa là chúng nhằm mục đích truy xuất tất cả các mục có khả năng liên quan, ngay cả khi điều đó có nghĩa là bao gồm một số mục ít liên quan hơn. Chúng thường trả về một tập hợp các ứng viên lớn hơn mức cần thiết cuối cùng.

Sau đó, một trình xếp hạng lại sẽ lấy một tập hợp con nhỏ hơn của các ứng viên hàng đầu này (ví dụ: 100 kết quả hàng đầu từ tìm kiếm ban đầu) và áp dụng một mô hình mạnh hơn, đòi hỏi nhiều tính toán hơn. Mô hình này có thể thực hiện phân tích sâu hơn về mối quan hệ giữa truy vấn của người dùng và từng mục ứng viên. Các kỹ thuật phổ biến bao gồm sử dụng các mô hình học sâu (DL) phức tạp như Transformers , đặc biệt là các biến thể được gọi là bộ mã hóa chéo . Bộ mã hóa chéo đánh giá truy vấn và mục ứng viên cùng nhau, cho phép hiểu sâu sắc về mức độ liên quan theo ngữ cảnh, thường vượt trội hơn giai đoạn truy xuất ban đầu có thể đánh giá nhúng truy vấn và mục riêng biệt. Trình xếp hạng lại đưa ra điểm số liên quan mới, được tinh chỉnh cho từng ứng viên, cho phép hệ thống trình bày các mục có liên quan nhất trước, do đó cải thiện độ chính xác của kết quả cuối cùng.

Xếp hạng lại so với Truy xuất ban đầu

Điều quan trọng là phải phân biệt giai đoạn xếp hạng lại với giai đoạn truy xuất hoặc xếp hạng ban đầu:

  • Thu hồi ban đầu (Giai đoạn đầu tiên):
    • Mục tiêu: Nhanh chóng tìm ra một tập hợp rộng các ứng viên có khả năng liên quan từ một tập hợp lớn. Ưu tiên tốc độ và khả năng nhớ lại.
    • Phương pháp: Thường sử dụng các kỹ thuật như chỉ mục đảo ngược ( Apache Lucene , Elasticsearch ), tìm kiếm ANN trên nhúng hoặc các hàm chấm điểm đơn giản hơn.
    • Độ phức tạp: Chi phí tính toán rẻ hơn cho mỗi sản phẩm, có thể mở rộng lên tới hàng tỷ sản phẩm.
  • Xếp hạng lại (Giai đoạn thứ hai):
    • Mục tiêu: Sắp xếp lại chính xác một tập hợp nhỏ hơn các ứng viên hàng đầu được cung cấp bởi giai đoạn đầu tiên. Ưu tiên độ chính xác và tính liên quan.
    • Phương pháp: Sử dụng các mô hình phức tạp hơn như bộ mã hóa chéo dựa trên BERT , Transformers hoặc các tương tác tính năng phức tạp khác. Các kỹ thuật thường liên quan đến việc điều chỉnh siêu tham số để có hiệu suất tối ưu.
    • Độ phức tạp: Đắt hơn về mặt tính toán cho mỗi mục, nhưng chỉ áp dụng cho một số lượng ứng viên hạn chế (ví dụ: 50-200 ứng viên hàng đầu).

Ứng dụng và Ví dụ

Xếp hạng lại rất quan trọng trong nhiều ứng dụng AI hiện đại:

  • Công cụ tìm kiếm trên web: Các công ty như GoogleMicrosoft Bing sử dụng hệ thống xếp hạng nhiều giai đoạn, trong đó các công cụ xếp hạng lại đóng vai trò quan trọng trong việc tinh chỉnh các kết quả tìm kiếm hàng đầu được trình bày cho người dùng, xem xét các yếu tố phức tạp ngoài việc khớp từ khóa đơn giản. Đây là một phần cốt lõi của nghiên cứu truy xuất thông tin .
  • Nền tảng thương mại điện tử: Các trang web như Amazon sử dụng công cụ xếp hạng lại để tinh chỉnh các đề xuất sản phẩm và kết quả tìm kiếm, hiển thị cho người dùng các mặt hàng mà họ có nhiều khả năng mua hơn dựa trên các mẫu phức tạp về hành vi của người dùng và các tính năng của mặt hàng. Điều này được trình bày chi tiết trong nghiên cứu từ những nơi như Amazon Science .
  • Retrieval-Augmented Generation (RAG): Trong các hệ thống sử dụng Large Language Models (LLM) , RAG trước tiên sẽ truy xuất các tài liệu có liên quan để cung cấp ngữ cảnh. Sau đó, một trình xếp hạng lại có thể tinh chỉnh các tài liệu đã truy xuất này, đảm bảo ngữ cảnh có liên quan nhất được chuyển đến LLM để tạo ra phản hồi chính xác và có thông tin hơn. Các dịch vụ như Cohere Rerank API được thiết kế riêng cho mục đích này.
  • Hậu xử lý thị giác máy tính: Mặc dù theo truyền thống không được gọi là "reranker", các kỹ thuật như Non-Maximum Suppression (NMS) được sử dụng trong các mô hình phát hiện đối tượng như Ultralytics YOLO có chung một triết lý. NMS tinh chỉnh một tập hợp ban đầu các hộp giới hạn được dự đoán dựa trên điểm tin cậy và chồng chéo ( IoU ), giữ lại các phát hiện có khả năng xảy ra nhất và loại bỏ các phát hiện trùng lặp, tương tự như tinh chỉnh các ứng viên ban đầu. Bạn có thể tìm thấy các mẹo đào tạo mô hình và khám phá các điểm chuẩn hiệu suất cho các mô hình như vậy. Đào tạo các mô hình này thường tận dụng các nền tảng như Ultralytics HUB để quản lý các tập dữ liệu và thử nghiệm.
Đọc tất cả