Hybrid Search
Khám phá cách tìm kiếm kết hợp (hybrid search) hợp nhất việc khớp từ khóa và AI ngữ nghĩa. Tìm hiểu cách xây dựng các pipeline tìm kiếm có nhận biết ngữ cảnh sử dụng metadata từ Ultralytics YOLO26.
Bằng cách kết hợp độ chính xác của phương thức khớp từ khóa truyền thống với khả năng hiểu ngữ cảnh của AI hiện đại, phương pháp tìm kiếm này truy xuất và xếp hạng thông tin bằng cách tận dụng cả biểu diễn dữ liệu thưa (sparse) và dày (dense). Trong khi một search engine tiêu chuẩn hoàn toàn dựa vào việc khớp từ khóa chính xác (được gọi là lexical search) và các vector search engines chỉ dựa vào semantic similarity, một công cụ tìm kiếm hybrid kết hợp cả hai phương pháp này để mang lại kết quả chính xác cao và hiểu rõ ngữ cảnh.
Cách thức hoạt động
Một pipeline tìm kiếm hybrid điển hình thực hiện hai phương pháp truy xuất riêng biệt đồng thời, hợp nhất đầu ra của chúng thành một bảng xếp hạng duy nhất, được tối ưu hóa:
- Lexical (Sparse) Search: Sử dụng các thuật toán như BM25 để tính điểm cho các từ khóa khớp chính xác dựa trên tần suất thuật ngữ. Điều này rất quan trọng để truy xuất các thực thể cụ thể, từ viết tắt, mã SKU sản phẩm hoặc thuật ngữ chuyên ngành mà một mô hình ngữ nghĩa đơn thuần có thể gặp khó khăn khi xác định.
- Semantic (Dense) Search: Tạo ra các mảng số nhiều chiều bằng cách sử dụng các mô hình AI để hiểu ý nghĩa sâu xa và ngữ cảnh của truy vấn. Điều này cho phép hệ thống tìm thấy các kết quả liên quan ngay cả khi các từ chính xác bị thiếu trong truy vấn tìm kiếm.
Sau khi cả hai phương pháp truy xuất kết quả ứng viên của chúng, một fusion algorithm—phổ biến nhất là Reciprocal Rank Fusion (RRF)—sẽ kết hợp các danh sách lại với nhau. RRF tính toán một điểm số mới dựa trên thứ hạng của từng mục trong các tập kết quả thưa và dày tương ứng. Điều này đảm bảo rằng các tài liệu xếp hạng cao trong một hoặc cả hai tìm kiếm sẽ nổi lên hàng đầu, cân bằng giữa các kết quả khớp ngữ cảnh rộng và độ chính xác từ khóa chính xác.
Các ứng dụng AI và ML trong thế giới thực
Các kiến trúc AI hiện đại dựa rất nhiều vào kỹ thuật này để vượt qua những hạn chế của việc sử dụng một phương pháp truy xuất duy nhất trong môi trường production.
- Hybrid RAG (Retrieval-Augmented Generation): Trong các hệ thống tri thức doanh nghiệp, việc cung cấp cho một Large Language Model (LLM) ngữ cảnh liên quan nhất là rất quan trọng để ngăn chặn hallucinations. Một thiết lập RAG hybrid đảm bảo mô hình truy xuất được các tài liệu khớp với các ràng buộc kỹ thuật chính xác đồng thời kéo theo các đoạn văn có liên quan về mặt ngữ nghĩa.
- Thương mại điện tử và Khám phá sản phẩm trực quan: Các nhà bán lẻ sử dụng tìm kiếm hybrid để hỗ trợ danh mục sản phẩm. Người dùng có thể tìm kiếm "giày chạy bộ màu đỏ". Công cụ lexical sẽ khớp chính xác từ khóa thương hiệu hoặc danh mục, trong khi một vision AI model sử dụng các embedding hình ảnh để hiển thị các mặt hàng tương tự về mặt thị giác.
Ngày nay, hầu hết mọi vector database lớn—bao gồm Pinecone, Qdrant, OpenSearch, và PostgreSQL thông qua pgvector—đều hỗ trợ tìm kiếm hybrid một cách tự nhiên. Điều này cho phép các nhà phát triển lập chỉ mục cả từ khóa thưa và vector dày một cách hiệu quả trong cùng một cơ sở hạ tầng.
Tạo Metadata cho Hybrid Search
Trong các pipeline computer vision, bạn có thể trích xuất các từ khóa ý nghĩa từ hình ảnh để xây dựng thành phần thưa của một chỉ mục hybrid. Sử dụng Ultralytics YOLO26, bạn có thể tự động thực hiện object detection trên một hình ảnh và sử dụng các class names đó làm metadata tags. Các thẻ từ khóa này sau đó có thể được ghép nối với các vector embedding dày của hình ảnh để lập chỉ mục toàn diện.
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 object detection model
model = YOLO("yolo26n.pt")
# Run inference to detect objects in an image
results = model("store_aisle.jpg")
# Extract predicted class names to be indexed as keyword metadata (sparse data)
keywords = [model.names[int(box.cls)] for box in results[0].boxes]
print("Sparse keywords for lexical search:", keywords)Bằng cách làm phong phú thêm các embedding hình ảnh dày với các từ khóa thưa chính xác do AI tạo ra, các nhà phát triển có thể tận dụng Ultralytics Platform và các vector database tương thích hybrid để xây dựng các multimodal search engines mạnh mẽ, có khả năng hiểu hoàn hảo cả các thẻ văn bản rõ ràng và ngữ cảnh thị giác ngầm định của dữ liệu của họ.






