Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Tìm kiếm ngữ nghĩa (Semantic Search)

Khám phá sức mạnh của tìm kiếm ngữ nghĩa! Tìm hiểu cách AI, NLP và ML nâng cao độ chính xác của tìm kiếm bằng cách hiểu ý định và ngữ cảnh của người dùng.

Tìm kiếm ngữ nghĩa vượt ra ngoài việc khớp từ khóa theo nghĩa đen để hiểu ý định và ý nghĩa ngữ cảnh đằng sau truy vấn của người dùng. Bằng cách tận dụng các thuật toán Xử lý Ngôn ngữ Tự nhiên (NLP) tiên tiến và Học máy (ML) tinh vi, công nghệ này thu hẹp khoảng cách giữa ngôn ngữ con người và khả năng hiểu của máy móc. Đây là một thành phần quan trọng của các hệ thống Trí tuệ Nhân tạo (AI) hiện đại, cho phép chúng truy xuất kết quả có độ liên quan cao ngay cả khi dữ liệu nguồn thiếu các thuật ngữ chính xác.

Tìm kiếm ngữ nghĩa hoạt động như thế nào

Cơ chế cốt lõi của tìm kiếm ngữ nghĩa liên quan đến việc chuyển đổi dữ liệu phi cấu trúc—chẳng hạn như văn bản, hình ảnh hoặc âm thanh—thành các vectơ số đa chiều được gọi là nhúng . Các vectơ này được đặt trong không gian ngữ nghĩa đa chiều, trong đó các mục có ý nghĩa tương tự thể hiện mối quan hệ không gian chặt chẽ.

Ví dụ, trong một hệ thống ngữ nghĩa, tìm kiếm "bạn đồng hành mèo" sẽ gần giống với "mèo" hoặc "mèo con" vì mô hình học sâu hiểu được mối quan hệ khái niệm, trong khi một công cụ tìm kiếm từ vựng truyền thống có thể thất bại nếu từ cụ thể "mèo" không xuất hiện trong tài liệu đích. Quá trình này thường dựa vào các cơ sở dữ liệu vector như Milvus hoặc Pinecone để lưu trữ và truy xuất các dữ liệu nhúng này một cách hiệu quả.

Sau đây là Python mã chứng minh cách tạo nhúng tính năng từ hình ảnh bằng cách sử dụng ultralytics gói. Đây là bước đầu tiên trong việc xây dựng hệ thống tìm kiếm ngữ nghĩa trực quan.

from ultralytics import YOLO

# Load a pre-trained YOLO11 classification model
model = YOLO("yolo11n-cls.pt")

# Generate embeddings for an image (returns a list of tensors)
# This converts visual content into a numerical vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")

# Print the shape of the embedding vector to verify output
print(f"Embedding vector shape: {results[0].shape}")

Các Ứng dụng Thực tế

Tìm kiếm ngữ nghĩa đã chuyển đổi nhiều ngành công nghiệp bằng cách làm cho việc truy xuất thông tin trở nên trực quan và hiệu quả hơn.

  • Thương mại điện tử và Khám phá Hình ảnh : Các nhà bán lẻ trực tuyến sử dụng tìm kiếm ngữ nghĩa để cải thiện trải nghiệm của khách hàng . Người mua sắm có thể tìm kiếm "váy hoa mùa hè" và hệ thống có thể trả về các kết quả hình ảnh phù hợp ngay cả khi mô tả sản phẩm thiếu chính xác các từ khóa đó. Điều này thường sử dụng Mô hình Đa phương thức có thể xử lý đồng thời cả truy vấn văn bản và hình ảnh.
  • Quản lý Kiến thức và RAG : Trong môi trường doanh nghiệp, nhân viên thường tìm kiếm tài liệu dựa trên khái niệm hơn là tên tệp. Tìm kiếm ngữ nghĩa hỗ trợ Retrieval-Augmented Generation (RAG) , trong đó AI thu thập thông tin có liên quan theo ngữ cảnh để trả lời các câu hỏi phức tạp, nâng cao khả năng của các Mô hình Ngôn ngữ Lớn (LLM) .
  • Đề xuất nội dung : Các dịch vụ phát trực tuyến và nền tảng nội dung sử dụng hiểu biết ngữ nghĩa để xây dựng hệ thống đề xuất . Bằng cách phân tích các đặc điểm ngữ nghĩa của nội dung mà người dùng yêu thích, hệ thống có thể đề xuất các bộ phim hoặc bài viết tương tự về mặt khái niệm, giúp người dùng luôn hứng thú.

Tìm kiếm ngữ nghĩa (Semantic Search) so với các khái niệm liên quan

Điều quan trọng là phải phân biệt tìm kiếm ngữ nghĩa với các thuật ngữ truy xuất thông tin khác để hiểu vai trò cụ thể của nó trong bối cảnh AI.

  • Tìm kiếm vectơ : Tìm kiếm vectơ là phương pháp toán học được sử dụng để thực hiện tìm kiếm ngữ nghĩa. Nó bao gồm việc tính toán khoảng cách giữa các vectơ (sử dụng các số liệu như độ tương đồng cosin ) để tìm các lân cận gần nhất. Tìm kiếm ngữ nghĩa là ứng dụng rộng hơn, bao gồm việc hiểu ý định.
  • Tìm kiếm từ khóa : Đây là phương pháp truyền thống dựa trên việc khớp chính xác các chuỗi ký tự. Phương pháp này tiết kiệm chi phí tính toán hơn nhưng lại không có khả năng hiểu các từ đồng nghĩa hoặc đa nghĩa (từ có nhiều nghĩa).
  • Học Zero-Shot : Điều này đề cập đến khả năng của một mô hình trong việc nhận dạng hoặc phân loại các mục mà nó chưa từng thấy trước đây trong quá trình đào tạo. Các công cụ tìm kiếm ngữ nghĩa thường thể hiện khả năng Zero-Shot vì chúng có thể ánh xạ các truy vấn mới vào các cụm ngữ nghĩa hiện có mà không cần đào tạo lại rõ ràng.
  • Hiểu Ngôn ngữ Tự nhiên (NLU) : NLU là một tập hợp con của NLP tập trung vào việc hiểu máy đọc. Trong khi NLU cung cấp trí tuệ để diễn giải truy vấn, tìm kiếm ngữ nghĩa là quá trình truy xuất dựa trên diễn giải đó.

Bằng cách vượt ra ngoài việc khớp từ khóa cứng nhắc, tìm kiếm ngữ nghĩa cho phép thị giác máy tính và các hệ thống dựa trên văn bản tương tác với con người theo cách tự nhiên và "giống con người" hơn. Đối với các nhà phát triển muốn triển khai các tính năng này, việc khám phá hướng dẫn tìm kiếm tương đồng Ultralytics sẽ cung cấp các bước thực tế để áp dụng các khái niệm này bằng YOLO11 .

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay