Khám phá cách tìm kiếm vector sử dụng embedding để tìm dữ liệu tương tự. Học cách tạo ra các vector chất lượng cao với Ultralytics YOLO26 giúp truy xuất thông tin chính xác.
Tìm kiếm vector là một phương pháp truy xuất thông tin tinh vi, xác định các mục tương tự trong một tập dữ liệu dựa trên các đặc điểm toán học của chúng thay vì sự trùng khớp chính xác với từ khóa. Không giống như tìm kiếm từ khóa truyền thống, dựa vào việc tìm kiếm các chuỗi ký tự cụ thể, tìm kiếm vector phân tích ý nghĩa ngữ nghĩa tiềm ẩn của dữ liệu. Kỹ thuật này là nền tảng cho các ứng dụng trí tuệ nhân tạo (AI) hiện đại vì nó cho phép máy tính hiểu được mối quan hệ giữa các khái niệm trừu tượng, xử lý dữ liệu phi cấu trúc như hình ảnh, tệp âm thanh và văn bản ngôn ngữ tự nhiên với độ chính xác đáng kể.
Cốt lõi của tìm kiếm vector liên quan đến việc chuyển đổi dữ liệu thô thành các vector số đa chiều được gọi là embedding . Quá trình này ánh xạ các mục đến các điểm trong không gian đa chiều, nơi các mục có khái niệm tương tự được đặt gần nhau.
Để thực hiện tìm kiếm vector, trước tiên bạn phải chuyển đổi dữ liệu của mình thành vector. Đoạn mã sau đây minh họa cách tạo ra vector. bản đồ đặc trưng và nhúng dữ liệu từ hình ảnh bằng cách sử dụng ultralytics gói phần mềm và mô hình YOLO26 đã được huấn luyện trước.
from ultralytics import YOLO
# Load a pre-trained YOLO26 classification model
model = YOLO("yolo26n-cls.pt")
# Generate feature embeddings for an image URL
# The 'embed' method returns the high-dimensional vector representation
results = model.embed("https://ultralytics.com/images/bus.jpg")
# Print the shape of the resulting embedding vector
print(f"Embedding vector shape: {results[0].shape}")
Tìm kiếm vector là động lực đằng sau nhiều tính năng trực quan trong hệ sinh thái phần mềm hiện nay, thu hẹp khoảng cách giữa thị giác máy tính (CV) và ý định của người dùng.
Việc phân biệt tìm kiếm vectơ với các thuật ngữ tương tự là rất hữu ích để hiểu toàn bộ quy trình học máy (ML) .
Đối với các nhóm xây dựng hệ thống tìm kiếm tương đồng , quản lý tập dữ liệu và huấn luyện mô hình nhúng là bước đầu tiên vô cùng quan trọng. Nền tảng Ultralytics đơn giản hóa quy trình này bằng cách cung cấp các công cụ quản lý dữ liệu, huấn luyện trên đám mây và triển khai mô hình. Bằng cách đảm bảo các mô hình cơ bản của bạn—cho dù là để phát hiện đối tượng hay phân loại—có hiệu suất cao, bạn đảm bảo các vectơ kết quả cung cấp kết quả tìm kiếm chính xác và có ý nghĩa.
Bắt đầu hành trình của bạn với tương lai của học máy