Thuật ngữ

Học tập dựa trên biểu diễn Matryoshka (MRL)

Tìm hiểu cách Học biểu diễn Matryoshka (MRL) cho phép nhúng đa cấp độ. Khám phá cách tối ưu hóa Ultralytics Tìm kiếm YOLO26 và triển khai tại biên.

Học biểu diễn Matryoshka (MRL) là một kỹ thuật huấn luyện trong trí tuệ nhân tạo (AI) và học máy (ML) buộc mạng nơ-ron phải học các phép nhúng đa cấp trong một vectơ đầu ra duy nhất. Lấy cảm hứng từ những con búp bê lồng nhau của Nga, MRL cấu trúc phép nhúng sao cho thông tin ngữ nghĩa quan trọng được đặt ở phía trước. Điều này có nghĩa là một vectơ đa chiều (ví dụ: 1024 chiều) có thể được cắt bớt thành các tập con nhỏ hơn, lồng nhau (như 512, 256 hoặc 64 chiều) mà không làm mất đi biểu diễn cơ bản của nó. Tính linh hoạt này làm giảm đáng kể chi phí tính toán thường liên quan đến các tác vụ truy xuất thông tin .

Cách thức hoạt động của phương pháp học biểu diễn Matryoshka

Theo truyền thống, mô hình nhúng được huấn luyện để tối ưu hóa một hàm mất mát cụ thể cho kích thước đầu ra cố định. Nếu hệ thống yêu cầu một vectơ nhỏ hơn để tiết kiệm bộ nhớ, thì phải huấn luyện một mô hình hoàn toàn mới. Học tăng cường đa cấp (MRL) giải quyết vấn đề này bằng cách áp dụng một hàm mất mát lồng nhau trong giai đoạn huấn luyện. Nó tối ưu hóa đồng thời toàn bộ biểu diễn và các tập con lồng nhau của nó. Các tổ chức như OpenAI đã áp dụng MRL cho các API nhúng hiện đại của họ, cho phép các nhà phát triển loại bỏ động các chiều ở cuối vectơ trong khi vẫn giữ được điểm số tương đồng cosine chính xác.

Các Ứng dụng Thực tế

MRL mang lại những lợi thế rõ rệt khi cân bằng giữa độ chính xác với chi phí lưu trữ và băng thông bộ nhớ .

Tìm kiếm vectơ thích ứng cho mô hình ngôn ngữ lớn (LLM): Trong các quy trình tạo ngôn ngữ được tăng cường bằng truy xuất (RAG) , các mô hình ngôn ngữ lớn (LLM) thường dựa vào các cơ sở dữ liệu vectơ khổng lồ. Sử dụng MRL, một doanh nghiệp có thể thực hiện tìm kiếm ngữ nghĩa nhanh, sơ bộ bằng cách sử dụng 64 chiều đầu tiên của các vectơ nhúng, sau đó xếp hạng lại các kết quả hàng đầu bằng cách sử dụng toàn bộ vectơ 1024 chiều. Cách tiếp cận hai bước này giúp tăng tốc đáng kể quá trình tìm kiếm vectơ và giảm chi phí lưu trữ cơ sở dữ liệu.
Thị giác máy tính có khả năng mở rộng ở vùng biên: Khi triển khai các hệ thống thị giác máy tính sử dụng Nền tảng Ultralytics , các hạn chế về phần cứng có thể rất khác nhau. Một mô hình sử dụng MRL có thể truyền các embedding hình ảnh kích thước đầy đủ đến máy chủ triển khai đám mây mạnh mẽ, nhưng vẫn có thể tự động chuyển sang truyền các embedding 128 chiều bị cắt bớt khi hoạt động trên các thiết bị điện toán biên công suất thấp, tối ưu hóa độ trễ mà không cần huấn luyện lại mô hình.

Phân biệt các khái niệm liên quan

Để sử dụng MRL một cách hiệu quả, cần phân biệt nó với các kỹ thuật nén dữ liệu cũ hơn.

MRL so với Giảm chiều dữ liệu : Các thuật toán như PCA (Phân tích thành phần chính) hoặc t-SNE được áp dụng sau khi huấn luyện để nén dữ liệu. Ngược lại, MRL được tích hợp trực tiếp vào kiến trúc mạng nơ-ron trong quá trình huấn luyện, bảo toàn các mối quan hệ phi tuyến tính sâu hơn.
So sánh MRL và Cắt tỉa mô hình : Cắt tỉa loại bỏ các trọng số và lớp khỏi mạng nơ-ron thực tế để tăng tốc độ suy luận, chẳng hạn như tạo ra một biến thể nhỏ hơn của mô hình Ultralytics YOLO . MRL không thay đổi kích thước mô hình; nó chỉ thay đổi kích thước của vectơ đầu ra do mô hình tạo ra.

Triển khai thực tế

Việc cắt bớt một embedding MRL cực kỳ đơn giản và không yêu cầu logic lập chỉ mục ngữ nghĩa phức tạp. Vì các đặc trưng quan trọng nhất được trọng số hóa cao ở các chiều sớm nhất, bạn chỉ cần cắt mảng. Ví dụ sau đây minh họa việc cắt bớt đầu ra đa phương thức YOLO26 mô phỏng bằng cách sử dụng các phép toán tensor cơ bản PyTorch .

import torch

# Simulate a full 1024-dimensional MRL embedding returned by a model
full_embedding = torch.rand(1, 1024)

# To deploy on memory-constrained hardware, simply slice the first 256 dimensions
# Because the model was trained with MRL, this subset remains highly accurate
truncated_embedding = full_embedding[:, :256]

print(f"Original size: {full_embedding.shape[1]}, Compressed size: {truncated_embedding.shape[1]}")

Học tập dựa trên biểu diễn Matryoshka (MRL)

Xuất ra hơn 17 định dạng. Triển khai tại 43 khu vực toàn cầu.

Huấn luyện YOLO26 trên GPU H100 với giá 2,39 đô la/giờ.

Giấy phép doanh nghiệp linh hoạt để thúc đẩy các dự án AI thị giác của bạn.

Giấy phép doanh nghiệp được thiết kế để hỗ trợ dự án tiếp theo của bạn.

Gán nhãn nhanh hơn tới 10 lần với tính năng gán nhãn thông minh

Ghi chú. Đào tạo. Triển khai. Tất cả trong một nền tảng.

Cách thức hoạt động của phương pháp học biểu diễn Matryoshka

Các Ứng dụng Thực tế

Phân biệt các khái niệm liên quan

Triển khai thực tế

Đọc thêm trong danh mục này

Ultralytics AMD Dev Day Thượng Hải: Trí tuệ nhân tạo địa phương kết hợp với các hệ thống có khả năng tự chủ

Những điểm nổi bật chính từ Ultralytics Hội nghị Thượng đỉnh về Thị giác Nhúng 2026

Ultralytics YOLO với DEEPX: Xử lý suy luận AI tại thiết bị đầu cuối cho AI vật lý

Hãy cùng nhau xây dựng tương lai của trí tuệ nhân tạo!