Thuật ngữ

Lượng tử hóa vectơ

Khám phá phương pháp lượng tử hóa vectơ trong nén dữ liệu và phân đoạn dữ liệu trong Học máy. Tìm hiểu cách phương pháp này tối ưu hóa các mô hình VQ-VAE, tìm kiếm vectơ và các triển khai Ultralytics .

Lượng tử hóa vectơ là một kỹ thuật nén và rời rạc hóa dữ liệu mạnh mẽ, được ứng dụng rộng rãi trong học máy (ML) và xử lý tín hiệu số hiện đại. Về cơ bản, kỹ thuật này hoạt động bằng cách chia một tập hợp lớn các điểm hoặc vectơ liên tục thành các nhóm và biểu diễn mỗi nhóm bằng một vectơ "mẫu", cùng nhau tạo thành một cấu trúc được gọi là sổ mã. Bằng cách ánh xạ các vectơ liên tục đa chiều sang các mục sổ mã rời rạc này, các hệ thống có thể giảm đáng kể việc sử dụng bộ nhớ trong khi vẫn giữ được các đặc tính ngữ nghĩa thiết yếu của dữ liệu để thực hiện giảm chiều hiệu quả.

Vai trò của việc chia lưới trong học sâu

Trong lĩnh vực học sâu (DL) hiện đại, khái niệm này đã được phổ biến rộng rãi nhờ mô hình Vector Quantized Variational Autoencoder (VQ-VAE). Khác với các mô hình autoencoder tiêu chuẩn học không gian tiềm ẩn liên tục để thực hiện trích xuất đặc trưng, VQ-VAE học một đại diện rời rạc. Điều này cho phép các mô hình tạo sinh xử lý hình ảnh, âm thanh hoặc video như một chuỗi các token rời rạc, tương tự như cách các Mô hình Ngôn ngữ Lớn (LLMs) xử lý các đầu vào văn bản . Bạn có thể khám phá các nghiên cứu cơ bản về học biểu diễn rời rạc để thấy cách các triển khai ban đầu đã mở đường cho các hệ thống thị giác dựa trên token hiện đại.

Các Ứng dụng Thực tế

Lượng tử hóa vectơ đóng vai trò quan trọng trong nhiều ứng dụng AI thực tế, nơi hiệu suất và hiệu quả sử dụng bộ nhớ là yếu tố then chốt:

Trí tuệ nhân tạo tạo sinh và nén phương tiện: Bằng cách nén dữ liệu hình ảnh phức tạp thành các mã tiềm ẩn rời rạc, lượng tử hóa vectơ cho phép tạo hình ảnh và video với hiệu suất cao. Các mô hình ánh xạ các pixel liên tục sang các token rời rạc giúp giảm đáng kể gánh nặng tính toán, hỗ trợ các kiến trúc tiên tiến như các mô hình khuếch tán tiềm ẩn.
Tìm kiếm vectơ tốc độ cao: Để thực hiện tìm kiếm độ tương đồng nhanh chóng, các hệ thống hiện đại phải truy vấn hàng triệu vectơ nhúng. Lượng tử hóa vectơ giúp nén các tập dữ liệu khổng lồ này, cho phép các công cụ tìm kiếm thực hiện các tìm kiếm láng giềng gần nhất xấp xỉ (ANN) một cách nhanh chóng, điều này mang lại lợi ích lớn cho AI trong lĩnh vực bán lẻ và các hệ thống đề xuất sản phẩm. Hãy tham khảo hướng dẫn của OpenAI về vectơ nhúng để có thêm thông tin về việc xử lý dữ liệu đa chiều.

Phân biệt các khái niệm liên quan

Việc nắm rõ sự khác biệt tinh tế giữa lượng tử hóa vectơ và các thuật ngữ tương tự sẽ rất hữu ích khi thiết kế một kiến trúc thị giác máy tính (CV) hiệu quả:

Lượng tử hóa vectơ so với lượng tử hóa mô hình: Lượng tử hóa mô hình thường đề cập đến việc giảm độ chính xác số học của các trọng số mạng nơ-ron (ví dụ: từ số thực 32-bit xuống số nguyên 8-bit) để tăng tốc độ suy luận cho việc triển khai mô hình trên phần cứng như Ultralytics . Trong khi đó, lượng tử hóa vectơ nhóm các vectơ dữ liệu thành một tập hợp cố định các mẫu rời rạc.
Lượng tử hóa vectơ so với cơ sở dữ liệu vectơ: Cơ sở dữ liệu vectơ là cơ sở hạ tầng thực tế dùng để lưu trữ dữ liệu đa chiều. Lượng tử hóa vectơ là một kỹ thuật thuật toán cơ bản thường được các cơ sở dữ liệu này sử dụng để giảm thiểu dung lượng bộ nhớ, như đã được giải thích chi tiết trong phần giải thích của Qdrant về xử lý vectơ.
Lượng tử hóa vectơ so với Tìm kiếm vectơ: Tìm kiếm vectơ là quá trình chủ động tìm kiếm các mục tương tự dựa trên độ gần gũi của vectơ. Lượng tử hóa đóng vai trò như một lớp tối ưu hóa cấu trúc để đảm bảo quá trình tìm kiếm này có thể thực hiện được về mặt tính toán trên quy mô lớn.

Ví dụ triển khai cơ bản

Để tìm hiểu cách lượng tử hóa vectơ ánh xạ các đầu vào liên tục thành các mã rời rạc trong thực tế, bạn có thể sử dụng PyTorch tính toán khoảng cách Euclid và tìm mẫu gần nhất trong một bộ mã đã được định nghĩa sẵn:

import torch

# Define a continuous input batch and a discrete codebook vocabulary
inputs = torch.randn(4, 128)  # 4 input vectors of dimension 128
codebook = torch.randn(10, 128)  # 10 discrete prototype vectors

# Compute distances and find the nearest codebook index for each input
distances = torch.cdist(inputs, codebook)
quantized_indices = torch.argmin(distances, dim=1)

# Retrieve the discrete quantized vectors corresponding to the inputs
quantized_vectors = codebook[quantized_indices]

Để tìm hiểu chi tiết về cách tính toán tensor theo cách bản địa và tối ưu hóa các thao tác này, vui lòng tham khảo tài liệu chính thức PyTorch .

Tối ưu hóa quy trình làm việc với Ultralytics

Việc tích hợp các mô hình nhúng được tối ưu hóa vào quy trình xử lý của bạn đòi hỏi một bộ công cụ mạnh mẽ. Ultralytics cung cấp một môi trường toàn diện để quản lý dữ liệu huấn luyện và huấn luyện các mô hình thị giác tiên tiến nhất. Bằng cách tối ưu hóa việc quản lý dữ liệu và đơn giản hóa quá trình triển khai mô hình, các nhà phát triển có thể dễ dàng tạo ra các đặc trưng hình ảnh chất lượng cao phù hợp cho quá trình lượng tử hóa vectơ, từ đó giúp tăng tốc các ứng dụng phát hiện đối tượng và tìm kiếm phương tiện truyền thông quy mô lớn .

Lượng tử hóa vectơ

Xuất ra hơn 17 định dạng. Triển khai tại 43 khu vực toàn cầu.

Huấn luyện YOLO26 trên GPU H100 với giá 2,39 đô la/giờ.

Giấy phép doanh nghiệp linh hoạt để thúc đẩy các dự án AI thị giác của bạn.

Giấy phép doanh nghiệp được thiết kế để hỗ trợ dự án tiếp theo của bạn.

Gán nhãn nhanh hơn tới 10 lần với tính năng gán nhãn thông minh

Ghi chú. Đào tạo. Triển khai. Tất cả trong một nền tảng.

Vai trò của việc chia lưới trong học sâu

Các Ứng dụng Thực tế

Phân biệt các khái niệm liên quan

Ví dụ triển khai cơ bản

Tối ưu hóa quy trình làm việc với Ultralytics

Đọc thêm trong danh mục này

Cách xuấtYOLO Ultralytics bằng Ultralytics

Phát hiện việc xếp pallet không an toàn bằng Ultralytics

Hướng dẫn về cách chú thích đa giác với Ultralytics Nền tảng

Hãy cùng nhau xây dựng tương lai của trí tuệ nhân tạo!