Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Linear Attention

Khám phá cách linear attention tối ưu hóa các model deep learning bằng cách giảm độ phức tạp của Transformer xuống O(N). Tìm hiểu cách nó mở rộng hiệu suất cho các ứng dụng AI.

Linear attention là một kỹ thuật tối ưu hóa nền tảng được thiết kế để cải thiện đáng kể hiệu quả tính toán của các mô hình học sâu (DL) hiện đại. Trong các kiến trúc Transformer truyền thống, các cơ chế attention tiêu chuẩn xử lý các chuỗi bằng cách so sánh từng token với tất cả các token khác. Điều này tạo ra một nút thắt cổ chai nghiêm trọng về bộ nhớ và tính toán được gọi là độ phức tạp thời gian bậc hai, hay O(N bình phương), trong đó N là độ dài chuỗi. Linear attention thay đổi phép toán nền tảng này để nó mở rộng theo cách tuyến tính, hay O(N). Bước đột phá này cho phép các mô hình trong trí tuệ nhân tạo (AI) xử lý các tập dữ liệu khổng lồ, chẳng hạn như toàn bộ sách hoặc hình ảnh gigapixel, mà không làm cạn kiệt bộ nhớ phần cứng.

Link to this sectionCách thức hoạt động của Linear Attention#

Trong attention tiêu chuẩn, các mạng thần kinh xử lý ba vector chính: Queries (Q), Keys (K), và Values (V). Công thức cổ điển tính toán độ tương đồng giữa tất cả Queries và Keys bằng hàm softmax, tạo ra một ma trận N x N khổng lồ trước khi nhân nó với Values.

Linear attention bỏ qua việc tạo ra ma trận trung gian khổng lồ này. Thay vào đó, nó dựa vào tính chất kết hợp của phép nhân ma trận. Bằng cách loại bỏ hoặc xấp xỉ lớp softmax sử dụng các hàm kernel chuyên dụng, mô hình nhóm các phép nhân theo cách khác. Nó nhân Keys và Values với nhau trước để tạo ra một ma trận ngữ cảnh có kích thước cố định, và sau đó nhân Queries với ma trận nén mới này. Việc sắp xếp lại đơn giản này làm giảm đáng kể độ phức tạp tính toán, giải phóng phần cứng như GPU (Graphics Processing Unit) để xử lý các đầu vào dài hơn nhiều một cách tự nhiên.

Link to this sectionNhững phát triển gần đây và DeltaNet#

Cộng đồng nghiên cứu AI, dẫn đầu bởi các tổ chức như Đại học Stanford và những gã khổng lồ công nghệ như Google DeepMind, không ngừng đổi mới các công thức tuyến tính để tăng độ chính xác. Trong năm 2024 và 2025, các nhà nghiên cứu đã giới thiệu DeltaNet, một kiến trúc mới thay thế các bản cập nhật cộng dồn tiêu chuẩn trong các transformer tuyến tính bằng "Quy tắc Delta". Điều này cho phép mạng cập nhật bộ nhớ nội bộ của nó dựa trên những gì đã được lưu trữ, thay vì tính toán các giá trị tuyệt đối từ đầu.

Các tiến bộ tiếp theo, chẳng hạn như kiến trúc Gated DeltaNet, giới thiệu các tỷ lệ phân rã theo kênh, cho phép các mô hình quên hoặc giữ lại các tính năng chính cụ thể theo thời gian một cách có chọn lọc. Những cải tiến hiệu quả về phần cứng này thu hẹp khoảng cách hiệu suất giữa các transformer tuyến tính và attention softmax truyền thống, đặc biệt là trong các tác vụ truy xuất theo ngữ cảnh phức tạp.

Link to this sectionSo sánh Linear Attention với các cơ chế Attention khác#

Việc hiểu rõ kỹ thuật này khác biệt như thế nào so với các khái niệm liên quan trong nhóm cơ chế attention rộng hơn là rất quan trọng đối với các kỹ sư AI đang tối ưu hóa mạng của họ:

  • Self-Attention: Cơ chế nền tảng sử dụng ma trận softmax toàn bộ với chi phí tính toán đắt đỏ O(N bình phương) để nắm bắt ngữ cảnh toàn cục hoàn hảo.
  • Flash Attention: Một tối ưu hóa nhận biết IO giúp tăng tốc toán học self-attention chính xác O(N bình phương) bằng cách di chuyển dữ liệu hiệu quả giữa các tầng bộ nhớ GPU. Không giống như linear attention, Flash Attention không thay đổi công thức toán học cơ bản.
  • Sparse Attention: Một phương pháp tiết kiệm bộ nhớ bằng cách buộc mạng chỉ nhìn vào một cửa sổ cục bộ của các token lân cận, trong khi linear attention nén toàn bộ góc nhìn toàn cầu thành một trạng thái cố định về mặt toán học.

Link to this sectionCác ứng dụng trong thực tế#

Bằng cách phá vỡ rào cản về độ dài chuỗi, quy mô tuyến tính mở ra các khả năng mạnh mẽ trong nhiều lĩnh vực AI:

Link to this sectionVí dụ về mã#

Các framework hiện đại như PyTorchTensorFlow giúp việc triển khai các khái niệm toán học này trở nên đơn giản. Dưới đây là một đoạn mã PyTorch khái niệm minh họa cách linear attention thay đổi thứ tự của phép nhân ma trận để đạt được hiệu suất O(N).

import torch
import torch.nn as nn
import torch.nn.functional as F


class SimpleLinearAttention(nn.Module):
    def __init__(self, dim):
        super().__init__()
        self.qkv = nn.Linear(dim, dim * 3)

    def forward(self, x):
        # x shape: (Batch, Sequence Length, Channels)
        q, k, v = self.qkv(x).chunk(3, dim=-1)

        # Apply an activation function as a kernel approximation (replaces softmax)
        q = F.elu(q) + 1.0
        k = F.elu(k) + 1.0

        # Associative trick: Multiply Key and Value first (O(N) complexity)
        # k^T @ v yields a fixed (Batch, Channels, Channels) matrix
        kv_context = torch.matmul(k.transpose(-2, -1), v)

        # Multiply Query by the fixed context matrix to get the final output
        return torch.matmul(q, kv_context)


# Example: Processing a sequence of 1024 tokens
model = SimpleLinearAttention(dim=64)
dummy_input = torch.randn(1, 1024, 64)
output = model(dummy_input)
print(f"Output shape: {output.shape}")

Trong khi các mô hình cộng đồng mang tính thử nghiệm có thể kết hợp các lớp attention tuyến tính hoặc thưa thớt khác nhau, chúng thường có thể gặp phải tốc độ CPU chậm hoặc sự thiếu ổn định khi huấn luyện. Đối với các triển khai thị giác máy tính mạnh mẽ, sẵn sàng cho sản xuất, Ultralytics YOLO26 là tiêu chuẩn được khuyến nghị. Nó có kiến trúc end-to-end được tối ưu hóa cao, tối đa hóa tốc độ và độ chính xác cho các tác vụ quan trọng như phát hiện đối tượng mà không cần dựa vào các lớp attention nặng nề. Các nhà phát triển có thể chú thích tập dữ liệu, huấn luyện, triển khai và giám sát các mô hình hàng đầu này một cách liền mạch bằng cách sử dụng Ultralytics Platform toàn diện.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning