Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Sparse Attention

Tìm hiểu cách Sparse Attention tối ưu hóa học sâu bằng cách giảm chi phí tính toán. Khám phá vai trò của nó trong các LLM và cách triển khai các mô hình thông qua Ultralytics Platform.

Sparse Attention là một kỹ thuật tối ưu hóa nâng cao trong deep learning (DL) được thiết kế để giảm đáng kể gánh nặng tính toán khi xử lý các chuỗi dữ liệu dài. Trong các Transformer architectures truyền thống, các model tính toán tương tác giữa mọi mẩu dữ liệu—ví dụ như mọi từ trong một tài liệu hoặc mọi pixel trong một hình ảnh. Khi kích thước đầu vào tăng lên, điều này gây ra computational overhead khổng lồ và nhanh chóng vượt quá GPU memory constraints. Sparse Attention giải quyết nút thắt này bằng cách áp dụng các nguyên tắc từ sparse neural networks. Thay vì so sánh mọi thứ với mọi thứ, model sẽ giới hạn phạm vi tập trung một cách chiến lược vào một tập hợp con động, nhỏ hơn của các điểm dữ liệu có độ liên quan cao. Điều này cho phép xử lý hiệu quả các đầu vào cực dài mà không làm giảm độ chính xác của model.

Link to this sectionPhân biệt các phương thức Attention#

Việc hiểu cách Sparse Attention phù hợp với AI hiện đại đòi hỏi phải phân biệt nó với các attention mechanisms liên quan. Trong khi Self-Attention tiêu chuẩn tính toán một bản đồ dày đặc, toàn cục về mọi tương tác token, thì Sparse Attention thực hiện mask các kết nối ít quan trọng hơn một cách rõ ràng bằng cách sử dụng các mô hình định sẵn như sliding window hoặc block-sparse grid.

Điều này khác biệt về cơ bản với Flash Attention, vốn là một kỹ thuật tối ưu hóa cấp phần cứng giúp tăng tốc attention chính xác tiêu chuẩn bằng cách giảm thiểu việc đọc/ghi bộ nhớ trên chính chip GPU. Hơn nữa, nó khác biệt với Deformable Attention. Các mạng deformable học các vị trí lấy mẫu không gian động một cách nhanh chóng, trong khi Sparse Attention thường dựa vào các mô hình sparsity có cấu trúc, theo thuật toán để lọc bỏ các kết nối không liên quan.

Các cơ chế hiệu quả cao này đang được sử dụng tích cực trong các framework PyTorch ecosystemTensorFlow implementations hiện đại. Tuy nhiên, các kiến trúc thuần attention đôi khi có thể gây ra sự phức tạp khi triển khai trên các thiết bị edge. Đối với các lập trình viên đang tìm kiếm hiệu suất cực nhanh, được tối ưu hóa cho edge mà không cần gánh nặng transformer quá lớn, Ultralytics YOLO26 là tiêu chuẩn được khuyến nghị cho các tác vụ như object detectionimage segmentation.

Link to this sectionCác ứng dụng trong thực tế#

Sparse Attention là nền tảng cho các ứng dụng được ghi lại trong các IEEE academic publications gần đây và được tiên phong bởi các tổ chức như OpenAI vision developmentsAnthropic's advanced research.

  • Large Language Models (LLMs) và Tài liệu dài: Bằng cách tận dụng các tương tác thưa thớt, các model văn bản hiện đại có thể đạt được context window khổng lồ. Điều này cho phép AI tiếp nhận và tóm tắt toàn bộ sách giáo khoa, cơ sở mã pháp lý hoặc các báo cáo tài chính phức tạp trong một lượt truyền duy nhất mà không bị crash do giới hạn bộ nhớ.
  • High-Resolution Medical Image Analysis: Trong bệnh học và chẩn đoán hình ảnh, các hệ thống AI phải xử lý các bản quét mô gigapixel. Các kỹ thuật sparse cho phép vision transformer phân tích các hình ảnh khổng lồ ở độ phân giải gốc của chúng—phát hiện các điểm bất thường nhỏ của tế bào mà không cần giảm tỷ lệ và làm mất các chi tiết chẩn đoán quan trọng.
  • Genomic Sequence Mapping: Trong tin sinh học, việc phân tích DNA liên quan đến việc so sánh các chuỗi mã di truyền cực kỳ dài. Sparse Attention giúp các model AI tìm thấy các mô hình cấu trúc trong hàng tỷ cặp base một cách hiệu quả, tăng tốc khám phá thuốc và nghiên cứu bệnh tật.

Link to this sectionMô phỏng các Sparse Attention Mask#

Một thành phần cơ bản của việc triển khai Sparse Attention là tạo ra một mask hạn chế model không nhìn vào mọi token. Mã PyTorch sau đây minh họa cách tạo một sparse mask cục bộ, đảm bảo một token chỉ chú ý đến các hàng xóm trực tiếp của nó.

import torch

# Simulate a sequence of 6 tokens
seq_len = 6

# Create a sparse mask where True allows attention (local window of size 1)
sparse_mask = torch.eye(seq_len, dtype=torch.bool)
sparse_mask.diagonal(1).fill_(True)
sparse_mask.diagonal(-1).fill_(True)

print("Sparse Attention Mask:\n", sparse_mask.int())

Khi mở rộng các dự án computer vision (CV) lên sản xuất, các lập trình viên thường tận dụng Ultralytics Platform. Giải pháp đám mây toàn diện này đơn giản hóa quy trình training, theo dõi và triển khai các model hiện đại nhất, trừu tượng hóa cơ sở hạ tầng phức tạp cần thiết cho các tối ưu hóa nâng cao như custom attention kernel.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning