Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Ring Attention

Khám phá cách Ring Attention mở rộng quy mô các Transformer đến độ dài chuỗi vô hạn. Tìm hiểu cách kỹ thuật này nâng cao các LLM và Vision Transformer cho các tác vụ dữ liệu khổng lồ.

Ring Attention là một kỹ thuật machine learning (ML) tiên tiến được thiết kế để mở rộng context window của các kiến trúc Transformer lên độ dài chuỗi gần như vô hạn. Bằng cách phân tán quá trình tính toán attention phức tạp trên một cụm GPU được kết nối theo cấu trúc liên kết vòng (ring topology), nó chồng lấp hiệu quả việc giao tiếp với tính toán. Bước đột phá về kiến trúc này cho phép các Large Language Models (LLMs)Vision Transformers (ViT) xử lý các đầu vào khổng lồ—chẳng hạn như toàn bộ sách hoặc hàng giờ video liên tục—vượt xa dung lượng bộ nhớ của bất kỳ thiết bị phần cứng đơn lẻ nào.

Link to this sectionVượt qua rào cản Context Window#

Trong các cơ chế self-attention tiêu chuẩn, mức tiêu thụ bộ nhớ tăng theo bậc hai so với độ dài của chuỗi đầu vào. Điều này tạo ra một điểm nghẽn nghiêm trọng cho các mô hình deep learning (DL) khi cố gắng phân tích dữ liệu dạng dài. Để tìm hiểu thêm về cách cộng đồng AI giải quyết vấn đề này, bạn có thể khám phá nghiên cứu của Berkeley AI Research về các mô hình context lớn.

Ring Attention giải quyết điểm nghẽn bậc hai này bằng cách chia các query, key và value thành các khối nhỏ hơn. Mỗi GPU trong mạng lưới phân tán tính toán một khối và sau đó chuyển các key và value cho thiết bị lân cận trong vòng. Quá trình truyền vòng này tiếp tục cho đến khi cơ chế attention hoàn chỉnh được tính toán. Việc sử dụng các công cụ như gói giao tiếp phân tán PyTorch cho phép các nhà phát triển xây dựng các pipeline huấn luyện đa thiết bị phức tạp này.

Link to this sectionRing Attention so với Flash Attention#

Mặc dù cả hai kỹ thuật đều tối ưu hóa bộ nhớ, chúng hoạt động ở các cấp độ khác nhau. Flash Attention là một thuật toán nhận biết phần cứng giúp giảm thiểu việc đọc và ghi bộ nhớ tốn kém trong SRAM của một GPU. Ngược lại, Ring Attention là một thuật toán phân tán tập trung vào việc mở rộng quy mô tính toán trên nhiều GPU. Trong các workflow generative AI tiên tiến, hai kỹ thuật này thường được kết hợp để đạt được cả hiệu suất phần cứng cục bộ và khả năng mở rộng đa thiết bị ở quy mô lớn, như đã trình bày chi tiết trong bài báo nghiên cứu Ring Attention gốc trên arXiv.

Link to this sectionCác ứng dụng trong thực tế#

Khả năng xử lý hàng triệu token đồng thời mở ra những năng lực mạnh mẽ trong AI hiện đại:

  1. Phân tích tài liệu và cơ sở mã nguồn toàn diện: Ring Attention cho phép các mô hình nạp hàng triệu dòng code hoặc các thư viện pháp lý phức tạp trong một prompt duy nhất. Điều này cải thiện đáng kể các hệ thống dựa trên Retrieval Augmented Generation (RAG), cho phép chúng tổng hợp ngữ cảnh mà không làm cắt xén thông tin quan trọng. Khái niệm này là nền tảng cho các mô hình context khổng lồ như kiến trúc Gemini của Google.

  2. Hiểu video mở rộng: Trong computer vision (CV), việc xử lý các chuỗi video độ phân giải cao thường yêu cầu downsampling mạnh. Ring Attention cho phép các mô hình phân tích nguồn cấp dữ liệu video không nén, kéo dài hàng giờ. Điều này nâng cao khả năng action recognitionobject tracking liên tục trong các hệ thống an ninh và lái xe tự động, duy trì nhận thức thời gian qua các khoảng thời gian dài.

Link to this sectionXử lý các chuỗi thị giác#

Mặc dù các mô hình attention phân tán khổng lồ xử lý được các context vô hạn, các ứng dụng thực tế ưu tiên edge lại đòi hỏi các kiến trúc được tối ưu hóa cao. Đối với real-time inference và xử lý chuỗi hình ảnh, Ultralytics YOLO26 cung cấp hiệu suất dẫn đầu ngành mà không cần chi phí tính toán cực lớn như các transformer thuần dựa trên attention.

from ultralytics import YOLO

# Load the recommended YOLO26 model for high-speed object tracking
model = YOLO("yolo26n.pt")

# Perform robust multi-object tracking on a long video sequence
results = model.track(source="long_surveillance_feed.mp4", stream=True)

# Iterate through the stream to process temporal tracking data
for frame_result in results:
    print(f"Tracked {len(frame_result.boxes)} objects in current frame.")

Khi xây dựng và mở rộng các giải pháp object detectionimage segmentation phức tạp này, việc quản lý điều phối phần cứng là rất quan trọng. Ultralytics Platform đơn giản hóa hoàn toàn quy trình này, cung cấp các công cụ cho cloud training liền mạch, tự động gán nhãn tập dữ liệu và model deployment một cú nhấp chuột trên nhiều môi trường phần cứng. Việc tận dụng các nền tảng này đảm bảo rằng các kỹ thuật mở rộng tiên tiến chuyển đổi suôn sẻ từ nghiên cứu sang các pipeline AI có thể mở rộng và sẵn sàng cho sản xuất.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning