Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Reformer

Khám phá kiến trúc Reformer, một biến thể Transformer hiệu quả cho các chuỗi dài. Tìm hiểu cách chú ý LSH và RevNets tối ưu hóa bộ nhớ cho nghiên cứu AI.

Reformer là một biến thể hiệu quả của kiến trúc Transformer được thiết kế để xử lý các chuỗi dữ liệu rất dài vốn sẽ gây trở ngại về mặt tính toán đối với các mô hình tiêu chuẩn. Được giới thiệu để giải quyết các nút thắt cổ chai về bộ nhớ vốn có trong các hệ thống deep learning truyền thống, Reformer giảm độ phức tạp của attention mechanism từ bậc bậc hai xuống các số hạng log-tuyến tính. Sự đổi mới này cho phép các nhà nghiên cứu artificial intelligence huấn luyện các mô hình trên các cửa sổ ngữ cảnh kéo dài hàng chục nghìn token—chẳng hạn như toàn bộ sách, hình ảnh có độ phân giải cao hoặc các bản nhạc dài—trên một GPU duy nhất.

Link to this sectionNhững đổi mới cốt lõi của Reformer#

Reformer đạt được hiệu suất của nó thông qua hai thay đổi kiến trúc chính giúp phân biệt nó với các mô hình như BERT hoặc loạt GPT ban đầu. Các kỹ thuật này giải quyết vấn đề bộ nhớ khổng lồ cần thiết để lưu trữ các kích hoạt trong quá trình model training.

  • Locality-Sensitive Hashing (LSH) Attention: Trong một Transformer tiêu chuẩn, mọi phần tử trong một chuỗi đều chú ý đến mọi phần tử khác, tạo ra tải tính toán khổng lồ. Reformer sử dụng Locality-Sensitive Hashing để nhóm các vector tương tự lại với nhau. Thay vì tính toán điểm chú ý cho tất cả các cặp, mô hình chỉ tính toán chúng cho một tập hợp con nhỏ các nearest neighbors, giúp tăng tốc đáng kể inference engine.
  • Reversible Residual Layers (RevNets): Các neural networks truyền thống phải lưu trữ các kích hoạt cho mọi lớp để tính toán gradient trong quá trình backpropagation. Reformer sử dụng mạng thần kinh có thể đảo ngược, cho phép đầu vào của một lớp được tính toán lại từ đầu ra của nó trong quá trình truyền ngược. Kỹ thuật này loại bỏ nhu cầu lưu trữ các kích hoạt trung gian vào bộ nhớ đệm, giải phóng memory for larger batch sizes.

Link to this sectionReformer so với Transformer tiêu chuẩn#

Mặc dù cả hai kiến trúc đều dựa vào cơ chế tự chú ý (self-attention), chúng phục vụ các mục đích khác nhau trong hệ sinh thái machine learning.

  • Standard Transformer: Tuyệt vời cho các chuỗi có độ dài ngắn đến trung bình. Tuy nhiên, mức sử dụng bộ nhớ của nó tăng theo cấp số nhân ($O(L^2)$) theo độ dài chuỗi ($L$). Đây là nền tảng của nhiều Large Language Models (LLMs) được sử dụng cho các tác vụ như sentiment analysis hoặc chatbot.
  • Reformer: Được tối ưu hóa cho độ dài cực lớn ($O(L \log L)$). Nó hy sinh một lượng nhỏ accuracy trong một số bối cảnh để đổi lấy khả năng xử lý các đầu vào mà các Transformer tiêu chuẩn không thể xử lý, chẳng hạn như xử lý dữ liệu time series analysis cực dài hoặc tạo hình ảnh theo từng pixel.

Link to this sectionCác ứng dụng trong thực tế#

Khả năng xử lý các cửa sổ ngữ cảnh rộng lớn của Reformer mở ra những khả năng mới trong các lĩnh vực mà dữ liệu không thể dễ dàng bị phân mảnh.

  1. Genomic Analysis: Các chuỗi DNA bao gồm hàng triệu cặp cơ sở. Reformer có thể phân tích các chuỗi dài này để xác định các mẫu trong bioinformatics mà không làm mất bối cảnh rộng hơn, hỗ trợ dự đoán cấu trúc protein.

  2. Long-Form Text Generation: Không giống như các mô hình text generation tiêu chuẩn có thể mất tính mạch lạc sau vài đoạn văn, Reformer có thể duy trì sự nhất quán qua hàng nghìn từ, làm cho nó phù hợp để tạo tóm tắt các hợp đồng pháp lý dài hoặc toàn bộ các chương tiểu thuyết.

Link to this sectionHiệu suất trong Computer Vision#

Mặc dù Reformer thường được liên kết với văn bản, nguyên tắc về hiệu suất là rất quan trọng trong computer vision. Cũng giống như cách Reformer tối ưu hóa Transformer, các mô hình thị giác hiện đại như YOLO26 tối ưu hóa các mạng thần kinh tích chập (CNN) cho real-time inference. Việc hiểu các hạn chế về bộ nhớ là rất quan trọng khi triển khai các mô hình lên các thiết bị biên thông qua Ultralytics Platform, nơi tài nguyên phần cứng bị hạn chế.

Đoạn mã sau đây minh họa cách kiểm tra dấu chân bộ nhớ của một mô hình bằng cách sử dụng PyTorch, một khái niệm trọng tâm trong việc phát triển các kiến trúc tiết kiệm bộ nhớ như Reformer.

import torch
import torch.nn as nn

# Define a simple Transformer layer (Standard, not Reformer optimized)
layer = nn.TransformerEncoderLayer(d_model=512, nhead=8)
model = nn.TransformerEncoder(layer, num_layers=6)

# Create a long sequence input (Sequence Length: 2000, Batch: 1, Features: 512)
# Standard Transformers struggle as this length increases.
input_data = torch.rand(2000, 1, 512)

# Check parameter count to understand model complexity
params = sum(p.numel() for p in model.parameters())
print(f"Model Parameters: {params:,}")

# Perform a forward pass
output = model(input_data)
print(f"Output shape: {output.shape}")

Link to this sectionCác khái niệm liên quan#

  • Sparse Attention: Một danh mục rộng hơn các kỹ thuật, bao gồm LSH, trong đó mô hình chỉ chú ý đến một tập hợp con các token để tiết kiệm tài nguyên tính toán.
  • Gradient Checkpointing: Một kỹ thuật tương tự như các lớp có thể đảo ngược được sử dụng để đánh đổi thời gian tính toán lấy bộ nhớ trong quá trình model training.
  • Model Optimization: Thực tiễn chung nhằm cải thiện hiệu suất mô hình, bao gồm định lượng (quantization), cắt tỉa (pruning) và các thay đổi kiến trúc như những thay đổi trong Reformer.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning