Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Transformer-XL

Khám phá Transformer-XL và sự tái phát cấp phân đoạn của nó. Tìm hiểu cách kiến trúc này giải quyết vấn đề ngữ cảnh cố định cho các phụ thuộc tầm xa (long-range dependencies) trong các mô hình AI.

Transformer-XL (Transformer-Extra Long) là một kiến trúc mạng thần kinh chuyên biệt được thiết kế để giải quyết một hạn chế nghiêm trọng trong các mô hình Transformer tiêu chuẩn: khả năng xử lý các phụ thuộc tầm xa trong dữ liệu tuần tự. Được giới thiệu bởi các nhà nghiên cứu tại Google AI, kiến trúc này cho phép các mô hình ngôn ngữ nhìn xa hơn các cửa sổ ngữ cảnh có độ dài cố định vốn gây hạn chế cho các phương pháp truyền thống như BERT hoặc Transformer nguyên bản. Bằng cách giới thiệu cơ chế lặp lại cấp độ phân đoạn (segment-level recurrence) và sơ đồ mã hóa vị trí mới lạ, Transformer-XL có thể xử lý các chuỗi văn bản cực dài mà không làm mất ngữ cảnh, trở thành một khái niệm nền tảng cho các Large Language Models (LLMs) hiện đại và các ứng dụng AI tạo sinh.

Link to this sectionVượt qua các hạn chế về ngữ cảnh#

Động lực chính đằng sau Transformer-XL là "vấn đề ngữ cảnh cố định". Các Transformer tiêu chuẩn xử lý dữ liệu theo các phân đoạn có kích thước cố định (ví dụ: 512 token). Thông tin thường không truyền tải giữa các phân đoạn này, nghĩa là mô hình sẽ quên đi những gì đã xảy ra trong phân đoạn trước đó. Điều này làm phá vỡ tính mạch lạc trong các tài liệu dài.

Transformer-XL giải quyết vấn đề này bằng hai đổi mới chính:

  1. Cơ chế lặp lại cấp độ phân đoạn: Không giống như Transformer thông thường xử lý từng phân đoạn độc lập, Transformer-XL lưu trữ các trạng thái ẩn (hidden states) từ phân đoạn trước vào bộ nhớ. Khi xử lý phân đoạn hiện tại, mô hình có thể chú ý (attend) đến các trạng thái đã lưu này. Điều này kết nối các phân đoạn một cách hiệu quả, cho phép thông tin lan truyền qua các khoảng cách xa hơn nhiều, tương tự như Recurrent Neural Network (RNN) nhưng với các lợi ích về song song hóa của cơ chế chú ý (attention mechanisms).

  2. Mã hóa vị trí tương đối: Vì cơ chế lặp lại tái sử dụng các trạng thái từ các phân đoạn trước, các mã hóa vị trí tuyệt đối tiêu chuẩn (gán một ID duy nhất cho mỗi vị trí) sẽ trở nên gây nhầm lẫn. Transformer-XL sử dụng mã hóa tương đối, giúp mô hình hiểu khoảng cách giữa các token (ví dụ: "từ A cách từ B 5 bước") thay vì vị trí tuyệt đối của chúng trong tài liệu.

Kiến trúc này cải thiện đáng kể các điểm số perplexity trong các tác vụ mô hình hóa ngôn ngữ so với các tiền nhiệm như RNN và các Transformer tiêu chuẩn.

Link to this sectionSự khác biệt so với các Transformer tiêu chuẩn#

Việc phân biệt Transformer-XL với Vision Transformer (ViT) tiêu chuẩn hoặc các Transformer văn bản là rất hữu ích. Trong khi một Transformer tiêu chuẩn thiết lập lại trạng thái của nó sau mỗi phân đoạn, gây ra "sự phân mảnh ngữ cảnh", thì Transformer-XL duy trì bộ nhớ của các kích hoạt (activations) trong quá khứ. Điều này cho phép nó mô hình hóa các phụ thuộc dài hơn hàng trăm lần so với các mô hình ngữ cảnh cố định. Điều này đặc biệt quan trọng đối với các tác vụ yêu cầu natural language understanding (NLU) sâu sắc, nơi câu trả lời cho một câu hỏi có thể nằm cách xa các đoạn văn chứa truy vấn.

Link to this sectionCác ứng dụng trong thực tế#

Khả năng duy trì ngữ cảnh dài hạn giúp Transformer-XL trở nên giá trị trong một số lĩnh vực có tác động cao:

  • Tạo văn bản dài: Trong các ứng dụng text generation, chẳng hạn như viết tiểu thuyết hoặc tạo các báo cáo dài, việc duy trì tính nhất quán về chủ đề là rất khó khăn. Transformer-XL cho phép AI ghi nhớ tên nhân vật, các tình tiết cốt truyện hoặc các định nghĩa kỹ thuật được giới thiệu từ sớm trong văn bản, đảm bảo đầu ra vẫn mạch lạc xuyên suốt.
  • Phân tích chuỗi DNA: Kiến trúc này không chỉ giới hạn ở ngôn ngữ con người. Trong tin sinh học, các nhà nghiên cứu sử dụng các biến thể của Transformer-XL để phân tích các chuỗi DNA dài. Việc hiểu mối quan hệ giữa các chuỗi gen ở xa giúp xác định các dấu hiệu di truyền và dự đoán cấu trúc protein, tương tự như cách AI in healthcare hỗ trợ phân tích hình ảnh y tế.
  • Chatbot và Trợ lý ảo: Các chatbots hiện đại cần ghi nhớ sở thích và chi tiết của người dùng được đề cập từ sớm trong cuộc trò chuyện. Các cơ chế của Transformer-XL giúp mở rộng context window, ngăn chặn trải nghiệm gây thất vọng khi một trợ lý quên đi chủ đề đã thảo luận chỉ vài phút trước đó.

Link to this sectionBộ nhớ và Hiệu năng#

Mặc dù Transformer-XL cung cấp hiệu suất vượt trội trên các chuỗi dài, nó cũng đưa ra các cân nhắc cụ thể về bộ nhớ. Việc lưu trữ các trạng thái ẩn yêu cầu thêm bộ nhớ GPU, điều này có thể ảnh hưởng đến inference latency nếu không được quản lý đúng cách. Tuy nhiên, đối với các ứng dụng mà độ chính xác trên các ngữ cảnh dài là tối quan trọng, sự đánh đổi này thường được chấp nhận.

Các mô hình object detection hiện đại như YOLO26 tập trung vào tốc độ và hiệu suất cho dữ liệu hình ảnh. Ngược lại, các kiến trúc như Transformer-XL ưu tiên khả năng lưu giữ bộ nhớ cho dữ liệu tuần tự. Thú vị là, lĩnh vực này đang phát triển theo hướng multimodal AI, nơi các cấu trúc thị giác (vision backbones) hiệu quả (như trong YOLO26) có thể được kết hợp với các bộ giải mã ngôn ngữ ngữ cảnh dài để phân tích các video dài và trả lời các câu hỏi phức tạp về các sự kiện diễn ra theo thời gian.

Link to this sectionVí dụ: Quản lý ngữ cảnh trong suy luận (Inference)#

Mặc dù các cơ chế nội bộ của Transformer-XL khá phức tạp, việc sử dụng các mô hình tiên tiến thường bao gồm việc quản lý đầu vào để tuân thủ các giới hạn ngữ cảnh. Ví dụ Python sau đây sử dụng torch minh họa khái niệm truyền "bộ nhớ" (trạng thái ẩn) vào một mô hình để duy trì ngữ cảnh qua các bước, mô phỏng hành vi lặp lại được tìm thấy trong các kiến trúc như Transformer-XL.

import torch
import torch.nn as nn

# Define a simple RNN to demonstrate passing hidden states (memory)
# This mimics the core concept of recurrence used in Transformer-XL
rnn = nn.RNN(input_size=10, hidden_size=20, num_layers=2, batch_first=True)

# Initial input: Batch size 1, sequence length 5, feature size 10
input_seq1 = torch.randn(1, 5, 10)

# Run first segment, receiving output and the hidden state (memory)
output1, memory = rnn(input_seq1)

# Run second segment, PASSING the memory from the previous step
# This connects the two segments, allowing context to flow
input_seq2 = torch.randn(1, 5, 10)
output2, new_memory = rnn(input_seq2, memory)

print(f"Output shape with context: {output2.shape}")

Đối với các đội ngũ đang tìm cách huấn luyện và triển khai các mô hình hiện đại một cách hiệu quả, Ultralytics Platform cung cấp các công cụ để quản lý tập dữ liệu và hợp lý hóa quy trình model training, cho dù bạn đang làm việc với các mô hình thị giác hay tích hợp các kiến trúc tuần tự phức tạp.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning