Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Recurrent Neural Network (RNN)

Khám phá cách Mạng thần kinh tái phát (RNN) xử lý dữ liệu tuần tự bằng bộ nhớ. Tìm hiểu về kiến trúc RNN, ứng dụng NLP và các triển khai trong PyTorch.

Mạng thần kinh tái phát (RNN) là một loại mạng thần kinh nhân tạo được thiết kế đặc biệt để nhận dạng các mẫu trong chuỗi dữ liệu, chẳng hạn như văn bản, bộ gen, chữ viết tay hoặc lời nói. Không giống như các mạng feedforward truyền thống giả định rằng tất cả các đầu vào (và đầu ra) là độc lập với nhau, RNN duy trì một dạng bộ nhớ. Bộ nhớ nội bộ này cho phép chúng xử lý các đầu vào với sự hiểu biết về thông tin trước đó, khiến chúng đặc biệt phù hợp cho các tác vụ mà ngữ cảnh và thứ tự thời gian là rất quan trọng. Kiến trúc này mô phỏng cách con người xử lý thông tin—ví dụ, việc đọc một câu đòi hỏi phải ghi nhớ các từ trước đó để hiểu từ hiện tại.

Link to this sectionCách RNN hoạt động#

Cải tiến cốt lõi của một RNN là cấu trúc vòng lặp. Trong một mạng feedforward tiêu chuẩn, thông tin chỉ truyền theo một hướng: từ đầu vào đến đầu ra. Ngược lại, RNN có một vòng lặp phản hồi cho phép thông tin tồn tại lâu dài. Khi mạng xử lý một chuỗi, nó duy trì một "trạng thái ẩn"—một vector đóng vai trò là bộ nhớ ngắn hạn của mạng. Tại mỗi bước thời gian, RNN nhận đầu vào hiện tại và trạng thái ẩn trước đó để tạo ra đầu ra và cập nhật trạng thái ẩn cho bước tiếp theo.

Khả năng xử lý tuần tự này rất cần thiết cho Xử lý ngôn ngữ tự nhiên (NLP)phân tích chuỗi thời gian. Tuy nhiên, các RNN tiêu chuẩn thường gặp khó khăn với các chuỗi dài do vấn đề vanishing gradient, trong đó mạng quên đi các đầu vào trước đó khi chuỗi dài ra. Hạn chế này đã dẫn đến việc phát triển các biến thể tiên tiến hơn như mạng Long Short-Term Memory (LSTM)Gated Recurrent Units (GRUs), vốn giới thiệu các cơ chế để điều tiết luồng thông tin tốt hơn trong khoảng thời gian dài hơn.

Link to this sectionCác ứng dụng trong thực tế#

Mạng thần kinh tái phát đã chuyển đổi nhiều ngành công nghiệp bằng cách cho phép máy móc hiểu được dữ liệu tuần tự. Dưới đây là hai ví dụ nổi bật:

  1. Dịch máy: Các dịch vụ như Google Translate ban đầu dựa rất nhiều vào các kiến trúc dựa trên RNN (cụ thể là sequence-to-sequence models) để chuyển đổi văn bản từ ngôn ngữ này sang ngôn ngữ khác. Mạng đọc toàn bộ câu đầu vào (ví dụ: bằng tiếng Anh) và xây dựng một vector ngữ cảnh, sau đó nó sử dụng vector này để tạo đầu ra đã dịch (ví dụ: bằng tiếng Pháp) từng từ một, đảm bảo tính nhất quán về ngữ pháp.

  2. Gợi ý từ và tự động sửa lỗi: Khi bạn nhập liệu trên điện thoại thông minh, bàn phím sẽ gợi ý từ tiếp theo có khả năng cao nhất. Điều này thường được hỗ trợ bởi một mô hình ngôn ngữ được huấn luyện bằng RNN. Mô hình phân tích chuỗi các từ bạn đã nhập để dự đoán từ tiếp theo có xác suất cao nhất, giúp cải thiện tốc độ và độ chính xác cho người dùng. Logic tương tự áp dụng cho các hệ thống nhận dạng giọng nói chuyển đổi âm thanh nói thành văn bản.

Link to this sectionRNN so với CNN và Transformer#

Việc phân biệt RNN với các kiến trúc chính khác là rất hữu ích. Một Mạng thần kinh tích chập (CNN) chủ yếu được thiết kế cho dữ liệu không gian, chẳng hạn như hình ảnh, xử lý lưới pixel để nhận dạng hình dạng và đối tượng. Ví dụ: Ultralytics YOLO26 sử dụng một backbone CNN mạnh mẽ cho phát hiện đối tượng theo thời gian thực. Trong khi CNN xuất sắc ở câu hỏi "có gì trong hình ảnh này?", thì RNN xuất sắc ở câu hỏi "điều gì sẽ xảy ra tiếp theo trong video này?".

Gần đây hơn, kiến trúc Transformer đã thay thế phần lớn RNN cho nhiều tác vụ NLP phức tạp. Transformers sử dụng cơ chế chú ý (attention mechanism) để xử lý toàn bộ chuỗi song song thay vì tuần tự. Tuy nhiên, RNN vẫn duy trì hiệu quả cao đối với các ứng dụng streaming có độ trễ thấp, hạn chế về tài nguyên cụ thể và dễ triển khai hơn trên các thiết bị biên (edge devices) cho việc dự báo chuỗi thời gian đơn giản.

Link to this sectionVí dụ triển khai với PyTorch#

Mặc dù các tác vụ thị giác máy tính hiện đại thường dựa vào CNN, các mô hình lai có thể sử dụng RNN để phân tích các đặc trưng thời gian được trích xuất từ các khung hình video. Dưới đây là một ví dụ đơn giản, có thể chạy được bằng cách sử dụng PyTorch để tạo một lớp RNN cơ bản xử lý chuỗi dữ liệu.

import torch
import torch.nn as nn

# Define a basic RNN layer
# input_size: number of features in the input (e.g., 10 features per time step)
# hidden_size: number of features in the hidden state (memory)
# batch_first: input shape will be (batch, seq, feature)
rnn = nn.RNN(input_size=10, hidden_size=20, num_layers=1, batch_first=True)

# Create a dummy input: Batch size 1, Sequence length 5, Features 10
input_seq = torch.randn(1, 5, 10)

# Forward pass through the RNN
# output contains the hidden state for every time step
# hn contains the final hidden state
output, hn = rnn(input_seq)

print(f"Output shape: {output.shape}")  # Expected: torch.Size([1, 5, 20])
print(f"Final hidden state shape: {hn.shape}")  # Expected: torch.Size([1, 1, 20])

Link to this sectionNhững thách thức và Triển vọng tương lai#

Bất chấp tính hữu dụng của chúng, RNN phải đối mặt với các rào cản tính toán. Việc xử lý tuần tự ngăn cản khả năng song song hóa, làm cho quá trình huấn luyện chậm hơn so với Transformers trên các GPU. Hơn nữa, việc quản lý vấn đề exploding gradient đòi hỏi phải tinh chỉnh siêu tham số (hyperparameter tuning) cẩn thận và sử dụng các kỹ thuật như gradient clipping.

Tuy nhiên, RNN vẫn là một khái niệm nền tảng trong Deep Learning (DL). Chúng đóng vai trò không thể thiếu trong việc tìm hiểu sự tiến hóa của Trí tuệ nhân tạo (AI) và vẫn được sử dụng rộng rãi trong các hệ thống phát hiện bất thường (anomaly detection) đơn giản cho các cảm biến IoT. Đối với các nhà phát triển đang xây dựng các đường ống (pipelines) phức tạp—chẳng hạn như kết hợp các mô hình thị giác với các bộ dự đoán chuỗi—việc quản lý tập dữ liệu và quy trình huấn luyện là rất quan trọng. Nền tảng Ultralytics đơn giản hóa quy trình này, cung cấp các công cụ để quản lý dữ liệu và triển khai mô hình hiệu quả trên nhiều môi trường khác nhau.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning