Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Vanishing Gradient

Tìm hiểu cách vấn đề vanishing gradient ảnh hưởng đến deep learning và khám phá các giải pháp hiệu quả như ReLU và residual connections được sử dụng trong Ultralytics YOLO26.

Vấn đề Vanishing Gradient (đạo hàm biến mất) là một thách thức lớn gặp phải trong quá trình huấn luyện các artificial neural networks (mạng thần kinh nhân tạo) sâu. Hiện tượng này xảy ra khi các gradient—những giá trị quyết định mức độ thay đổi của các tham số trong mạng—trở nên vô cùng nhỏ khi chúng lan truyền ngược từ lớp đầu ra đến các lớp đầu vào. Vì các gradient này rất cần thiết để cập nhật model weights (trọng số mô hình), sự biến mất của chúng đồng nghĩa với việc các lớp trước của mạng ngừng học tập. Hiện tượng này ngăn cản mô hình nắm bắt các mô hình phức tạp trong dữ liệu, từ đó giới hạn độ sâu và hiệu suất của các kiến trúc deep learning (học sâu).

Link to this sectionCơ chế của các tín hiệu biến mất#

Để hiểu lý do tại sao điều này xảy ra, cần xem xét quy trình backpropagation (lan truyền ngược). Trong quá trình huấn luyện, mạng tính toán sai số giữa dự đoán của nó và mục tiêu thực tế bằng cách sử dụng một loss function (hàm mất mát). Sai số này sau đó được truyền ngược qua các lớp để điều chỉnh trọng số. Việc điều chỉnh này dựa trên quy tắc chuỗi của giải tích, bao gồm việc nhân các đạo hàm của các activation functions (hàm kích hoạt) theo từng lớp.

Nếu một mạng sử dụng các hàm kích hoạt như sigmoid function hoặc hàm tiếp tuyến hyperbol (tanh), các đạo hàm thường nhỏ hơn 1. Khi nhiều số nhỏ như vậy được nhân với nhau trong một mạng sâu với hàng chục hoặc hàng trăm lớp, kết quả sẽ tiến dần về 0. Bạn có thể hình dung điều này giống như trò chơi "điện thoại" trong đó thông điệp được thì thầm dọc theo một hàng dài người; đến khi nó đến đầu hàng, thông điệp đã trở nên không thể nghe rõ, và người đầu tiên không biết phải nói gì.

Link to this sectionCác giải pháp và kiến trúc hiện đại#

Lĩnh vực AI đã phát triển một số chiến lược mạnh mẽ để giảm thiểu tình trạng vanishing gradient, cho phép tạo ra các mô hình mạnh mẽ như Ultralytics YOLO26.

  • ReLU và các biến thể: Rectified Linear Unit (ReLU) và các phiên bản kế nhiệm của nó, chẳng hạn như Leaky ReLU và SiLU, không bị bão hòa đối với các giá trị dương. Đạo hàm của chúng bằng 1 hoặc là một hằng số nhỏ, giúp bảo toàn độ lớn của gradient qua các lớp sâu.
  • Residual Connections: Được giới thiệu trong Residual Networks (ResNets), đây là các "skip connections" (kết nối tắt) cho phép gradient bỏ qua một hoặc nhiều lớp. Điều này tạo ra một "đường cao tốc" để gradient lưu thông mà không bị cản trở đến các lớp trước đó, một khái niệm thiết yếu cho object detection (phát hiện đối tượng) hiện đại.
  • Batch Normalization: Bằng cách chuẩn hóa đầu vào của mỗi lớp, batch normalization đảm bảo rằng mạng hoạt động trong một chế độ ổn định nơi các đạo hàm không quá nhỏ, làm giảm sự phụ thuộc vào việc khởi tạo cẩn thận.
  • Gated Architectures: Đối với dữ liệu tuần tự, các mạng Long Short-Term Memory (LSTM) và GRU sử dụng các cổng chuyên dụng để quyết định lượng thông tin cần lưu giữ hoặc loại bỏ, giúp bảo vệ gradient khỏi tình trạng biến mất trên các chuỗi dài.

Link to this sectionVanishing vs. Exploding Gradients#

Mặc dù xuất phát từ cùng một cơ chế cơ bản (phép nhân lặp lại), vanishing gradients khác biệt hoàn toàn so với exploding gradients (gradient bùng nổ).

  • Vanishing Gradient: Các gradient tiến về 0, khiến quá trình học tập dừng lại. Điều này thường xảy ra trong các mạng sâu với hàm kích hoạt sigmoid.
  • Exploding Gradient: Các gradient tích lũy trở nên quá lớn, khiến model weights biến động dữ dội hoặc đạt đến giá trị NaN (Not a Number). Vấn đề này thường được khắc phục bằng gradient clipping.

Link to this sectionCác ứng dụng trong thực tế#

Việc vượt qua hiện tượng vanishing gradient là điều kiện tiên quyết cho sự thành công của các ứng dụng AI hiện đại.

  1. Deep Object Detection: Các mô hình được sử dụng cho autonomous vehicles (xe tự hành), như dòng YOLO, đòi hỏi hàng trăm lớp để phân biệt giữa người đi bộ, biển báo và phương tiện. Nếu không có các giải pháp như khối residual và batch normalization, việc huấn luyện các mạng sâu này trên các datasets khổng lồ như COCO là không thể. Các công cụ như Ultralytics Platform giúp hợp lý hóa quy trình huấn luyện này, đảm bảo các kiến trúc phức tạp hội tụ một cách chính xác.

  2. Machine Translation: Trong Natural Language Processing (NLP) (xử lý ngôn ngữ tự nhiên), việc dịch một câu dài đòi hỏi sự hiểu biết về mối quan hệ giữa từ đầu tiên và từ cuối cùng. Việc giải quyết vấn đề vanishing gradient trong các mạng RNN (thông qua LSTM) và sau đó là Transformers đã cho phép các mô hình duy trì ngữ cảnh qua các đoạn văn dài, tạo ra cuộc cách mạng cho các dịch vụ machine translation (dịch máy) như Google Translate.

Link to this sectionVí dụ về Python#

Các framework và mô hình hiện đại trừu tượng hóa nhiều sự phức tạp này. Khi bạn huấn luyện một mô hình như YOLO26, kiến trúc tự động bao gồm các thành phần như hàm kích hoạt SiLU và Batch Normalization để ngăn chặn gradient bị biến mất.

from ultralytics import YOLO

# Load the YOLO26 model (latest generation, Jan 2026)
# This architecture includes residual connections and modern activations
# that inherently prevent vanishing gradients.
model = YOLO("yolo26n.pt")

# Train the model on a dataset
# The optimization process remains stable due to the robust architecture
results = model.train(data="coco8.yaml", epochs=10)

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning