Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Exploding Gradient

Tìm hiểu cách exploding gradients ảnh hưởng đến học sâu và khám phá các kỹ thuật giảm thiểu đã được kiểm chứng như gradient clipping để đảm bảo quá trình huấn luyện ổn định cho Ultralytics YOLO26.

Exploding gradient xảy ra trong quá trình huấn luyện các mạng thần kinh nhân tạo khi các gradient—những giá trị được sử dụng để cập nhật trọng số của mạng—tích lũy và trở nên quá lớn. Hiện tượng này thường xảy ra trong quá trình backpropagation, quy trình mà mạng tính toán lỗi và tự điều chỉnh để cải thiện độ chính xác. Khi các tín hiệu lỗi này được nhân lặp đi lặp lại qua các lớp sâu, chúng có thể tăng theo cấp số nhân, dẫn đến các bản cập nhật khổng lồ cho model weights. Sự mất ổn định này ngăn cản model hội tụ, làm gián đoạn quá trình học tập và thường khiến hàm mất mát (loss function) trả về các giá trị NaN (Not a Number).

Link to this sectionCơ chế của sự mất ổn định#

Để hiểu tại sao gradient lại explode, hãy xem xét cấu trúc của các kiến trúc deep learning. Trong các mạng sâu, chẳng hạn như Recurrent Neural Networks (RNNs) hoặc các Convolutional Neural Networks (CNNs) rất sâu, gradient cho các lớp đầu là tích của các số hạng từ tất cả các lớp phía sau. Nếu các số hạng này lớn hơn 1.0, việc nhân lặp lại sẽ tạo ra hiệu ứng quả cầu tuyết.

Điều này tạo ra một kịch bản nơi optimizer thực hiện các bước quá lớn, vượt quá giải pháp tối ưu trong không gian lỗi. Đây là một thách thức phổ biến khi huấn luyện trên dữ liệu phức tạp với các thuật toán tiêu chuẩn như Stochastic Gradient Descent (SGD).

Link to this sectionCác kỹ thuật phòng ngừa và giảm thiểu#

Phát triển AI hiện đại sử dụng một số kỹ thuật tiêu chuẩn để ngăn chặn gradient vượt tầm kiểm soát, đảm bảo model training diễn ra đáng tin cậy.

  • Gradient Clipping: Đây là biện pháp can thiệp trực tiếp nhất. Nó liên quan đến việc thiết lập một giá trị ngưỡng. Nếu norm của vector gradient vượt quá ngưỡng này, nó sẽ được thu nhỏ (clipping) để khớp với giới hạn. Kỹ thuật này là tiêu chuẩn trong các framework natural language processing và cho phép model tiếp tục học tập một cách ổn định.
  • Batch Normalization: Bằng cách chuẩn hóa các đầu vào của mỗi lớp sao cho có giá trị trung bình bằng 0 và phương sai bằng 1, Batch Normalization ngăn chặn các giá trị trở nên quá lớn hoặc quá nhỏ. Thay đổi cấu trúc này giúp làm mượt đáng kể không gian tối ưu hóa.
  • Weight Initialization: Các chiến lược khởi tạo phù hợp, chẳng hạn như Xavier initialization (hoặc Glorot initialization), thiết lập các trọng số ban đầu sao cho phương sai của các kích hoạt (activations) giữ nguyên trên các lớp.
  • Residual Connections: Các kiến trúc như Residual Networks (ResNets) giới thiệu các kết nối tắt (skip connections). Những đường dẫn này cho phép gradient truyền qua mạng mà không cần phải đi qua mọi hàm kích hoạt phi tuyến tính, từ đó giảm thiểu hiệu ứng nhân.
  • Advanced Optimizers: Các thuật toán như Adam optimizer sử dụng tốc độ học tập thích ứng (adaptive learning rates) cho từng tham số riêng lẻ, có thể xử lý các thang đo gradient thay đổi tốt hơn so với SGD cơ bản.

Link to this sectionSo sánh Exploding và Vanishing Gradients#

Vấn đề exploding gradient thường được thảo luận cùng với đối trọng của nó, vanishing gradient. Cả hai đều bắt nguồn từ quy tắc chuỗi (chain rule) của giải tích được sử dụng trong backpropagation, nhưng chúng biểu hiện theo những cách đối lập nhau.

  • Exploding Gradient: Gradient trở nên quá lớn (lớn hơn 1.0). Điều này dẫn đến các bản cập nhật trọng số không ổn định, tràn số (numerical overflow) và phân kỳ. Nó thường được khắc phục bằng gradient clipping.
  • Vanishing Gradient: Gradient trở nên quá nhỏ (nhỏ hơn 1.0) và tiến gần về 0. Điều này khiến các lớp trước của mạng ngừng học hoàn toàn. Hiện tượng này thường được khắc phục bằng cách sử dụng các hàm kích hoạt như ReLU hoặc các biến thể leaky.

Link to this sectionCác ứng dụng trong thực tế#

Việc xử lý độ lớn của gradient là rất quan trọng để triển khai các giải pháp AI mạnh mẽ trên nhiều ngành công nghiệp khác nhau.

  1. Generative AI và Language Modeling: Huấn luyện Large Language Models (LLMs) hoặc các model như GPT-4 đòi hỏi phải xử lý các chuỗi văn bản cực dài. Nếu không có các cơ chế như gradient clipping và Layer Normalization, các gradient tích lũy qua hàng trăm bước thời gian sẽ khiến quá trình huấn luyện thất bại ngay lập tức. Gradient ổn định đảm bảo model học được các cấu trúc ngữ pháp và ngữ cảnh phức tạp.

  2. Advanced Computer Vision: Trong các tác vụ như object detection, các model hiện đại như YOLO26 sử dụng các kiến trúc sâu với hàng trăm lớp. Ultralytics YOLO26 tích hợp sẵn các khối chuẩn hóa và residual blocks nâng cao, đảm bảo người dùng có thể huấn luyện trên các tập dữ liệu khổng lồ như COCO mà không cần điều chỉnh thủ công các ngưỡng gradient. Sự ổn định này rất cần thiết khi sử dụng Ultralytics Platform cho các luồng công việc huấn luyện tự động.

Link to this sectionVí dụ mã Python#

Mặc dù các thư viện cấp cao thường xử lý điều này một cách tự động, bạn vẫn có thể áp dụng gradient clipping một cách rõ ràng trong PyTorch trong vòng lặp huấn luyện tùy chỉnh. Đoạn mã này minh họa cách thực hiện clipping gradient trước khi bộ tối ưu hóa cập nhật trọng số.

import torch
import torch.nn as nn

# Define a simple model and optimizer
model = nn.Linear(10, 1)
optimizer = torch.optim.SGD(model.parameters(), lr=0.1)

# Simulate a training step
loss = torch.tensor(100.0, requires_grad=True)  # Simulated high loss
loss.backward()

# Clip gradients in place to a maximum norm of 1.0
# This prevents the weight update from being too drastic
torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

# Update weights using the safe, clipped gradients
optimizer.step()

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning