Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Residual Networks (ResNet)

Khám phá sức mạnh của Mạng dư (ResNet). Tìm hiểu cách các kết nối tắt (skip connections) giải quyết vấn đề triệt tiêu gradient để cho phép học sâu trong thị giác máy tính.

Residual Networks, hay còn được gọi là ResNet, là một loại kiến trúc mạng thần kinh nhân tạo (ANN) cụ thể được thiết kế để hỗ trợ việc huấn luyện các mạng cực sâu. Được giới thiệu bởi các nhà nghiên cứu tại Microsoft vào năm 2015, ResNet đã giải quyết một nút thắt quan trọng trong deep learning được gọi là vấn đề biến mất gradient. Trong các mạng truyền thống, việc xếp chồng thêm nhiều lớp thường dẫn đến tình trạng bão hòa hoặc suy giảm hiệu suất vì tín hiệu cần thiết để cập nhật trọng số model sẽ yếu dần khi truyền ngược qua các lớp. ResNet đã giới thiệu các "kết nối tắt" (skip connections) hay còn gọi là các kết nối dư, cho phép dữ liệu bỏ qua một hoặc nhiều lớp và đi trực tiếp đến các giai đoạn xử lý tiếp theo. Đổi mới này chứng minh rằng các mạng sâu hơn có thể được huấn luyện hiệu quả, dẫn đến những bước đột phá đáng kể trong lĩnh vực thị giác máy tính (CV) và trở thành khái niệm nền tảng cho các kiến trúc hiện đại.

Link to this sectionKhái niệm cốt lõi: Residual Learning#

Đặc điểm xác định của một ResNet là "khối dư" (residual block). Trong một mạng thần kinh tích chập (CNN) tiêu chuẩn, mỗi lớp cố gắng học một ánh xạ trực tiếp từ đầu vào sang đầu ra. Khi các mạng ngày càng sâu hơn, việc học ánh xạ trực tiếp này trở nên khó khăn hơn bao giờ hết.

ResNet thay đổi cách tiếp cận này bằng cách thiết lập mục tiêu học tập theo hướng khác. Thay vì hy vọng mỗi ngăn xếp lớp học toàn bộ ánh xạ cơ bản, khối dư buộc các lớp phải học "phần dư"—hoặc sự khác biệt—giữa đầu vào và đầu ra mong muốn. Đầu vào ban đầu sau đó được cộng lại vào phần dư đã học thông qua một kết nối tắt. Thay đổi cấu trúc này hàm ý rằng nếu một ánh xạ nhận dạng (truyền đầu vào mà không thay đổi) là tối ưu, mạng có thể dễ dàng học cách đưa phần dư về mức không. Điều này giúp các model deep learning (DL) dễ tối ưu hóa hơn nhiều, cho phép chúng mở rộng từ hàng chục lên hàng trăm hoặc thậm chí hàng ngàn lớp.

Link to this sectionCác biến thể kiến trúc chính#

Kể từ khi ra đời, một số biến thể của ResNet đã trở thành các chuẩn benchmark trong cộng đồng AI.

  • ResNet-50: Một phiên bản 50 lớp sử dụng thiết kế "nút thắt cổ chai" (bottleneck). Thiết kế này sử dụng các tích chập 1x1 để giảm và sau đó khôi phục kích thước, giúp mạng đạt hiệu suất tính toán cao trong khi vẫn duy trì độ chính xác cao.
  • ResNet-101 và ResNet-152: Các biến thể sâu hơn với lần lượt 101 và 152 lớp. Chúng thường được sử dụng khi tài nguyên tính toán cho phép độ phức tạp cao hơn để nắm bắt các feature map phức tạp hơn.
  • ResNeXt: Một sự tiến hóa của ResNet giới thiệu chiều "cardinality" (tính lực lượng), chia khối dư thành nhiều đường dẫn song song, giúp cải thiện hiệu quả và hiệu suất.

Link to this sectionCác ứng dụng trong thực tế#

Sự mạnh mẽ của các kiến trúc ResNet đã biến chúng thành lựa chọn ưu tiên cho hàng loạt các tác vụ thị giác.

  • Phân tích hình ảnh y tế: Trong chăm sóc sức khỏe, việc xác định các bất thường nhỏ trong các bản quét độ phân giải cao là rất quan trọng. Các model dựa trên ResNet thường được sử dụng để phát hiện các tình trạng như phát hiện khối u trong hình ảnh y tế, nơi độ sâu của mạng giúp phân biệt các mô hình chi tiết trong dữ liệu MRI hoặc CT.
  • Phương tiện tự hành: Xe tự lái đòi hỏi khả năng trích xuất đặc trưng đáng tin cậy từ luồng camera để nhận diện người đi bộ, biển báo và vật cản. ResNet thường đóng vai trò là backbone cho các hệ thống phát hiện đối tượng trong các ứng dụng AI trong ô tô, cung cấp các đặc trưng thị giác phong phú cần thiết cho việc điều hướng an toàn.

Link to this sectionResNet so với các kiến trúc khác#

Việc phân biệt ResNet với các kiến trúc phổ biến khác là rất hữu ích để hiểu rõ công dụng cụ thể của nó.

  • ResNet so với VGG: Mạng VGG (Visual Geometry Group) cũng là các CNN sâu nhưng thiếu các kết nối dư. Do đó, chúng khó huấn luyện hơn nhiều ở độ sâu tương đương với ResNet và thường tốn kém chi phí tính toán hơn do có các lớp kết nối đầy đủ (fully connected layers) lớn.
  • ResNet so với Inception: Các mạng Inception tập trung vào chiều rộng, sử dụng các bộ lọc có kích thước đa dạng trong cùng một lớp để nắm bắt đặc trưng ở các quy mô khác nhau. ResNet tập trung vào chiều sâu. Các kiến trúc hiện đại như Inception-ResNet kết hợp cả hai khái niệm này.
  • ResNet so với Vision Transformer (ViT): Trong khi ViT sử dụng cơ chế self-attention để xử lý hình ảnh trên toàn cục, ResNet dựa vào các tích chập cục bộ. Tuy nhiên, ResNet vẫn là một baseline mạnh mẽ và thường nhanh hơn đối với các tập dữ liệu nhỏ hơn hoặc khi thực hiện inference thời gian thực.

Link to this sectionVí dụ về triển khai#

Các thư viện deep learning hiện đại như PyTorch giúp việc truy cập vào các model ResNet đã được huấn luyện sẵn trở nên đơn giản. Những model này cực kỳ giá trị cho transfer learning, nơi một model được huấn luyện trên tập dữ liệu lớn như ImageNet được tinh chỉnh cho một tác vụ cụ thể.

Đoạn mã Python dưới đây minh họa cách tải một model ResNet-50 đã được huấn luyện sẵn bằng cách sử dụng torchvision (một phần của hệ sinh thái PyTorch) và thực hiện một đường truyền xuôi (forward pass) đơn giản. Mặc dù người dùng Ultralytics Platform có thể thường xuyên sử dụng YOLO26 cho tác vụ phát hiện, việc hiểu các khái niệm backbone nền tảng như ResNet là rất quan trọng để tùy chỉnh nâng cao.

import torch
import torchvision.models as models

# Load a pre-trained ResNet-50 model
resnet50 = models.resnet50(weights=models.ResNet50_Weights.DEFAULT)
resnet50.eval()  # Set model to evaluation mode

# Create a dummy input tensor (batch_size, channels, height, width)
input_tensor = torch.randn(1, 3, 224, 224)

# Perform a forward pass to get predictions
with torch.no_grad():
    output = resnet50(input_tensor)

print(f"Output shape: {output.shape}")  # Expect [1, 1000] for ImageNet classes

Link to this sectionÝ nghĩa trong AI hiện đại#

Mặc dù các kiến trúc mới hơn như YOLO26 sử dụng các cấu trúc được tối ưu hóa cao để đạt tốc độ và độ chính xác tối đa, các nguyên tắc của residual learning vẫn rất phổ biến. Khái niệm kết nối tắt giờ đây là thành phần tiêu chuẩn trong nhiều mạng tiên tiến, bao gồm các transformer được sử dụng trong xử lý ngôn ngữ tự nhiên (NLP) và các model phát hiện đối tượng mới nhất. Bằng cách cho phép thông tin truyền đi tự do hơn qua mạng, ResNet đã mở đường cho các model phức tạp, sâu rộng đang vận hành trí tuệ nhân tạo ngày nay.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning