Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Object Detection Architectures

Khám phá các kiến trúc phát hiện đối tượng, từ backbone đến head. Tìm hiểu cách Ultralytics YOLO26 mang lại tốc độ và độ chính xác ưu việt cho thị giác máy tính thời gian thực.

Kiến trúc phát hiện đối tượng là các bản thiết kế cấu trúc của mạng thần kinh được sử dụng để nhận diện và định vị các mục trong dữ liệu hình ảnh. Trong lĩnh vực rộng lớn hơn là computer vision (CV), các kiến trúc này xác định cách máy tính "nhìn" bằng cách xử lý dữ liệu pixel thô thành các thông tin chi tiết có ý nghĩa. Không giống như các mô hình phân loại cơ bản chỉ đơn giản là gắn nhãn cho một hình ảnh, kiến trúc phát hiện đối tượng được thiết kế để xuất ra bounding box kèm theo nhãn lớp và confidence score cho mỗi đối tượng riêng biệt mà nó tìm thấy. Thiết kế cấu trúc này quyết định tốc độ, độ chính xác và hiệu quả tính toán của mô hình, khiến nó trở thành yếu tố then chốt khi chọn mô hình cho real-time inference hoặc phân tích độ chính xác cao.

Link to this sectionCác thành phần cốt lõi của một kiến trúc#

Mặc dù các thiết kế cụ thể có thể khác nhau, hầu hết các kiến trúc hiện đại đều chia sẻ ba thành phần cơ bản: backbone, neck và head. Backbone đóng vai trò là bộ trích xuất đặc trưng chính. Đây thường là một Convolutional Neural Network (CNN) được huấn luyện trước trên một tập dữ liệu lớn như ImageNet, chịu trách nhiệm nhận diện các hình dạng, cạnh và kết cấu cơ bản. Các lựa chọn phổ biến cho backbone bao gồm ResNet và CSPDarknet.

Neck kết nối backbone với các lớp đầu ra cuối cùng. Vai trò của nó là trộn và kết hợp các đặc trưng từ các giai đoạn khác nhau của backbone để đảm bảo mô hình có thể phát hiện các đối tượng với nhiều kích thước khác nhau—một khái niệm được gọi là hợp nhất đặc trưng đa quy mô (multi-scale feature fusion). Các kiến trúc thường sử dụng Feature Pyramid Network (FPN) hoặc Path Aggregation Network (PANet) ở đây để làm phong phú thêm thông tin ngữ nghĩa được truyền tới các lớp dự đoán. Cuối cùng, detection head xử lý các đặc trưng đã hợp nhất này để dự đoán lớp cụ thể và vị trí tọa độ của từng đối tượng.

Link to this sectionSự tiến hóa: Hai giai đoạn so với một giai đoạn#

Về mặt lịch sử, các kiến trúc được chia thành hai loại chính. Two-stage detectors, chẳng hạn như R-CNN family, trước tiên đề xuất các vùng quan tâm (RoI) nơi các đối tượng có thể tồn tại và sau đó phân loại các vùng đó trong bước thứ hai. Mặc dù nhìn chung có độ chính xác cao, chúng thường quá nặng nề về tính toán đối với các thiết bị biên.

Ngược lại, one-stage detectors xử lý việc phát hiện như một bài toán hồi quy đơn giản, ánh xạ pixel hình ảnh trực tiếp tới tọa độ bbox và xác suất lớp trong một lần chuyển duy nhất. Cách tiếp cận này, do dòng họ YOLO (You Only Look Once) tiên phong, đã cách mạng hóa ngành công nghiệp bằng cách cho phép hiệu suất thời gian thực. Các tiến bộ hiện đại đã đạt đỉnh cao với các mô hình như YOLO26, không chỉ mang lại tốc độ vượt trội mà còn áp dụng các kiến trúc end-to-end, không dùng NMS. Bằng cách loại bỏ nhu cầu hậu xử lý Non-Maximum Suppression (NMS), các kiến trúc mới này giảm thiểu sự biến động về độ trễ, điều này rất quan trọng đối với các hệ thống an toàn trọng yếu.

Link to this sectionCác ứng dụng trong thực tế#

Việc lựa chọn kiến trúc ảnh hưởng trực tiếp đến sự thành công của các giải pháp AI trên toàn ngành.

  • Tự động hóa bán lẻ: Trong các smart supermarkets, các kiến trúc một giai đoạn hiệu quả cho phép hệ thống thanh toán tự động nhận diện ngay lập tức các sản phẩm trên băng chuyền hoặc trong giỏ hàng, giúp giảm thời gian chờ đợi và sai sót của con người.
  • Chẩn đoán y tế: Các kiến trúc có độ chính xác cao được sử dụng trong medical image analysis để phát hiện các bất thường như khối u trong ảnh X-quang hoặc quét MRI. Ở đây, khả năng giữ lại các chi tiết tinh vi của kiến trúc quan trọng hơn tốc độ xử lý thô.

Link to this sectionPhân biệt các thuật ngữ liên quan#

Điều quan trọng là phải phân biệt các kiến trúc phát hiện với các tác vụ thị giác máy tính tương tự:

  • vs. Phân loại hình ảnh: Một kiến trúc image classification (như VGG hoặc EfficientNet) gán một nhãn duy nhất cho toàn bộ hình ảnh (ví dụ: "mèo"). Nó không cho bạn biết con mèo ở đâu hoặc liệu có nhiều con mèo hay không, đó là chức năng chính của các kiến trúc phát hiện.
  • vs. Phân đoạn thực thể (Instance Segmentation): Trong khi việc phát hiện đặt một khung quanh đối tượng, instance segmentation xác định đường viền chính xác từng pixel (mask) của mỗi đối tượng. Các kiến trúc phân đoạn thường là các phần mở rộng của kiến trúc phát hiện (ví dụ: thêm một nhánh mask vào detection head).

Link to this sectionTriển khai với Ultralytics#

Các framework hiện đại đã trừu tượng hóa các phức tạp của những kiến trúc này, cho phép các nhà phát triển tận dụng các thiết kế tiên tiến nhất với mã nguồn tối thiểu. Sử dụng gói ultralytics, bạn có thể tải một mô hình YOLO26 được huấn luyện trước và chạy inference ngay lập tức. Đối với các đội ngũ muốn quản lý tập dữ liệu và huấn luyện các kiến trúc tùy chỉnh trên đám mây, Ultralytics Platform đơn giản hóa toàn bộ pipeline MLOps.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on an image source
# This uses the model's architecture to detect objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning