Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

Anchor Boxes

Tìm hiểu cách anchor box đóng vai trò là các khuôn mẫu tham chiếu cho nhận diện đối tượng. Khám phá cách chúng cải thiện độ chính xác và cách các mô hình như Ultralytics YOLO26 sử dụng các thiết kế không dùng anchor.

Anchor boxes là các hình chữ nhật tham chiếu được xác định trước với tỷ lệ khung hình và kích thước cụ thể, được đặt trên toàn bộ hình ảnh để hỗ trợ các model phát hiện đối tượng trong việc định vị và phân loại đối tượng. Thay vì yêu cầu mạng thần kinh dự đoán chính xác kích thước và vị trí của một đối tượng từ đầu—điều vốn có thể gây mất ổn định do sự đa dạng lớn về hình dạng đối tượng—model sử dụng các mẫu cố định này làm điểm khởi đầu. Bằng cách học cách dự đoán mức độ điều chỉnh, hay còn gọi là "hồi quy", các khung ban đầu này để khớp với dữ liệu thực tế (ground truth), hệ thống có thể đạt được sự hội tụ nhanh hơn và độ chính xác cao hơn. Kỹ thuật này đã thay đổi căn bản lĩnh vực thị giác máy tính (CV) bằng cách đơn giản hóa bài toán định vị phức tạp thành một vấn đề tối ưu hóa dễ quản lý hơn.

Link to this sectionCơ chế của Anchor Boxes#

Trong các trình phát hiện dựa trên anchor cổ điển, hình ảnh đầu vào được chia thành một lưới các ô. Tại mỗi vị trí ô, mạng lưới tạo ra nhiều anchor box với các hình học khác nhau. Ví dụ, để đồng thời phát hiện một người đi bộ cao và một chiếc ô tô rộng, model có thể đề xuất một khung cao, hẹp và một khung thấp, rộng tại cùng một điểm tâm.

Trong quá trình huấn luyện model, các anchor này được đối chiếu với các đối tượng thực tế bằng cách sử dụng số liệu gọi là Intersection over Union (IoU). Các anchor có độ chồng lấp đáng kể với một đối tượng được gán nhãn sẽ được chỉ định là các mẫu "dương tính". Sau đó, mạng lưới học hai nhiệm vụ song song:

  1. Phân loại: Gán điểm xác suất cho anchor, cho biết khả năng nó chứa một lớp cụ thể (ví dụ: "chó" hoặc "xe đạp"). Nhiệm vụ này sử dụng các mục tiêu học máy có giám sát tiêu chuẩn như hàm mất mát cross-entropy.

  2. Hồi quy khung (Box Regression): Tính toán các giá trị bù chính xác (dịch chuyển tọa độ và hệ số tỷ lệ) cần thiết để chuyển đổi anchor tổng quát thành một bounding box khớp chặt chẽ.

Cách tiếp cận này cho phép model xử lý nhiều đối tượng có kích thước khác nhau nằm gần nhau, vì mỗi đối tượng có thể được gán cho anchor khớp nhất với hình dạng của nó.

Link to this sectionCác ứng dụng trong thực tế#

Mặc dù các kiến trúc mới hơn đang chuyển sang các thiết kế không sử dụng anchor, anchor boxes vẫn đóng vai trò quan trọng trong nhiều hệ thống sản xuất đã được thiết lập, nơi các đặc điểm đối tượng có thể dự đoán trước.

  • Bán lẻ và Quản lý hàng tồn kho: Trong các giải pháp bán lẻ dựa trên AI, camera giám sát lượng hàng trên kệ. Vì các sản phẩm như hộp ngũ cốc hoặc lon nước ngọt có kích thước tiêu chuẩn, anchor boxes có thể được tinh chỉnh theo các tỷ lệ khung hình cụ thể này. Kiến thức tiên nghiệm này giúp model duy trì recall cao ngay cả trong các môi trường lộn xộn.
  • Xe tự lái: Các ngăn xếp nhận thức (perception stacks) trong xe tự lái dựa vào việc phát hiện người đi bộ, phương tiện và biển báo giao thông. Vì một chiếc ô tô nhìn từ xa có cấu hình hình dạng tương đối nhất quán so với mặt đường, việc sử dụng các anchor được thiết kế riêng cho các hình dạng này đảm bảo theo dõi đối tượng và ước tính khoảng cách mạnh mẽ.

Link to this sectionDựa trên Anchor so với Không dựa trên Anchor#

Điều quan trọng là phải phân biệt giữa các phương pháp dựa trên anchor truyền thống và các trình phát hiện không dựa trên anchor hiện đại.

  • Dựa trên Anchor: Các model như Faster R-CNN gốc hoặc các phiên bản YOLO đời đầu (ví dụ: YOLOv5) sử dụng các mẫu được xác định trước này. Chúng mạnh mẽ nhưng thường yêu cầu tinh chỉnh thủ công các siêu tham số (kích thước/tỷ lệ anchor) hoặc các thuật toán phân cụm như k-means clustering để thích ứng với các tập dữ liệu mới.
  • Không dựa trên Anchor: Các model tiên tiến, bao gồm YOLO26, thường sử dụng các cách tiếp cận không dựa trên anchor hoặc end-to-end. Các mạng lưới này dự đoán trực tiếp tâm đối tượng hoặc các điểm chính (keypoints), loại bỏ nhu cầu cấu hình anchor thủ công. Điều này đơn giản hóa kiến trúc và tăng tốc độ suy luận bằng cách loại bỏ các tính toán cần thiết để xử lý hàng nghìn anchor nền trống.

Link to this sectionVí dụ: Truy cập thông tin Anchor#

Trong khi các API cấp cao hiện đại như Ultralytics Platform trừu tượng hóa các chi tiết này trong quá trình huấn luyện, việc hiểu về anchors vẫn hữu ích khi làm việc với các kiến trúc model cũ hơn hoặc phân tích các file cấu hình model. Đoạn mã dưới đây minh họa cách tải một model và kiểm tra cấu hình của nó, nơi các cài đặt anchor (nếu có) thường sẽ được định nghĩa.

from ultralytics import YOLO

# Load a pre-trained YOLO model (YOLO26 is anchor-free, but legacy configs act similarly)
model = YOLO("yolo26n.pt")

# Inspect the model's stride, which relates to grid cell sizing in detection
print(f"Model strides: {model.model.stride}")

# For older anchor-based models, anchors might be stored in the model's attributes
# Modern anchor-free models calculate targets dynamically without fixed boxes
if hasattr(model.model, "anchors"):
    print(f"Anchors: {model.model.anchors}")
else:
    print("This model architecture is anchor-free.")

Link to this sectionThách thức và Cân nhắc#

Mặc dù hiệu quả, anchor boxes mang lại sự phức tạp. Số lượng lớn các anchor được tạo ra—thường là hàng chục nghìn mỗi hình ảnh—tạo ra vấn đề mất cân bằng lớp, vì hầu hết các anchor chỉ bao phủ nền. Các kỹ thuật như Focal Loss được sử dụng để giảm thiểu điều này bằng cách giảm trọng số các ví dụ nền dễ. Ngoài ra, đầu ra cuối cùng thường yêu cầu Non-Maximum Suppression (NMS) để lọc bỏ các khung chồng lấp dư thừa, đảm bảo rằng chỉ còn lại phát hiện tự tin nhất cho mỗi đối tượng.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning