Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024
Bảng chú giải thuật ngữ

Các bộ dò tìm không dựa trên Anchor

Khám phá sức mạnh của các bộ dò tìm không dựa trên anchor—khả năng phát hiện đối tượng được sắp xếp hợp lý với độ chính xác, hiệu quả và khả năng thích ứng được cải thiện cho các ứng dụng thực tế.

Các detector không dựa trên anchor đại diện cho một sự phát triển hiện đại trong computer vision (CV) (thị giác máy tính), cung cấp một cách tiếp cận hợp lý và linh hoạt hơn để object detection (phát hiện đối tượng). Thay vì dựa vào một tập hợp anchor box được xác định trước để dự đoán vị trí đối tượng, các mô hình này xác định trực tiếp các đối tượng. Điều này thường đạt được bằng cách dự đoán điểm trung tâm của một đối tượng và kích thước của nó, hoặc bằng cách xác định các keypoint (điểm đặc trưng) như góc. Sự thay đổi mô hình này đơn giản hóa quy trình phát hiện, giảm số lượng siêu tham số cần điều chỉnh và thường cải thiện hiệu suất, đặc biệt đối với các đối tượng có hình dạng khác nhau hoặc bất thường.

So sánh Detector Dựa trên Anchor và Không Dựa trên Anchor

Sự khác biệt chính nằm ở cách tạo ra các ứng viên đối tượng.

  • Bộ dò tìm dựa trên Anchor: Các mô hình như YOLOv5 và Faster R-CNN sử dụng một tập hợp các hộp neo được xác định trước với nhiều kích thước và tỷ lệ khung hình khác nhau ở các vị trí khác nhau trong một hình ảnh. Mạng tinh chỉnh các hộp này để khớp với các đối tượng ground-truth. Cách tiếp cận này có thể tốn kém về mặt tính toán và yêu cầu lựa chọn cẩn thận các cấu hình neo, có thể không khái quát tốt trên các bộ dữ liệu khác nhau như COCO.
  • Anchor-Free Detectors (Bộ phát hiện không cần Anchor): Các mô hình này bỏ qua nhu cầu về các hộp được xác định trước. Chúng dự đoán trực tiếp các thuộc tính của đối tượng từ các đặc trưng hình ảnh. Điều này dẫn đến một thiết kế đơn giản hơn và có thể dẫn đến suy luận thời gian thực nhanh hơn và cải thiện khả năng phát hiện các đối tượng có hình dạng không đều. Các kiến trúc hiện đại, bao gồm Ultralytics YOLO11, đã áp dụng thiết kế này để đạt được hiệu quả và tính linh hoạt.

Sự chuyển đổi sang thiết kế không neo là một bước phát triển quan trọng trong quá trình phát triển của object detection, được tiên phong bởi các mô hình như YOLOX, được giới thiệu bởi Megvii trong bài nghiên cứu năm 2021 của họ. Bạn có thể xem so sánh kỹ thuật giữa YOLO11 và YOLOX để hiểu sự khác biệt về kiến trúc của chúng.

Cách thức hoạt động của các Detector không neo?

Các detector không dựa trên anchor thường áp dụng một trong hai chiến lược chính:

  1. Dựa trên điểm đặc trưng (Keypoint-Based): Các phương pháp này xác định vị trí các đối tượng bằng cách xác định các điểm đặc trưng, chẳng hạn như các góc hoặc điểm trung tâm. Mô hình học cách nhóm các điểm đặc trưng này để tạo thành các dự đoán hộp giới hạn hoàn chỉnh.
  2. Dựa trên Trung tâm: Các phương pháp này dự đoán tâm của một đối tượng và sau đó hồi quy khoảng cách từ tâm đến bốn cạnh của hộp giới hạn. Đây là một kỹ thuật phổ biến và hiệu quả được sử dụng trong nhiều bộ dò tìm hiện đại.

Các phương pháp này đơn giản hóa quy trình gán nhãn trong quá trình huấn luyện mô hình và thường kết hợp các kỹ thuật tiên tiến như hàm mất mát phức tạp và tăng cường dữ liệu mạnh mẽ để tăng hiệu suất.

Các Ứng dụng Thực tế

Tính linh hoạt và hiệu quả của các detector không neo (anchor-free) làm cho chúng có hiệu quả cao trong nhiều lĩnh vực:

  • Lái xe tự động: Trong các hệ thống dành cho xe tự hành, các detector này có thể xác định chính xác người đi bộ, các xe khác và các chướng ngại vật với nhiều hình dạng và kích cỡ khác nhau. Khả năng thích ứng này rất quan trọng đối với các hệ thống điều hướng đang được phát triển bởi các công ty như Waymo.
  • Phân tích ảnh y tế: Các mô hình không neo vượt trội trong việc định vị các dị thường có hình dạng không đều, chẳng hạn như khối u hoặc tổn thương trong ảnh chụp y tế. Ví dụ: sử dụng YOLO11 để phát hiện khối u tận dụng bản chất không neo của nó để định vị chính xác hơn trong ảnh y tế.
  • Phân tích bán lẻ: Các mô hình này có thể theo dõi hiệu quả các kệ hàng trong cửa hàng để tìm các mặt hàng hết hàng hoặc phân tích lưu lượng khách hàng, ngay cả với các sản phẩm được đóng gói dày đặc hoặc có hình dạng kỳ lạ. Đây là một phần quan trọng của quản lý hàng tồn kho dựa trên AI.
  • An ninh và Giám sát: Xác định người hoặc vật thể trong các khung cảnh đông đúc là một nhiệm vụ phổ biến trong giám sát thông minh. Các detector không neo (anchor-free) xử lý tốt các vật thể ở nhiều tỷ lệ khác nhau, khiến chúng trở nên lý tưởng cho các ứng dụng này.

Công Cụ và Công nghệ

Việc phát triển các mô hình anchor-free được hỗ trợ bởi các framework deep learning (học sâu) lớn như PyTorchTensorFlow. Hệ sinh thái Ultralytics cung cấp các công cụ toàn diện để xây dựng và triển khai các detector tiên tiến này. Bạn có thể khám phá tài liệu (documentation) của chúng tôi và sử dụng Ultralytics HUB để quản lý bộ dữ liệu, huấn luyện mô hình và xử lý triển khai (deployment). Để tiếp tục học tập, các nền tảng như Coursera cung cấp các khóa học nền tảng và các tài nguyên như Papers With Code liệt kê các mô hình hiện đại nhất.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay
Đã sao chép liên kết vào clipboard