Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Các bộ dò tìm không dựa trên Anchor

Khám phá sức mạnh của các bộ dò tìm không dựa trên anchor—khả năng phát hiện đối tượng được sắp xếp hợp lý với độ chính xác, hiệu quả và khả năng thích ứng được cải thiện cho các ứng dụng thực tế.

Bộ phát hiện không neo đại diện cho một bước tiến đáng kể trong kiến trúc thị giác máy tính , được thiết kế để nhận dạng và định vị các đối tượng trong ảnh mà không cần dựa vào các hộp tham chiếu được xác định trước. Không giống như các phương pháp truyền thống phụ thuộc vào lưới các neo được thiết lập sẵn để ước tính kích thước đối tượng, các mô hình không neo dự đoán kết quả phát hiện đối tượng trực tiếp từ các đặc điểm ảnh. Sự thay đổi mô hình này giúp đơn giản hóa thiết kế mô hình, giảm nhu cầu điều chỉnh siêu tham số thủ công và thường dẫn đến các kiến trúc nhanh hơn, hiệu quả hơn, phù hợp với các tác vụ suy luận thời gian thực . Các khuôn khổ hiện đại, bao gồm Ultralytics YOLO11 , đã phần lớn áp dụng phương pháp này để đạt được khả năng khái quát hóa vượt trội trên các tập dữ liệu đa dạng.

Cơ chế phát hiện không có neo

Cải tiến chính của các máy dò không neo nằm ở cách chúng xây dựng bài toán phát hiện. Thay vì phân loại và tinh chỉnh hàng nghìn ứng viên hộp neo, các mô hình này thường xử lý phát hiện như một tác vụ dự đoán điểm hoặc hồi quy. Có hai chiến lược chủ đạo:

  • Phương pháp tiếp cận dựa trên tâm: Các mô hình này, chẳng hạn như FCOS (Phát hiện Đối tượng Một Giai đoạn Tích chập Hoàn toàn) nổi tiếng, xác định vị trí điểm trung tâm của một đối tượng trên bản đồ đặc trưng . Sau đó, mạng sẽ hồi quy khoảng cách từ điểm trung tâm này đến bốn ranh giới (trái, trên, phải, dưới) của khung giới hạn.
  • Phương pháp tiếp cận dựa trên điểm chính: Lấy cảm hứng từ các kỹ thuật ước lượng tư thế , các bộ phát hiện này xác định các điểm chính cụ thể, chẳng hạn như góc trên bên trái và góc dưới bên phải của một vật thể. Sau đó, mô hình nhóm các điểm này lại để tạo thành một hộp giới hạn hoàn chỉnh, một phương pháp được tiên phong bởi các kiến trúc như CornerNet .

Bằng cách loại bỏ các phép tính liên quan đến Giao điểm trên Hợp ( IoU ) giữa các điểm neo và dữ liệu thực tế trong quá trình đào tạo, các phương pháp không có điểm neo sẽ hợp lý hóa các phép tính hàm mất mát và giảm chi phí tính toán.

Ưu điểm so với phương pháp dựa trên neo

Để hiểu rõ tác động của công nghệ không neo, cần phân biệt nó với các bộ phát hiện dựa trên neo . Trong các mô hình dựa trên neo như Ultralytics YOLOv5 hoặc Faster R-CNN , hiệu suất phụ thuộc rất nhiều vào thiết kế của các hộp neo (kích thước và tỷ lệ khung hình cụ thể). Nếu các neo được xác định trước không khớp với hình dạng của các đối tượng trong tập dữ liệu, độ chính xác của mô hình có thể bị ảnh hưởng.

Máy dò không có điểm neo mang lại một số lợi ích riêng biệt:

  • Đào tạo đơn giản: Loại bỏ nhu cầu điều chỉnh các siêu tham số liên quan đến mỏ neo, giúp việc đào tạo mô hình trở nên đơn giản hơn.
  • Tổng quát hóa tốt hơn: Các mô hình này rất hiệu quả trong việc phát hiện các vật thể có tỷ lệ khung hình cực đại (ví dụ: tòa nhà cao tầng hoặc tàu hỏa dài) có thể không phù hợp với các mẫu neo tiêu chuẩn.
  • Hiệu quả: Với ít hộp ứng viên cần xử lý hơn, bước xử lý hậu kỳ, thường liên quan đến NMS , sẽ trở nên nhanh hơn.

Các Ứng dụng Thực tế

Tính linh hoạt của máy dò không cần neo khiến chúng trở nên lý tưởng cho các môi trường thực tế phức tạp, nơi hình dạng vật thể thay đổi không thể đoán trước.

  • Lái xe tự động: Trong ngành công nghiệp ô tô , các phương tiện phải detect Người đi bộ, người đi xe đạp và chướng ngại vật ở các khoảng cách khác nhau. Các mô hình không cần neo cho phép xe tự hành hồi quy chính xác các hộp giới hạn cho các vật thể có vẻ rất nhỏ (ở xa) hoặc rất lớn (ở gần) mà không bị giới hạn bởi các thang đo neo cố định. Nghiên cứu hàng đầu từ các tổ chức như Waymo nhấn mạnh tầm quan trọng của các hệ thống phát hiện linh hoạt như vậy.
  • Phân tích hình ảnh y tế: Các bất thường trong hình ảnh chụp cắt lớp y tế, chẳng hạn như khối u hoặc tổn thương, hiếm khi tuân theo hình dạng hình học tiêu chuẩn. Việc sử dụng YOLO11 để phát hiện khối u tận dụng khả năng không cần neo để phác thảo chính xác các khối u bất thường trên phim X-quang hoặc MRI, hỗ trợ các bác sĩ X-quang trong việc phân tích hình ảnh y tế .

Thực hiện với Ultralytics YOLO

Việc chuyển đổi sang kiến trúc không có mỏ neo là một tính năng chính của gần đây YOLO các thế hệ, bao gồm Ultralytics YOLOv8 và YOLO11 . Lựa chọn thiết kế này góp phần đáng kể vào hiệu suất hiện đại của chúng.

Ví dụ sau đây minh họa cách tải và chạy suy luận với một neo-free YOLO11 mô hình sử dụng ultralytics Python bưu kiện.

from ultralytics import YOLO

# Load the anchor-free YOLO11n model
model = YOLO("yolo11n.pt")

# Run inference on an image to detect objects
# The model directly predicts boxes without anchor matching
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the detection results
results[0].show()

Định hướng tương lai

Sự thành công của phát hiện không cần neo đã mở đường cho các quy trình phát hiện đầu cuối. Các phát triển trong tương lai, chẳng hạn như Ultralytics YOLO26 sắp ra mắt, nhằm mục đích tinh chỉnh hơn nữa phương pháp này bằng cách tích hợp các cơ chế chú ý tiên tiến hơn và tối ưu hóa để có độ trễ thấp hơn nữa trên các thiết bị biên.

Đối với những người quan tâm đến nền tảng lý thuyết, các khóa học về Học sâu từ các nền tảng như Coursera hoặc nghiên cứu do CVF (Computer Vision Foundation) công bố cung cấp nhiều tài nguyên về sự phát triển của các phương pháp phát hiện đối tượng.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay