Thuật ngữ

Máy dò dựa trên mỏ neo

Khám phá cách các máy dò dựa trên mỏ neo cách mạng hóa việc phát hiện vật thể với khả năng định vị chính xác, khả năng thích ứng với quy mô và các ứng dụng thực tế.

Bộ phát hiện dựa trên neo là một lớp nền tảng của các mô hình phát hiện đối tượng trong thị giác máy tính . Các mô hình này hoạt động bằng cách sử dụng một tập hợp các hộp được xác định trước, được gọi là hộp neo, để xác định và định vị các đối tượng trong một hình ảnh. Hộp neo về cơ bản là một lưới các mẫu với nhiều kích thước và tỷ lệ khung hình khác nhau được xếp chồng lên nhau trên ảnh. Mô hình dự đoán cách dịch chuyển và chia tỷ lệ các neo này để khớp với các hộp giới hạn thực tế của đối tượng, cùng với một điểm tin cậy cho biết sự hiện diện của đối tượng. Cách tiếp cận này đơn giản hóa vấn đề tìm kiếm đối tượng bằng cách biến nó thành một tác vụ hồi quy và phân loại liên quan đến các neo cố định này.

Các ví dụ nổi bật về kiến trúc dựa trên mỏ neo bao gồm họ R-CNN, chẳng hạn như Faster R-CNN và các bộ dò một giai đoạn đầu như SSD (Bộ dò MultiBox một lần bắn) và nhiều mô hình YOLO, bao gồm cả Ultralytics YOLOv5 cực kỳ thành công.

Máy dò dựa trên neo hoạt động như thế nào

Ý tưởng cốt lõi đằng sau phương pháp phát hiện dựa trên neo là sử dụng một tập hợp các hộp tham chiếu được xác định trước làm điểm khởi đầu. Trong quá trình huấn luyện mô hình , bộ phát hiện sẽ học cách thực hiện hai nhiệm vụ chính cho mỗi hộp neo:

  1. Phân loại : Xác định xem hộp neo có chứa đối tượng quan tâm hay chỉ là nền.
  2. Hồi quy : Tính toán các giá trị bù trừ chính xác (x, y, chiều rộng, chiều cao) cần thiết để điều chỉnh hộp neo sao cho bao kín chặt chẽ đối tượng được phát hiện.

Những dự đoán này được đưa ra bởi đầu phát hiện của mô hình sau khi xử lý các đặc điểm hình ảnh được trích xuất bởi xương sống . Vì một đối tượng duy nhất có thể được phát hiện bởi nhiều hộp neo, một bước hậu xử lý gọi là NMS (Non-Maximum Suppression) được sử dụng để lọc ra các phát hiện trùng lặp và chỉ giữ lại hộp phù hợp nhất. Hiệu suất của các mô hình này thường được đánh giá bằng các số liệu như Độ chính xác trung bình (mAP)Giao điểm trên hợp nhất (IoU) .

Máy dò dựa trên neo so với máy dò không có neo

Trong những năm gần đây, các máy dò không neo đã nổi lên như một giải pháp thay thế phổ biến. Không giống như các mô hình dựa trên neo, các phương pháp tiếp cận không neo dự đoán trực tiếp vị trí và kích thước của vật thể, thường bằng cách xác định các điểm chính (như tâm hoặc góc của vật thể) hoặc dự đoán khoảng cách từ một điểm đến ranh giới của vật thể, loại bỏ nhu cầu về hình dạng neo được xác định trước.

Những điểm khác biệt chính bao gồm:

  • Độ phức tạp : Các mô hình dựa trên neo đòi hỏi thiết kế và điều chỉnh cẩn thận các tham số neo (kích thước, tỷ lệ, thang đo), có thể phụ thuộc vào tập dữ liệu. Các mô hình không neo giúp đơn giản hóa thiết kế đầu phát hiện.
  • Tính linh hoạt : Các phương pháp không có điểm neo có thể thích ứng tốt hơn với các đối tượng có tỷ lệ khung hình hoặc hình dạng bất thường không được thể hiện tốt trong bộ điểm neo cố định.
  • Hiệu quả : Việc loại bỏ các mỏ neo có thể làm giảm số lượng dự đoán mà mô hình cần đưa ra, có khả năng dẫn đến suy luận nhanh hơn và xử lý hậu kỳ đơn giản hơn.

Trong khi các máy dò dựa trên neo như YOLOv4 rất thành công, nhiều kiến trúc hiện đại, bao gồm Ultralytics YOLO11 , đã áp dụng các thiết kế không neo để tận dụng lợi ích của chúng về tính đơn giản và hiệu quả. Bạn có thể khám phá những lợi thế của phát hiện không neo trong YOLO11 và xem các so sánh giữa các mô hình YOLO khác nhau .

Ứng dụng trong thế giới thực

Máy dò dạng mỏ neo được sử dụng rộng rãi trong nhiều ứng dụng khác nhau khi vật thể có hình dạng và kích thước tương đối chuẩn.

  • Lái xe tự động : Trong các giải pháp dành cho ngành công nghiệp ô tô , các máy dò này rất tuyệt vời để nhận dạng phương tiện, người đi bộ và biển báo giao thông. Hình dạng có thể dự đoán được của các vật thể này khớp với các điểm neo được xác định trước, cho phép các công ty như NVIDIATesla phát hiện đáng tin cậy.
  • Phân tích bán lẻ : Đối với quản lý hàng tồn kho dựa trên AI , các mô hình dựa trên neo có thể quét kệ hàng một cách hiệu quả để đếm sản phẩm. Kích thước và hình dạng đồng nhất của hàng hóa đóng gói khiến chúng trở thành ứng cử viên lý tưởng cho phương pháp này, giúp tự động hóa việc theo dõi hàng tồn kho.
  • An ninh và Giám sát : Nhận dạng người hoặc phương tiện trong cảnh quay camera giám sát cố định là một ứng dụng hữu ích khác. Đây là nền tảng cho các ứng dụng như hướng dẫn hệ thống báo động an ninh Ultralytics .

Công cụ và đào tạo

Phát triển và triển khai các mô hình phát hiện đối tượng, dù dựa trên neo hay không neo, đều liên quan đến việc sử dụng các khuôn khổ như PyTorch hoặc TensorFlow và các thư viện như OpenCV . Các nền tảng như Ultralytics HUB cung cấp các quy trình làm việc hợp lý để đào tạo các mô hình tùy chỉnh , quản lý tập dữ liệu và triển khai các giải pháp, hỗ trợ nhiều kiến trúc mô hình khác nhau. Để tìm hiểu thêm, các tài nguyên như Papers With Code liệt kê các mô hình tiên tiến và các khóa học từ các nền tảng như DeepLearning.AI bao gồm các khái niệm cơ bản.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard