Những lợi ích của Ultralytics YOLO11 là một máy dò không có mỏ neo

5 tháng 12, 2024
Hiểu cách Ultralytics YOLO11 hỗ trợ phát hiện đối tượng không có điểm neo và những lợi ích mà kiến trúc mô hình này mang lại cho nhiều ứng dụng khác nhau.

5 tháng 12, 2024
Hiểu cách Ultralytics YOLO11 hỗ trợ phát hiện đối tượng không có điểm neo và những lợi ích mà kiến trúc mô hình này mang lại cho nhiều ứng dụng khác nhau.
Nếu chúng ta nhìn lại lịch sử của các mô hình Vision AI, thì khái niệm về object detection (phát hiện đối tượng) - một nhiệm vụ thị giác máy tính cốt lõi liên quan đến việc xác định và định vị các đối tượng trong một hình ảnh hoặc video - đã xuất hiện từ những năm 1960. Tuy nhiên, lý do chính cho tầm quan trọng của nó trong các đổi mới tiên tiến ngày nay là do các kỹ thuật phát hiện đối tượng và kiến trúc mô hình đã tiến bộ và cải thiện nhanh chóng kể từ đó.
Trong bài viết trước, chúng tôi đã thảo luận về sự phát triển của phát hiện đối tượng và con đường dẫn đến Ultralytics YOLO mô hình. Hôm nay, chúng ta sẽ tập trung khám phá một cột mốc cụ thể hơn trong hành trình này: bước chuyển từ máy dò có neo sang máy dò không có neo.
Các detector dựa trên anchor dựa vào các hộp được xác định trước, được gọi là "anchor", để dự đoán vị trí của các đối tượng trong một hình ảnh. Ngược lại, các detector không dựa trên anchor bỏ qua các hộp được xác định trước này và thay vào đó dự đoán trực tiếp vị trí của đối tượng.
Mặc dù sự thay đổi này có vẻ đơn giản và hợp lý, nhưng nó thực sự đã mang lại những cải tiến đáng kể về độ chính xác và hiệu quả phát hiện vật thể. Trong bài viết này, chúng ta sẽ tìm hiểu cách các máy dò không cần neo đã định hình lại thị giác máy tính thông qua những tiến bộ như Ultralytics YOLO11 .
Các detector dựa trên anchor sử dụng các hộp được xác định trước, được gọi là anchor, để giúp định vị các đối tượng trong một hình ảnh. Hãy coi các anchor này như một lưới các hộp có kích thước và hình dạng khác nhau được đặt trên hình ảnh. Sau đó, mô hình sẽ điều chỉnh các hộp này để phù hợp với các đối tượng mà nó phát hiện. Ví dụ: nếu mô hình xác định một chiếc ô tô, nó sẽ sửa đổi hộp anchor để phù hợp với vị trí và kích thước của ô tô một cách chính xác hơn.
Mỗi điểm neo được liên kết với một đối tượng khả dĩ trong ảnh, và trong quá trình huấn luyện , mô hình sẽ học cách điều chỉnh các hộp neo để phù hợp hơn với vị trí, kích thước và tỷ lệ khung hình của đối tượng. Điều này cho phép mô hình detect các đối tượng ở các tỷ lệ và hướng khác nhau. Tuy nhiên, việc chọn đúng bộ hộp neo có thể tốn thời gian và quá trình tinh chỉnh chúng có thể dễ xảy ra lỗi.

Mặc dù các bộ dò dựa trên neo, như YOLOv4 , đã hoạt động tốt trong nhiều ứng dụng, nhưng chúng vẫn có một số nhược điểm. Ví dụ, các hộp neo không phải lúc nào cũng căn chỉnh tốt với các vật thể có hình dạng hoặc kích thước khác nhau, khiến mô hình khó xác định hơn. detect Các vật thể nhỏ hoặc có hình dạng bất thường. Quá trình lựa chọn và tinh chỉnh kích thước hộp neo cũng có thể tốn thời gian và đòi hỏi nhiều thao tác thủ công. Bên cạnh đó, các mô hình dựa trên neo thường gặp khó khăn trong việc phát hiện các vật thể bị che khuất hoặc chồng chéo, vì các hộp được xác định trước có thể không thích ứng tốt với các tình huống phức tạp hơn này.
Các detector không dựa trên anchor bắt đầu thu hút sự chú ý vào năm 2018 với các mô hình như CornerNet và CenterNet, vốn có cách tiếp cận mới đối với phát hiện đối tượng bằng cách loại bỏ nhu cầu về các hộp anchor được xác định trước. Không giống như các mô hình truyền thống dựa vào các hộp anchor có kích thước và hình dạng khác nhau để dự đoán vị trí của các đối tượng, các mô hình không dựa trên anchor dự đoán trực tiếp vị trí của các đối tượng. Chúng tập trung vào các điểm hoặc đặc trưng chính của đối tượng, chẳng hạn như tâm, giúp đơn giản hóa quá trình phát hiện và làm cho nó nhanh hơn và chính xác hơn.
Đây là cách các mô hình không neo thường hoạt động:

Vì các mô hình không neo không phụ thuộc vào hộp neo, nên chúng có thiết kế đơn giản hơn. Điều này có nghĩa là chúng hiệu quả hơn về mặt tính toán. Vì chúng không phải xử lý nhiều hộp neo, nên chúng có thể detect các đối tượng nhanh hơn - một lợi thế quan trọng trong các ứng dụng thời gian thực như lái xe tự động và giám sát video.
Các mô hình không có điểm neo cũng tốt hơn nhiều trong việc xử lý các vật thể nhỏ, bất thường hoặc bị che khuất. Vì chúng tập trung vào việc phát hiện các điểm chính thay vì cố gắng lắp hộp neo, nên chúng linh hoạt hơn nhiều. Điều này cho phép chúng detect các đối tượng chính xác trong môi trường lộn xộn hoặc phức tạp, nơi các mô hình dựa trên mỏ neo có thể không thành công.
Được thiết kế ban đầu để đạt được tốc độ và hiệu quả, YOLO các mô hình đã dần dần chuyển từ các phương pháp dựa trên mỏ neo sang phát hiện không có mỏ neo, tạo ra các mô hình như YOLO11 nhanh hơn, linh hoạt hơn và phù hợp hơn với nhiều ứng dụng thời gian thực.
Sau đây là cái nhìn nhanh về cách thiết kế không có mỏ neo đã phát triển trên nhiều phương diện khác nhau YOLO phiên bản:

Một ví dụ tuyệt vời về lợi ích của việc sử dụng phát hiện không có mỏ neo YOLO11 là trong xe tự lái . Trong xe tự lái, việc phát hiện người đi bộ, các phương tiện khác và chướng ngại vật một cách nhanh chóng và chính xác là rất quan trọng đối với sự an toàn. YOLO11 Phương pháp không có điểm neo giúp đơn giản hóa quá trình phát hiện bằng cách trực tiếp dự đoán các điểm chính của vật thể, như tâm của người đi bộ hoặc ranh giới của phương tiện khác, thay vì dựa vào các hộp neo được xác định trước.

YOLO11 không cần phải điều chỉnh hoặc lắp lưới neo cho từng đối tượng, vốn tốn kém về mặt tính toán và chậm. Thay vào đó, nó tập trung vào các tính năng chính, giúp việc xử lý nhanh hơn và hiệu quả hơn. Ví dụ, khi người đi bộ bước vào đường đi của xe, YOLO11 có thể nhanh chóng xác định vị trí bằng cách chỉ ra các điểm chính, ngay cả khi người đó bị che khuất một phần hoặc đang di chuyển. Khả năng thích ứng với nhiều hình dạng và kích thước khác nhau mà không cần hộp neo cho phép YOLO11 ĐẾN detect các vật thể đáng tin cậy hơn và ở tốc độ cao hơn, điều này rất quan trọng đối với việc ra quyết định theo thời gian thực trong các hệ thống lái xe tự động.
Các ứng dụng khác nơi YOLO11 Khả năng không cần neo của 's thực sự nổi bật bao gồm:
Trong khi các mô hình không có neo như YOLO11 Mặc dù mang lại nhiều lợi thế, chúng cũng đi kèm với một số hạn chế nhất định. Một trong những cân nhắc thực tế chính cần lưu ý là ngay cả các mô hình không có điểm neo cũng có thể gặp khó khăn với các vật thể bị che khuất hoặc chồng chéo cao. Lý do đằng sau điều này là thị giác máy tính hướng đến việc mô phỏng thị giác con người, và cũng giống như chúng ta đôi khi gặp khó khăn trong việc xác định các vật thể bị che khuất, các mô hình AI cũng có thể gặp phải những thách thức tương tự.
Một yếu tố thú vị khác liên quan đến việc xử lý dự đoán mô hình. Mặc dù kiến trúc của mô hình không neo đơn giản hơn so với mô hình dựa trên neo, nhưng trong một số trường hợp, việc tinh chỉnh bổ sung là cần thiết. Ví dụ, các kỹ thuật hậu xử lý như triệt tiêu không cực đại ( NMS ) có thể được yêu cầu để dọn dẹp các dự đoán chồng chéo hoặc cải thiện độ chính xác trong các cảnh đông đúc.
Sự chuyển đổi từ phát hiện dựa trên neo sang phát hiện không có neo là một bước tiến đáng kể trong phát hiện đối tượng. Với các mô hình không có neo như YOLO11 , quá trình này được đơn giản hóa, dẫn đến cải thiện cả về độ chính xác và tốc độ.
Bởi vì YOLO11 , chúng ta đã thấy cách phát hiện vật thể không có điểm neo vượt trội như thế nào trong các ứng dụng thời gian thực như xe tự lái, giám sát video và hình ảnh y tế, nơi phát hiện nhanh chóng và chính xác là rất quan trọng. Cách tiếp cận này cho phép YOLO11 để thích ứng dễ dàng hơn với các kích thước vật thể khác nhau và các cảnh phức tạp, mang lại hiệu suất tốt hơn trong nhiều môi trường khác nhau.
Khi computer vision tiếp tục phát triển, khả năng phát hiện đối tượng sẽ chỉ trở nên nhanh hơn, linh hoạt hơn và hiệu quả hơn.
Khám phá kho lưu trữ GitHub của chúng tôi và tham gia cộng đồng gắn kết của chúng tôi để luôn cập nhật mọi thứ về AI. Xem cách Vision AI đang tác động đến các lĩnh vực như sản xuất và nông nghiệp.