Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả cookie”, bạn đồng ý lưu trữ cookie trên thiết bị của mình để cải thiện khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thông tin thêm
Hiểu cách Ultralytics YOLO11 có thể tăng cường phát hiện đối tượng bằng cách sử dụng hộp giới hạn định hướng (OBB) và ứng dụng nào là lý tưởng cho tác vụ thị giác máy tính này.
Trong bài viết này, chúng ta sẽ xem xét phát hiện đối tượng OBB là gì , nơi có thể áp dụng và cách sử dụng YOLO11 để phát hiện OBB. Chúng ta cũng sẽ hướng dẫn cách các tính năng mới của YOLO11 có thể cải thiện các quy trình này và cách chạy suy luận và đào tạo các mô hình tùy chỉnh để tận dụng tối đa khả năng phát hiện OBB của nó.
Các tính năng YOLO11 thế hệ tiếp theo bao gồm các tác vụ như phát hiện đối tượng OBB
Phát hiện đối tượng OBB đưa phát hiện đối tượng truyền thống tiến thêm một bước nữa bằng cách phát hiện đối tượng ở các góc khác nhau. Không giống như các hộp giới hạn thông thường luôn thẳng hàng với trục của hình ảnh, OBB xoay để phù hợp với hướng của đối tượng. Phát hiện đối tượng OBB có thể được sử dụng để phân tích hình ảnh trên không hoặc vệ tinh khi đối tượng không phải lúc nào cũng thẳng. Trong các ngành như quy hoạch đô thị, năng lượng và giao thông , khả năng phát hiện chính xác các đối tượng có góc như tòa nhà, phương tiện hoặc cơ sở hạ tầng có thể hình thành nền tảng cho các ứng dụng thị giác máy tính với những lợi ích hữu hình.
Hình 1. So sánh hộp giới hạn bình thường và hộp giới hạn định hướng.
YOLO11 hỗ trợ phát hiện OBB và được đào tạo trên tập dữ liệu DOTA v1.0 để phát hiện các vật thể như máy bay , tàu và bồn chứa từ các góc nhìn khác nhau. YOLO11 có một số biến thể mô hình để phù hợp với các nhu cầu khác nhau, bao gồm YOLO11n-obb (Nano), YOLO11s-obb (Nhỏ), YOLO11m-obb (Trung bình), YOLO11l-obb (Lớn) và YOLO11x-obb (Cực lớn). Mỗi mô hình cung cấp một kích thước khác nhau, với các mức tốc độ, độ chính xác và sức mạnh tính toán khác nhau. Người dùng có thể chọn mô hình cung cấp sự cân bằng phù hợp giữa tốc độ và độ chính xác cho ứng dụng của họ.
Các trường hợp sử dụng YOLO11 giới thiệu góc độ phát hiện mới
Khả năng phát hiện đối tượng của YOLO11, đặc biệt là hỗ trợ hộp giới hạn định hướng, mang lại độ chính xác cao hơn cho nhiều ngành công nghiệp khác nhau. Tiếp theo, chúng ta sẽ xem xét một số ví dụ về cách phát hiện YOLO11 và OBB có thể được sử dụng trong các tình huống thực tế để làm cho các quy trình hiệu quả hơn, chính xác hơn và dễ quản lý hơn trong các lĩnh vực khác nhau.
Quy hoạch đô thị và giám sát cơ sở hạ tầng với YOLO11
Phát hiện đối tượng hộp giới hạn định hướng đặc biệt hữu ích ở đây vì nó cho phép phát hiện các đối tượng được nhìn từ nhiều góc độ khác nhau (thường là trường hợp với hình ảnh trên không). Độ chính xác rất quan trọng ở đây để theo dõi các khu công nghiệp, quản lý tác động môi trường và đảm bảo cơ sở hạ tầng được bảo trì đúng cách. OBB làm cho quá trình phát hiện đáng tin cậy hơn, giúp các nhà quy hoạch đưa ra quyết định sáng suốt về sự phát triển, an toàn và tính bền vững của thành phố. Sử dụng YOLO11, có thể giúp các nhà quy hoạch theo dõi và quản lý cơ sở hạ tầng giúp các thành phố hoạt động trơn tru.
Hình 2. Sử dụng YOLO11 để phát hiện các bồn chứa trong cảnh quay trên không.
Kiểm tra tấm pin mặt trời bằng máy bay không người lái, YOLO11 và AI biên
Khi năng lượng tái tạo và các sáng kiến như trang trại năng lượng mặt trời trở nên phổ biến hơn, việc kiểm tra thường xuyên trở nên quan trọng hơn. Các tấm pin mặt trời cần được kiểm tra để đảm bảo chúng hoạt động hiệu quả. Theo thời gian, những thứ như vết nứt , bụi bẩn tích tụ hoặc sai lệch có thể làm giảm hiệu suất của chúng. Các cuộc kiểm tra thường xuyên giúp phát hiện sớm các vấn đề này, do đó có thể bảo trì để chúng hoạt động trơn tru.
Ví dụ, có thể kiểm tra các tấm pin mặt trời để phát hiện hư hỏng bằng máy bay không người lái được tích hợp với AI cạnh và YOLO11. Phân tích hình ảnh trên cạnh mang lại độ chính xác và hiệu quả hơn cho quy trình kiểm tra. Do chuyển động và góc nhìn của máy bay không người lái, cảnh quay giám sát thường có thể chụp các tấm pin mặt trời từ nhiều góc độ khác nhau. Trong những trường hợp này, tính năng phát hiện OBB của YOLO11 có thể giúp máy bay không người lái xác định chính xác các tấm pin mặt trời.
YOLO11 có thể cung cấp thông tin chi tiết cho việc quản lý đội xe
Các cảng và bến cảng xử lý hàng trăm tàu mỗi tuần và việc quản lý một đội tàu lớn như vậy có thể là một thách thức. Một yếu tố khó khăn nữa là khi phân tích tàu trong hình ảnh trên không ; các tàu thường xuất hiện ở các góc độ khác nhau. Đây chính là lúc hỗ trợ phát hiện OBB của YOLO11 trở nên hữu ích.
Phát hiện OBB giúp mô hình có thể phát hiện tàu ở nhiều góc độ chính xác hơn so với các hộp chữ nhật tiêu chuẩn. Bằng cách sử dụng YOLO11 với OBB, các công ty vận chuyển có thể dễ dàng xác định vị trí và tình trạng của đội tàu, theo dõi các chi tiết quan trọng như chuyển động của đội tàu và hậu cần chuỗi cung ứng . Các giải pháp hỗ trợ tầm nhìn như vậy giúp tối ưu hóa các tuyến đường, giảm sự chậm trễ và cải thiện quản lý đội tàu nói chung trên các tuyến vận chuyển.
Hình 3. Sử dụng YOLO11 để phát hiện tàu thuyền và bến cảng ở một góc.
YOLO11 dành cho các nhà phát triển AI: Phát hiện các hộp giới hạn định hướng
Nếu bạn là nhà phát triển AI muốn sử dụng YOLO11 để phát hiện OBB, có hai tùy chọn dễ dàng để bắt đầu. Nếu bạn thoải mái làm việc với mã, gói Ultralytics Python là một lựa chọn tuyệt vời. Nếu bạn thích giải pháp thân thiện với người dùng, không cần mã với khả năng đào tạo đám mây, Ultralytics HUB là nền tảng nội bộ được thiết kế dành riêng cho mục đích đó. Để biết thêm chi tiết, bạn có thể xem hướng dẫn của chúng tôi về đào tạo và triển khai Ultralytics YOLO11 bằng Ultralytics HUB.
Bây giờ chúng ta đã thấy các ví dụ về nơi có thể áp dụng hỗ trợ OBB của YOLO11, hãy cùng khám phá gói Python Ultralytics và xem cách bạn có thể chạy suy luận và đào tạo các mô hình tùy chỉnh bằng cách sử dụng gói này.
Chạy suy luận bằng YOLO11
Trước tiên, để sử dụng YOLO11 với Python, bạn sẽ cần cài đặt gói Ultralytics. Tùy thuộc vào sở thích của mình, bạn có thể chọn cài đặt bằng pip, conda hoặc Docker. Để biết hướng dẫn từng bước, bạn có thể tham khảo Hướng dẫn cài đặt Ultralytics của chúng tôi. Nếu bạn gặp bất kỳ khó khăn nào trong quá trình cài đặt, Hướng dẫn sự cố thường gặp của chúng tôi cung cấp các mẹo khắc phục sự cố hữu ích.
Sau khi bạn đã cài đặt gói Ultralytics, việc làm việc với YOLO11 cực kỳ đơn giản. Chạy suy luận đề cập đến quá trình sử dụng mô hình đã được đào tạo để đưa ra dự đoán về hình ảnh mới - như phát hiện vật thể bằng OBB theo thời gian thực. Nó khác với đào tạo mô hình , tức là khi bạn dạy mô hình nhận dạng vật thể mới hoặc cải thiện hiệu suất của nó trên các tác vụ cụ thể. Suy luận được sử dụng khi bạn muốn áp dụng mô hình vào dữ liệu chưa biết.
Ví dụ bên dưới hướng dẫn bạn cách tải mô hình và sử dụng mô hình đó để dự đoán các hộp giới hạn định hướng trên hình ảnh. Để biết các ví dụ chi tiết hơn và mẹo sử dụng nâng cao, hãy đảm bảo xem tài liệu chính thức của Ultralytics để biết các phương pháp hay nhất và hướng dẫn thêm.
Hình 4. Một đoạn mã giới thiệu các suy luận đang chạy bằng YOLO11.
Đào tạo mô hình YOLO11 tùy chỉnh
Đào tạo mô hình YOLO11 có nghĩa là bạn có thể tinh chỉnh hiệu suất của nó trên các tập dữ liệu và tác vụ cụ thể, chẳng hạn như phát hiện đối tượng hộp giới hạn định hướng. Trong khi các mô hình được đào tạo trước như YOLO11 có thể được sử dụng để phát hiện đối tượng chung, đào tạo mô hình tùy chỉnh là điều cần thiết khi bạn cần mô hình phát hiện các đối tượng duy nhất hoặc tối ưu hóa hiệu suất trên một tập dữ liệu cụ thể.
Trong đoạn mã dưới đây, chúng tôi trình bày các bước đào tạo mô hình YOLO11 để phát hiện OBB.
Đầu tiên, mô hình được khởi tạo bằng cách sử dụng các trọng số cụ thể của YOLO11 OBB đã được đào tạo trước (yolo11n-obb.pt). Sau đó, một hàm đào tạo được sử dụng để đào tạo mô hình trên một tập dữ liệu tùy chỉnh, với các tham số như tệp cấu hình tập dữ liệu, số chu kỳ đào tạo, kích thước hình ảnh đào tạo và phần cứng để chạy đào tạo (ví dụ: CPU hoặc GPU). Sau khi đào tạo, hiệu suất của mô hình được xác thực để kiểm tra các số liệu như độ chính xác và mất mát.
Hình 5. Một ví dụ về việc đào tạo YOLO11 để phát hiện đối tượng OBB.
Con đường phía trước cho những tiến bộ của YOLO11 AI
Ultralytics YOLO11 đưa phát hiện vật thể lên một tầm cao mới với sự hỗ trợ của hộp giới hạn định hướng. Nhờ khả năng phát hiện vật thể ở nhiều góc độ khác nhau, YOLO11 có thể được sử dụng cho nhiều ứng dụng khác nhau trong nhiều ngành công nghiệp khác nhau. Ví dụ, nó hoàn toàn phù hợp với các ngành công nghiệp như quy hoạch đô thị, năng lượng và vận chuyển, nơi độ chính xác là yếu tố quan trọng đối với các nhiệm vụ như kiểm tra tấm pin mặt trời hoặc giám sát đội tàu. Với hiệu suất nhanh hơn và độ chính xác được cải thiện, YOLO11 có thể giúp các nhà phát triển AI giải quyết các thách thức trong thế giới thực.
Khi AI ngày càng được áp dụng rộng rãi và tích hợp vào cuộc sống hàng ngày, các mô hình như YOLO11 sẽ định hình tương lai của các giải pháp AI.
Để tìm hiểu về tiềm năng của Vision AI, hãy tham gia cộng đồng đang phát triển của chúng tôi và khám phá kho lưu trữ GitHub của chúng tôi. Chúng tôi đang thúc đẩy sự đổi mới bằng cách tái tạo các lĩnh vực như chăm sóc sức khỏe cho đến xe tự lái .