Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Cách sử dụng Ultralytics YOLO11 để phát hiện đối tượng OBB

Abirami Vina

5 phút đọc

Ngày 8 tháng 10 năm 2024

Tìm hiểu cách Ultralytics YOLO11 có thể tăng cường khả năng phát hiện đối tượng bằng cách sử dụng hộp giới hạn xoay (OBB) và những ứng dụng nào mà tác vụ thị giác máy tính này lý tưởng.

Sự kiện hybrid thường niên của Ultralytics, YOLO Vision 2024 (YV24), tập trung thảo luận về những đột phá mới nhất trong lĩnh vực AI và thị giác máy tính. Đây là cơ hội hoàn hảo để giới thiệu mô hình mới nhất của chúng tôi, Ultralytics YOLO11. Mô hình này hỗ trợ các tác vụ thị giác máy tính tương tự như Ultralytics YOLOv8, giúp người dùng dễ dàng chuyển đổi sang mô hình mới.

Giả sử bạn đang sử dụng YOLOv8 để phát hiện đối tượng bằng hộp giới hạn xoay (OBB) để phát hiện các đối tượng từ nhiều góc độ khác nhau. Giờ đây, bạn có thể chuyển sang YOLO11 chỉ với một vài thay đổi nhỏ trong mã của mình và hưởng lợi từ những cải tiến của YOLO11, từ độ chính xác và hiệu quả tăng lên đến tốc độ xử lý. Trong trường hợp bạn chưa sử dụng các mô hình như YOLO11, thì việc phát hiện OBB là một ví dụ tuyệt vời về cách YOLO11 có thể được áp dụng trong nhiều ngành khác nhau, mang lại các giải pháp thiết thực tạo ra tác động thực sự.

Trong bài viết này, chúng ta sẽ xem xét OBB object detection là gì, các lĩnh vực ứng dụng và cách sử dụng YOLO11 để phát hiện OBB. Chúng ta cũng sẽ xem xét cách các tính năng mới của YOLO11 có thể cải thiện các quy trình này và cách chạy suy luận (inferences) và huấn luyện các mô hình tùy chỉnh để tận dụng tối đa khả năng phát hiện OBB của nó.

Các tính năng YOLO11 thế hệ mới bao gồm các tác vụ như phát hiện đối tượng OBB

OBB object detection (phát hiện đối tượng bằng khung giới hạn xoay) là một bước tiến xa hơn so với object detection truyền thống bằng cách phát hiện các đối tượng ở các góc độ khác nhau. Không giống như các bounding box thông thường luôn thẳng hàng với các trục của ảnh, OBB xoay để phù hợp với hướng của đối tượng. OBB object detection có thể được sử dụng để phân tích ảnh chụp từ trên không hoặc ảnh vệ tinh, nơi các đối tượng không phải lúc nào cũng thẳng đứng. Trong các ngành như quy hoạch đô thị, năng lượng và giao thông vận tải, khả năng phát hiện chính xác các đối tượng có góc cạnh như tòa nhà, phương tiện hoặc cơ sở hạ tầng có thể tạo nền tảng cho các ứng dụng computer vision với những lợi ích hữu hình. 

__wf_reserved_inherit
Hình 1. So sánh bounding box thông thường và bounding box định hướng.

YOLO11 hỗ trợ phát hiện OBB và được huấn luyện trên bộ dữ liệu DOTA v1.0 để phát hiện các đối tượng như máy bay, tàu và bể chứa từ các góc độ khác nhau. YOLO11 có nhiều biến thể mô hình để phù hợp với các nhu cầu khác nhau, bao gồm YOLO11n-obb (Nano), YOLO11s-obb (Small), YOLO11m-obb (Medium), YOLO11l-obb (Large) và YOLO11x-obb (Extra Large). Mỗi mô hình cung cấp một kích thước khác nhau, với các mức độ khác nhau về tốc độ, độ chính xác và sức mạnh tính toán. Người dùng có thể chọn mô hình cung cấp sự cân bằng phù hợp giữa tốc độ và độ chính xác cho ứng dụng của họ. 

Các trường hợp sử dụng YOLO11 giới thiệu một góc độ mới cho việc phát hiện

Khả năng phát hiện đối tượng của YOLO11, đặc biệt là khả năng hỗ trợ hộp giới hạn định hướng, mang lại độ chính xác cao hơn cho nhiều ngành công nghiệp khác nhau. Tiếp theo, chúng ta sẽ xem xét một vài ví dụ về cách YOLO11 và phát hiện OBB có thể được sử dụng trong các tình huống thực tế để làm cho các quy trình hiệu quả hơn, chính xác hơn và dễ quản lý hơn trong các lĩnh vực khác nhau.

Quy hoạch đô thị và giám sát cơ sở hạ tầng với YOLO11

Nếu bạn đã từng ngưỡng mộ thiết kế và bố cục của một thành phố, thì đó là nhờ công việc chi tiết của quy hoạch đô thị và giám sát cơ sở hạ tầng. Một trong nhiều khía cạnh của giám sát cơ sở hạ tầng là xác định và quản lý các cấu trúc quan trọng như bể chứa, đường ống và các khu công nghiệp. YOLO11 có thể giúp các nhà quy hoạch thành phố phân tích hình ảnh trên không để phát hiện các thành phần quan trọng này một cách nhanh chóng và chính xác. 

Tính năng phát hiện đối tượng bằng hộp giới hạn theo hướng đặc biệt hữu ích ở đây vì nó cho phép phát hiện các đối tượng được xem từ nhiều góc độ khác nhau (thường là trường hợp với hình ảnh trên không). Độ chính xác là rất quan trọng ở đây để theo dõi các khu công nghiệp, quản lý các tác động môi trường và đảm bảo cơ sở hạ tầng được bảo trì đúng cách. OBB giúp quá trình phát hiện đáng tin cậy hơn, giúp các nhà hoạch định đưa ra các quyết định sáng suốt về sự tăng trưởng, an toàntính bền vững của thành phố. Sử dụng YOLO11 có thể giúp các nhà hoạch định theo dõi và quản lý cơ sở hạ tầng giúp các thành phố hoạt động trơn tru.

__wf_reserved_inherit
Hình 2. Sử dụng YOLO11 để phát hiện các bồn chứa trong cảnh quay trên không.

Kiểm tra các tấm pin mặt trời bằng máy bay không người lái, YOLO11 và AI biên

Khi năng lượng tái tạo (renewable energy) và các cải tiến như trang trại năng lượng mặt trời trở nên phổ biến hơn, việc kiểm tra thường xuyên ngày càng trở nên quan trọng. Cần kiểm tra các tấm pin mặt trời để đảm bảo chúng hoạt động hiệu quả. Theo thời gian, những thứ như vết nứt (cracks), bụi bẩn tích tụ hoặc lệch lạc có thể làm giảm hiệu suất của chúng. Kiểm tra định kỳ giúp phát hiện sớm những vấn đề này, để có thể thực hiện bảo trì để chúng hoạt động trơn tru.

Ví dụ: có thể kiểm tra hư hỏng của các tấm pin mặt trời bằng cách sử dụng drone tích hợp AI biên và YOLO11. Phân tích hình ảnh ở biên mang lại độ chính xác và hiệu quả cao hơn cho quá trình kiểm tra. Do chuyển động và góc nhìn của drone, cảnh quay giám sát thường có thể ghi lại các tấm pin mặt trời từ nhiều góc độ khác nhau. Trong những trường hợp này, tính năng phát hiện OBB của YOLO11 có thể giúp drone xác định chính xác các tấm pin mặt trời. 

YOLO11 có thể cung cấp thông tin chi tiết cho việc quản lý đội xe.

Các cảng và bến cảng xử lý hàng trăm tàu mỗi tuần và việc quản lý một đội tàu lớn như vậy có thể là một thách thức. Một yếu tố khó khăn được thêm vào là khi phân tích tàu trên ảnh chụp từ trên không; các tàu thường xuất hiện ở các góc khác nhau. Đây là nơi khả năng hỗ trợ phát hiện OBB của YOLO11 trở nên hữu ích. 

Phát hiện OBB giúp mô hình có thể phát hiện tàu ở nhiều góc độ khác nhau chính xác hơn so với các hộp hình chữ nhật tiêu chuẩn. Bằng cách sử dụng YOLO11 với OBB, các công ty vận tải biển có thể dễ dàng xác định vị trí và tình trạng đội tàu của họ, theo dõi các chi tiết quan trọng như sự di chuyển của đội tàu và hậu cần chuỗi cung ứng. Các giải pháp hỗ trợ thị giác như vậy giúp tối ưu hóa các tuyến đường, giảm sự chậm trễ và cải thiện quản lý đội tàu tổng thể trên các tuyến vận chuyển.

__wf_reserved_inherit
Hình 3. Sử dụng YOLO11 để phát hiện tàu và bến cảng ở một góc nghiêng.

YOLO11 cho nhà phát triển AI: Phát hiện hộp giới hạn định hướng

Nếu bạn là nhà phát triển AI đang tìm cách sử dụng YOLO11 cho việc phát hiện OBB, có hai lựa chọn dễ dàng để bắt đầu. Nếu bạn quen làm việc với code, thì gói Ultralytics Python là một lựa chọn tuyệt vời. Nếu bạn thích một giải pháp thân thiện với người dùng, không cần code với khả năng huấn luyện trên cloud, thì Ultralytics HUB là một nền tảng nội bộ được thiết kế riêng cho mục đích đó. Để biết thêm chi tiết, bạn có thể xem hướng dẫn của chúng tôi về huấn luyện và triển khai Ultralytics YOLO11 bằng Ultralytics HUB.

Sau khi xem các ví dụ về nơi có thể áp dụng hỗ trợ OBB của YOLO11, hãy khám phá gói Ultralytics Python và xem cách bạn có thể chạy suy luậnhuấn luyện các mô hình tùy chỉnh bằng cách sử dụng nó. 

Chạy suy luận bằng YOLO11

Đầu tiên, để sử dụng YOLO11 với Python, bạn cần cài đặt gói Ultralytics. Tùy thuộc vào sở thích của bạn, bạn có thể chọn cài đặt nó bằng pip, conda hoặc Docker. Để có hướng dẫn từng bước, bạn có thể tham khảo Hướng dẫn Cài đặt Ultralytics của chúng tôi. Nếu bạn gặp bất kỳ khó khăn nào trong quá trình cài đặt, Hướng dẫn Các Vấn đề Thường gặp của chúng tôi cung cấp các mẹo khắc phục sự cố hữu ích.

Sau khi bạn đã cài đặt gói Ultralytics, việc làm việc với YOLO11 trở nên vô cùng đơn giản. Chạy suy luận đề cập đến quá trình sử dụng mô hình đã huấn luyện để đưa ra dự đoán trên các hình ảnh mới - như phát hiện các đối tượng bằng OBB trong thời gian thực. Nó khác với huấn luyện mô hình, là khi bạn dạy mô hình nhận dạng các đối tượng mới hoặc cải thiện hiệu suất của nó trên các tác vụ cụ thể. Suy luận được sử dụng khi bạn muốn áp dụng mô hình cho dữ liệu chưa thấy.

Ví dụ dưới đây sẽ hướng dẫn bạn cách tải một mô hình và sử dụng nó để dự đoán các hộp giới hạn có hướng trên một hình ảnh. Để có các ví dụ chi tiết hơn và các mẹo sử dụng nâng cao, hãy nhớ xem tài liệu chính thức của Ultralytics để biết các phương pháp hay nhất và hướng dẫn thêm.

__wf_reserved_inherit
Hình 4. Một đoạn mã Code giới thiệu việc chạy suy luận bằng YOLO11.

Huấn luyện một mô hình YOLO11 tùy chỉnh

Huấn luyện một mô hình YOLO11 có nghĩa là bạn có thể tinh chỉnh hiệu suất của nó trên các bộ dữ liệutác vụ cụ thể, chẳng hạn như phát hiện đối tượng bằng khung giới hạn xoay. Mặc dù các mô hình được huấn luyện trước như YOLO11 có thể được sử dụng để phát hiện đối tượng nói chung, nhưng huấn luyện một mô hình tùy chỉnh là điều cần thiết khi bạn cần mô hình phát hiện các đối tượng duy nhất hoặc tối ưu hóa hiệu suất trên một bộ dữ liệu cụ thể.

Trong đoạn code bên dưới, chúng ta sẽ đề cập đến các bước huấn luyện mô hình YOLO11 để phát hiện OBB. 

Đầu tiên, mô hình được khởi tạo bằng cách sử dụng các trọng số YOLO11 OBB đã được huấn luyện trước (yolo11n-obb.pt). Sau đó, một hàm huấn luyện được sử dụng để huấn luyện mô hình trên một bộ dữ liệu tùy chỉnh, với các tham số như tệp cấu hình bộ dữ liệu, số lượng chu kỳ huấn luyện, kích thước ảnh huấn luyện và phần cứng để chạy huấn luyện (ví dụ: CPU hoặc GPU). Sau khi huấn luyện, hiệu suất của mô hình được xác thực để kiểm tra các số liệu như độ chính xác và loss. 

Sử dụng mô hình đã huấn luyện, bạn có thể chạy suy luận trên các hình ảnh mới để phát hiện các đối tượng bằng OBB và trực quan hóa chúng. Ngoài ra, mô hình đã huấn luyện có thể được chuyển đổi sang các định dạng như ONNX để triển khai bằng tính năng xuất.

__wf_reserved_inherit
Hình 5. Một ví dụ về huấn luyện YOLO11 để phát hiện đối tượng OBB.

Con đường phía trước cho những tiến bộ của YOLO11 AI

Ultralytics YOLO11 nâng khả năng phát hiện đối tượng lên một tầm cao mới với sự hỗ trợ cho các hộp giới hạn có hướng (oriented bounding boxes). Nhờ khả năng phát hiện các đối tượng ở các góc độ khác nhau, YOLO11 có thể được sử dụng cho nhiều ứng dụng khác nhau trong các ngành công nghiệp khác nhau. Ví dụ: nó hoàn toàn phù hợp với các ngành như quy hoạch đô thị, năng lượng và vận chuyển, nơi độ chính xác là rất quan trọng đối với các tác vụ như kiểm tra tấm pin mặt trời hoặc giám sát đội tàu. Với hiệu suất nhanh hơn và độ chính xác được cải thiện, YOLO11 có thể giúp các nhà phát triển AI giải quyết các thách thức trong thế giới thực. 

Khi AI ngày càng được áp dụng rộng rãi và tích hợp vào cuộc sống hàng ngày của chúng ta, các mô hình như YOLO11 sẽ định hình tương lai của các giải pháp AI.

Để tìm hiểu về tiềm năng của Vision AI, hãy tham gia cộng đồng đang phát triển của chúng tôi và khám phá kho lưu trữ GitHub của chúng tôi. Chúng tôi đang thúc đẩy sự đổi mới bằng cách tái tạo các lĩnh vực như chăm sóc sức khỏe đến xe tự lái.

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard