Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Cài đặt Cookie
Bằng cách nhấp vào “Chấp nhận tất cả Cookie”, bạn đồng ý với việc lưu trữ cookie trên thiết bị của mình để tăng cường khả năng điều hướng trang web, phân tích việc sử dụng trang web và hỗ trợ các nỗ lực tiếp thị của chúng tôi. Thêm thông tin
Hiểu cách Ultralytics YOLO11 có thể tăng cường khả năng phát hiện đối tượng bằng cách sử dụng hộp giới hạn định hướng (OBB) và ứng dụng nào phù hợp với tác vụ thị giác máy tính này.
Trong bài viết này, chúng ta sẽ xem xét phát hiện đối tượng OBB là gì , nơi nó có thể được áp dụng và cách sử dụng YOLO11 ĐẾN detect OBB. Chúng tôi cũng sẽ hướng dẫn cách YOLO11 Các tính năng mới của có thể cải thiện các quy trình này và cách chạy suy luận cũng như đào tạo các mô hình tùy chỉnh để tận dụng tối đa khả năng phát hiện OBB của nó.
Thế hệ tiếp theo YOLO11 các tính năng bao gồm các tác vụ như phát hiện đối tượng OBB
Phát hiện đối tượng OBB đưa công nghệ phát hiện đối tượng truyền thống lên một tầm cao mới bằng cách phát hiện đối tượng ở nhiều góc độ khác nhau. Không giống như các khung giới hạn thông thường luôn thẳng hàng với trục của hình ảnh, OBB xoay để phù hợp với hướng của đối tượng. Phát hiện đối tượng OBB có thể được sử dụng để phân tích ảnh hàng không hoặc ảnh vệ tinh khi đối tượng không phải lúc nào cũng thẳng hàng. Trong các ngành như quy hoạch đô thị, năng lượng và giao thông vận tải , khả năng xác định chính xác detect các vật thể góc cạnh như tòa nhà, phương tiện giao thông hoặc cơ sở hạ tầng có thể tạo thành nền tảng cho các ứng dụng thị giác máy tính với những lợi ích hữu hình.
Hình 1. So sánh bounding box thông thường và bounding box định hướng.
YOLO11 hỗ trợ phát hiện OBB và được đào tạo trên tập dữ liệu DOTA v1.0 để detect các vật thể như máy bay , tàu thủy và bồn chứa từ nhiều góc nhìn khác nhau. YOLO11 có nhiều biến thể mô hình khác nhau để phù hợp với các nhu cầu khác nhau, bao gồm YOLO11n- obb (Nano), YOLO11s- obb (Nhỏ), YOLO11m- obb (Trung bình), YOLO11l- obb (Lớn) và YOLO11x- obb (Cực lớn). Mỗi model có kích thước khác nhau, với các mức tốc độ, độ chính xác và sức mạnh tính toán khác nhau. Người dùng có thể lựa chọn model phù hợp nhất với nhu cầu sử dụng của mình.
YOLO11 các trường hợp sử dụng giới thiệu một góc độ mới để phát hiện
YOLO11 Khả năng phát hiện đối tượng của AI, đặc biệt là khả năng hỗ trợ các hộp giới hạn định hướng, mang lại độ chính xác cao hơn cho nhiều ngành công nghiệp khác nhau. Tiếp theo, chúng ta sẽ xem xét một vài ví dụ về cách YOLO11 và phát hiện OBB có thể được sử dụng trong các tình huống thực tế để làm cho các quy trình hiệu quả hơn, chính xác hơn và dễ quản lý hơn trong các lĩnh vực khác nhau.
Quy hoạch đô thị và giám sát cơ sở hạ tầng với YOLO11
Việc phát hiện vật thể trong hộp giới hạn định hướng đặc biệt hữu ích ở đây vì nó cho phép phát hiện các vật thể được nhìn từ nhiều góc độ khác nhau (thường là trường hợp với ảnh hàng không). Độ chính xác là yếu tố quan trọng để duy trì track của các khu công nghiệp, quản lý tác động môi trường và đảm bảo cơ sở hạ tầng được bảo trì đúng cách. OBB giúp quá trình phát hiện trở nên đáng tin cậy hơn, giúp các nhà quy hoạch đưa ra quyết định sáng suốt về sự phát triển, an toàn và tính bền vững của thành phố. Sử dụng YOLO11 có thể giúp các nhà quy hoạch theo dõi và quản lý cơ sở hạ tầng giúp các thành phố vận hành trơn tru.
Hình 2. Sử dụng YOLO11 ĐẾN detect các bồn chứa trong cảnh quay trên không.
Kiểm tra các tấm pin mặt trời bằng máy bay không người lái, YOLO11 và AI biên
Khi năng lượng tái tạo (renewable energy) và các cải tiến như trang trại năng lượng mặt trời trở nên phổ biến hơn, việc kiểm tra thường xuyên ngày càng trở nên quan trọng. Cần kiểm tra các tấm pin mặt trời để đảm bảo chúng hoạt động hiệu quả. Theo thời gian, những thứ như vết nứt (cracks), bụi bẩn tích tụ hoặc lệch lạc có thể làm giảm hiệu suất của chúng. Kiểm tra định kỳ giúp phát hiện sớm những vấn đề này, để có thể thực hiện bảo trì để chúng hoạt động trơn tru.
Ví dụ, các tấm pin mặt trời có thể được kiểm tra hư hỏng bằng máy bay không người lái được tích hợp với AI biên và YOLO11 Việc phân tích hình ảnh từ rìa mang lại độ chính xác và hiệu quả cao hơn cho quá trình kiểm tra. Do chuyển động và góc nhìn của máy bay không người lái, cảnh quay giám sát thường có thể ghi lại hình ảnh các tấm pin mặt trời từ nhiều góc độ khác nhau. Trong những trường hợp này, YOLO11 Tính năng phát hiện OBB có thể giúp máy bay không người lái xác định chính xác các tấm pin mặt trời.
YOLO11 có thể cung cấp thông tin chi tiết cho việc quản lý đội tàu
Các cảng và bến tàu tiếp nhận hàng trăm tàu mỗi tuần, và việc quản lý một đội tàu lớn như vậy có thể là một thách thức. Việc phân tích tàu trên ảnh hàng không còn khó khăn hơn nữa; các tàu thường xuất hiện ở nhiều góc độ khác nhau. Đây chính là lúc tính năng hỗ trợ phát hiện OBB của YOLO11 trở nên hữu ích.
Phát hiện OBB giúp cho mô hình có thể detect tàu ở nhiều góc độ chính xác hơn so với các hộp hình chữ nhật tiêu chuẩn. Bằng cách sử dụng YOLO11 với OBB, các công ty vận chuyển có thể dễ dàng xác định vị trí và tình trạng của đội tàu của họ, giữ track các chi tiết quan trọng như hoạt động của đội tàu và hậu cần chuỗi cung ứng . Các giải pháp hỗ trợ tầm nhìn này giúp tối ưu hóa tuyến đường, giảm thiểu sự chậm trễ và cải thiện quản lý đội tàu tổng thể trên các tuyến vận chuyển.
Hình 3. Sử dụng YOLO11 ĐẾN detect tàu thuyền và bến cảng ở một góc.
YOLO11 dành cho các nhà phát triển AI: Phát hiện các hộp giới hạn định hướng
Nếu bạn là nhà phát triển AI đang muốn sử dụng YOLO11 Để phát hiện OBB, có hai lựa chọn dễ dàng để bắt đầu. Nếu bạn quen với việc viết mã, gói Ultralytics Python là một lựa chọn tuyệt vời. Nếu bạn thích một giải pháp thân thiện với người dùng, không cần viết mã với khả năng đào tạo đám mây, Ultralytics HUB là một nền tảng nội bộ được thiết kế riêng cho mục đích đó. Để biết thêm chi tiết, bạn có thể xem hướng dẫn của chúng tôi về đào tạo và triển khai Ultralytics YOLO11 bằng Ultralytics TRUNG TÂM.
Bây giờ chúng ta đã thấy những ví dụ về nơi YOLO11 Hỗ trợ OBB có thể được áp dụng, hãy cùng khám phá Ultralytics Python gói và xem cách bạn có thể chạy suy luận và đào tạo các mô hình tùy chỉnh bằng cách sử dụng nó.
Chạy suy luận bằng cách sử dụng YOLO11
Đầu tiên, sử dụng YOLO11 với Python , bạn sẽ cần phải cài đặt Ultralytics Gói. Tùy thuộc vào sở thích, bạn có thể chọn cài đặt bằng pip, conda hoặc Docker. Để biết hướng dẫn từng bước, bạn có thể tham khảo Hướng dẫn Cài đặt Ultralytics của chúng tôi. Nếu bạn gặp bất kỳ khó khăn nào trong quá trình cài đặt, Hướng dẫn Các Vấn đề Thường gặp của chúng tôi cung cấp các mẹo khắc phục sự cố hữu ích.
Sau khi bạn đã cài đặt Ultralytics gói, làm việc với YOLO11 cực kỳ đơn giản. Chạy suy luận là quá trình sử dụng một mô hình đã được đào tạo để đưa ra dự đoán trên các hình ảnh mới - chẳng hạn như phát hiện vật thể bằng OBB theo thời gian thực. Nó khác với huấn luyện mô hình , tức là khi bạn dạy mô hình nhận dạng vật thể mới hoặc cải thiện hiệu suất của nó trong các tác vụ cụ thể. Suy luận được sử dụng khi bạn muốn áp dụng mô hình vào dữ liệu chưa được biết đến.
Ví dụ dưới đây hướng dẫn bạn cách tải mô hình và sử dụng nó để dự đoán các hộp giới hạn định hướng trên hình ảnh. Để biết thêm ví dụ chi tiết và các mẹo sử dụng nâng cao, hãy nhớ xem tài liệu chính thức Ultralytics để biết các phương pháp hay nhất và hướng dẫn chi tiết hơn.
Hình 4. Một đoạn mã giới thiệu các suy luận đang chạy bằng cách sử dụng YOLO11 .
Đào tạo một phong tục YOLO11 người mẫu
Đào tạo một YOLO11 mô hình có nghĩa là bạn có thể tinh chỉnh hiệu suất của nó trên các tập dữ liệu và tác vụ cụ thể, chẳng hạn như phát hiện đối tượng hộp giới hạn định hướng. Trong khi các mô hình được đào tạo trước như YOLO11 có thể được sử dụng để phát hiện đối tượng chung, việc đào tạo một mô hình tùy chỉnh là điều cần thiết khi bạn cần mô hình để detect các đối tượng duy nhất hoặc tối ưu hóa hiệu suất trên một tập dữ liệu cụ thể.
Trong đoạn mã dưới đây, chúng tôi trình bày các bước để đào tạo một YOLO11 mô hình phát hiện OBB.
Đầu tiên, mô hình được khởi tạo bằng cách sử dụng các dữ liệu được đào tạo trước YOLO11 Trọng số cụ thể của OBB (yolo11n- obb .pt). Sau đó, một hàm đào tạo được sử dụng để đào tạo mô hình trên một tập dữ liệu tùy chỉnh, với các tham số như tệp cấu hình tập dữ liệu, số chu kỳ đào tạo, kích thước hình ảnh đào tạo và phần cứng để chạy đào tạo (ví dụ: CPU hoặc GPU ). Sau khi đào tạo, hiệu suất của mô hình được xác thực để kiểm tra các số liệu như độ chính xác và độ mất mát.
Hình 5. Một ví dụ về đào tạo YOLO11 để phát hiện đối tượng OBB.
Con đường phía trước cho YOLO11 Những tiến bộ của AI
Ultralytics YOLO11 đưa khả năng phát hiện đối tượng lên một tầm cao mới với sự hỗ trợ của hộp giới hạn định hướng. Bằng cách có thể detect các vật thể ở các góc độ khác nhau, YOLO11 có thể được sử dụng cho nhiều ứng dụng khác nhau trong nhiều ngành công nghiệp khác nhau. Ví dụ, nó hoàn toàn phù hợp với các ngành công nghiệp như quy hoạch đô thị, năng lượng và vận tải biển, nơi độ chính xác là yếu tố then chốt cho các nhiệm vụ như kiểm tra tấm pin mặt trời hoặc giám sát đội tàu. Với hiệu suất nhanh hơn và độ chính xác được cải thiện, YOLO11 có thể giúp các nhà phát triển AI giải quyết những thách thức trong thế giới thực.
Khi AI ngày càng được áp dụng rộng rãi và tích hợp vào cuộc sống hàng ngày của chúng ta, các mô hình như YOLO11 sẽ định hình tương lai của các giải pháp AI.
Để tìm hiểu về tiềm năng của Vision AI, hãy tham gia cộng đồng đang phát triển của chúng tôi và khám phá kho lưu trữ GitHub của chúng tôi. Chúng tôi đang thúc đẩy sự đổi mới bằng cách tái tạo các lĩnh vực như chăm sóc sức khỏe đến xe tự lái.