Hướng dẫn về cách chú thích đa giác với Ultralytics Nền tảng
Khám phá cách chú thích đa giác, cách nó giúp phân đoạn đối tượng chính xác và cách tạo chú thích dễ dàng với Ultralytics Nền tảng.

Khám phá cách chú thích đa giác, cách nó giúp phân đoạn đối tượng chính xác và cách tạo chú thích dễ dàng với Ultralytics Nền tảng.

Các công nghệ AI tiên tiến đang được ứng dụng rộng rãi trong nhiều ngành công nghiệp, từ lái xe tự hành đến nông nghiệp chính xác. Ví dụ, các hộ nông dân chăn nuôi bò sữa đang sử dụng AI và phân tích hình ảnh để... detect bệnh tật ở gia súc. Các vấn đề sức khỏe như què chân có thể được theo dõi bằng cách quan sát những thay đổi trong dáng đi và tư thế của động vật, chẳng hạn như lưng cong và chuyển động không đối xứng.

Thị giác máy tính , một nhánh của trí tuệ nhân tạo, cho phép các ứng dụng như vậy bằng cách cho phép máy móc diễn giải và phân tích dữ liệu hình ảnh. Cụ thể, phân đoạn đối tượng là một nhiệm vụ thị giác máy tính xác định và phân đoạn từng đối tượng trong hình ảnh ở cấp độ pixel, giúp có thể xác định chính xác. detect và phân tích từng cá thể động vật.
Việc chú thích đa giác đóng vai trò quan trọng trong quá trình này. Đây là một phương pháp chú thích dữ liệu được sử dụng để theo dõi cẩn thận hình dạng chính xác của một đối tượng trong ảnh bằng cách đặt các điểm dọc theo các cạnh của nó. Không giống như các chú thích hộp giới hạn đơn giản, phương pháp này theo sát đường viền thực sự của đối tượng, giúp tạo ra dữ liệu huấn luyện chính xác hơn và cho phép các mô hình AI thị giác hiểu rõ hơn về ranh giới của đối tượng.
Hiện nay, có rất nhiều công cụ để tạo chú thích đa giác. Tuy nhiên, những công cụ này thường khá rời rạc, đặc biệt khi chúng hỗ trợ không nhất quán hoặc hạn chế các loại chú thích khác nhau, khiến việc quản lý các nhu cầu gắn nhãn đa dạng trong một quy trình làm việc duy nhất trở nên khó khăn hơn.
Nền tảng Ultralytics , không gian làm việc AI thị giác toàn diện mới của chúng tôi, giúp thu hẹp khoảng cách giữa quản lý tập dữ liệu, chú thích, đào tạo, triển khai và giám sát, giải quyết vấn đề này bằng cách hỗ trợ nhiều loại chú thích và quy trình làm việc hỗ trợ AI trong một không gian làm việc liền mạch, đơn giản hóa toàn bộ quy trình chú thích.
Trong bài viết này, chúng ta sẽ tìm hiểu chú thích đa giác là gì và cách tạo chúng bằng cách sử dụng Ultralytics Nền tảng. Bắt đầu thôi!
Trước khi chúng ta đi sâu vào... Ultralytics Hãy cùng tìm hiểu về nền tảng và các tính năng chú thích đa giác của nó, và xem chú thích đa giác là gì.
Chú thích hình ảnh là quá trình thêm nhãn vào dữ liệu hình ảnh để các mô hình AI có thể hiểu những gì chúng đang nhìn thấy. Thông thường, nó bao gồm việc xác định các đối tượng trong hình ảnh và đánh dấu chúng theo cách mà mô hình có thể học hỏi được.
Một trong những phương pháp phổ biến nhất là vẽ các hình chữ nhật xung quanh các đối tượng, được gọi là hộp giới hạn. Tuy nhiên, hộp giới hạn chỉ cung cấp một đường viền sơ lược của đối tượng. Chú thích đa giác là một phương pháp chính xác hơn.
Phương pháp này hoạt động bằng cách phác thảo đường viền của một đối tượng (các đường bao quanh) từng điểm một thay vì bao quanh nó bằng một hình hộp. Để làm điều này, người chú thích đặt nhiều đỉnh (điểm) dọc theo các cạnh của đối tượng, vẽ theo đường viền của nó cho đến khi toàn bộ hình dạng được bao phủ.
Các điểm được kết nối này tạo thành một đa giác phản chiếu đường viền tự nhiên của vật thể. Vì hình dạng này bám sát ranh giới của vật thể, nên phương pháp chú thích này nắm bắt được những chi tiết mà các phương pháp gắn nhãn truyền thống thường bỏ sót. Điều này đặc biệt hữu ích khi các vật thể có hình dạng bất thường hoặc các cạnh phức tạp, chẳng hạn như lá cây, hình bóng người và các vật thể chồng lên nhau.
Độ chính xác cao trong dữ liệu giúp các mô hình máy học hoạt động hiệu quả hơn trong quá trình huấn luyện. Khi các chú thích nắm bắt chính xác ranh giới thực sự của một đối tượng, các mô hình có thể hiểu rõ hơn các mẫu của đối tượng ở cấp độ pixel. Điều này dẫn đến hiệu suất mô hình được cải thiện, đặc biệt là trong các tác vụ phân đoạn đòi hỏi độ chính xác cao.
Vậy, các chú thích đa giác được sử dụng như thế nào? Chúng gắn liền với các mô hình AI thị giác hỗ trợ các tác vụ phân đoạn hình ảnh như phân đoạn đối tượng.
Trong nhiều ứng dụng thị giác máy tính, việc biết chính xác diện tích mà mỗi đối tượng chiếm giữ trong một khung hình ảnh hoặc video là rất cần thiết. Một ví dụ điển hình là việc phát hiện các bộ phận ô tô trong sản xuất. Trong trường hợp này, các mô hình cần phải xác định và phác thảo chính xác các bộ phận như cửa, cửa sổ và đèn pha, ngay cả khi chúng chồng chéo hoặc có hình dạng phức tạp.
Đây là lúc phân đoạn đối tượng phát huy tác dụng. Nó cho phép các mô hình detect Mỗi đối tượng được nhận diện và ranh giới chính xác của nó ở cấp độ pixel. Điều này khác với phát hiện đối tượng cơ bản, vốn sử dụng hộp giới hạn.

Khung bao chỉ cung cấp các vùng hình chữ nhật gần đúng xung quanh các đối tượng và thường bao gồm cả phần nền thừa, khiến việc nắm bắt các hình dạng bất thường hoặc tách các đối tượng chồng chéo trở nên khó khăn hơn.
Việc chú thích đa giác đóng vai trò quan trọng trong việc đạt được độ chính xác này. Việc theo dõi hình dạng chính xác của từng đối tượng trong ảnh dữ liệu tạo ra dữ liệu huấn luyện chất lượng cao, phản ánh đúng ranh giới của đối tượng. Những chú thích chi tiết này giúp các mô hình, chẳng hạn như Ultralytics YOLO26 , hiểu rõ hơn cấu trúc của từng thành phần, dẫn đến kết quả phân đoạn chính xác hơn.
Tiếp theo, chúng ta hãy cùng xem xét những hạn chế của các công cụ chú thích truyền thống để hiểu được sự cần thiết của các giải pháp hiệu quả và có khả năng mở rộng hơn như... Ultralytics Nền tảng.
Dưới đây là một số thách thức phổ biến mà người chú thích gặp phải khi sử dụng các công cụ chú thích đa giác truyền thống:
Ultralytics Nền tảng này giải quyết những mối lo ngại đó bằng các tính năng chú thích hỗ trợ bởi AI, được cung cấp bởi cả Mô hình Phân đoạn Bất kỳ (Segment Anything Models) ( SAM ) Và YOLO mô hình. SAM Công cụ này cho phép người dùng tạo ra các mặt nạ phân đoạn chất lượng cao từ các dữ liệu đầu vào đơn giản như các cú nhấp chuột, sau đó có thể được tinh chỉnh thành các chú thích đa giác chính xác.
Tương tự như vậy, YOLO Chú thích thông minh dựa trên mô hình sử dụng mô hình được huấn luyện trước hoặc tùy chỉnh. YOLO Các mô hình này cho phép chạy suy luận trên hình ảnh và thêm các dự đoán, chẳng hạn như hộp giới hạn, mặt nạ phân đoạn hoặc hộp giới hạn định hướng, dưới dạng chú thích, sau đó có thể được xem xét và điều chỉnh khi cần thiết. Nhờ đó, quy trình chú thích trở nên nhanh hơn, nhất quán hơn và dễ mở rộng hơn.
Ultralytics Nền tảng này bao gồm một trình chỉnh sửa chú thích tích hợp cho phép người dùng chú thích hình ảnh trực tiếp trong không gian làm việc. Điều này giúp việc xây dựng và quản lý tập dữ liệu dễ dàng hơn mà không cần dựa vào các công cụ gắn nhãn dữ liệu riêng biệt, thường tốn nhiều thời gian.
Ngoài các chú thích đa giác, Ultralytics Nền tảng này hỗ trợ một số loại chú thích khác. Dưới đây là tổng quan nhanh:
Bây giờ, chúng ta hãy xem cách tạo chú thích đa giác trên... Ultralytics Nền tảng, có thể được vận hành thủ công hoặc bằng các công cụ hỗ trợ trí tuệ nhân tạo.
Dưới đây là hướng dẫn từng bước nhanh chóng để tạo chú thích đa giác theo cách thủ công:

Tiếp theo, chúng ta hãy xem xét các tính năng gắn nhãn hỗ trợ bởi AI. Ultralytics Nền tảng giúp tăng tốc quá trình chú thích.
Nền tảng này cung cấp hai phương pháp chú thích thông minh: một phương pháp dựa trên Mô hình Phân đoạn Bất kỳ (Segment Anything Models) để tạo chú thích tương tác bằng cách nhấp chuột, và một phương pháp khác dựa trên... YOLO các mô hình để thêm trực tiếp dự đoán của mô hình dưới dạng chú thích. Cả hai phương pháp đều có thể được sử dụng để chú thích đa giác thông minh.
SAM - chú thích có hỗ trợ trên Ultralytics Nền tảng này đơn giản hóa việc dán nhãn thủ công bằng cách sử dụng Mô hình Phân đoạn Bất kỳ (Segment Anything Model) SAM (Phần mềm này có thể tạo mặt nạ phân đoạn với đầu vào tối thiểu.) Thay vì phải vẽ từng điểm đối tượng, người dùng có thể tương tác với hình ảnh bằng các thao tác đơn giản như nhấp chuột để chỉ ra những gì nên được bao gồm hoặc loại trừ.
Nền tảng này hỗ trợ nhiều tính năng. SAM các mô hình, bao gồm SAM 2.1 và SAM 3, cho phép người dùng lựa chọn giữa hiệu năng nhanh hơn hoặc độ chính xác cao hơn tùy thuộc vào nhu cầu của họ. Dựa trên thông tin do người dùng cung cấp, SAM Công cụ này tạo ra các mặt nạ ở cấp độ pixel trong thời gian thực. Sau đó, các mặt nạ này có thể được tinh chỉnh và sử dụng làm chú thích đa giác, giúp quá trình nhanh hơn, nhất quán hơn và dễ dàng mở rộng hơn.
Dưới đây là các bước sử dụng SAM để chú thích đa giác trong Ultralytics Nền tảng:

YOLO - chú thích thông minh dựa trên Ultralytics Nền tảng này tăng tốc quá trình gắn nhãn bằng cách sử dụng dữ liệu được đào tạo trước. Ultralytics YOLO mô hình hoặc được tinh chỉnh YOLO Các mô hình này tạo ra các dự đoán trên một hình ảnh và thêm chúng dưới dạng chú thích. Các dự đoán này có thể bao gồm các hộp giới hạn, mặt nạ phân đoạn hoặc các hộp giới hạn định hướng, tùy thuộc vào nhiệm vụ của tập dữ liệu.
Người dùng sau đó có thể xem xét và chỉnh sửa các chú thích này khi cần. Dưới đây là tổng quan về các bước liên quan đến việc sử dụng YOLO - chú thích thông minh dựa trên Ultralytics Nền tảng:

Việc chú thích đa giác đang tạo ra tác động thực sự trong nhiều ngành công nghiệp, từ kiểm soát chất lượng trong sản xuất đến nông nghiệp và chăm sóc sức khỏe. Hãy cùng khám phá một số ứng dụng thực tế quan trọng.
Trong nông nghiệp, việc theo dõi sức khỏe cây trồng rất quan trọng để nâng cao năng suất và giảm thiểu tổn thất. Phát hiện các vùng bị nhiễm sâu bệnh trên lá cây trồng có thể khó khăn vì những vùng này thường có hình dạng bất thường và ranh giới không rõ ràng.
Loại vấn đề này có thể được giải quyết bằng các kỹ thuật phân đoạn ảnh như phân đoạn ngữ nghĩa, gán nhãn cho tất cả các pixel thuộc về một lớp (chẳng hạn như các khu vực bị nhiễm bệnh), hoặc phân đoạn đối tượng, tách các đường viền đối tượng một cách chính xác hơn.
Với Ultralytics Trên nền tảng này, người dùng có thể sử dụng chú thích đa giác để theo dõi hình dạng chính xác của các khu vực bị nhiễm bệnh. Điều này giúp tạo ra các bộ dữ liệu chính xác hơn và giúp các thuật toán AI thị giác dễ dàng phát hiện các mô hình tinh tế trong môi trường nông nghiệp.
Do đó, các nhóm có thể xây dựng dữ liệu huấn luyện tốt hơn, giúp các mô hình xác định chính xác vị trí bị sâu bệnh. Điều này hiệu quả hơn so với việc sử dụng các hộp giới hạn, vốn có thể bao gồm cả những phần lá không bị ảnh hưởng.
Tương tự như việc phát hiện sâu bệnh trong nông nghiệp, ngay cả những khác biệt nhỏ về ranh giới cũng có thể ảnh hưởng đến cách phân tích các bệnh như ung thư trong hình ảnh y học . Điều này đặc biệt quan trọng khi xác định các bất thường trong chăm sóc sức khỏe như khối u trong ảnh chụp CT.
Các phương pháp chú thích truyền thống có thể bỏ sót các cạnh nhỏ hoặc bao gồm cả mô xung quanh, điều này có thể làm giảm độ chính xác. Với Ultralytics Trên nền tảng này, các nhóm có thể sử dụng chú thích đa giác để theo dõi chính xác các vùng này trong dữ liệu huấn luyện, giúp các mô hình tạo ra phân đoạn khối u chính xác và đáng tin cậy hơn.
Chú thích đa giác là yếu tố then chốt khi các mô hình cần hiểu hình dạng đối tượng trong ảnh với độ chính xác cao. Nó giúp biểu diễn các hình dạng phức tạp chính xác hơn, đặc biệt khi sử dụng Ultralytics Nền tảng. Bằng cách kết hợp độ chính xác với các công cụ mạnh mẽ, các nhóm có thể xây dựng các mô hình AI đáng tin cậy và hiệu suất cao hơn.
Bạn đã sẵn sàng đưa trí tuệ nhân tạo thị giác vào các dự án của mình chưa? Hãy tham gia cộng đồng của chúng tôi và khám phá trí tuệ nhân tạo trong ngành công nghiệp ô tô và trí tuệ nhân tạo thị giác trong robot . Khám phá kho lưu trữ GitHub của chúng tôi để tìm hiểu thêm. Xem các tùy chọn cấp phép của chúng tôi để bắt đầu ngay hôm nay!
Bắt đầu hành trình của bạn với tương lai của học máy