Đơn giản hóa việc gán nhãn hình ảnh với Ultralytics Platform
Tìm hiểu mọi điều bạn cần biết về gán nhãn hình ảnh với Ultralytics Platform, cùng với các công cụ tích hợp sẵn để gắn nhãn dataset, quản lý các annotation và chuẩn bị dữ liệu cho các model.

Ultralytics gần đây đã giới thiệu Ultralytics Platform, một môi trường được xây dựng để hỗ trợ toàn bộ vòng đời phát triển computer vision. Nền tảng này tập trung hóa các công cụ được sử dụng để quản lý các giai đoạn khác nhau của quy trình làm việc AI thị giác, bao gồm chuẩn bị tập dữ liệu, gán nhãn hình ảnh và video, huấn luyện model và triển khai.
Mặc dù ngày càng được áp dụng rộng rãi trong các ngành như xe tự lái và y tế, việc xây dựng các giải pháp computer vision vẫn có thể bị xem là một quy trình rời rạc. Một trong những lý do chính là các model computer vision phụ thuộc rất nhiều vào chất lượng của dữ liệu dùng để huấn luyện. Ngay cả trước khi bắt đầu huấn luyện, các tập dữ liệu cần được tạo, sắp xếp, đánh giá và gán nhãn để model có thể học cách phát hiện hoặc nhận diện.
Khi làm việc với dữ liệu hình ảnh, quy trình này được gọi là gán nhãn dữ liệu (data annotation) hoặc gán nhãn hình ảnh (image annotation). Trong quá trình gán nhãn hình ảnh, các phần cụ thể của hình ảnh được đánh dấu và gán nhãn để hướng dẫn model trong quá trình huấn luyện.
Ví dụ, nếu mục tiêu là phát hiện chó trong hình ảnh, người gán nhãn có thể vẽ bounding box quanh mỗi con chó để hiển thị vị trí của chúng. Trong các tác vụ chi tiết hơn, họ có thể phác thảo hình dạng của con chó bằng các segmentation mask hoặc đánh dấu các keypoints để xác định tư thế. Những ví dụ đã gán nhãn này ảnh hưởng trực tiếp đến hiệu suất của model sau khi triển khai.
Việc quản lý quy trình gán nhãn hình ảnh ở quy mô lớn có thể là một thách thức. Các tập dữ liệu lớn thường yêu cầu tiêu chuẩn gán nhãn nhất quán, sự phối hợp giữa nhiều người gán nhãn và các công cụ giúp việc đánh giá và tinh chỉnh nhãn trở nên dễ dàng hơn.
Ultralytics Platform giải quyết vấn đề này với một annotation editor tích hợp sẵn. Nó hỗ trợ nhiều loại tác vụ gán nhãn và cung cấp cho các nhóm một cách đơn giản hơn để gán nhãn dữ liệu và chuẩn bị tập dữ liệu computer vision trong một quy trình làm việc duy nhất.

Hình 1. Giao diện trình chỉnh sửa gán nhãn trên Ultralytics Platform (Nguồn)
Trong bài viết này, chúng ta sẽ khám phá cách trình chỉnh sửa gán nhãn của Ultralytics Platform giúp các nhóm gán nhãn tập dữ liệu hiệu quả và hợp lý hóa quá trình chuẩn bị dữ liệu. Hãy bắt đầu nào!
Link to this sectionGán nhãn dữ liệu trong computer vision#
Trước khi khám phá các công cụ gán nhãn hình ảnh có sẵn trên Ultralytics Platform, hãy lùi lại một bước để hiểu gán nhãn dữ liệu là gì và tại sao nó lại quan trọng trong việc xây dựng các hệ thống computer vision.
Các model computer vision học bằng cách phân tích các tập hợp lớn hình ảnh hoặc video được gọi là tập dữ liệu. Tuy nhiên, bản thân hình ảnh thô không cung cấp đủ thông tin để model hiểu nó nên phát hiện hoặc nhận diện cái gì. Để làm cho dữ liệu hữu ích cho việc huấn luyện, hình ảnh phải được dán nhãn thông qua việc gán nhãn dữ liệu để model có thể học cách tìm kiếm các đối tượng, hình dạng hoặc mẫu hình nào.
Trong quá trình gán nhãn hình ảnh, các phần tử cụ thể trong hình ảnh được đánh dấu và gán nhãn mô tả những gì model cần học. Những ví dụ đã gán nhãn này hướng dẫn các model học sâu (deep learning) và thuật toán trong quá trình huấn luyện, giúp chúng nhận diện các mẫu hình tương tự khi xử lý hình ảnh mới.
Các tác vụ computer vision khác nhau đòi hỏi các kiểu gán nhãn hình ảnh khác nhau tùy thuộc vào ứng dụng và trường hợp sử dụng. Ví dụ, người gán nhãn có thể vẽ bounding box quanh các đối tượng cho tác vụ phát hiện đối tượng (object detection), phác thảo các vùng trong hình ảnh cho phân đoạn ngữ nghĩa (semantic segmentation), xác định keypoints cho ước tính tư thế (pose estimation), hoặc gán nhãn cho toàn bộ hình ảnh cho phân loại (classification).
Link to this sectionQuản lý và chuẩn bị dữ liệu#
Chuẩn bị dữ liệu cho các dự án computer vision thường liên quan đến việc làm việc với nhiều định dạng tệp và tổ chức tập dữ liệu. Nó cũng bao gồm việc đảm bảo mọi thứ đã sẵn sàng cho việc gán nhãn và huấn luyện các thuật toán machine learning. Trong nhiều quy trình làm việc, quá trình này bị phân tán qua nhiều công cụ, với dữ liệu được tải lên, làm sạch và di chuyển giữa các hệ thống trước khi có thể sử dụng.
Ultralytics Platform đơn giản hóa điều này bằng cách xử lý chuẩn bị dữ liệu, huấn luyện model và triển khai trong một môi trường duy nhất. Các nhóm có thể tải lên hình ảnh, video hoặc các kho lưu trữ tập dữ liệu và tận dụng cách tiếp cận tùy chỉnh hoàn toàn để chuẩn bị dữ liệu với các chú thích thủ công hoặc tự động bằng AI. Ultralytics Platform hỗ trợ cả dữ liệu thô và các định dạng tiêu chuẩn như YOLO và COCO, giúp dễ dàng bắt đầu các dự án mới. Nó cũng cung cấp quyền truy cập vào các tập dữ liệu hiện có trên nền tảng, bao gồm cả các tập dữ liệu đã gán nhãn mà các nhóm có thể sử dụng để bắt đầu nhanh các dự án hoặc thử nghiệm mới.

Hình 2. Tải lên và quản lý tập dữ liệu trong một môi trường duy nhất trên Ultralytics Platform. (Nguồn)
Sau khi dữ liệu khả dụng, nó có thể được quản lý trực tiếp trên nền tảng. Các nhà phát triển có thể đánh giá hình ảnh, theo dõi tiến độ gán nhãn và sử dụng các hình ảnh trực quan tích hợp để hiểu sự phân bổ của tập dữ liệu và xác định các lỗ hổng tiềm ẩn.
Nền tảng cũng hỗ trợ lập phiên bản tập dữ liệu, giúp các nhóm ghi lại các snapshot dữ liệu khi nó thay đổi. Điều này giúp dễ dàng theo dõi các thay đổi, so sánh các thử nghiệm và duy trì tính nhất quán trong quá trình huấn luyện.
Với dữ liệu đã được chuẩn bị, các nhóm có thể chuyển sang gán nhãn hình ảnh, nơi chúng được gắn nhãn để giúp các model học cách phát hiện.
Link to this sectionGán nhãn tập dữ liệu trên Ultralytics Platform#
Sau khi dữ liệu được tải lên, bước tiếp theo là gán nhãn. Đây là nơi dữ liệu hình ảnh được gắn nhãn, đặt nền móng để sau đó huấn luyện các model computer vision. Ultralytics Platform bao gồm các dịch vụ gán nhãn hình ảnh tích hợp thông qua trình chỉnh sửa gán nhãn cho phép các nhóm gắn nhãn và quản lý tập dữ liệu trực tiếp trong cùng một môi trường.
Trình chỉnh sửa gán nhãn mở ra trong một không gian làm việc đơn giản, nơi người dùng có thể đánh giá hình ảnh, thêm nhãn và cập nhật các chú thích khi cần. Mọi thứ được sắp xếp ở một nơi, giúp việc giữ cho tập dữ liệu nhất quán và sẵn sàng cho huấn luyện dữ liệu trở nên dễ dàng hơn.
Các nhóm có thể tải lên tập dữ liệu và bắt đầu gắn nhãn hình ảnh trực tiếp trong trình duyệt, định nghĩa và quản lý các annotation class để đảm bảo nhãn duy trì tính nhất quán trên toàn bộ tập dữ liệu. Khi các chú thích được tạo, người dùng có thể đánh giá chúng trực quan trong trình chỉnh sửa, giúp dễ dàng kiểm tra độ chính xác trước khi chuyển sang huấn luyện model.
Link to this sectionCông cụ gán nhãn hình ảnh trong Ultralytics Platform#
Ultralytics Platform cũng bao gồm một số tính năng hỗ trợ các quy trình gán nhãn tập dữ liệu hiệu quả, đơn giản hóa quá trình gán nhãn bằng cách sử dụng các thuật toán nâng cao.
Dưới đây là một số tính năng chính có sẵn trong Ultralytics Platform:
- Gán nhãn thủ công: Cách tiếp cận này cho phép người dùng kiểm soát hoàn toàn và linh hoạt khi tạo các chú thích hình ảnh, chẳng hạn như bounding box, vùng phân đoạn hoặc keypoints, trực tiếp trên hình ảnh.
- Gán nhãn hỗ trợ bởi AI: Tính năng này tự động tạo ra các đề xuất chú thích, giảm nhu cầu gán nhãn thủ công. Nó sử dụng SAM (Segment Anything Model) để phát hiện đối tượng hoặc vùng chỉ với một cú nhấp chuột, hợp lý hóa quy trình gán nhãn, giúp người dùng đánh giá và xác nhận các đề xuất trước khi thêm chúng vào tập dữ liệu.
- Chỉnh sửa chú thích: Tại bất kỳ thời điểm nào, người dùng có thể sửa đổi hoặc tinh chỉnh các chú thích hình ảnh sau khi chúng được tạo. Điều này giúp sửa lỗi gán nhãn và duy trì các nhãn tập dữ liệu nhất quán trong suốt quá trình gán nhãn.
- Quản lý lớp (Class management): Các nhóm và nhà phát triển cá nhân có thể định nghĩa và sắp xếp các annotation class được sử dụng trong quá trình gán nhãn tập dữ liệu. Điều này giúp giữ cho các nhãn nhất quán trên các hình ảnh, điều quan trọng để huấn luyện các model có thể nhận diện và phân biệt chính xác giữa các lớp.
Bằng cách kết hợp các công cụ thủ công, trí tuệ nhân tạo và tự động hóa, Ultralytics Platform giúp người dùng gán nhãn hình ảnh hiệu quả hơn. Nó cũng cho phép chuẩn bị dữ liệu huấn luyện chất lượng cao cho các model computer vision có thể mở rộng.
Link to this sectionCác loại tác vụ gán nhãn được hỗ trợ#
Các trường hợp sử dụng khác nhau như đảm bảo chất lượng sản phẩm sẽ đòi hỏi các loại chú thích khác nhau tùy thuộc vào những gì cần được phát hiện trong hình ảnh hoặc video. Như chúng tôi đã đề cập ở trên, Ultralytics Platform hỗ trợ năm tác vụ phát hiện đối tượng, mỗi tác vụ có loại chú thích riêng.
Hãy xem xét kỹ hơn các tác vụ gán nhãn được hỗ trợ trên nền tảng và cách chúng có thể được sử dụng để gắn nhãn tập dữ liệu.
Link to this sectionPhát hiện đối tượng#
Phát hiện đối tượng (Object detection) xác định và bản địa hóa các đối tượng trong hình ảnh. Người gán nhãn đánh dấu mỗi đối tượng quan tâm bằng bounding box, chỉ ra nơi các mục xuất hiện trong hình ảnh.
Trong trình chỉnh sửa gán nhãn, việc này được thực hiện bằng công cụ bounding box. Người dùng có thể vào “edit mode”, nhấp và kéo để vẽ một hình chữ nhật quanh đối tượng, và gán một class label từ menu thả xuống.
Bounding box có thể được điều chỉnh sau khi chúng được tạo. Người gán nhãn có thể thay đổi kích thước chúng bằng cách kéo các góc hoặc cạnh, di chuyển chúng bằng cách kéo tâm của hộp hoặc xóa chúng bằng các phím tắt. Những chú thích này giúp các vision model học cách phát hiện đối tượng qua các cảnh và điều kiện khác nhau.

Hình 3. Chú thích phát hiện đối tượng sử dụng bounding box trong Ultralytics Platform. (Nguồn)
Link to this sectionPhân đoạn thực thể#
Phân đoạn thực thể (Instance segmentation) cung cấp các chú thích chi tiết hơn bằng cách xác định hình dạng chính xác của các đối tượng trong hình ảnh. Thay vì vẽ một hộp đơn giản, người gán nhãn vẽ các đường biên của đối tượng bằng chú thích polygon để tạo các mask chính xác cho các tác vụ phân đoạn hình ảnh.
Trình chỉnh sửa gán nhãn bao gồm một công cụ polygon cho tác vụ này. Người gán nhãn đặt nhiều đỉnh (vertices) quanh các cạnh của một đối tượng để phác thảo hình dạng của nó. Sau khi các đỉnh được đặt, polygon có thể được đóng lại để tạo mask phân đoạn.
Các đỉnh có thể được điều chỉnh sau khi polygon được tạo. Các điểm riêng lẻ có thể được di chuyển để tinh chỉnh đường biên đối tượng và các đỉnh có thể được xóa nếu cần. Những chú thích cấp pixel này giúp các model học các cấu trúc thị giác chi tiết và phân biệt giữa các đối tượng xuất hiện gần nhau.
Link to this sectionƯớc tính tư thế#
Các chú thích ước tính tư thế (Pose estimation) ghi lại vị trí của các khớp cơ thể và mối quan hệ giữa chúng. Điều này giúp các model hiểu cấu trúc và chuyển động của con người hoặc động vật trong hình ảnh.
Sử dụng công cụ keypoint, người gán nhãn đặt các keypoints đại diện cho các khớp cơ thể như vai, khuỷu tay, cổ tay, hông, đầu gối và mắt cá chân. Nền tảng hỗ trợ một số mẫu skeleton tích hợp, bao gồm định dạng khung xương người COCO 17 điểm cũng như các mẫu cho bàn tay, khuôn mặt, chó và các góc hộp.
Các mẫu giúp bạn có thể đặt toàn bộ bố cục skeleton chỉ với một cú nhấp chuột, sau đó các keypoints riêng lẻ có thể được điều chỉnh để khớp với tư thế trong hình ảnh. Mỗi keypoint cũng có thể bao gồm cờ hiển thị để cho biết liệu nó có hiển thị hay bị che khuất hay không.

Hình 4. Chú thích ước tính tư thế sử dụng keypoints và các mẫu skeleton. (Nguồn)
Link to this sectionOriented bounding box (OBB)#
Oriented bounding box đưa các bounding box truyền thống tiến thêm một bước bằng cách hỗ trợ xoay. Loại chú thích này hữu ích khi các đối tượng xuất hiện theo các góc thay vì được căn chỉnh với khung hình ảnh.
Trong trình chỉnh sửa gán nhãn, người gán nhãn có thể sử dụng công cụ oriented bounding box để vẽ các hình chữ nhật xoay quanh các đối tượng. Sau khi vẽ hộp ban đầu, một tay cầm xoay có thể được sử dụng để điều chỉnh góc, trong khi các tay cầm ở góc cho phép thay đổi kích thước hộp.
Các chú thích xoay thường được sử dụng trong hình ảnh hàng không, tập dữ liệu kiểm tra công nghiệp và các kịch bản khác nơi các đối tượng xuất hiện theo đường chéo hoặc từ các góc nhìn khác nhau.

Hình 5. Chú thích oriented bounding box (OBB) cho các đối tượng xoay trong hình ảnh hàng không. (Nguồn)
Link to this sectionPhân loại hình ảnh#
Phân loại hình ảnh (Image classification) gán một nhãn cho toàn bộ hình ảnh thay vì đánh dấu từng đối tượng riêng lẻ bên trong nó.
Đối với các tập dữ liệu phân loại, trình chỉnh sửa gán nhãn cung cấp bảng chọn lớp. Người gán nhãn có thể gán nhãn cho hình ảnh bằng cách chọn một lớp từ thanh bên hoặc bằng cách sử dụng các phím tắt để gán nhãn nhanh hơn.
Những nhãn cấp hình ảnh này giúp các model học các mẫu hình thị giác cấp cao đại diện cho các danh mục khác nhau.
Link to this sectionGán nhãn hỗ trợ bởi AI với SAM#
Gán nhãn hình ảnh cho các tác vụ như phân đoạn thường đòi hỏi công việc cẩn thận, chi tiết, đặc biệt là khi các đối tượng cần được phác thảo chính xác. Ultralytics Platform bao gồm các công cụ gán nhãn hỗ trợ bởi AI giúp tăng tốc quy trình trong khi vẫn giữ các chú thích chính xác và dễ dàng đánh giá.
Ví dụ, người gán nhãn có thể tương tác với một hình ảnh bằng cách nhấp vào các phần của một đối tượng mà họ muốn đưa vào chú thích. Họ cũng có thể đánh dấu các khu vực nên bị loại trừ để tinh chỉnh kết quả. Dựa trên những đầu vào này, model tạo ra một mask phân đoạn trong thời gian thực, sau đó có thể được đánh giá và điều chỉnh trước khi được lưu.
Cách tiếp cận này giúp làm việc với các hình ảnh phức tạp dễ dàng hơn mà không cần phải thủ công theo dõi từng chi tiết. Đồng thời, người gán nhãn vẫn kiểm soát kết quả cuối cùng, đảm bảo rằng các chú thích duy trì tính nhất quán trên toàn bộ tập dữ liệu.

Hình 6. Phân đoạn hỗ trợ bởi AI sử dụng công cụ gán nhãn thông minh trong Ultralytics Platform. (Nguồn)
Các tính năng này được cung cấp bởi Segment Anything Models (SAM). Các model này là một phần của hệ sinh thái rộng lớn hơn các công cụ computer vision nguồn mở được thiết kế để tạo ra các phân đoạn chất lượng cao từ đầu vào tối thiểu. Nền tảng hỗ trợ nhiều biến thể SAM, bao gồm SAM 2.1 và SAM 3. Điều này mang lại cho các nhóm sự linh hoạt để lựa chọn giữa hiệu suất nhanh hơn và kết quả chi tiết hơn dựa trên nhu cầu của họ.
Các công cụ hỗ trợ bởi AI này có thể được áp dụng trên các tác vụ như phát hiện đối tượng, phân đoạn thực thể và phát hiện oriented bounding box. Điều này có nghĩa là các nhóm có thể xử lý các tập dữ liệu lớn hiệu quả hơn trong khi vẫn duy trì chất lượng cần thiết cho việc huấn luyện model đáng tin cậy.
Link to this sectionCải thiện quy trình làm việc gán nhãn với các công cụ tích hợp#
Khi công việc gán nhãn tiến triển, thường cần quay lại và điều chỉnh nhãn, sửa lỗi hoặc đánh giá hình ảnh kỹ hơn. Trình chỉnh sửa gán nhãn Ultralytics bao gồm các công cụ tích hợp giúp các tác vụ hàng ngày này dễ xử lý hơn và ít tốn thời gian hơn.
Một số tính năng quy trình làm việc có sẵn trong trình chỉnh sửa bao gồm:
- Phím tắt: Trình chỉnh sửa bao gồm các phím tắt giúp tăng tốc các hành động thông thường, chẳng hạn như lưu chú thích, hoàn tác hoặc làm lại các thay đổi, xóa nhãn và chọn lớp trong khi gán nhãn.
- Lịch sử hoàn tác và làm lại: Người gán nhãn có thể dễ dàng đảo ngược hoặc khôi phục các thay đổi được thực hiện trong phiên chỉnh sửa. Điều này giúp các nhóm thử nghiệm với các chú thích và nhanh chóng sửa lỗi mà không làm mất tiến độ, hỗ trợ kiểm soát chất lượng tốt hơn trong quá trình chuẩn bị tập dữ liệu.
- Chỉnh sửa chú thích linh hoạt: Các chú thích có thể được điều chỉnh ngay cả sau khi được tạo. Người dùng có thể thay đổi kích thước hình dạng, di chuyển chú thích, xoay oriented bounding box hoặc cập nhật nhãn lớp khi cần, đặc biệt là khi tinh chỉnh các đối tượng có hình dạng bất thường.
- Kiểm soát hiển thị: Trình chỉnh sửa bao gồm các nút bật/tắt hiển thị cho phép người dùng hiển thị hoặc ẩn các chú thích và nhãn lớp, giúp việc kiểm tra hình ảnh trong khi gán nhãn dễ dàng hơn.
- Công cụ chính xác: Các tính năng như thu phóng (zoom) và con trỏ hình chữ thập (crosshair) với tọa độ pixel giúp người gán nhãn đặt nhãn chính xác hơn khi làm việc với các hình ảnh chi tiết.
Link to this sectionQuản lý annotation class trên Ultralytics Platform#
Các annotation class rõ ràng và nhất quán đóng vai trò quan trọng trong việc xây dựng các tập dữ liệu computer vision đáng tin cậy. Khi các dự án phát triển, việc quản lý gán nhãn dữ liệu trên các tập dữ liệu lớn có thể trở nên khó khăn, đặc biệt là khi có sự tham gia của nhiều người gán nhãn. Việc giữ cho các lớp được sắp xếp tốt giúp đảm bảo các chú thích duy trì tính nhất quán và các model học từ dữ liệu có cấu trúc.
Ultralytics Platform đơn giản hóa quy trình này bằng cách đưa việc quản lý lớp trực tiếp vào trình chỉnh sửa gán nhãn. Thay vì xử lý các nhãn riêng biệt, các nhóm có thể tạo, cập nhật và đánh giá các lớp trong khi làm việc trên hình ảnh, giúp duy trì tính nhất quán dễ dàng hơn trong suốt quy trình làm việc gán nhãn.
Trong trình chỉnh sửa, tất cả các lớp đều có sẵn trong thanh bên cạnh canvas chú thích. Điều này giúp dễ dàng chọn nhãn chính xác trong khi gán nhãn và theo dõi cách các lớp được sử dụng trên toàn bộ tập dữ liệu. Người dùng có thể tìm kiếm các lớp hiện có hoặc tạo các lớp mới khi cần mà không làm gián đoạn quy trình làm việc của họ.
Chi tiết lớp cũng có thể được cập nhật bất cứ lúc nào. Tên có thể được chỉnh sửa trực tiếp và màu sắc có thể được gán để giúp các lớp khác nhau dễ nhận diện hơn trên các chú thích. Trình chỉnh sửa cũng hiển thị bao nhiêu chú thích được liên kết với mỗi lớp và cho phép người dùng đánh giá chúng, giúp các nhóm kiểm tra tính nhất quán và độ chính xác.
Tất cả các lớp được quản lý thông qua một bảng tập trung, nơi chúng có thể được sắp xếp, tìm kiếm và cập nhật. Bất kỳ thay đổi nào được thực hiện ở đây đều được tự động áp dụng trên toàn bộ tập dữ liệu, giúp các nhóm duy trì tính nhất quán khi các dự án gán nhãn mở rộng quy mô.

Hình 7. Quản lý lớp trong trình chỉnh sửa gán nhãn hiển thị việc tổ chức nhãn và tùy chỉnh màu sắc. (Nguồn)
Link to this sectionChất lượng gán nhãn ảnh hưởng như thế nào đến hiệu suất trong thế giới thực#
Khi các hệ thống computer vision chuyển từ phát triển sang sử dụng trong thế giới thực, chất lượng dữ liệu được gán nhãn đóng vai trò then chốt trong hiệu suất của các model. Các tập dữ liệu được dán nhãn tốt giúp các model đưa ra các dự đoán chính xác và nhất quán hơn, đặc biệt là trong các môi trường động hoặc không thể đoán trước.
Trên thực tế, ngay cả những sự không nhất quán nhỏ trong việc gán nhãn cũng có thể ảnh hưởng đến hành vi của model. Sự khác biệt trong cách các đối tượng được dán nhãn hoặc cách xử lý các trường hợp biên có thể không rõ ràng trong quá trình huấn luyện nhưng có thể dẫn đến các dự đoán kém tin cậy hơn sau khi các hệ thống được triển khai.
Hơn nữa, những sự không nhất quán này có thể trở nên rõ rệt hơn trong các ứng dụng thực tế. Ví dụ, trong các hệ thống robot và y tế, các model dựa vào đầu vào thị giác để phát hiện đối tượng và hướng dẫn hành động trong thời gian thực. Sự biến đổi trong việc dán nhãn có thể ảnh hưởng đến độ chính xác mà các hệ thống này diễn giải môi trường xung quanh.
Bằng cách duy trì các thực hành gán nhãn nhất quán và sử dụng các nền tảng như Ultralytics để quản lý và tinh chỉnh các tập dữ liệu theo thời gian, các nhóm có thể xây dựng các model hoạt động đáng tin cậy hơn bên ngoài các môi trường thử nghiệm được kiểm soát.
Link to this sectionCác điểm chính cần lưu ý#
Gán nhãn dữ liệu chất lượng cao là điều cần thiết để huấn luyện các model computer vision chính xác và hỗ trợ các dự án gán nhãn hình ảnh thành công. Ultralytics Platform đơn giản hóa quy trình này với trình chỉnh sửa gán nhãn mạnh mẽ hỗ trợ nhiều tác vụ thị giác. Bằng cách kết hợp các công cụ gán nhãn thủ công với việc gán nhãn hỗ trợ bởi AI sử dụng SAM và các tính năng quy trình làm việc tích hợp, các nhóm có thể chuẩn bị tập dữ liệu hiệu quả hơn và di chuyển nhanh hơn từ việc chuẩn bị dữ liệu sang phát triển model.
Hãy tham gia cộng đồng của chúng tôi và khám phá GitHub repository để tìm hiểu thêm về các model computer vision. Đọc về các ứng dụng như AI trong ô tô và computer vision trong robot trên các trang giải pháp của chúng tôi. Xem các tùy chọn cấp phép của chúng tôi và bắt đầu xây dựng model AI thị giác của riêng bạn.






