Giới thiệu Ultralytics Platform: Cách thức thông minh nhất để gán nhãn, huấn luyện và triển khai AI thị giác
Gán nhãn, huấn luyện và triển khai các model thị giác máy tính sẵn sàng cho môi trường production trong một không gian làm việc toàn diện được xây dựng cho các đội ngũ phát triển AI thị giác thực tế.

Chúng tôi xây dựng hệ sinh thái mã nguồn mở Ultralytics để làm cho computer vision trở nên dễ tiếp cận với mọi người. Hàng triệu nhà phát triển trên toàn thế giới hiện đang huấn luyện các model Ultralytics YOLO để hỗ trợ mọi thứ, từ các dây chuyền kiểm tra tại nhà máy đến các hệ thống giao hàng tự động.
Nhưng qua nhiều năm, chúng tôi liên tục nhận được cùng một phản hồi từ cộng đồng: huấn luyện một model mạnh mẽ không còn là rào cản lớn nhất trong computer vision nữa. Việc đưa nó vào môi trường sản xuất mới là điều khó khăn.
Hôm nay, chúng tôi đang thay đổi điều đó. Hãy đón nhận Ultralytics Platform: nền tảng end-to-end tối ưu được xây dựng với mục đích đưa vision AI của bạn từ dữ liệu thô đến triển khai thực tế ở cấp độ sản xuất.
Link to this sectionKhoảng cách giữa một model tuyệt vời và một sản phẩm tuyệt vời#
Trong thập kỷ qua, computer vision và deep learning đã phát triển nhanh chóng từ nghiên cứu thành cơ sở hạ tầng quan trọng vận hành các hệ thống trong thế giới thực. Nó hỗ trợ kiểm tra chất lượng trên các sàn sản xuất, cho phép bán lẻ không cần thu ngân, hướng dẫn robot phẫu thuật và giữ cho các phương tiện tự hành đi đúng lộ trình. Các model chưa bao giờ mạnh mẽ hơn thế, nhưng hành trình từ một prototype đang hoạt động đến một hệ thống sản xuất đáng tin cậy? Điều đó vẫn khó khăn hơn mức cần thiết.
Hầu hết các nhóm ngày nay phải kết nối các công cụ riêng lẻ cho việc gán nhãn, huấn luyện, theo dõi thử nghiệm, triển khai và giám sát. Mỗi sự tích hợp lại làm tăng thêm sự phức tạp. Mỗi khâu bàn giao lại làm chậm tiến độ. Và hàng tuần có thể lặng lẽ trôi qua chỉ để quản lý cơ sở hạ tầng thay vì xây dựng ứng dụng.
Khi chúng tôi làm việc chặt chẽ với các nhà phát triển, các startup và các nhóm doanh nghiệp trong cộng đồng computer vision, ba thách thức liên tục xuất hiện:
- Nút thắt cổ chai về gán nhãn: Các model hiệu năng cao đòi hỏi dữ liệu được gán nhãn chất lượng cao, nhưng việc tạo và duy trì các tập dữ liệu đó vẫn chậm chạp và tốn nhiều công sức.
- Khoảng cách triển khai: Một model hoạt động tốt trong quá trình huấn luyện có thể mất hàng tuần kỹ thuật bổ sung để chạy ổn định trên các thiết bị cạnh (edge), môi trường cloud và các hệ thống sản xuất.
- Chi phí phân mảnh công cụ: Việc rải rác các tác vụ gán nhãn, huấn luyện, theo dõi và triển khai qua nhiều dịch vụ tạo ra chi phí quản lý cộng dồn làm chậm mọi chu kỳ lặp lại.
Những thách thức lặp đi lặp lại này là nút thắt cổ chai quyết định của quá trình phát triển computer vision hiện đại và là điều cuối cùng dẫn chúng tôi đến việc xây dựng Ultralytics Platform. Việc đơn giản hóa quy trình làm việc từ chuẩn bị dữ liệu đến triển khai và kết nối các giai đoạn chính của quá trình phát triển computer vision giúp các nhóm dễ dàng chuyển đổi từ các model đầy hứa hẹn sang các hệ thống vision AI thực tế.
Link to this sectionToàn bộ vòng đời vision AI, tại một nơi duy nhất#
Ultralytics Platform tập hợp mọi giai đoạn của quy trình làm việc computer vision từ quản lý dữ liệu đến gán nhãn, huấn luyện model, triển khai và giám sát. Tất cả trong một không gian làm việc kết nối duy nhất để giảm bớt sự phức tạp và tăng tốc lộ trình từ ý tưởng đến tác động.
Tải lên hình ảnh hoặc video của bạn. Gán nhãn chúng với các công cụ gán nhãn tích hợp sẵn. Huấn luyện các model như Ultralytics YOLO26 trực tiếp trên nền tảng. Triển khai toàn cầu. Giám sát hiệu năng theo thời gian thực. Mỗi giai đoạn đều chảy vào giai đoạn tiếp theo, vì vậy bạn có thể tập trung vào việc xây dựng ứng dụng thay vì quản lý cơ sở hạ tầng.

Hình 1. Một cái nhìn thoáng qua về Ultralytics Platform (Nguồn)
Link to this sectionTừ ý tưởng đến triển khai: Ultralytics Platform hoạt động như thế nào#
Biến một ý tưởng computer vision thành một hệ thống hoạt động đòi hỏi nhiều giai đoạn, từ chuẩn bị dữ liệu đến chạy các model trong sản xuất. Ultralytics Platform tổ chức quá trình này thành một pipeline rõ ràng, đơn giản giúp bạn chuyển đổi từ ý tưởng ban đầu sang model được triển khai một cách dễ dàng.
Link to this sectionGán nhãn: Được tăng tốc đáng kể#
Gán nhãn dữ liệu theo truyền thống là một trong những phần tốn thời gian nhất của bất kỳ dự án computer vision nào. Ultralytics Platform làm cho nó nhanh hơn đáng kể và được thiết kế để đáp ứng nhu cầu ở bất cứ đâu dữ liệu của bạn lưu trữ.
Bạn có thể tải lên hình ảnh thô, video hoặc các kho lưu trữ tập dữ liệu, nhập các tập dữ liệu đã được gán nhãn theo định dạng YOLO hoặc COCO, hoặc sao chép các tập dữ liệu công khai được chia sẻ bởi cộng đồng Ultralytics. Cho dù bạn đang bắt đầu từ đầu hay xây dựng dựa trên công việc hiện có, dữ liệu của bạn đã sẵn sàng để sử dụng ngay khi nó được đưa lên nền tảng.
Nếu hình ảnh hoặc video của bạn chưa được gán nhãn, trình biên tập gán nhãn tích hợp sẵn giúp việc thực hiện điều đó nhanh hơn đáng kể. Nó hỗ trợ mọi tác vụ computer vision chính, từ phát hiện đối tượng (object detection) và phân đoạn cá thể (instance segmentation) đến ước tính tư thế (pose estimation), phát hiện hộp bao xoay (OBB) và phân loại hình ảnh (image classification), với các công cụ được thiết kế cho cả tốc độ và độ chính xác.
Khả năng nổi bật ở đây là gán nhãn thông minh dựa trên SAM 3. Sử dụng Segment Anything Model 3 (SAM 3), bạn có thể tạo các mask chính xác, hộp bao hoặc hộp xoay bằng cách nhấp vào một đối tượng và tinh chỉnh với một vài điểm. Những gì trước đây mất hàng giờ vẽ thủ công nay chỉ mất vài phút, mang lại cho các nhóm khả năng xây dựng các tập dữ liệu chất lượng cao với tốc độ phù hợp với tốc độ phát triển của họ.

Hình 3. Một ví dụ về gán nhãn thông minh dựa trên SAM trên Ultralytics Platform (Nguồn)
Các mẫu khung xương tư thế, phím tắt bàn phím, quản lý lớp nội tuyến và hỗ trợ hoàn tác/làm lại hoàn thiện trải nghiệm gán nhãn được xây dựng để giúp bạn duy trì luồng công việc.
Link to this sectionHuấn luyện: Mạnh mẽ một cách dễ dàng#
Sau khi dữ liệu của bạn đã được gán nhãn, quá trình huấn luyện chỉ cách một cú nhấp chuột. Ultralytics YOLO26, YOLO11 và toàn bộ gia đình các model Ultralytics YOLO được hỗ trợ nguyên bản và có thể được huấn luyện trực tiếp trên nền tảng sử dụng các đơn vị xử lý đồ họa (GPU) trên cloud hoặc huấn luyện trên phần cứng cục bộ trong khi truyền tải các chỉ số (metrics) ngược lại nền tảng.
Chọn từ nhiều tùy chọn GPU cloud, bao gồm RTX 4090, RTX PRO 6000, NVIDIA A100, H100 và nhiều loại khác, hoặc huấn luyện trên phần cứng cục bộ của riêng bạn trong khi truyền tải các chỉ số thời gian thực ngược lại nền tảng. Mỗi thử nghiệm được tự động tổ chức thành các dự án nhóm các model liên quan lại với nhau, giúp dễ dàng theo dõi cách các tập dữ liệu, tham số và cấu hình khác nhau ảnh hưởng đến kết quả và xác định các model mạnh nhất.
Giám sát đường cong mất mát (loss curves), độ chính xác (precision), độ gọi (recall) và mean average precision (mAP) khi chúng phát triển qua từng epoch. Đi sâu vào các ma trận nhầm lẫn (confusion matrices) và đường cong precision-recall để hiểu chính xác nơi model của bạn hoạt động tốt và nơi nó có thể cải thiện. So sánh nhiều lần chạy cạnh nhau để tìm cấu hình mang lại kết quả tốt nhất.

Hình 2. Một cái nhìn về việc giám sát tiến trình huấn luyện bằng cách sử dụng Ultralytics Platform (Nguồn)
Ultralytics Platform cũng quản lý các giai đoạn chính của vòng đời huấn luyện một cách tự động. Các điểm kiểm tra (checkpoints) được lưu trong suốt quá trình huấn luyện, bảo toàn cả model hoạt động tốt nhất và các trọng số huấn luyện cuối cùng. Các model pretrained có thể được tinh chỉnh (fine-tuned) trực tiếp trong nền tảng, và các model đã huấn luyện có thể được tải lên hoặc tải xuống để sử dụng trong các môi trường khác, mang lại cho các nhóm sự linh hoạt hoàn toàn về cách thức và nơi họ làm việc.
Không cần thiết lập cơ sở hạ tầng. Không cần thiết lập dịch vụ theo dõi thử nghiệm riêng biệt. Chỉ là một lộ trình rõ ràng, hiệu quả từ dữ liệu đã gán nhãn đến một model đã huấn luyện sẵn sàng cho thế giới thực.
Link to this sectionTriển khai toàn cầu, giám sát mọi thứ#
Một model được huấn luyện tốt cần một lộ trình tiến tới sản xuất cũng mạnh mẽ tương đương. Ultralytics Platform cung cấp điều đó.
Bắt đầu bằng việc xác thực kết quả suy luận của model của bạn trực tiếp trong trình duyệt. Khi bạn tự tin với kết quả, hãy triển khai đến 43 vùng toàn cầu với các endpoint chuyên dụng tự động mở rộng để đáp ứng nhu cầu, mỗi endpoint có một API endpoint duy nhất sẵn sàng để tích hợp vào các ứng dụng của bạn.

Hình 4. Ultralytics Platform hỗ trợ triển khai model trên 43 vùng toàn cầu. (Nguồn)
Cho dù bạn cần triển khai trên cloud hay chạy các model trên các thiết bị cạnh, Ultralytics Platform cung cấp các tùy chọn linh hoạt được thiết kế cho cả hai tình huống. Tất cả các model Ultralytics YOLO được tối ưu hóa nguyên bản để chạy hiệu quả trên các môi trường, mang lại hiệu năng đáng tin cậy ngay cả trên phần cứng cạnh với tài nguyên tính toán hạn chế. Đối với các nhóm cần chạy model bên ngoài nền tảng, Ultralytics hỗ trợ xuất sang 17 định dạng đã xác thực, bao gồm ONNX, TensorRT, CoreML, TFLite và OpenVINO, vì vậy các model của bạn chạy nguyên bản trên các dịch vụ cloud, thiết bị di động, hệ thống cạnh và hơn thế nữa.
Sau khi các model của bạn hoạt động, tính năng giám sát tích hợp trong bảng điều khiển triển khai cung cấp cho bạn cái nhìn đầy đủ về hiệu năng sản xuất: lưu lượng yêu cầu, chỉ số độ trễ (latency), tỷ lệ lỗi, tình trạng endpoint và log chi tiết. Bạn cũng có thể xem lại log, kiểm tra trạng thái sức khỏe của endpoint và theo dõi hiệu năng theo thời gian để giúp đảm bảo các hệ thống computer vision của bạn chạy đáng tin cậy trong sản xuất và xác định các cơ hội để tối ưu hóa hiệu năng.
Bắt đầu ngay hôm nay, hoặc khám phá tài liệu Ultralytics để hiểu sâu hơn về những gì nền tảng có thể làm.
Link to this sectionDân chủ hóa quá trình phát triển vision AI#
Khi tìm hiểu thêm về Ultralytics Platform, bạn sẽ nhanh chóng thấy rằng mục tiêu của nó không chỉ là cung cấp các công cụ để xây dựng các hệ thống computer vision. Về cốt lõi, nền tảng được thiết kế để giúp quá trình phát triển vision AI trở nên dễ tiếp cận và thân thiện hơn với cộng đồng rộng lớn hơn.
Trong lịch sử, việc xây dựng và triển khai các hệ thống AI đòi hỏi cơ sở hạ tầng chuyên biệt, công cụ phức tạp và đầu tư trả trước đáng kể. Ngay cả khi các model mạnh mẽ trở nên dễ huấn luyện hơn, quy trình làm việc xung quanh - quản lý tập dữ liệu, chạy thử nghiệm, triển khai model và duy trì cơ sở hạ tầng - vẫn là điều khó khăn đối với các cá nhân và các nhóm nhỏ hơn.
Ultralytics Platform hạ thấp những rào cản này bằng cách đưa toàn bộ quy trình làm việc vision AI vào một môi trường duy nhất, đồng thời giúp bắt đầu một cách dễ dàng. Người dùng mới có thể bắt đầu thử nghiệm với nền tảng thông qua gói miễn phí, bao gồm các khoản tín dụng đăng ký để huấn luyện trên cloud và quyền truy cập vào các tính năng cốt lõi như quản lý tập dữ liệu, công cụ gán nhãn, huấn luyện model và xuất model.
Khi các dự án phát triển, người dùng hoặc khách hàng doanh nghiệp có thể mở rộng quy mô với các khoản tín dụng bổ sung và các gói nền tảng mở khóa thêm tài nguyên tính toán, lưu trữ, tính năng cộng tác và khả năng triển khai. Cách tiếp cận linh hoạt này có nghĩa là các nhà phát triển, nhà nghiên cứu, startup và doanh nghiệp có thể bắt đầu nhỏ, thử nghiệm tự do và mở rộng việc sử dụng khi các hệ thống computer vision của họ tiến tới sản xuất.
Bằng cách kết hợp một quy trình làm việc computer vision end-to-end với một mô hình định giá dễ tiếp cận, Ultralytics Platform giúp mở ra cánh cửa cho nhiều người hơn để xây dựng, thử nghiệm và triển khai các ứng dụng vision AI thực tế.
Link to this sectionCác điểm chính cần lưu ý#
Ultralytics Platform đưa toàn bộ vòng đời vision AI vào một không gian làm việc mạnh mẽ, giúp chuyển đổi từ dữ liệu thô sang các hệ thống vision AI sẵn sàng sản xuất nhanh hơn. Với các công cụ tích hợp sẵn cho việc gán nhãn, huấn luyện, triển khai và giám sát, các nhóm có thể xây dựng và triển khai các model như Ultralytics YOLO26, Ultralytics YOLO11, Ultralytics YOLO11 và các model YOLO cũ mà không cần quản lý cơ sở hạ tầng phức tạp.
Cho dù bạn đang thử nghiệm với model đầu tiên của mình hay triển khai vision AI trên quy mô lớn, nền tảng được thiết kế để hỗ trợ mọi giai đoạn của hành trình.
Tham gia cộng đồng của chúng tôi và khám phá những đổi mới như AI trong sản xuất và vision AI trong bán lẻ. Truy cập kho lưu trữ GitHub của chúng tôi và bắt đầu với computer vision ngay hôm nay bằng cách xem qua các tùy chọn cấp phép của chúng tôi.











