Ultralytics Platform: Năm công cụ, một nền tảng thị giác máy tính
Khám phá cách Ultralytics Platform thay thế năm công cụ bằng một nền tảng thị giác máy tính duy nhất cho việc gán nhãn, huấn luyện, kiểm thử và triển khai model.

Hôm nay, chúng tôi ra mắt Ultralytics Platform, nền tảng thị giác máy tính toàn diện (end-to-end) tối ưu được thiết kế để đơn giản hóa cách xây dựng và triển khai các hệ thống AI thị giác. Mặc dù thị giác máy tính, một lĩnh vực của trí tuệ nhân tạo cho phép máy móc diễn giải hình ảnh và video, vốn đã cung cấp năng lượng cho nhiều hệ thống chúng ta dựa vào ngày nay, nhưng việc xây dựng các giải pháp này theo cách truyền thống vẫn rất phức tạp.
Đối với nhiều kỹ sư AI và nhà phát triển học máy, việc xây dựng một ứng dụng thị giác máy tính vẫn bao gồm việc chuyển đổi giữa nhiều công cụ trong suốt quy trình phát triển. Một nhóm có thể quản lý tập dữ liệu và chú thích trên một nền tảng, chạy huấn luyện model trên một nền tảng khác, và dựa vào các dịch vụ bổ sung để kiểm thử dự đoán, theo dõi thử nghiệm và triển khai hệ thống vào môi trường production.
Khi các dự án phát triển, việc chuyển đổi công cụ có thể làm chậm quá trình phát triển và tăng thêm gánh nặng vận hành. Thay vì tập trung vào việc cải thiện model và xây dựng các ứng dụng thị giác máy tính mới, các nhóm thường dành thời gian quản lý luồng công việc, di chuyển dữ liệu giữa các công cụ và cấu hình cơ sở hạ tầng.
Ultralytics Platform được tạo ra để tinh giản và tăng tốc quy trình này. Bằng cách mang việc chú thích, huấn luyện, xác thực, triển khai và giám sát vào cùng một môi trường, nó thay thế nhiều công cụ trong ngăn xếp (stack) AI thị giác bằng một nền tảng thị giác máy tính duy nhất, giúp các nhóm xây dựng và triển khai các hệ thống AI thị giác có khả năng mở rộng hiệu quả hơn.

Hình 1. Cái nhìn về việc chuẩn bị tập dữ liệu bằng Ultralytics Platform (Nguồn)
Trong bài viết này, chúng ta sẽ khám phá cách Ultralytics Platform thay thế nhiều công cụ bằng một nền tảng thị giác máy tính hợp nhất. Hãy cùng bắt đầu!
Link to this sectionVấn đề đa công cụ trong phát triển thị giác máy tính#
Việc xây dựng một giải pháp thị giác máy tính bao gồm nhiều giai đoạn, từ chuẩn bị tập dữ liệu đến triển khai các hệ thống vào môi trường production. Trong nhiều trường hợp, các nhóm dựa vào các công cụ khác nhau cho mỗi phần của luồng công việc này, bao gồm:
- Công cụ quản lý tập dữ liệu: Các nhóm sử dụng những công cụ này để lưu trữ và sắp xếp hình ảnh và video sẽ được sử dụng làm dữ liệu huấn luyện cho các hệ thống thị giác máy tính sau này.
- Công cụ chú thích: Các nền tảng này cho phép các nhà phát triển và nhóm dữ liệu gắn nhãn đối tượng, phân đoạn hoặc điểm khóa (keypoint) trong hình ảnh để hệ thống có thể học các mẫu từ dữ liệu trực quan.
- Công cụ và framework huấn luyện model: Các nhà phát triển dựa vào những công cụ này để huấn luyện các hệ thống thị giác máy tính bằng cách sử dụng các tập dữ liệu đã gắn nhãn và các model học sâu, thường làm việc trong các framework học máy dựa trên Python như PyTorch và TensorFlow.
- Công cụ kiểm thử và suy luận (inference): Trước khi triển khai, các nhóm chạy model trên hình ảnh hoặc video mới để kiểm tra dự đoán và đánh giá hiệu suất của hệ thống.
- Công cụ triển khai và giám sát: Khi giải pháp AI thị giác đã sẵn sàng để xuất xưởng, cơ sở hạ tầng bổ sung được sử dụng để chạy ứng dụng trong môi trường production và giám sát hiệu suất theo thời gian.
Việc quản lý các công cụ này một cách riêng biệt có thể khiến luồng công việc phát triển khó điều phối hơn. Các nhóm cuối cùng phải dành thời gian di chuyển dữ liệu giữa các nền tảng, duy trì các tích hợp và cấu hình cơ sở hạ tầng thay vì tập trung vào việc cải thiện các ứng dụng thị giác máy tính.
Link to this sectionNền tảng AI thị giác end-to-end là gì?#
Trước khi đi sâu vào các tính năng chính của Ultralytics Platform và những gì nó có thể làm, hãy cùng hiểu ý nghĩa của một nền tảng thị giác máy tính end-to-end.
Nói một cách đơn giản, Ultralytics Platform cung cấp một nơi duy nhất để các nhà phát triển có thể xây dựng và chạy các ứng dụng thị giác máy tính. Thay vì dựa vào các dịch vụ riêng biệt cho các phần khác nhau của quy trình phát triển, các cá nhân và nhóm có thể làm việc với dữ liệu trực quan, huấn luyện model và thuật toán, kiểm thử kết quả và chạy các ứng dụng trong cùng một môi trường.

Hình 2. Kiểm thử model trên Ultralytics Platform (Nguồn)
Cách tiếp cận này giúp các nhà phát triển thử nghiệm, cải thiện hệ thống của họ và thúc đẩy các dự án tiến lên dễ dàng hơn mà không cần liên tục chuyển đổi giữa các công cụ.
Link to this sectionCách Ultralytics Platform đơn giản hóa luồng công việc AI thị giác#
Ultralytics Platform được định hình bởi nhiều năm làm việc chặt chẽ với cộng đồng thị giác máy tính. Các cuộc thảo luận của chúng tôi với các nhà phát triển và các nhóm xây dựng hệ thống AI thị giác luôn đề cập đến một vài thách thức chung.
Ví dụ, một mối quan tâm chính là việc chú thích dữ liệu, vốn có thể mất nhiều thời gian khi các tập dữ liệu lớn cần được gắn nhãn. Một thách thức khác xuất hiện khi các nhóm cố gắng đưa hệ thống vào môi trường production, nơi việc triển khai ứng dụng trên các môi trường và cấu hình phần cứng khác nhau thường yêu cầu công cụ bổ sung.
Nhiều nhóm cũng phải đối mặt với việc chuyển đổi công cụ, vì các công cụ chú thích, môi trường huấn luyện và hệ thống triển khai thường nằm rải rác trên nhiều nền tảng. Ultralytics Platform giải quyết tất cả những phức tạp này với hàng loạt tính năng tích hợp sẵn.
Link to this sectionTổng quan về các tính năng chính của Ultralytics Platform#
Hãy cùng đi sâu vào một số chức năng chính của Ultralytics Platform giúp tinh giản những thách thức này và toàn bộ luồng công việc AI thị giác:
- Chú thích dữ liệu thông minh: Các công cụ chú thích tích hợp sẵn giúp các nhóm gắn nhãn tập dữ liệu nhanh hơn với các tính năng như chú thích thông minh được hỗ trợ bởi Segment Anything Model (SAM) và các phím tắt giúp tối ưu hóa luồng công việc chú thích.
- Huấn luyện model tích hợp: Các nhà phát triển có thể huấn luyện các model tiền huấn luyện trực tiếp trong nền tảng trong khi theo dõi các thử nghiệm và giám sát hiệu suất thông qua bảng điều khiển tương tác.
- Kiểm thử suy luận dựa trên trình duyệt: Các nhóm có thể nhanh chóng kiểm thử dự đoán trên trình duyệt để đánh giá hiệu suất hệ thống trước khi triển khai vào môi trường production.
- Các tùy chọn triển khai linh hoạt: Model có thể được xuất ra 17 định dạng khác nhau hoặc triển khai thông qua các dịch vụ suy luận chia sẻ và các endpoint chuyên biệt trên 43 khu vực toàn cầu.
- Giám sát tích hợp: Nền tảng cung cấp các bảng điều khiển giúp các nhóm theo dõi kết quả thử nghiệm, hiệu suất hệ thống và trạng thái triển khai tại một nơi duy nhất.
Link to this sectionTừ dữ liệu thô đến triển khai với Ultralytics Platform#
Khi bạn tìm hiểu thêm về Ultralytics Platform, bạn có thể tự hỏi việc làm việc với nó thực sự như thế nào. Để có cái nhìn rõ hơn, hãy cùng đi qua một ví dụ đơn giản.
Hãy cân nhắc việc xây dựng một hệ thống kiểm tra trực quan cho dây chuyền sản xuất. Mục tiêu là tự động nhận diện các sản phẩm bị hỏng hoặc lỗi khi chúng di chuyển qua quy trình sản xuất.
Quy trình thường bắt đầu bằng việc thu thập dữ liệu trực quan. Sử dụng nền tảng thị giác máy tính mới của Ultralytics, bạn có thể tải lên hình ảnh hoặc video về sản phẩm từ dây chuyền sản xuất và sắp xếp chúng vào các tập dữ liệu sẽ được sử dụng để huấn luyện model phát hiện lỗi.
Tiếp theo là chú thích dữ liệu. Với các công cụ chú thích thủ công hoặc hỗ trợ bởi AI tích hợp sẵn của nền tảng, bạn có thể gắn nhãn lỗi trực tiếp trong hình ảnh qua 5 tác vụ phát hiện. Sự đổi mới đằng sau các tính năng như chú thích thông minh, được hỗ trợ bởi SAM, và các mẫu khung xương tư thế (pose skeleton) tích hợp cho phép đặt các điểm khóa bằng một cú nhấp chuột, giúp tinh giản luồng công việc mà nếu không sẽ mất hàng giờ.
Khi tập dữ liệu đã sẵn sàng, bạn có thể chuyển sang huấn luyện model. Nền tảng cho phép bạn huấn luyện các model thị giác máy tính, chẳng hạn như Ultralytics YOLO models, sử dụng dữ liệu đã gắn nhãn. Trong quá trình huấn luyện, bạn có thể giám sát các chỉ số hiệu suất, theo dõi thử nghiệm và tối ưu hóa model theo thời gian để cải thiện hiệu suất hệ thống từ một bảng điều khiển duy nhất.
Sau khi huấn luyện, bước tiếp theo là kiểm thử và xác thực. Bạn có thể chạy dự đoán trên hình ảnh mới trực tiếp trong nền tảng để kiểm tra mức độ hiệu quả của hệ thống trong việc phát hiện lỗi và xác định các khu vực cần cải thiện thêm.
Cuối cùng, khi hệ thống hoạt động tốt, nó có thể được triển khai vào môi trường production. Ultralytics Platform hỗ trợ xuất model sang nhiều định dạng hoặc triển khai chúng thông qua các dịch vụ suy luận và endpoint để chúng có thể chạy trong các môi trường thực tế.

Hình 3. Ví dụ về việc xuất model bằng Ultralytics Platform (Nguồn)
Bằng cách hỗ trợ từng bước của đường ống này, Ultralytics Platform giúp việc di chuyển từ dữ liệu trực quan thô đến một ứng dụng thị giác máy tính hoạt động được có thể phát hiện lỗi tự động trên dây chuyền sản xuất trở nên dễ dàng hơn.
Link to this sectionCác trường hợp sử dụng được hỗ trợ bởi AI thị giác mà bạn có thể xây dựng với Ultralytics Platform#
Trong hầu hết các ứng dụng mà dữ liệu trực quan có thể được chuyển đổi thành thông tin và sử dụng để tự động hóa quy trình, thị giác máy tính có thể tạo ra sự khác biệt. Điều này đúng trong các ngành công nghiệp, từ chăm sóc sức khỏe đến ngành công nghiệp ô tô, và Ultralytics Platform được xây dựng để hỗ trợ tính linh hoạt này.
Nền tảng hỗ trợ tự nhiên các model tiên tiến như Ultralytics YOLO26 và một loạt các tác vụ thị giác máy tính, bao gồm phát hiện đối tượng, phân loại hình ảnh, phân đoạn đối tượng (instance segmentation), ước tính tư thế (pose estimation) và phát hiện hộp bao xoay (oriented bounding box - OBB). Nhờ sự linh hoạt này, các nhà phát triển có thể xây dựng ứng dụng cho nhiều tình huống khác nhau cần phân tích hình ảnh hoặc video.
Ví dụ, các nhóm có thể tạo ra các hệ thống giám sát dưới nước thời gian thực trong môi trường biển, đếm tế bào trong nghiên cứu y tế và sinh học, theo dõi động vật hoang dã trong các hệ sinh thái từ xa, kích hoạt các hệ thống nhận thức cho xe tự lái và điều hướng robot qua các môi trường phức tạp. Và đó chỉ mới là phần nổi của tảng băng chìm đối với những gì có thể thực hiện được với thị giác máy tính.

Hình 4. Chú thích hình ảnh để phát hiện động vật hoang dã trên Ultralytics Platform (Nguồn)
Link to this sectionTại sao Ultralytics Platform là tương lai của AI thị giác#
Khi thị giác máy tính ngày càng được sử dụng rộng rãi, việc làm cho sự phát triển AI thị giác trở nên dễ tiếp cận hơn đang ngày càng trở nên quan trọng. Nhiều nhà phát triển và tổ chức muốn thử nghiệm với dữ liệu trực quan và xây dựng các ứng dụng AI, nhưng các thiết lập phát triển truyền thống có thể gây khó khăn khi bắt đầu.
Ultralytics Platform giúp giảm bớt những rào cản này bằng cách cung cấp một môi trường nơi các nhà phát triển có thể nhanh chóng bắt đầu làm việc với công nghệ thị giác máy tính. Thay vì dành thời gian thiết lập cơ sở hạ tầng hoặc tích hợp các công cụ khác nhau, các nhóm có thể tập trung vào việc thử nghiệm các ý tưởng và xây dựng các ứng dụng thực tế.
Khả năng tiếp cận này mở ra cơ hội cho một loạt các nhà phát triển, nhà nghiên cứu và tổ chức khám phá AI thị giác. Kết quả là, nhiều nhóm hơn có thể chuyển đổi dữ liệu trực quan thành những thông tin chi tiết có ý nghĩa và tạo ra các ứng dụng giải quyết các vấn đề thực tế.
Khi AI thị giác tiếp tục mở rộng trong các ngành công nghiệp, chúng tôi tin rằng Ultralytics Platform sẽ làm cho quá trình phát triển trở nên dễ tiếp cận hơn và đóng vai trò quan trọng trong việc định hình tương lai của thị giác máy tính.
Link to this sectionBắt đầu với Ultralytics Platform#
Bắt đầu xây dựng các dự án thị giác máy tính với Ultralytics Platform ngay hôm nay. Bạn có thể khám phá nền tảng thông qua gói miễn phí, bao gồm các khoản tín dụng đăng ký cho việc huấn luyện trên cloud và quyền truy cập vào các công cụ cốt lõi để quản lý tập dữ liệu, chú thích hình ảnh, huấn luyện model và triển khai ứng dụng.
Khi các dự án của bạn phát triển, bạn có thể mở rộng việc sử dụng của mình với các gói bổ sung cung cấp thêm tài nguyên tính toán, lưu trữ, tính năng cộng tác và năng lực triển khai. Nền tảng cũng sử dụng hệ thống định giá dựa trên tín dụng cho các dịch vụ như huấn luyện trên cloud và các endpoint được quản lý, cho phép các nhóm chạy thử nghiệm và triển khai ứng dụng trong khi vẫn theo dõi mức sử dụng một cách minh bạch.
Link to this sectionCác điểm chính cần lưu ý#
Công nghệ xử lý hình ảnh và thị giác máy tính đang nhanh chóng chuyển từ các thí nghiệm nghiên cứu sang các hệ thống thực tế thúc đẩy công nghệ hàng ngày. Ultralytics Platform giúp đẩy nhanh sự chuyển đổi này bằng cách cung cấp cho các nhà phát triển một cách đơn giản hơn để xây dựng, kiểm thử và triển khai các ứng dụng AI thị giác. Với ít rào cản hơn giữa ý tưởng và triển khai, thế hệ giải pháp thị giác máy tính tiếp theo có thể được xây dựng nhanh hơn bao giờ hết.
Tham gia cộng đồng của chúng tôi và khám phá GitHub repository để tìm hiểu thêm về các model thị giác máy tính. Đọc về các ứng dụng như AI trong nông nghiệp và thị giác máy tính trong robot trên các trang giải pháp của chúng tôi. Kiểm tra các tùy chọn cấp phép của chúng tôi và bắt đầu xây dựng model AI thị giác của riêng bạn.






