Định hướng phát triển của Ultralytics
Từ những model đã mang AI thị giác thời gian thực đến hàng triệu người, cho đến các bản phát hành sắp ra mắt. Đây là những gì chúng tôi đã phát hành và những gì sắp tới.
Bản phát hành mang tính năng phát hiện đối tượng thời gian thực đến hàng triệu người — dựa trên PyTorch, tốc độ cao và cực kỳ dễ huấn luyện.
Một framework duy nhất cho các tác vụ phát hiện, phân đoạn, phân loại, ước tính tư thế và bounding box có hướng.
Một kiến trúc tinh chỉnh mang lại độ chính xác cao hơn với ít tham số hơn, được công bố tại YOLO Vision 2024.
Model khuyến nghị hiện tại của chúng tôi — nhanh hơn, chính xác hơn và sẵn sàng cho môi trường production trên mọi tác vụ thị giác.
Nền tảng end-to-end để gán nhãn dữ liệu, huấn luyện các model YOLO và triển khai trên 43 khu vực toàn cầu — tất cả tại một nơi.
Các model phân đoạn ngữ nghĩa đầu tiên của chúng tôi — nhãn lớp dày đặc cho từng pixel để hiểu toàn cảnh.
Theo dõi đa đối tượng nhanh hơn, chính xác hơn — định danh ổn định hơn qua các trường hợp bị che khuất và cảnh đông đúc cho video thực tế.
- Re-ID — tái nhận dạng giúp giữ nhất quán định danh đối tượng qua nhiều camera và sau khi bị che khuất
Tính năng chưng cất tích hợp để nén các model giáo viên lớn thành các mô hình học sinh nhỏ hơn, nhanh hơn mà vẫn giữ được độ chính xác — lý tưởng cho triển khai tại biên (edge) và thời gian thực.
Phát hiện bất thường chuyên dụng cho kiểm soát chất lượng sản xuất — bắt lỗi và các linh kiện không đạt chuẩn ngay trên dây chuyền sản xuất.
Thâm Quyến, Trung Quốc · YOLO Vision 2026
Thế hệ hàng đầu kế tiếp của YOLO, được công bố trực tiếp tại YOLO Vision 2026, mở rộng dòng sản phẩm sang cảm nhận 3D:
- YOLO-Depth — ước tính độ sâu đơn ảnh từ một camera duy nhất
- YOLO-StereoDepth — ước tính độ sâu bằng sự chênh lệch thị sai từ hai camera cho robot, một giải pháp thay thế dựa trên camera thay cho lidar
Phân tích huấn luyện lặp đi lặp lại do LLM điều khiển, tự động chẩn đoán từng lần chạy và tinh chỉnh cấu hình qua các vòng tiếp theo để đẩy độ chính xác lên cao hơn.
Các khả năng mới sẽ gia nhập gia đình YOLO trong suốt năm 2027:
- YOLO-OCR — nhận diện văn bản nhanh, chính xác
- YOLO-Face — nhận diện và phân tích khuôn mặt
- YOLO-VLM — một front-end YOLO nhẹ cung cấp dữ liệu cho tầng LLM sâu hơn cho các pipeline thị giác-ngôn ngữ hiệu quả
Xây dựng trên nền tảng YOLO mới nhất
Bắt đầu huấn luyện và triển khai với YOLO26 ngay hôm nay — và sẵn sàng cho mọi thứ sắp tới.