Khám phá cách suy luận thời gian thực với Ultralytics YOLO cho phép dự đoán tức thời cho các ứng dụng AI như hệ thống lái xe tự động và an ninh.
Suy luận thời gian thực đề cập đến quá trình mà mô hình máy học (ML) được đào tạo đưa ra dự đoán hoặc quyết định ngay lập tức khi dữ liệu mới đến. Không giống như suy luận theo lô, xử lý dữ liệu theo nhóm được thu thập theo thời gian, suy luận thời gian thực ưu tiên độ trễ thấp và phản hồi tức thời. Khả năng này rất cần thiết cho các ứng dụng yêu cầu phản hồi hoặc hành động ngay lập tức dựa trên luồng dữ liệu trực tiếp, cho phép các hệ thống phản ứng động với các điều kiện thay đổi, phù hợp với các nguyên tắc của điện toán thời gian thực .
Trên thực tế, suy luận thời gian thực có nghĩa là triển khai một mô hình ML, chẳng hạn như mô hình YOLO Ultralytics cho thị giác máy tính (CV) , do đó, nó có thể phân tích các dữ liệu đầu vào riêng lẻ (như khung hình video hoặc số liệu cảm biến) và tạo ra đầu ra với độ trễ tối thiểu. Chỉ số hiệu suất chính là độ trễ suy luận , thời gian từ khi nhận đầu vào đến khi tạo ra dự đoán . Để đạt được độ trễ thấp thường liên quan đến một số chiến lược, bao gồm tối ưu hóa chính mô hình và tận dụng phần cứng và phần mềm chuyên dụng.
Sự khác biệt chính nằm ở cách xử lý dữ liệu và các yêu cầu về độ trễ liên quan:
Suy luận thời gian thực hỗ trợ nhiều ứng dụng Trí tuệ nhân tạo (AI) hiện đại, nơi mà việc ra quyết định tức thời là rất quan trọng:
Việc tạo ra các mô hình chạy đủ nhanh cho các ứng dụng thời gian thực thường đòi hỏi phải tối ưu hóa đáng kể:
Các mô hình như Ultralytics YOLO11 được thiết kế với mục tiêu hướng đến hiệu quả và độ chính xác , khiến chúng phù hợp với các tác vụ phát hiện đối tượng theo thời gian thực. Các nền tảng như Ultralytics HUB cung cấp các công cụ để đào tạo, tối ưu hóa (ví dụ: xuất sang ONNX hoặc TensorRT định dạng) và triển khai các mô hình, tạo điều kiện thuận lợi cho việc triển khai các giải pháp suy luận thời gian thực trên nhiều tùy chọn triển khai khác nhau.