Mở khóa sức mạnh của Phân tích chuỗi thời gian để dự báo xu hướng, detect các hiện tượng bất thường và tối ưu hóa các ứng dụng AI/ML trên nhiều ngành.
Phân tích chuỗi thời gian là một kỹ thuật thống kê được sử dụng để phân tích chuỗi các điểm dữ liệu được thu thập, ghi lại hoặc quan sát tại các khoảng thời gian liên tiếp cách đều nhau. Không giống như các tập dữ liệu tĩnh, nơi thứ tự quan sát có thể không quan trọng, dữ liệu chuỗi thời gian phụ thuộc rất nhiều vào thứ tự thời gian để xác định các cấu trúc cơ bản như xu hướng, tính thời vụ và các mô hình tuần hoàn. Phương pháp này là nền tảng của mô hình dự đoán , cho phép các nhà khoa học dữ liệu và kỹ sư dự báo các sự kiện trong tương lai dựa trên các hành vi lịch sử. Nó được sử dụng rộng rãi trong nhiều lĩnh vực, từ theo dõi biến động thị trường chứng khoán đến giám sát các chỉ số bảo mật trung tâm dữ liệu .
Để diễn giải dữ liệu theo thời gian một cách hiệu quả, các nhà phân tích phải phân tích chuỗi dữ liệu thành các thành phần cấu thành. Hiểu rõ các thành phần này là điều cần thiết để lựa chọn kiến trúc học máy (ML) phù hợp.
Trong khi các phương pháp thống kê truyền thống như ARIMA (Trung bình động tích hợp tự hồi quy) vẫn phổ biến, các phương pháp AI hiện đại tận dụng Mạng nơ-ron hồi quy (RNN) và Mạng bộ nhớ dài hạn ngắn hạn (LSTM) . Các kiến trúc này được thiết kế đặc biệt để ghi nhớ các mối quan hệ phụ thuộc dài hạn trong dữ liệu tuần tự.
Phân tích chuỗi thời gian rất quan trọng đối với các ngành công nghiệp đòi hỏi dự báo chính xác để tối ưu hóa hoạt động và giảm thiểu rủi ro.
Mặc dù phân tích chuỗi thời gian khác với Thị giác Máy tính (CV) — tập trung vào dữ liệu không gian như hình ảnh — nhưng hai lĩnh vực này thường giao thoa với nhau. Mô hình CV có thể xử lý các luồng video để tạo dữ liệu chuỗi thời gian. Ví dụ, một hệ thống đếm đối tượng chạy trên camera giao thông sẽ tạo ra số lượng xe tuần tự mỗi phút.
Ví dụ sau đây minh họa cách sử dụng Ultralytics YOLO11 để track các đối tượng trong video, chuyển đổi dữ liệu hình ảnh thành chuỗi số lượng đối tượng theo thời gian.
from ultralytics import YOLO
# Load the YOLO11 model for object tracking
model = YOLO("yolo11n.pt")
# Track objects in a video stream (generates time-series data)
# The 'stream=True' argument returns a generator for memory efficiency
results = model.track("path/to/traffic_video.mp4", stream=True)
# Process frames sequentially to build a time series of counts
for i, r in enumerate(results):
if r.boxes.id is not None:
count = len(r.boxes.id)
print(f"Time Step {i}: {count} objects detected")
Điều quan trọng là phải phân biệt Phân tích chuỗi thời gian với Mô hình hóa chuỗi và Thị giác máy tính .
Các chuyên gia có thể tiếp cận một loạt phần mềm để thực hiện phân tích chuỗi thời gian. Về mặt thao tác dữ liệu, Pandas là tiêu chuẩn công nghiệp trong Python Để xây dựng các mô hình dự đoán, các thư viện như Scikit-learn cung cấp các công cụ hồi quy cơ bản, trong khi các khung như PyTorch và TensorFlow rất cần thiết để huấn luyện các mô hình học sâu phức tạp như LSTM hoặc Transformer. Để trực quan hóa kết quả, các thư viện Trực quan hóa Dữ liệu như Matplotlib là không thể thiếu để truyền đạt xu hướng cho các bên liên quan.