Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Nhận dạng lại đối tượng (Re-ID)

Khám phá đối tượng Re-ID: khớp người hoặc phương tiện trên các camera không chồng lấn với nhúng ngoại hình để tăng cường giám sát, phân tích bán lẻ, pháp y.

Nhận dạng lại đối tượng (Re-ID) là một kỹ thuật chuyên biệt trong thị giác máy tính (CV) tập trung vào việc liên kết các đối tượng hoặc cá nhân cụ thể trên các khung hình camera riêng biệt, không chồng chéo hoặc trong khoảng thời gian dài. Trong khi phát hiện đối tượng tiêu chuẩn xác định loại đối tượng (ví dụ: "người" hoặc "ô tô") trong một hình ảnh duy nhất, Re-ID xác định xem một đối tượng được phát hiện cụ thể có phải là cùng một đối tượng đã được nhìn thấy trước đó hay không. Khả năng này rất quan trọng để tạo ra sự hiểu biết mạch lạc về chuyển động trong môi trường quy mô lớn, nơi một camera duy nhất không thể bao phủ toàn bộ khu vực, giúp kết nối hiệu quả các điểm giữa các quan sát hình ảnh riêng lẻ.

Quy trình xác định lại danh tính hoạt động như thế nào?

Thách thức cơ bản của Re-ID là việc đối khớp danh tính bất chấp sự thay đổi về ánh sáng, tư thế, góc máy quay và các yếu tố gây nhiễu trong bối cảnh. Để đạt được điều này, hệ thống không chỉ dựa vào tọa độ khung hình đơn giản mà còn phân tích nội dung hình ảnh của đối tượng.

  • Trích xuất đặc trưng: Khi một đối tượng được phát hiện, mô hình học sâu (DL) sẽ xử lý phần ảnh đã cắt để tạo ra một vectơ đặc trưng, thường được gọi là embedding . Vectơ này biểu diễn các đặc điểm hình ảnh cấp cao—chẳng hạn như kết cấu của quần áo hoặc màu sắc của một chiếc xe—ở định dạng số.
  • Học ma trận khoảng cách: Hệ thống sử dụng học ma trận khoảng cách để đảm bảo rằng các embedding của cùng một đối tượng có khoảng cách toán học gần nhau, trong khi các embedding của các đối tượng khác nhau lại cách xa nhau. Các kỹ thuật như mạng nơ-ron Siamese thường được huấn luyện cho mục đích này.
  • So khớp độ tương đồng: Trong quá trình suy luận, hệ thống tính toán độ tương đồng cosine hoặc khoảng cách Euclidean giữa phần nhúng của đối tượng truy vấn và "thư viện" các định danh đã được lưu trữ trước đó. Nếu điểm số tương đồng vượt quá một ngưỡng nhất định, hệ thống sẽ tuyên bố có sự trùng khớp.

Re-ID so với Theo dõi đối tượng

Điều quan trọng là phải phân biệt giữa nhận dạng lại đối tượng (Re-ID) và theo dõi đối tượng , vì chúng đóng vai trò bổ sung nhưng khác biệt trong quy trình xử lý hình ảnh.

  • Theo dõi đối tượng: Quá trình này, thường được hỗ trợ bởi các thuật toán như bộ lọc Kalman , dự đoán vị trí của một đối tượng từ khung hình video này đến khung hình liền kề tiếp theo. Nó phụ thuộc rất nhiều vào tính liên tục theo thời gian và sự chồng chéo không gian, chẳng hạn như giao điểm trên hợp nhất ( IoU ) .
  • Nhận dạng lại: Chức năng nhận dạng lại (Re-ID) được sử dụng khi quá trình theo dõi thất bại—ví dụ, khi một vật thể bị che khuất hoàn toàn hoặc rời khỏi tầm nhìn của một camera và đi vào tầm nhìn của camera khác. Chức năng này thiết lập lại danh tính dựa trên hình dạng bên ngoài chứ không phải lịch sử vị trí, cho phép theo dõi nhiều đối tượng (MOT) mạnh mẽ trên các mạng phân tán.

Các Ứng dụng Thực tế

Việc tái nhận dạng giúp chuyển đổi các phát hiện riêng lẻ thành các lộ trình có thể hành động, cho phép phân tích chuyên sâu trong nhiều lĩnh vực khác nhau.

  • An ninh thành phố thông minh: Trong giám sát đô thị , Re-ID cho phép các nhà điều hành track Thông tin về một người hoặc phương tiện cụ thể trên toàn bộ mạng lưới camera giao thông của thành phố. Điều này rất quan trọng cho việc tìm kiếm pháp y, cho phép các nhà chức trách xác định vị trí của một đứa trẻ mất tích hoặc một nghi phạm mà không cần phải xem xét thủ công hàng nghìn giờ dữ liệu.
  • Phân tích bán lẻ: Trong môi trường bán lẻ được hỗ trợ bởi AI , các cửa hàng sử dụng Re-ID để hiểu hành trình của khách hàng. Bằng cách nhận dạng lại người mua sắm khi họ di chuyển giữa các lối đi hoặc tầng, các nhà bán lẻ có thể tạo ra bản đồ nhiệt về các tuyến đường phổ biến và tối ưu hóa bố cục cửa hàng, đồng thời vẫn đảm bảo quyền riêng tư bằng cách phân tích các mã số thay vì dữ liệu sinh trắc học.

Triển khai tính năng theo dõi với chức năng nhận dạng lại

Các mẫu điện thoại hiện đại như YOLO26YOLO11 có thể được tích hợp với các thiết bị theo dõi sử dụng khái niệm Nhận dạng lại (Re-ID) để duy trì danh tính trong điều kiện khó khăn. Thiết bị theo dõi BoT-SORT , có sẵn trong... Ultralytics Thư viện này kết hợp các tín hiệu chuyển động với các đặc điểm hình ảnh để mang lại hiệu suất mạnh mẽ.

Ví dụ sau đây minh họa cách áp dụng tính năng theo dõi này vào một tập tin video:

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Track objects in a video using BoT-SORT
# BoT-SORT uses appearance features to help re-identify objects after occlusions
results = model.track(source="path/to/video.mp4", tracker="botsort.yaml", persist=True)

# Process results
for result in results:
    if result.boxes.id is not None:
        print(f"Tracked IDs: {result.boxes.id.cpu().numpy()}")

Để tìm hiểu sâu hơn về kiến trúc hỗ trợ các khả năng này, nên xem xét lại các mạng nơ-ron tích chập (CNN) và kiến trúc ResNet . Hiểu rõ những nền tảng này giúp lựa chọn dữ liệu huấn luyện phù hợp để tinh chỉnh các mô hình Nhận dạng lại tùy chỉnh cho các môi trường cụ thể.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay