Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Nhận dạng lại đối tượng (Re-ID)

Khám phá đối tượng Re-ID: khớp người hoặc phương tiện trên các camera không chồng lấn với nhúng ngoại hình để tăng cường giám sát, phân tích bán lẻ, pháp y.

Nhận dạng lại Đối tượng (Re-ID) là một kỹ thuật thị giác máy tính (CV) tinh vi được thiết kế để nhận dạng và liên kết một đối tượng hoặc cá nhân cụ thể trên các góc nhìn camera không chồng chéo hoặc các khoảng thời gian riêng biệt. Không giống như phát hiện tiêu chuẩn, vốn chỉ đơn giản là phân loại một đối tượng, Re-ID tập trung vào việc xác định liệu một đối tượng được phát hiện ở một vị trí có cùng danh tính với đối tượng đã thấy trước đó ở một vị trí khác hay không. Khả năng này rất cần thiết để tạo ra sự hiểu biết thống nhất về chuyển động và hành vi trong các môi trường quy mô lớn, chẳng hạn như sân bay, trung tâm mua sắm và thành phố thông minh, nơi một camera duy nhất không thể bao quát toàn bộ khu vực.

Cơ chế nhận dạng lại

Thách thức cốt lõi của Re-ID là việc khớp danh tính bất chấp sự khác biệt về ánh sáng, tư thế, góc nhìn và độ che khuất. Để đạt được điều này, hệ thống tạo ra một chữ ký số duy nhất cho mỗi đối tượng được phát hiện.

  • Trích xuất đặc điểm : Khi một đối tượng được xác định trong một khung giới hạn , mô hình học sâu (DL) sẽ xử lý vùng ảnh để tạo ra một vectơ đa chiều, được gọi là nhúng . Vectơ này bao gồm các đặc điểm thị giác riêng biệt, chẳng hạn như hoa văn màu sắc quần áo của một người hoặc chi tiết cụ thể về hãng và kiểu xe.
  • Học tập theo phương pháp đo lường : Để đảm bảo độ chính xác, các mô hình này sử dụng các kỹ thuật học tập theo phương pháp đo lường . Quá trình huấn luyện thường liên quan đến mạng nơ-ron nhân tạo Siamese hoặc sử dụng hàm mất mát bộ ba , giúp mạng giảm thiểu khoảng cách giữa các nhúng có cùng danh tính trong khi tối đa hóa khoảng cách giữa các danh tính khác nhau.
  • So khớp thư viện : Trong quá trình suy luận, hệ thống so sánh nhúng của một đối tượng mới được phát hiện ("truy vấn") với một "thư viện" các nhúng đã lưu trữ từ các lần phát hiện trước đó. Các thuật toán xếp hạng các phép so sánh này theo độ tương đồng, thường sử dụng độ tương đồng cosin hoặc khoảng cách Euclid để tìm ra kết quả khớp nhất.

Re-ID so với Theo dõi đối tượng

Mặc dù thường được sử dụng cùng nhau, Nhận dạng lại đối tượng và theo dõi đối tượng phục vụ các mục đích riêng biệt trong quy trình phân tích video.

  • Theo dõi Đối tượng : Quá trình này duy trì danh tính của một đối tượng theo từng khung hình trong một luồng video liên tục duy nhất . Nó phụ thuộc rất nhiều vào tính liên tục theo thời gian và các thuật toán dự đoán chuyển động như bộ lọc Kalman . Nếu một đối tượng rời khỏi khung hình hoặc bị che khuất trong một thời gian dài, track thường bị mất hoặc được cấp ID mới khi trả lại.
  • Nhận dạng lại đối tượng : Nhận dạng lại giải quyết vấn đề "mất dấu vết" bằng cách liên kết lại danh tính trên các góc nhìn không liên tục . Nó kết nối các điểm giữa các camera khác nhau trong hệ thống theo dõi đa đối tượng (MOT) , cho phép tái tạo toàn bộ quỹ đạo trên một mạng lưới phân tán.

Các Ứng dụng Thực tế

Công nghệ Re-ID là nền tảng của phân tích hiện đại, cho phép đưa ra thông tin chi tiết hữu ích trong nhiều ngành công nghiệp khác nhau.

  • Bán lẻ Thông minh : Trong môi trường bán lẻ ứng dụng AI , Re-ID giúp các nhà bán lẻ lập bản đồ hành trình khách hàng trong toàn bộ cửa hàng. Bằng cách hiểu rõ khu vực nào khách hàng ghé thăm và nhận dạng lại khi họ di chuyển giữa các tầng, doanh nghiệp có thể tối ưu hóa bố cục cửa hàng và vị trí đặt sản phẩm mà không cần thu thập dữ liệu sinh trắc học.
  • Giám sát Thành phố Thông minh : Để đảm bảo an ninh và an toàn đô thị , Re-ID cho phép người vận hành tìm kiếm đối tượng quan tâm—chẳng hạn như trẻ em mất tích hoặc nghi phạm—trên toàn mạng lưới camera toàn thành phố. Điều này giúp giảm đáng kể thời gian cần thiết để xem xét video pháp y, một quy trình được hỗ trợ bởi các tập dữ liệu nghiên cứu như Market-1501 .

Triển khai Re-ID với Ultralytics YOLO

Các khung phát hiện đối tượng hiện đại thường tích hợp các thuật toán theo dõi sử dụng các đặc điểm ngoại hình tương tự như Re-ID để duy trì danh tính trong quá trình che khuất. Mô hình YOLO11 có thể dễ dàng được ghép nối với các bộ theo dõi tiên tiến như BoT-SORT, tích hợp các tính năng Re-ID để theo dõi mạnh mẽ.

Ví dụ sau đây minh họa cách bắt đầu theo dõi trên một nguồn video bằng cách sử dụng Python giao diện.

from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Run tracking on a video file using the BoT-SORT tracker
# BoT-SORT utilizes Re-ID features to improve tracking robustness
results = model.track(source="path/to/video.mp4", tracker="botsort.yaml", show=True)

# Access the unique tracking IDs assigned to detected objects
for r in results:
    if r.boxes.id is not None:
        print(f"Track IDs: {r.boxes.id.cpu().numpy()}")

Đọc thêm và Tài nguyên

Để hiểu sâu hơn về các công nghệ nền tảng, hãy khám phá các khái niệm như trích xuất đặc trưng và kiến trúc của mạng nơ-ron (NN) . Các nền tảng như PyTorchTensorFlow cung cấp các công cụ cần thiết để xây dựng và huấn luyện các mô hình Re-ID tùy chỉnh. Đối với những ai quan tâm đến lĩnh vực giám sát thông minh rộng hơn, việc xem lại kiến thức về video có thể cung cấp thêm bối cảnh về cách máy móc diễn giải dữ liệu hình ảnh theo thời gian.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay